Vous êtes sur la page 1sur 37

Collège iconique du 7 juin 2006 : Le son et l’image

Collège iconique

Le son et l’image

Michel Chion

7 juin 2006

Institut national de l’audiovisuel


4 avenue de l’Europe
94366 Bry-sur-Marne Cedex

Tél. : 01 49 83 30 11
Mél : inatheque-de-france@ina.fr
Site : www.ina.fr

1
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

François SOULAGES : Bonsoir. Merci beaucoup d’être venus pour cette dernière séance du
Collège iconique de cette année 2005-2006. Nous sommes tous très heureux que Michel
Chion ait accepté de venir parler avec nous des rapports du son et de l’image. Pourquoi ?
Parce que vous savez que le principe de ce collège est d’essayer de penser l’image avec
des points de vue les plus différents possible. Penser, c’est un peu comprendre, donc
prendre avec soi, donc prendre avec quelque chose de différent, ou à partir d’un lieu
différent, un objet. Penser l’image, c’est donc penser l’image souvent à partir d’autre chose
que d’elle-même. Quand on pense l’image, on a souvent tendance à la penser
abstraitement, c’est-à-dire à la penser comme si nous n’étions pas des êtres humains et
comme si notre approche du monde n’était pas à la fois une approche consciente et
inconsciente, mais une approche aussi qui mobilisait tous nos sens. Or, un des sens, une
des dimensions les plus importantes pour l’homme, c’est l’ouïe, et une des réalités les plus
importantes, c’est le son. Nous allons essayer ce soir de réfléchir à tout cela à partir de
l’œuvre de Michel Chion. Vous connaissez tous Michel Chion, je ne vais pas reprendre dans
le détail tout ce qu’il a fait. Il est professeur associé à Paris III, il a écrit énormément de
livres, non pas des livres que l’on écrit comme ça en été pour en faire paraître un ou deux
par an, mais des livres absolument fondamentaux. Il est arrivé sur un terrain qu’il a lui-même
pensé et repensé à partir de réalités à la fois matérielles, techniques, artistiques. Il a essayé
de mettre toute sa culture et toute son intelligence pour penser cet objet particulier, avec
toutes les dimensions, tous les liens qu’il y a, qu’est le son. Il a écrit de nombreux livres, je
vais vous en citer quelques-uns : Les Musiques électroacoustiques, un livre sur Pierre
Henry, La Voix au cinéma, L’Art des sons fixés, ou la musique concrètement, La Symphonie,
des livres sur la littérature, beaucoup de choses nourries notamment par Pierre Schaeffer,
par le GRM, etc. À mon avis, c’est extrêmement précieux qu’on termine cette année avec cet
auteur, et que cet auteur nous aide à mieux rentrer dans son œuvre et à mieux rentrer dans
ses problématiques. Pour ceux qui n’ont encore jamais lu de livres de Michel Chion, je crois,
personnellement, qu’un livre qui permet de bien introduire à la pensée de cet auteur, c’est Le
Son (publié chez Nathan-Université, maintenant chez Armand-Colin), qui permet d’avoir une
sorte de panorama des différentes problématiques autour du son et des problématiques que
met en œuvre Michel Chion. Michel Chion, merci beaucoup d’être là, nous vous écoutons –
c’est le cas de le dire. À tout à l’heure pour le dialogue.

Michel CHION : Merci beaucoup. Merci pour toutes les choses gentilles qui ont été dites et
merci pour votre invitation et votre présence. Je vais donc faire un exposé de 40 ou
45 minutes, et puis la procédure habituelle est qu’il y ait des questions, donc on passera à
cette partie-là. Je ne vais pas vous donner de références bibliographiques trop précises. Il se
trouve qu’il y a un site qui m’est consacré, qui a été créé par un jeune compositeur,
michel.chion.com, sur lequel on peut trouver ma bibliographie et donc les références des
livres dont je vais citer rapidement les titres. Comme François Soulages l’a rappelé, j’ai pas
mal publié, effectivement. Un des livres qui concernent le sujet de ce soir, c’est d’abord Le
Son, sorti en 1998. Un autre livre, sorti il y a deux ans, auquel je tiens beaucoup également,

2
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

qui fait 500 pages, s’appelle Un art sonore : le cinéma (Éditions des Cahiers du cinéma), où
j’ai à la fois repris des textes anciens et écrit des choses nouvelles. Ce n’est pas pour moi le
texte définitif que je voudrais écrire sur la question, mais disons que c’est une avancée, c’est
le plus à jour de tous ceux que j’ai publiés sur ce sujet – que j’enseigne effectivement à
Paris III. Dans ce domaine, je n’étais pas le premier à travailler, évidemment. Je vais faire un
peu d’historique, parce que ça permet de comprendre les choses. À la fin des années 1960,
j’ai fait le stage de « Musique électroacoustique » (comme on disait à l’époque) au Groupe
de recherche musicale, qui à ce moment-là était dans le cadre du Service de la recherche
(beaucoup d’entre vous connaissent bien ce nom-là) dirigé par Schaeffer dont j’ai été
l’assistant pendant deux ans au Conservatoire de Paris. Schaeffer avait d’ailleurs écrit des
articles très intéressants sur les rapports musique/image, publiés dans La Revue du cinéma.
J’ai donc bien connu Schaeffer. Vers la fin des années 1970, alors que je n’étais déjà plus au
GRM, j’avais démissionné pour faire d’autres choses, Pierre Schaeffer me dit : « On vient de
me proposer de faire un enseignement sur l’image et la musique. Est-ce que ça t’intéresse ?
C’est à l’Idhec. » Il n’y avait rien là-dessus. J’ai dit : « Oui, ça m’intéresse. » Sur le sujet, je
n’avais fait qu’un seul article, mais je me suis mis à travailler le sujet. Ce départ dans ce
champ de recherche coïncidait avec l’arrivée de quelque chose qui a tout changé, qui était le
magnétoscope. Jusque vers la fin des années 1970, en France, si on voulait étudier le son
d’un film, ce n’était pas très facile : soit on faisait comme moi, c’est-à-dire arriver dans un
cinéma avec un magnétophone et on emportait le son avec l’ambiance de la salle, et ce
n’était pas très facile de travailler ainsi. Quand les gens faisaient des analyses de
photogrammes de films… il y a eu de très bonnes analyses de séquences
cinématographiques par des gens comme Raymond Bellour, il fallait qu’il ait à sa disposition
pendant deux ou trois jours une copie de tel film, une copie film en 35 mm. À l’époque, avec
les haut-parleurs des machines de montage, on ne pouvait pas entendre grand-chose, les
machines faisaient du bruit. Donc ça explique largement qu’il n’y ait pas eu de travaux précis
là-dessus. Le fait tout simplement d’avoir le magnétoscope, avec le standard VHS qui s’est
finalement imposé… Vous savez qu’il y avait trois standards amateurs au départ : le V 2000,
le Betamax et le VHS. Le fait de pouvoir copier des films qui passaient à la télévision et de
les regarder ensuite, de les écouter dans des conditions où enfin on pouvait repasser des
sons, et surtout sans le bruit de la table de montage cinéma, évidemment, crée des moyens
d’observation dont j’ai profité avec les étudiants que j’avais à ce moment-là à l’Idhec. Je me
suis aperçu de plein de choses et j’ai dit aux étudiants : « On va voir ce que ça donne si on
coupe le son de cette séquence. On va voir ce que ça donne si on ne regarde pas l’image.
On va le passer à d’autres étudiants qui n’ont pas vu la séquence avec les images, donc ils
sont obligés d’imaginer… » Si vous donnez à quelqu’un le son et l’image d’une séquence et
qu’ensuite vous supprimez l’un des deux, forcément, la mémoire de ce qu’on a vu ou de ce
qu’on a entendu intervient. Des expériences comme ça (ça repose beaucoup sur
l’expérience) ont mis en évidence des choses que j’ai développées, d’abord dans des livres
publiés aux Cahiers du cinéma, ensuite plus largement. C’était pour rappeler le point de
départ de ce travail. Je suis d’ailleurs frappé par le fait qu’aujourd’hui c’est accessible à tout
le monde, avec les DVD, de faire des recherches comme celles que je fais, et que peut-être
font d’autres, et en fait pratiquement personne ne le fait. L’approche des films est très

3
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

souvent extrêmement conceptuelle, les gens parlent du film comme d’un objet… Pour eux,
ce n’est pas un texte, c’est un objet de discours, on dirait que c’est très lointain. Il existe
encore relativement peu de livres sur le cinéma ou la vidéo qui parlent du texte, ce qu’on
peut appeler par analogie le « texte » du film, c’est-à-dire la substance, le fil des images et
des sons, la matière, alors que c’est tellement facile d’y prêter un peu d’attention. Ça, ça me
frappe, ça montre bien que dans ce domaine il y a un décalage complet entre les machines
et ce qu’on en fait. Ce n’est pas du tout parce qu’on a les machines pour faire telle chose
qu’on en profite. Un autre exemple de ça, c’est que les machines à enregistrer le son, à le
fixer, existaient depuis pas mal de temps et il a fallu attendre plusieurs décennies pour que
quelqu’un comme Pierre Schaeffer dise : « On peut faire un art directement à partir de sons
enregistrés. »
C’est un vaste sujet, évidemment. Quand on me propose une intervention, je pars du titre
qu’on me propose, donc : « Le son et l’image ». Je traite ça un peu comme en musique on
traite des notes, on donne un thème de trois notes. Ce sera donc autour de ce titre qu’on m’a
proposé que je vais essayer de construire ce petit exposé. D’abord, je vois que c’est au
singulier. Puisqu’on est en français, on a deux articles définis. Il est certain que ce serait
différent si c’était en anglais, on dirait Sound and Image, comme le permet l’anglais. On
penserait moins à faire « Son et image » en français, mais c’est plus courant dans une autre
langue. Souvent, d’ailleurs, en France, on est assez nominalistes : « le son », ça existe, on
va parler de « le son ». Ce nominalisme n’est pas quelque chose dont on peut se
débarrasser facilement. Je suis critique par rapport à ça, c’est-à-dire de penser qu’à partir du
moment où il y a un mot, tout ce qu’on dit, tout ce qui est concerné quand on dit « l’image »,
« l’image », « l’image », ce sera forcément la même chose et les gens s’entendent, alors qu’il
est clair qu’on parle de cinquante mille choses. C’est la même chose pour le son. Pour le
son, on parle peut-être moins de cinquante mille choses, mais on peut quand même parler
de trois ou quatre choses qui n’ont rien à voir les unes avec les autres. Pour être très simple,
le son c’est quoi ? Si vous ouvrez certains dictionnaires et des manuels d’acoustique, même
des livres d’esthétique musicale, vous verrez des définitions qui sont souvent en deux
parties. Le son est une vibration d’un milieu (l’air, l’eau, les solides, mais essentiellement
pour nous : l’air), avec des propriétés, des fréquences et tout ça. Bien. Donc il y a du son. Et
on dit par ailleurs : le son est une perception, et on a l’impression qu’on a dit quelque chose
de précis. Mais c’est bien embêtant d’avoir le même mot pour dire des choses qui n’ont pas
besoin d’être entendues, qui peuvent être mesurées par des appareils, c’est-à-dire le son au
sens no 1, et quelque chose qui est lié forcément à un sujet percevant. Il peut être animal,
mais en l’occurrence il est humain, qu’on soit une catégorie d’animaux ou pas, en tout cas il
est humain puisqu’on ne peut parler que de ça. Donc c’est bien embêtant d’avoir le même
mot, mais souvent, le fait d’avoir le même mot pour dire deux choses radicalement
différentes amène à dire : c’est clair, le domaine est objectif ou le domaine est subjectif.
Donc on pourrait parler du son d’une manière objective quand on parle des fréquences, par
exemple : un son à 440 Hz, 440 vibrations par seconde. Vous voyez qu’il n’y a pas besoin
d’une oreille pour mesurer ça, c’est le son objectif. Et le son subjectif, c’est ce qu’on entend,
par exemple la hauteur, là, serait subjective. Je donne l’exemple le plus banal : le diapason a
bougé. Le diapason officiel aujourd’hui est à 440 Hz pour une note la de médium, alors on

4
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

dira que le la est subjectif. Mais ça veut dire quoi en l’occurrence ? Ça ne veut rien dire,
puisque vous prenez des millions d’individus, vous leur faites entendre un la, ils entendront
tous et toutes un la. Alors ce n’est pas subjectif dans le sens où chacun entend ce qu’il a
envie d’entendre, ou comme il peut, ou en fonction de sa culture. Il y a un autre problème ici
(j’ouvre un peu des fenêtres dans des fenêtres, tant pis), des problèmes que je rencontre
souvent quand on aborde ça, notamment en France, c’est que les gens aiment bien, sur ce
sujet-là, être culturalistes, c’est-à-dire : moi j’entends ça, mais un Eskimo entendra autre
chose, un Japonais encore autre chose, et une femme n’entendra pas la même chose qu’un
homme, un enfant qu’un adulte, etc. En fait, moralité : le son est subjectif, puisque chacun
entend en fonction d’une position culturelle. Parfois aussi, ça peut être du biologisme. Alors
que la réponse à la question : ce que nous percevons du son est-il culturel ?, je crois que la
seule bonne réponse est celle que donnait Schaeffer sur d’autres sujets : c’est un peu des
deux, c’est-à-dire qu’il y a un aspect culturel et il y a un aspect naturel. Naturel dans quel
sens ? Dans le sens où, étant donné la conformation de l’organisme humain et le
fonctionnement des choses, c’est quand même la même chose pour tout le monde. Si vous
faites entendre un son qui a une forme par exemple « percussion résonance », c’est-à-dire
des sons dont les modèles existent beaucoup dans la musique, dans les sons de la réalité,
baoum, une chute d’énergie, d’intensité qui conduit au silence, ce modèle est conçu comme
étant ce modèle-là par absolument tout le monde. Pour des raisons d’ailleurs banales : les
lois d’amortissement de certains phénomènes sont les mêmes dans le monde entier, les
modes de fonctionnement de l’oreille (en mettant à part les gens qui sont sourds ou
malentendants) sont les mêmes dans le monde entier. Donc il est tout à fait simple de
retrouver là-dedans des choses qui sont naturelles, non pas dans le sens du naturalisme,
mais dans le sens où ça découle de la manière dont ça fonctionne. C’est un mélange d’une
question naturelle et d’une question culturelle.
Je reviens à la question « le son ». En français, on a l’article, et on a le fait d’avoir au moins
deux sens entre lesquels on aurait tendance à dire : il y a le sens objectif et le sens subjectif.
C’est des choses que vous trouvez encore dans des livres d’acoustiques ou de technique,
c’est très répandu. Moi je dis (à la suite de Schaeffer) que tout ça ne veut rien dire, parce
que ce n’est pas du tout la même chose. Ce qu’on perçoit n’est pas une sorte d’image
subjective d’une réalité objective, c’est un objet en soi. D’ailleurs, Schaeffer (dont je me
réclame ici) a créé l’expression « objet sonore », ce qui veut dire que c’est un objet. L’objet
sonore, ce n’est pas le corps sonore, ce n’est pas la cause du son. Ou les causes. On dit la
cause, mais en fait c’est les causes. C’est un autre type de réalité, plus ou moins fluctuante.
Qu’est-ce qui là-dedans est commun à tout le monde ? Qu’est-ce qui est lié aux conditions
dans lesquelles on entend ? Est-ce que vous entendez la même chose de ma voix si vous
êtes au fond de la salle, si vous êtes loin d’un haut-parleur ou près, si vous êtes dehors,
etc. ? Là encore, la réponse est qu’il y a des choses en commun et des choses différentes
selon la position géographique que vous occupez, et selon d’autres dimensions.
Le son et l’image. Si on pouvait lancer un mot, je dirais : ne parlons plus du son, je propose
d’appeler ça l’auditum, participe passé neutre du latin audire, « la chose entendue ». C’est
un mot que je propose dans ce livre, mais je n’escomptais pas qu’il remplace
universellement le mot « son » dans cet usage-là, de ce qu’on entend. Un auditum, ce n’est

5
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

pas une perception subjective au sens de (?), etc. Je ne le propose pas « à la place », ce
serait prétentieux, mais disons dans un autre cadre que l’« objet sonore » schaefferien,
parce que ça pose un problème inévitable, que Schaeffer d’ailleurs connaissait bien, c’est
qu’il y aurait un objet et « sonore » serait un prédicat de cet objet. En anglais, c’est plus
pratique, puisqu’on dit sound object. Là où on cite Schaeffer dans les textes anglais, on dit
sound object, c’est-à-dire en quelque sorte un « objet son », il n’y a pas ce côté « sonore »
qui est un adjectif ou un prédicat d’un objet qui existerait sans être sonore. Si j’avais une
sorte de mécanisme, je dirais tout le temps dans cette présentation « l’auditum », mais pour
être plus simple je vais dire « le son » dans cet emploi-là.
Ensuite, je vois que si on dit « le son et l’image », comme on le dit facilement en français, on
a deux singuliers. Je réfléchis sur la question singulier/pluriel. Pourquoi dit-on par exemple
« l’image » quand on parle du cinéma, puisqu’une bonne partie de notre travail concerne le
cinéma, ou la télévision, enfin l’audiovisuel, comme on dit ? Pourquoi emploie-t-on le
singulier alors qu’il y a plusieurs images, c’est dans le temps ? Il y a au moins une raison,
c’est qu’il y a une unicité du cadre. Il y a un cadre visuel des images, qui fait qu’on dit
« l’image ». Il peut se succéder dans un film des tas d’images, ça dépend où on les
démarque, si on dit que l’image c’est le plan ou c’est le photogramme, en tout cas il y en a
beaucoup, il y en a plusieurs. Et si on dit quand même le singulier, « l’image », c’est parce
qu’il y a quelque chose de spécifique au domaine visuel, dont on a aucun équivalent pour le
son, c’est qu’il y a un cadre visible du visuel, ou un cadre visuel du visible, si vous voulez,
mais disons qu’il y a un cadre. À ce moment-là, ça veut dire que quand vous avez trois ou
quatre écrans, ou installations vidéo, est-ce que ce n’est plus du cinéma ? Peu importe que
ce soit ou non du cinéma, c’est un cas de figure très différent de ce que je vais aborder,
qu’on aborde souvent, c’est-à-dire le cadre de la télévision ou du cinéma. Vous avez quand
même l’unicité du cadre. C’est d’ailleurs assez caractéristique que dans le cas du cinéma les
nombreuses tentatives, très faciles à faire techniquement, de subdivisions du champ, ce
qu’on appelle le split screen… Il sort régulièrement des films en split screen, au moins deux
par an, il y en a un qui est sorti aujourd’hui, je ne l’ai pas encore vu mais j’ai vu les bandes-
annonces, ça s’appelle Conversations avec une femme. C’est un film où l’écran est divisé
constamment en deux parties. Des films comme ça, il y en a de très anciens et il y en a
régulièrement. Un film sur 500 ou sur 1 000 est comme ça. C’est très intéressant. Mais 99 %
des films sont avec une image à la fois. Au passage, il y a une chose très intéressante, c’est
anecdotique, mais ça éclairera peut-être des choses qu’on fait sur le son : il est intéressant
d’apprendre que le principe du Cinémascope, qui a été inventé dans les années 1920 (et
non pas dans les années 1950) par un Français, le professeur Chrétien, c’était l’idée d’un
format large, mais pas du tout conçu au départ pour avoir une image, un champ, mais pour
en avoir trois, une centrale et deux sur les bords, sur la même pellicule. À quoi ça servait,
dans l’esprit du professeur Chrétien ? Ça servait à ce qu’on puisse montrer par exemple
quelqu’un qui regarde et la chose qu’il regarde, ou quelqu’un qui parle de quelque chose et
la chose qu’il évoque, ou quelqu’un qui est dans la réalité et son univers mental, c’est-à-dire
faire exister dans la simultanéité, dans le même regard, quelque chose que le montage
cinématographique fait apparaître dans la succession. Dans certains cas, vous savez que le
cinéma muet utilise la succession pour traduire un rapport (c’est ce qu’a fait Eisenstein),

6
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

mais on peut se dire : pourquoi pas dans la simultanéité ? pourquoi mettre le plan de ceci
après et pas en même temps ? Donc il y a eu un film – perdu, et pour cela mythique –, je ne
sais pas ce qu’il valait, mais on a plein de documents dessus, réalisé par Claude Autant-Lara
à la fin des années 1920, d’après une nouvelle de Jack London, Construire un feu, qui
utilisait l’écran large non pas pour filmer un paysage de neige (ça se passe dans la neige)
sur toute la largeur, comme d’habitude en Cinémascope, mais pour avoir trois images en
même temps. Dans le centre, on a l’image d’un explorateur, d’un aventurier dans le Grand
Nord, et sur les côtés l’image de ce qu’il pense. Côte à côte, et non pas l’un après l’autre.
C’est intéressant de voir que, dans cet emploi-là, le Cinémascope a été très peu utilisé. Le
split screen est souvent utilisé pour des comédies, pour des conversations au téléphone, des
choses comme ça. Dans la majeure partie des cas, on a donc affaire à un cadre visuel du
visible, occupé par une chose à la fois, un champ à la fois, même s’il y a différents détails sur
cette image, donc on peut dire « l’image ». Mais est-ce que c’est valable pour le son ? Je
dirais que non, c’est plutôt « des sons », dans le cas le plus courant, le cas du cinéma à la
télévision. Souvent, on a en même temps une musique, qu’on appelle « non diégétique »,
c’est-à-dire qui n’appartient pas à la réalité qui est montrée sur l’écran ; on peut avoir en
même temps les dialogues des gens qui parlent dans l’image, des bruits correspondant aux
actions qu’ils font ou à l’ambiance où ils sont… Moi je dis qu’il n’y a aucune raison de parler
de ça au singulier. On pourrait en parler au singulier, on pourrait dire « le son », s’il y avait un
cadre sonore des sons. Ceci n’est pas une boutade, c’est à partir d’expériences que j’ai
faites : il n’y a pas de cadre sonore des sons. On peut dire les choses comme ça. Cette
formule est ultrasimple à énoncer : « Il n’y a pas de cadre sonore des sons. » J’étais content
de moi le jour où j’ai trouvé cette formule, parce que j’ai mis du temps pour arriver à ça. Pour
moi, ça explique bien des choses. C’est une chose qu’on comprend immédiatement, mais je
dis – ça peut paraître prétentieux – que pour la comprendre vraiment, il faut vraiment la lire
et réfléchir. Autant c’est rapidement compris, ce genre de formule… Puisqu’il n’y en a pas, il
y en a quand même une. Avec les grandes formules disant les choses négativement, on a
l’impression que c’est une sorte de jeu de l’esprit. On commence par une formulation
négative. Il y a une sorte de négativité positive. « Il n’y a pas de cadre sonore des sons », ce
n’est pas juste se débarrasser du truc. C’est dire quelque chose, de dire ça. Je pense que
dans certains cas, certaines choses ne peuvent être comprises ou formulées que dans la
double négation. Quand on parle de « son continu », par exemple, je trouve qu’on n’a pas dit
grand-chose, on n’est pas vraiment aidé. Je travaille aussi beaucoup à partir des textes, à
l’intersection des expériences sensorielles, les mots, une série de choses, et j’ai remarqué
que Flaubert écrit de temps en temps à propos d’un son : on entendait ceci sans
discontinuer. C’est intéressant qu’il le dise comme ça. « On entendait le bruit de la cascade
qui ne discontinuait pas. » Flaubert n’écrivait pas n’importe quoi, ce n’est pas seulement
pour faire de belles cadences. Pourquoi c’est dit comme ça ? Est-ce que c’est vrai ? Quelque
chose qui est continu, pour nous c’est quelque chose qui n’est pas discontinu. On ne peut
concevoir le continu qu’à partir du discontinu, c’est donc quelque chose qui n’est pas
discontinu. Cette double négation du non-interrompu, du non-discontinu, c’est ce que
j’appelle l’indiscontinu, tout simplement, tout bêtement, un néologisme très simple, c’est une
manière juste de parler de ça, beaucoup plus juste parce qu’elle porte une tension en elle.

7
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

Ce n’est pas évident, une chose continue, ce n’est pas évident de penser le continu. Je
pense qu’on ne peut le penser que par rapport au discontinu. Les mathématiques ont
énormément réfléchi là-dessus, bien sûr. Tout le monde connaît au moins de nom le fameux
paradoxe de Zénon, avec la flèche, ou Achille et la tortue. Des choses aussi simples que ça
ont parfois conduit à inventer les mathématiques infinitésimales, le calcul infinitésimal, parce
qu’on se posait la question de savoir comment résoudre la question continu/discontinu. C’est
une des grandes questions, une énorme question pour l’homme, à tous les niveaux. Ce
paradoxe de Zénon d’Élée, qu’on trouve dans tous les livres, dans tous les dictionnaires, sur
Internet, a obligé les gens à penser le calcul infinitésimal.
Je reviens au son. Donc, il n’y a pas de cadre sonore des sons. Ça oblige au moins à penser
son et image comme un rapport qui n’est pas symétrique, qui n’est pas : là, il y a le son, et là
il y a l’image, « bonjour, je suis le son… » Non, c’est plus compliqué, il y a des sons, il n’y a
pas de cadre sonore des sons. Ça veut dire quoi ? Quelles sont les conséquences ? Ça veut
dire que dans un film ou une télévision, vous pouvez entasser autant de sons que vous
voulez, il y a toujours de la place. On aura peut-être du mal à les entendre, mais il n’y a pas
de « bord », c’est tout à fait différent. Il n’y a donc pas de symétrie possible entre le son et
l’image. Est-ce que ça veut dire pour autant qu’un son et une image n’ont rien à voir (sans
jouer les mots), n’ont pas de domaine commun ? Si. C’est plus compliqué que ça. Quand on
dit « le son et l’image », on aurait tendance, surtout si on est nominaliste, à dire : il y a le
domaine de l’image, qui n’a rien à voir avec le son, et le domaine du son, qui n’a rien à voir
avec l’image. Ce n’est pas comme ça que ça se passe. Pourquoi ? Parce que quand on
regarde quelque chose qui bouge sur un écran et quand on entend en même temps des
choses qui bougent, qui sont rythmées dans notre perception, il y a au moins un domaine
commun : le rythme. C’est le domaine commun le plus évident, le plus clair, entre ce qu’on
voit et ce qu’on entend. Devra-t-on parler de rythme visuel et de rythme sonore, en disant
que le rythme sonore c’est du sonore et le rythme visuel c’est du visuel ? Je dirais que c’est
plus compliqué que ça. On est encore sur un modèle des cinq sens auquel pieusement on
ne touche pas, bien qu’on fasse des tas de découvertes et de recherches sur la perception
humaine depuis pas mal de temps. On est toujours avec les cinq sens : le goût, l’odorat,
l’ouïe, la vue, l’audition et je ne sais plus quoi. C’est un peu ridicule. C’est une chose qui est
ancienne, qui est très poétique, mais enfin ça ne veut plus dire grand-chose, parce qu’on sait
quand même un peu mieux comment fonctionne la perception humaine et on sait très bien
que, pour certains types de perception, dont la perception rythmique, certes, ça rentre en
nous par des canaux divers, par exemple des pulsations rythmées sur la peau, qu’on appelle
tactiles (vous voyez comme les mots sont pauvres), des pulsations rythmées sur les parois
du corps, ou des choses qui oscillent devant nos yeux, par exemple un essuie-glace… Ou
bien des rythmes qu’on entend, par exemple dans la musique à percussions. Certes, dans
ce cadre de perception, les rythmes entrent par les yeux, par les oreilles et par la peau (ce
qui est un mot assez vague), mais ce n’est pas spécialement sonore ou visuel ou tactile.
C’est une des parties de notre perception, de nos champs perceptifs, qui n’a pas d’organe
précis. Il n’y a pas d’organe de la perception du rythme dans le corps humain. Il n’empêche
que c’est l’une des perceptions les plus archaïques, les plus anciennes, les plus ancrées, les
plus fondamentales, et qui est installée dans la vie intra-utérine puisqu’il y a des pulsations,

8
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

des variations de rythmes, il y a une structure du temps, les battements de cœur, etc. Ça
reste après. Il y a une sorte de base rythmique de notre perception qui n’est ni spécialement
visuelle ni spécialement sonore. C’est une vieille idée, mais il n’y a pas de mot reconnu là-
dessus, moi j’appelle ça « trans-sensoriel ». Ce sont des choses qu’on trouve déjà dans la
Phénoménologie de Merleau-Ponty, ce sont des choses qui devraient déjà être banales, à
mon avis. Il se trouve que Merleau-Ponty n’est plus vraiment lu, c’est dommage. Sa
Phénoménologie de la perception est un livre fantastique. Il y a aussi un autre auteur, que
j’ai découvert plus récemment, qui est Maurice Pradines, qui a beaucoup étudié la
perception, mais malheureusement peu de choses ont été reprises, ses textes ne sont pas si
faciles que ça à trouver. Il y a plein de choses fantastiques là-dessus, où il dit la même
chose finalement, ça se recoupe. Je pense qu’on ne peut pas étudier, parler de la question
du son et de l’image sans se poser la question du trans-sensoriel, c’est-à-dire des choses
qui ne sont pas spécialement visuelles ou sonores. Sonore, visuel, je dirais que ce sont des
trous, des tuyaux par lesquels passe la perception qui n’est pas spécialement sonore ou
visuelle en soi. Ce qui est vrai, par contre, c’est pour ça que c’est vraiment un peu plus
compliqué que ça, c’est qu’il y a des sens plus ou moins rapides et plus ou moins lents.
L’ouïe est le sens le plus rapide, c’est-à-dire qu’un mouvement sonore extrêmement rapide
va quand même imprimer une forme assez précise dans notre perception. Un mouvement
visuel, oui, mais assez vite c’est un peu plus flou. Donc l’ouïe, pour la vélocité, est le sens le
plus rapide. Il y a d’autres sens où on a bien du mal à établir des perceptions rythmiques
parce que ce sont des sens lents, par exemple le sens qu’on appelle globalement, de
manière approximative, l’odorat, c’est lent. J’ai appris ça, on le trouve dans un tas de
bouquins, il faut plusieurs secondes pour qu’une sensation s’établisse et qu’elle disparaisse.
Donc on ne peut faire que des adagios ou des mouvements lents, si on veut faire des
rythmes d’odeurs, mais ça n’a pas le même sens, c’est trop lent. Le goût, ce qu’on appelle le
goût, vous savez ce que c’est hyper compliqué. On sait bien que les aliments, ce n’est pas
seulement la langue et les papilles qui tâtent et qui disent si c’est bon. C’est ultra compliqué.
Dans ce qu’on appelle le goût, il y a des sensations diverses de résistance, etc. Plus les
odeurs. Vous savez que les gens qui, pour des raisons parfois médicales, ont le malheur de
ne plus avoir d’odorat, les anosmiques, ne trouvent plus de goût à la plupart des aliments.
C’est terrible d’être anosmique. J’ai entendu une fois une émission sur quelqu’un qui avait
perdu l’odorat, c’est assez terrible. C’est là qu’on s’aperçoit que ce n’est pas si simple que
ça. En tout cas, les perceptions rythmiques dites tactiles, par contact, ou visuelles ou
sonores, c’est du rythmique. Ce n’est sonore ou visuel ou tactile que secondairement. Ça ne
caractérise pas spécifiquement quelque chose de sonore ou de visuel. En revanche, il y a
bien des perceptions dans chaque domaine qui sont uniquement visuelles, par exemple la
couleur. Il y a des perceptions qui sont uniquement sonores, par exemple la hauteur et
surtout les intervalles de hauteur. Bien sûr, il y a de très jolies spéculations artistiques, le
peintre qui dit : je vais essayer de faire, avec des taches colorées, l’équivalent d’un intervalle,
d’une quinte par exemple. Des gens très intelligents, très cultivés, de grands artistes comme
Paul Klee ont tenté ça. Ils n’ont pas dit qu’ils y arrivaient, ils ont tenté, parce que ça les a
stimulés esthétiquement. Il y a sans arrêt des expositions (il y en a une en ce moment à
Beaubourg) sur ça. Mais il ne suffit pas de baptiser un tableau Harmonie de couleurs en

9
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

disant : voici une quinte, voici une octave, pour que ce soit la même chose. Si ça a motivé
l’artiste, c’est bien, mais on ne peut que constater que ce n’est pas ça du tout, ça n’a rien à
voir. Et dans l’autre sens, bien sûr. Quand Debussy donnait des titres visuels à ses œuvres,
il n’était pas fou, il ne se disait pas : je fais la même chose que ce que font les peintres que
j’admire. S’il donnait un titre visuel à une œuvre sonore, par exemple « Images pour piano,
pour orchestre », etc., il savait très bien que ça n’a rien à voir. C’était une stimulation
esthétique, sans prétention scientifique. Mais on sait très bien que, à partir du moment où on
essaie de mettre des couleurs en sons, ou des sons en couleurs, ça ne marche pas. Ce
n’est pas du tout la même chose, ça n’a rien à voir. Alors on se gargarise un peu, souvent,
sur la fameuse question de la synesthésie. On a parfois des gens qui disent : Moi, j’entends
les sons en couleurs, etc. Olivier Messiaen, que je respecte beaucoup, qui était un grand
artiste, disait que lui, en raison d’une période où il avait eu très faim dans un stalag, ses sens
s’étaient un peu mélangés et il voyait des couleurs mentales en entendant des accords. Lui,
ce n’étaient pas des sons, c’étaient des accords. Donc il donnait des couleurs aux différents
accords. En musique traditionnelle, les accords sont classés, il y en a un nombre limité. Il
voyait mentalement, disait-il, du violet, du jaune, etc. Je me suis aperçu que beaucoup de
gens ont des associations de couleurs en entendant certains sons. Moi j’en ai en écoutant
les timbres instrumentaux, je ne peux pas m’empêcher de voir des couleurs mentales. Mais
ce ne sont pas des couleurs que je pourrais voir, en fait. Est-ce que c’est partiellement lié
aux mots ? Pourquoi j’entends la flûte en jaune, les violons dans une sorte de bleu-gris ? Je
ne sais pas comment ça s’est structuré, mais je constate en tout cas que tout le monde ne l’a
pas et ça varie complètement selon les individus. C’est la partie complètement fantaisiste :
chacun a sa poésie, mais on ne peut rien en dire d’autre. Quand quelqu’un dit : « J’entends
en jaune », ça passe souvent par le mot jaune dans sa propre langue, c’est quand même
structuré par le langage. La question des couleurs est aussi liée au répertoire des mots
qu’on a. Là-dessus, je glisse une parenthèse, excusez-moi, ça m’a conduit aussi à
m’intéresser aux mots, dans une langue donnée, pour désigner les sons. Le discours tout fait
là-dessus était de dire : en français, il n’y a pas beaucoup de mots, mais peut-être qu’il y en
a beaucoup en langue eskimo… J’ai regardé ça au niveau international et finalement, pour
parler de la langue française, je me suis aperçu qu’il y avait beaucoup de mots, tout
simplement on ne les utilise pas. Des mots que tout le monde comprend, d’ailleurs. Les mots
crisser, crissement concernent le son : un crissement dans la neige, la craie sur le tableau…
Ça désigne une perception assez précise. Mais ça fait partie de ce qu’on appelle le
« vocabulaire passif ». C’est déjà bien que les gens l’aient à l’état de vocabulaire passif,
c’est-à-dire que s’ils lisent ça dans un livre de Flaubert, ils le comprennent. Mais je suis
frappé par le fait que des gens qui travaillent sur le son, dans des livres, n’emploient jamais
le mot crissement. C’est idiot, puisque le mot existe et qu’il désigne quelque chose
acoustiquement très précis. Donc une des parties du problème, ça ne serait pas d’inventer
des mots, de dire : j’arrive, voici des tas des mots nouveaux ! Ce serait de dire : qu’est-ce
qu’il y a dans la langue ? J’ai commencé – mais ça me mène assez loin et je n’ai pas encore
terminé – un inventaire des mots sur les sons dans pas mal de langues, et je vous assure
qu’il y en a beaucoup. Il y en a des centaines en français. Certains sont compris par tout le
monde, à condition qu’on ait un peu de lecture, bien sûr. S’ils ne regardent que la télévision

10
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

et s’ils ne lisent jamais, ils ne connaîtront pas le mot crissement. C’est un des problèmes
actuels. C’est pour ça que je dis à mes étudiants : « Lisez, lisez ! Mais lisez des romans, ne
lisez pas seulement… » À la télévision, il n’y a jamais de mots sur les sensations. C’est
normal, puisqu’on se dit : ce n’est pas la peine de nommer les sensations, elles sont là, elles
nous sont données. On peut se créer une culture à partir des sensations, nombreuses,
données par le cinéma, à mon avis, que si on mobilise les mots. Mais ça ne sert strictement
à rien de créer des mots nouveaux à partir du moment où les mots sont déjà là. Il faut activer
la langue. La langue française est riche en mots sonores, la langue allemande aussi, la
langue anglaise aussi. Chacune apporte quelque chose de différent, parce qu’il y a des mots
spécifiques, intraduisibles, en allemand, comme le mot rauschen/Rauschen, qui est un verbe
ou un substantif (en allemand, on peut substantiver les verbes). C’est un mot intraduisible,
c’est un bruit collectif. Autant dire Rauschen, comme dans certains domaines on emploie le
mot anglais ou le mot français. Pour certaines choses, c’est un mot international, un mot
français, anglais ou allemand. Ceci peut nous mener loin, cette mobilisation des mots sur les
sons.
Où en étais-je ? À la synesthésie. Moi, je dis qu’on ne peut pas en faire grand-chose pour
étudier le rapport son/image, parce que ça varie selon les individus. Ce n’est pas quelque
chose que j’ai décrété, j’ai simplement lu ou interrogé des gens : qu’est-ce que vous voyez ?
qu’est-ce que vous entendez ? Je constate que ça ne doit pas être complètement arbitraire,
mais en tout cas c’est très variable, tandis que certaines choses sur les relations son/image,
c’est toujours la même chose. Quelle est cette fameuse partie naturelle des rapports
son/image, c’est-à-dire qui est liée au fonctionnement de notre perception ? Une chose toute
bête, qui est d’une banalité telle qu’on n’y fait plus attention, mais il faut partir de là, c’est le
synchronisme. Nous sommes ainsi faits, tous sur terre, que si un phénomène sonore et un
phénomène visuel se produisent simultanément, pour nous, à un certain niveau, c’est la
même chose. Secondairement, il y a une partie visuelle et une partie sonore, mais ça va
ensemble, c’est comme un bloc, quelque chose qu’on ne peut pas démêler, défaire. Si par
exemple je faisais un numéro amusant, improvisé : si je pose un gros objet par terre et qu’en
même temps qu’il atterrit sur la table il y a un autre son, une note qui arrive, c’est la même
chose. Pour tout le monde, moi y compris. On a beau essayer de faire fonctionner des filtres,
se dire : je sais bien que, mais ça fonctionne quand même, c’est une seule perception. On
fait des gags dans les films, quelqu’un marche sur le sol et on entend des notes. On se dit :
là, je ne confonds pas, c’est une note faite par un piano ou une harpe. Mais pour nous, c’est
la même chose, il y a quelque chose de soudé, pour une raison idiote qui est la
synchronicité. Cette synchronicité est bien sûr relative, approximative. Tout ce qui est réel
est approximatif. Si c’est un peu décalé d’un vingtième de seconde, c’est toujours synchrone
pour nous. Si c’est un peu trop décalé dans le temps, ça ne l’est plus. Donc c’est
approximatif, il y a une marge d’approximation. Mais cette marge ne prouve pas que c’est
arbitraire ou que ça n’existe pas, ça veut dire qu’il y a une marge d’approximation, comme
pour tout phénomène physique, psycho-physiologique, tout ce que vous voulez. Vous savez
que le son est lent par rapport à l’image. Le son, c’est 340 m/s en milieu aérien, c’est très
très lent. Quelqu’un qui est au fond d’une salle de cinéma (on le sait depuis longtemps), le
son arrive avec retard. Dans une salle de concert, c’est classique, on voit le timbalier partir

11
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

un peu vite, un peu tôt. Pourquoi il n’est pas synchrone avec le son qu’on entend ? Parce
que lui sait que, pour être synchrone, il doit tenir compte de ce décalage. Le son va arriver
un peu plus tard. Comme l’image du timbalier arrive un peu plus tôt, il est forcément en
avance. C’est tout bête, on connaît ce phénomène. Dans cette marge-là, quand même, on
peut parler de synchronisme, même s’il y a un petit décalage.
Qu’est-ce qui en découle ? Il en découle tous les rapports du visuel possibles au cinéma,
c’est-à-dire que c’est merveilleux parce que ça nous permet de mettre un son complètement
nouveau à la place du son qu’il y avait éventuellement dans la réalité, et ça marche aussi.
Tout le monde sait que c’est la base du doublage. C’est la base du doublage dans une autre
langue, mais c’est aussi la base de la post-synchronisation. C’est une réalité objective :
encore aujourd’hui, 80 % des films qu’on voit, moins maintenant à cause des micro-
émetteurs, mais 75 % des films qu’on voit, même si c’est du son réaliste, le son a été refait
après. C’est de la post-synchro, dans la langue d’origine, la langue du film. On a tout refait le
son après, on a recalé tous les sons, et ça marche. C’est merveilleux, et en même temps ça
crée une sorte de brouillard qui empêche d’apprécier le rapport son/image en tant que
rapport puisque justement ça se fond tellement bien, tellement le son et l’image sont
synchrones, qu’on trouve ça tout naturel et on ne se pose pas de questions. Ça marche.
Bien sûr, si on fait un gag de décalage, par exemple si on donne une voix d’homme à un
corps de femme, on a fait ça depuis le début, on se dit : d’accord, il y a un truc. Mais si vous
prenez un acteur qui parle et vous entendez une voix bien synchrone, dans la même langue,
de genre masculin si l’acteur est masculin, vous vous dites : c’est bon, c’est sa voix. Mais
non, ce n’est pas forcément sa voix, c’est autre chose, c’est une combinaison particulière.
Sauf que ça ne peut pas être perçu comme un intervalle puisqu’il n’y a plus d’intervalle. Il n’y
a plus d’intervalle entre le son et l’image, c’est une seule et même chose. Ça semble naturel.
Énormément de choses qui sont très élaborées, très pensées, très fortes, qui sont au service
du film, ne sont pas du tout perçues comme un effet rhétorique parce que justement ça
fusionne, ça fusionne tout de suite dans la perception en raison du synchronisme. C’est un
moyen merveilleux pour inventer des tas de choses, et à peu près tous les grands
réalisateurs s’en sont servis, et en même temps ça fait que beaucoup de choses
magnifiquement fabriquées en salle de montage ne sont pas perçues comme une création,
on se dit que ça va de soi : j’entends le son de ce que je vois et je vois l’image que j’entends.
Donc il n’y a pas cette chose qui serait équivalente à un intervalle. Ça a conduit certains
théoriciens, cinéastes à dire : on va faire des choses seulement désynchronisées, seulement
en décalage. Oui, pourquoi pas ? Des fois, ça donne des choses intéressantes. D’autres
fois, ça crée une sorte de rhétorique de la contradiction. Par exemple, on peut faire tomber
un objet énorme et ça fait un petit son délicat et cristallin. Il y a une sorte de catalogue de
contradictions, vous en avez trois ou quatre, pas cinquante : au niveau du genre (en anglais,
gender), masculin ou féminin ; contradiction de poids, etc. Au bout de sept ou huit exemples,
on est arrivé à ce catalogue-là. Par contre, le catalogue des choses créatives comporte des
centaines de procédés, mais ils ne sont pas perçus en tant que tels. On a affaire ici à un
procédé d’expression qui ne peut absolument pas être perçu comme une rhétorique, comme
un langage. J’ai été frappé par le fait que moi je trouvais qu’il y avait beaucoup de choses
intéressantes dans le son au cinéma, mais beaucoup de gens disaient : on n’a rien fait. Moi

12
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

je trouvais que si. Du fait que je fais de la musique concrète, j’ai quand même une certaine
expérience de créer des sons, de voir ce que ça donne. Ensuite, j’ai créé des images, j’ai fait
des films. Et je me disais : c’est fou, en fait, il faut vraiment se mettre devant sa télé et
couper le son pour se rendre compte de tout ce que ça apporte. Ça apporte, mais ça
fusionne.
J’ai donné un nom à ce phénomène de fusion, de sensation sonore et de sensation visuelle
concomitantes, tombant au même endroit, j’ai appelé ça synchrèse. C’est un mot simple, une
sorte de mot-valise entre synthèse et synchronisme. Et puis voilà. C’est vrai que pour moi
c’est une acquisition d’avoir créé ce mot, je trouve que ça apporte quelque chose. Parfois,
j’ai trouvé un ou deux articles : « Michel Chion dit ça, mais c’est complètement culturel. »
Pas du tout, ce n’est pas culturel. Ce n’est pas culturel dans le sens où ce n’est pas lié à une
certaine culture, à un certain stade de l’humanité. Peut-être que ça évoluera, on verra, mais
ça évoluera avec l’espèce. Donc il y a des aspects naturels, on peut le dire dans ce sens-là.
Pour d’autres choses, c’est plus culturel, bien sûr. Pour moi, c’est une acquisition – très
modeste – de dire que la question des rapports son/image est largement traversée,
conditionnée par le fait que beaucoup de rapports, ce n’est même plus un rapport, parce qu’il
n’y a plus la distance, la perception de la distance qui fait qu’il y a un rapport. On peut dire :
entre telle et telle note, j’entends l’intervalle. Et là, il n’y en a pas. En même temps, bien sûr,
si on dit : « les sons et l’image »… J’ai dit plusieurs fois que le cinéma, c’est un lieu d’images
et des sons. Pas un lieu d’images et de sons, attention, il n’y a pas de lieu de son. Ça veut
dire que les sons qu’on perçoit dans un film, qu’on reçoit et qu’on perçoit, ils n’ont pas de lieu
à eux. Le son qu’on entend dans l’espace n’a pas de lieu précis. C’est là où on entre dans
des problèmes très intéressants, sur lesquels il y a une certaine confusion, c’est que souvent
on écrase la question du lieu du son sur la question du lieu de sa source. On dit : le son est
là. Non, il n’est pas là. Le son est là où quelqu’un pose le pied par terre. Non. La cause du
son, oui, mais le son, physiquement, il est dans la pièce, c’est comme un gaz. Donc il y a
des auteurs très consciencieux, notamment Roberto Casati et Jérôme Dokic, qui se prennent
la tête – c’est une bonne chose – sur la question : où est le son ? C’est une question
intéressante, mais si on assimile le lieu du son et le lieu de la source du son, on n’est pas
sortis de l’auberge, parce que ce n’est pas du tout la même chose. C’est un fait observé des
millions de fois tous les jours (sans quoi, d’ailleurs, le cinéma ne serait pas possible) que,
quand on voit quelque chose frontalement sur un écran ou même devant soi et qu’on entend
un son qui vient de derrière nous ou d’à côté de nous, donc d’une autre provenance que ce
qu’on voit, si ce son est synchronisé avec ce qu’on voit, on va malgré tout l’entendre venir de
ce qu’on voit. C’est-à-dire que le son est attiré, au niveau spatial, par l’image de ce qui
semble être sa source, source réelle ou préfabriquée. Tout le monde fait l’expérience de ça
en avion maintenant : pour ne pas déranger les autres, on a un casque qu’on met sur les
oreilles pour suivre le son du film. pendant deux ou trois minutes, on a du mal à se dire que
ce qu’on entend dans nos oreilles, c’est le son du film, mais au bout de deux ou trois minutes
ça s’est rebranché dans le cerveau. Il y a un phénomène que j’appelle l’« aimantation
spatiale » du son par l’image. Attention, si ce n’est pas synchrone, c’est autre chose. Mais à
partir du moment où c’est synchronisé, le phénomène de synchronisme est tellement fort
qu’on se dit : ça vient de ce que je vois. On a beau le savoir intellectuellement, se dire :

13
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

« attention, ce son est dans mes oreilles, il est là »… J’ai constaté que ça marche aussi
quand le son est derrière vous. Une fois, j’ai un ami qui faisait un ciné-club chez lui, qui louait
des films 16 mm. Je le voyais qui sortait son petit écran et le haut-parleur. « Attention, si tu le
mets derrière, ce ne sera pas le son du film ! » Mais ça marchait aussi. Pendant deux
minutes, on entendait le son qui venait de derrière et l’image était devant, et puis au bout de
deux ou trois minutes ça venait de devant. Sauf, petite exception, si le son se déplace entre
des haut-parleurs ou dans l’espace. Quand un son se déplace dans l’espace, soit parce qu’il
va autre part, soit parce que la source se balade (une voiture qui passe derrière vous), nous
sommes conscients de la provenance réelle. Mais si le son cesse de se déplacer dans
l’espace, si sa source est fixe, nous aurons tendance à ne pas reconnaître sa provenance et,
s’il est synchronisé, à l’entendre provenir de ce que nous voyons. Donc, c’est une sorte de
paradoxe, si vous voulez qu’un son soit entendu en relation avec le lieu géographique de sa
source réelle, il faut qu’il bouge, il ne peut pas être immobile. C’est ce qui explique que, dans
les premières années où on a fait le son en Dolby dans les salles, où il y avait des
promenades du son, des sons d’hélicoptères, etc., les gens disaient : ça ne marche pas, je
n’arrive pas à rapporter le son que j’entends à ce que je vois. Oui, parce que c’est du son
mobile. Mais à partir du moment où les sons ne se déplacent pas trop dans l’espace, ils
peuvent venir de derrière vous, du plafond, etc., et s’ils sont synchronisés… Ce sont des cas
bien différents. Ce sont de petites acquisitions, des petites choses que je suis content d’avoir
trouvées et formulées. Ça ne fait pas un système, ça fait une série d’observations qui pourra
me permettre d’avancer. Ça veut dire qu’on est vraiment dans du concret, on ne peut pas du
tout penser à la question de la provenance du son et du lieu du son de la même façon si ce
son se déplace dans l’espace pour nous ou s’il ne se déplace pas. Nous avons deux cas de
figure, qui peuvent se combiner dans un même film, puisque dans un même film vous avez
souvent à la fois un son qui ne bouge pas et un son qui bouge dans l’espace, sans arrêt.
Vous remarquerez d’ailleurs que, quand vous avez affaire à un film, une émission de
télévision ou une vidéo, vous avez souvent devant vos yeux un lieu « diégétique », comme
on dit dans le jargon, c’est-à-dire qui fait partie d’une scène d’action, un niveau diégétique à
la fois, mais au son vous pouvez très bien avoir en même temps une musique qui vient de
nulle part (la musique non diégétique), les dialogues des personnages qui marchent et une
ambiance qui est censée environner les personnages. Vous avez trois ou quatre niveaux
très différents, et ce sont des sons. J’ai formulé ça d’une autre manière en disant : il n’y a
pas de bande-son (autre formulation négative). C’est-à-dire que l’expression « bande-son »
ne veut strictement rien dire dans le rapport audiovisuel. « Bande-son », ça nous remet dans
le cas où il y aurait le lieu des sons, et la musique et les dialogues qui sont en même temps
que la musique, et les bruits, ils auraient quelque chose à voir les uns avec les autres sous
prétexte que ce sont des sons et que c’est inscrit matériellement sur un support, qui existe,
qui est maintenant de plus en plus un CD mais qui est aussi souvent le son optique sur
pellicule. Là, il y a un lieu d’inscription des sons, mais ce n’est pas pour ça que pour nous il y
a un lieu des sons. C’est pour cela qu’il n’y a pas de bande-son. Les sons, c’est chacun pour
soi. Certains sont reliés à ce qu’on voit, etc. C’est comme ça. Le singulier « le son », qui
conduit à parler de « bande-son », c’est une sorte de mythe. C’est comme si on disait : on va
donner au son une dignité en lui mettant un article défini, le son. Puisqu’il y a la bande-

14
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

image, on pourra dire qu’il y a la bande-son. Mais ça ne veut strictement rien dire. Alors du
fait que j’ai formulé ça ainsi, il y a eu parfois des malentendus, on a dit : Michel Chion est en
train de dire que le son est au service de l’image, ou est moins important que l’image. Ce
n’est pas le problème. On n’est pas du tout dans le problème de savoir qui est plus important
que qui. Les deux choses sont intéressantes. C’est aussi faux de dire ça que de dire : dans
la musique pour piano, est-ce que la main gauche est plus importante que la main droite ?
C’est une question qui n’a aucun sens. Évidemment, si on pose suivant ce modèle de
répartition des pouvoirs, de balance entre les pouvoirs, les rôles, on n’en sort pas. Moi je
dis : il faut sortir de ça. Mais c’est un fait qu’il n’y a pas de bande-son, en tout cas au niveau
perceptible, au niveau qui compte ; par contre, il y a bien un lieu d’image. Donc on peut
commencer à penser les rapports son/image.
Maintenant, évidemment, il y a la question esthétique. Elle est liée à ça […]. Il y a des livres
qui ont montré en quoi des tableaux, qu’on pouvait penser être des reproductions ou des
imitations de la réalité, étaient en fait un langage (Pierre Francastel, par exemple). Pour le
cinéma, c’est la même chose. Certains films muets sont rigoureusement incompréhensibles
pour quelqu’un d’aujourd’hui s’il n’a pas vu d’autres films muets, s’il ne s’est pas intéressé à
ça. Par contre, s’il en voit un certain nombre, il va finir par comprendre, et surtout s’il lit des
bouquins. C’est la même chose pour le cinéma sonore actuel. Quand je passe à des
étudiants un film des années 1960, déjà ils ne comprennent plus. Enfin, « comprendre »
n’est peut-être pas le mot, disons que des choses passent différemment pour eux que pour
moi. Je vous donne un exemple : dans les années 1960, il était très courant d’avoir des films
où le son est rare, c’est-à-dire où il y a un son à la fois, pas cinquante. Il y a des films
d’Antonioni ou de Jean-Pierre Melville (je cite volontairement des auteurs très différents) où
vous avez à un moment donné une mouche, bzzzzzz, et puis le pas de quelqu’un. Un son à
la fois et pas beaucoup. Il y a une période silencieuse, une période de discrétion sonore très
caractéristique entre 1965 et 1970, c’est très curieux. J’ai vu ça en regardant des centaines
de films. En 1967-1968, vous avez des films qui sortent et qui n’ont rien à voir
apparemment : Playtime de Tati, 2001 de Kubrick, Il était une fois dans l’Ouest de Sergio
Leone et un film de Melville, je ne sais plus lequel [Le Samouraï, en 1967]. Point commun de
ces quatre films si différents : le son est rare, vous avez un son à la fois, il y a une sorte de
côté dénudé au niveau du son. Mais aujourd’hui où on est habitués à des films avec
beaucoup de sons ensemble, dans tous les genres de films, ce climat fait une sorte
d’austérité, de perception austère qui d’ailleurs peut plaire. C’était le ton de l’époque. De la
même façon, si quelqu’un écoute aujourd’hui du clavecin, ça sonne comme un instrument au
son faible, parce qu’on entend des sons beaucoup plus forts, mais au temps où on jouait
couramment du clavecin, non. Ce sont des choses qui vieillissent, qui changent. Il y a
évidemment une perspective historique qu’il faut avoir, et dans cette perspective historique il
ne faut pas croire que c’est qui que ce soit, Lynch ou Godard, qui va inventer le langage
audiovisuel, ça s’invente au fur et à mesure, comme ça peut. L’invention d’un langage
audiovisuel est quelque chose de collectif. Les grands artistes en font quelque chose, mais
c’est une sorte de trésor commun qui s’enrichit de tas de choses. Il y a des tas de films dont
on a oublié le titre et qui ont apporté quelque chose, des procédés de langage. C’est une
histoire collective. Moi, une des choses auxquelles je tiens dans mon enseignement, c’est de

15
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

dire : on ne va pas considérer que c’est cinq auteurs, si précieux soient-ils, comme Godard
ou Kubrick, qui ont inventé ça, ce n’est pas possible. Un langage ne s’invente pas comme
ça, c’est une construction collective – et parfois inconsciente. Ça crée peu à peu ce qu’on
appelle « un langage », je ne sais pas si ça veut dire quelque chose, en tout cas une série
de choses qui elles-mêmes sont dans une histoire. Ça veut dire que, tous les vingt ou trente
ans, les choses deviennent de moins en moins compréhensibles. Il y a des choses qui
restent, qui font qu’un film de Renoir des années 1930 reste accessible aujourd’hui, mais il y
a des tas de choses qu’on comprend totalement différemment, à moins de bien connaître le
cinéma des années 1930 et de voir beaucoup de films. À ce moment-là, on comprend la
valeur des choses différemment.
Voilà, j’ai couvert une certaine surface. Parfois, je l’ai fait un peu dans le désordre, mais
j’espère que je l’ai à peu près couverte dans cet espace de temps.

François SOULAGES : On me dit que vous vouliez passer des images…

Michel CHION : Oui, mais je me suis trompé de cassette, alors je n’ai pas d’images. Je vais
vous raconter ce que je voulais vous passer, c’est assez facile à raconter, et ça me
permettra de compléter certaines choses. Je vais vous passer un extrait des Oiseaux de
Hitchcock, une scène bien précise que j’ai utilisée en couverture de mon livre Un art sonore :
le cinéma. Pourquoi j’ai pensé à cette séquence ? C’est une séquence où le personnage
féminin, la blonde (Melanie) jouée par Tippi Hedren, s’assied sur un banc, en plein air, et
derrière elle des oiseaux noirs s’accumulent. Elle n’y fait pas attention, mais c’est un moment
du film où des oiseaux ont déjà attaqué des humains, donc si elle les voyait, elle
s’inquiéterait et, comme elle est à proximité d’une école avec des enfants, elle rentrerait tout
de suite dans l’école pour interrompre le cours qui a lieu (c’est plutôt une répétition, les
enfants sont en train de seriner une comptine du genre irlandais). Le découpage de
Hitchcock fait qu’on voit un oiseau noir se poser sur un portique derrière elle, ensuite quatre
oiseaux, puis on revient sur la femme. Alors le spectateur est en train de calculer combien il
peut y avoir d’oiseaux, sachant que… Il y a une espèce de mathématique mentale qui se
crée. À un moment donné, Melanie voit un oiseau dans le ciel, elle le suit, en le suivant elle
tourne la tête et derrière il y a une centaine d’oiseaux. Qu’est-ce qu’on a entendu pendant
cette séquence ? Certes pas le flap-flap des ailes des oiseaux, certes pas ! Si on les
entendait, on dirait : pourquoi elle ne les entend pas et qu’elle ne se retourne pas ? Quel est
le prétexte diégétique qui fait qu’elle ne l’entend pas et que nous ne l’entendons pas ? C’est
parce qu’il y a des enfants qui chantent et le son des voix d’enfants est censé « couvrir » le
flap-flap des ailes. En fait, il ne le couvre pas du tout dans la fabrication du film. Vous savez
que dans les films aucun son ne couvre un autre, on peut mettre autant de sons qu’on veut.
Puisque c’est électro-acoustique, vous pouvez faire entendre en même temps le bruit délicat
d’un pétale de rose qui tombe et un bruit énorme. Si vous les mixez, il n’y a aucune
référence à un univers naturel. Et ce n’est pas valable uniquement pour les films. Aujourd’hui
que vous avez des micros, il est certain que l’équilibre entre tel et tel son n’a plus rien à voir
avec l’équilibre naturel des sons. Dans bien des cas, vous avez une transmission, une
amplification de certains sons par rapport à d’autres, donc l’acoustique naturelle n’a plus

16
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

grand sens dans ce contexte-là. Donc, si dans le film de Hitchcock, on n’entend pas le flap-
flap des oiseaux, ce n’est pas du tout parce qu’il est couvert par le son des enfants dans la
fabrication du film, c’est qu’il n’y est pas. Il y a un chercheur américain qui avait tellement
envie d’entendre ce son des ailes d’oiseaux qu’il a fini par l’entendre et il a dit : si on pousse
le son très très fort, on finit par l’entendre. Évidemment, on entend du souffle et on peut
imaginer… En fait, on ne les entend pas du tout. Et pourtant, ce son qu’on n’entend pas est
très important, parce que ce n’est pas parce qu’on ne l’entend pas qu’on ne l’imagine pas.
Chaque fois que vous voyez ça, vous imaginez un son. J’ai constaté ça des dizaines de fois
avec mes étudiants. Il y a des sons qu’on n’entend pas, mais ça n’empêche pas de les
imaginer. Je dis que ce son qu’on imagine sans entendre est aussi important, dans l’analyse
audiovisuelle de cette séquence, que les sons qu’on entend. Si vous analysez une séquence
audiovisuelle, il sera très important de se poser la question des sons qu’on n’entend pas au
même titre que les sons qu’on entend. Mais ces sons qu’on n’entend pas, en quoi peut-on en
parler ? Parce qu’ils sont suggérés par l’image. Des oiseaux battent des ailes, d’accord.
Quelqu’un marche, est-ce que j’entends ses bruits de pas ? On ne les entend pas. C’est une
remarque intéressante de dire qu’on ne les entend pas puisque ce son est quand même
présent. Par exemple, dans des tas de films de Fellini, vous n’entendez pas les gens
marcher. Vous les voyez marcher, mais vous ne les entendez pas marcher. C’est pourtant
un son important, puisque justement cette absence de sons de pas joue un certain rôle, c’est
un effet expressif. Mais on ne peut pas en rendre compte en disant : il y a les sons et il y a
les images. Les sons de l’image qu’on n’entend pas, les sons fantômes, suggérés par ce
qu’on voit, jouent un rôle aussi important, pas plus, mais aussi important que les sons qu’on
entend. Ici, le son de la comptine des enfants joue un rôle très important, et à différents
niveaux, mais le son des ailes des oiseaux qu’on n’entend pas joue un rôle. Il est suggéré
par l’image, bien sûr : si on ne voit pas non plus de source, il y a des tas de sons qu’on
n’entend pas dans cette séquence, on ne va pas en parler. Par contre, on voit bien des
oiseaux voler et il y a bien la représentation mentale d’un son possible. Je suis persuadé de
ça, je ne l’ai pas encore démontré, mais je pense que chaque fois qu’on voit un mouvement,
on a une sensation sonore mentale, comme quelque chose en creux qui existe. Ça explique
d’ailleurs pourquoi, quand vous avez des films avec des gens qui font de l’escrime, les gens
qui font de l’escrime pour de vrai le savent, ça ne fait pas tout le temps fuiiii fuiiii fuiiii, mais
au cinéma on en a besoin et on trouve ça tout naturel que les mouvements produisent des
sons. Dans beaucoup de films récents, quand la caméra bouge, ça fait fuiiii et ça semble tout
naturel. Par exemple, pour les yeux, il y a un mouvement sonore quelque part, soit qu’on
entend réellement, soit qu’on n’entend pas mais qu’on imagine, avec éventuellement la
contradiction entre l’un et l’autre, celui qu’on imagine et celui qu’on entend. Tout ça est
important, et ça provient de l’image, donc il est rigoureusement impossible d’analyser le
rapport audiovisuel en disant que le son n’est que dans ce qu’on entend et le visuel que
dans ce qu’on voit. Parce que évidemment, inversement, le son nous fait représenter des
images mentales. Mais ces images ne sont pas quelque chose qu’on voit avec ses yeux. Par
exemple, quand quelqu’un entend un son de chien. Je fais de la musique concrète et parfois
il m’arrive de mettre un aboiement de chien à côté d’un son de synthétiseur. C’est une sorte
de touche de réel que je mets dans beaucoup de mes musiques. C’est amusant, d’ailleurs,

17
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

parce qu’on se demande d’où il vient. Des gens disent : « Ça me fait venir des images de
chien. » Je dis : « Vous dites que vous visualisez un chien mentalement. À ce moment-là,
est-ce que c’est un caniche ? Si vous dites que vous le voyez, comment est-il, ce chien ? »
Donc c’est une image, mais pas au même sens que celles qu’on voit, c’est « le chien ». C’est
pourtant une image mentale. Toutes ces choses-là sont importantes. Ça veut dire aussi que,
pour analyser les rapports audiovisuels, il faut se poser la question (c’est valable aussi
quand on fait des films) des sons (?) qu’on entend ou qu’on n’entend pas. Ça, c’est très
intéressant. Voilà, c’est ce que je voulais ajouter. Cet exemple-là, qui est facile à raconter,
vous pourrez le trouver dans le film Les Oiseaux, qui est un film extraordinaire, c’est 45 mn
après le début, la fameuse séquence sans paroles de Melanie devant l’école avec les
oiseaux derrière elle, c’est une séquence très facile à trouver. C’est une séquence sans
paroles et d’une nudité sonore, encore une fois… C’est 1962-1963, les années 1960. Il y a
eu un courant, il y a eu beaucoup de films avec peu de sons. Un film comme L’Éclipse
d’Antonioni, le son est épuré de façon incroyable. Mais à l’époque, ça ne le faisait pas
autant, je me rappelle, parce que énormément de films étaient faits comme ça. Dès que les
personnages ne parlaient plus ou qu’il n’y avait plus de musique, il y avait une sorte de bruit
de fond et c’est tout. Tandis qu’aujourd’hui ces films semblent silencieux. C’est le côté
historique qui a changé.

François SOULAGES : Merci beaucoup. On va vous poser quelques questions. Justement, en


vous entendant, je pensais à quelque chose mais vous avez embrayé dessus en discutant
des images des Oiseaux. Je voulais vous interroger sur ce son qu’on pourrait appeler
« réel » ou « entendu », et son « imaginaire ». Je ne sais pas si vous utilisez exactement
cette notion de « son imaginaire », mais ça me paraît extrêmement riche. On pourrait
quasiment parler de « son intérieur ».

Michel CHION : Je dirais un son « en creux ». Dans la version anglaise de certains de mes
textes, ça a été traduit par phantom sound. Il n’est pas imaginaire dans le sens où c’est une
sorte de fantaisie personnelle. Il est là, mais il est en creux. Il s’inscrit dans le creux par
exemple du mouvement des oiseaux. C’est un son creux qui se loge par exemple
rythmiquement dans ce qu’on voit, c’est-à-dire qu’on ne l’imagine pas en dehors des cadres
rythmiques donnés par l’image. C’est comme un moule.

François SOULAGES : Est-ce que vous accepteriez de passer de l’analyse que vous avez
faite du cinéma, de l’audiovisuel, du statut du son, à une utilisation de ces grilles d’analyse
pour comprendre peut-être l’histoire de la littérature, en tout cas l’histoire de la production et
de la réception de la littérature ? Je veux dire par là qu’il fut un temps où la littérature était
d’abord orale, c’est-à-dire qu’on la prononçait, on l’écoutait, c’était quelque chose qui existait
en groupe. Et puis l’écriture a pris de plus en plus de place et s’est parfois même substituée
à l’écoute du poème ou du texte. Est-ce que dans cette lecture, qui est à la fois une lecture
qui rompt avec l’écoute et avec la prononciation, et qui rompt aussi avec le fait que ça
devient un exercice personnel, solitaire, et ça change beaucoup les choses… Dans cette
lecture personnelle, il y a l’apparition à nouveau d’un son intérieur, c’est-à-dire qu’on va avoir

18
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

une lecture à voix basse, voire une lecture intérieure. Est-ce qu’on peut être dans un texte
sans sons, sans sons personnels, sans cette réaction ? Un peu comme ce que vous disiez
tout à l’heure, qu’on associait parfois, avec tout ce que ça pouvait dire, des couleurs à des
notes de musique ou à des accords.

Michel CHION : C’est vrai que j’aurais dû en parler. Le logos, le langage. Il est certain que si
on dit « le son et l’image » par rapport au cinéma, on ne parle pas d’une chose qui est
tellement importante et dont je n’ai pas parlé du tout, c’est quand il y a du langage. Ça peut
être pour les yeux, pour les oreilles ou pour les deux, le même texte ou d’autres textes. Pas
seulement chez Godard, où il y a beaucoup de texte à lire. Effectivement, quand c’est le
langage, c’est en soi-même tout un monde de questions. La plupart des films dits
audiovisuels sont audio-logo-visuels. Les films sans paroles, sans mots ou sans langage,
que ce soit à lire ou à entendre, sont rares. Ça ne veut pas dire qu’ils ne sont pas importants.
Là, je fais des statistiques. Il faudrait parler de ça. En effet, est-ce que le langage est une
sphère de questions complètement indépendantes des questions sonores et audiovisuelles ?
Partiellement ? C’est très compliqué et c’est riche. Est-ce que, quand on lit un texte, on est
dans quelque chose de visuel ? Dans la langue française, avec le système alphabétique, on
a du sonore. On a surtout appris à lire par rapport à des mots. Par exemple, si je lis le mot
temps, on ne prononce quasiment rien. La graphie et le son en français se sont
incroyablement éloignés, par rapport à d’autres langues comme l’italien où on prononce plus
les lettres qu’on écrit. Pour chaque langue, c’est différent. En français, c’est la spécialité,
vous avez des orthographes très particulières pour des mots. Mais en même temps il y a
quelque chose qui colle au son, on ne peut pas séparer complètement les choses. Il y a
toute une histoire évidemment très complexe : quand on lit, on entend une voix en soi, il y a
une endophonie de la voix. On n’en a pas conscience, mais on a une voix en soi qui lit. Cette
voix, c’est de la voix incorporée aussi des adultes ou des autres. Et puis il y a la question,
soulignée par Derrida, mais il s’est vite arrêté sur cette question parce qu’il voulait à tout prix
prouver quelque chose. Il parle de « s’entendre parler ». Quand on s’entend parler, c’est
homogène, c’est un phénomène de complétude, etc. Pas du tout. C’est très compliqué, de
s’entendre parler, et surtout c’est très gênant. Vous savez que, depuis x décennies, on peut
s’entendre de l’extérieur. C’est une chose importante. Je suis né en 1947, à la fin des
années 1950 il y avait encore peu de magnétophones. J’ai joué enfant avec un
magnétophone et à l’époque c’était assez rare, parce que mon père avait rapporté un
magnétophone d’Allemagne, un gros Grundig assez lourd, au moins 20 kilos. Donc je jouais
avec un magnétophone à une époque où pratiquement personne n’entendait sa voix, sauf
évidemment les professionnels. Alors tout de suite on se dit : « Mais c’est ma voix, ça ? »
C’est une expérience que maintenant tout le monde fait avec les vidéos, les répondeurs, etc.
Tout le monde l’a fait, et à un âge précoce, quasiment tout le monde. On s’habitue à ça, mais
des fois on se dit : « C’est ma voix ? C’est horrible ! » Elle est toujours plus aiguë que celle
qu’on imagine. Donc le « s’entendre parler » est quelque chose d’assez complexe, qui n’est
pas du tout cette plénitude, cette complétude. Ça intervient dans le phénomène de la lecture
et c’est un phénomène multicouche (je réponds rapidement là-dessus). Il est certain que,
quand on lit quelque chose, ce n’est pas entièrement spatial puisque c’est linéaire, mais en

19
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

même temps c’est spatial. Par exemple, moi j’aimais bien – j’aime toujours – lire des
poèmes. Je me suis demandé pourquoi j’aime lire certains poèmes. C’est spatial, un poème,
à partir d’une certaine époque. C’est à la fois auditif et spatial, je crois que ça ne s’est jamais
complètement séparé du son. Et en même temps c’est autre chose. Je parle de la poésie
parce que justement ça distribue des mots dans l’espace. Les versets claudéliens, pourquoi,
à quoi ça sert ? est-ce que ce n’est pas un découpage arbitraire ? Et puis la rime dans la
poésie. Une bonne partie de la poésie, c’est sonore. Dans la poésie française, à un moment
donné, il fallait rimer pour les yeux et pas seulement pour les oreilles, donc on ne pouvait
pas faire rimer un singulier avec un pluriel, même à une époque où déjà on ne prononçait
plus les s à la fin des mots. Juste ces petits exemples pour dire que c’est assez complexe,
c’est un phénomène qui n’est pas du tout homogène, avec une série de couches, de pelures.
Maintenant, dans le cadre du cinéma, il y a en plus ça, dont je n’ai pas parlé. Je ne sais pas
si j’ai répondu à votre question, je suis plutôt parti… Je pense que c’est multicouche, on ne
peut pas être dans une sorte d’absolu.

François SOULAGES : Mais est-ce qu’il peut y avoir une absence de son, justement ? Est-ce
que, face à un texte, je peux ne pas être dans le son ? et face à une image ? Je vais à une
exposition de photographies, est-ce qu’il n’y a pas un accompagnement intérieur d’un son,
pour chaque récepteur différent ?

Michel CHION : C’est la question du silence, c’est très important. Il y a un compositeur,


philosophe, etc. très important, souvent ce que j’entendais de lui ne m’intéressait pas, mais
sa pensée, oui, c’est John Cage. Une fois, dans une émission réalisée par Michel Fano, il a
dit que ce qu’il préférait entendre, ce qui était pour lui le silence, c’était les voitures, la
circulation qui passe dans une rue assez fréquentée de New York. Je me suis demandé
pourquoi c’était pour lui le silence. C’est quelque chose d’intéressant. Quand on écoute
quelque chose, on a souvent envie d’y projeter une voix, de suivre et d’y projeter une voix.
C’est très difficile, pour l’être humain, d’entendre un son sans y projeter quelque chose de
vocal, on projette de la voix partout. Lui, apparemment ça l’énervait, ou ça l’affectait, le fait
qu’il y ait toujours la voix de quelqu’un. Il y avait peut-être quelque chose pour lui de
persécuteur dans les voix, je ne sais pas. Effectivement, ça peut être persécuteur, les voix :
Jeanne d’Arc, certaines psychoses, le président Schreiber… On a des cas bien connus dans
l’histoire de la psychiatrie et l’histoire de la psychanalyse. Le fameux président Schreiber, sur
lequel Lacan a écrit, c’était un cas de psychose très connu, il entendait des voix. Souvent,
les persécutions, ce sont des voix. Il m’a semblé que John Cage avait un rapport à la voix
qui était assez phobique. Ce n’est pas une critique, quand je dis ça. C’est lui, il n’y a rien à
dire. Mais pour lui c’était une sorte de persécution et ce qui pouvait le mettre dans le silence,
ce n’était pas le silence, parce que le silence ça n’existe pas, vous vous entendez vous-
même. Vous pouvez avoir des sifflements d’oreilles, ce qui est mon cas puisque j’ai des
acouphènes depuis un an, comme beaucoup de gens (il paraît que 15 % des gens ont des
acouphènes). Et même quand on n’a pas d’acouphènes (je me rappelle quand je n’en avais
pas), il y a toujours du bruit, il y a toujours quelque chose. Et si on se met à projeter sur ce
qu’on entend quelque chose de vocal, évidemment on est persécuté par le son, on ne peut

20
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

pas s’en empêcher, on ne peut pas faire le silence, le fameux silence dont on parle parfois
dans la méditation. Mais pour lui, c’étaient les routes. Pourquoi est-ce que les voitures qui
passent, pour lui, ça crée ce silence ? C’est peut-être parce que c’est un son qui est
parfaitement non intentionnel. On peut en suivre un et en même temps il y en a un autre,
donc ça flotte, ça permet de laisser flotter la perception. Ça serait ça, le silence : quand on
peut laisser flotter la perception, qu’on n’agrippe pas un son qu’on entend et qu’on sort de ce
côté persécuteur ou d’une voix qui nous prend. C’est étonnant comme on accroche des voix
sur ce qu’on entend. Je crois que c’est strictement impossible pour l’être humain de ne pas
entendre des voix. Cage ne disait pas ça exactement, je l’interprète dans mon souvenir, mais
il disait : « Les musiques nous parlent, et moi je n’ai pas envie qu’une musique me parle. »
C’est vrai que les musiques nous parlent. Quand on a pris conscience qu’une bonne partie
de la musique occidentale – mais pas seulement occidentale –, c’est de la parole, par
exemple un quatuor de Mozart, si on se met à entendre des gens qui causent, ça devient
persécuteur. C’est très difficile d’échapper à ce côté-là, entendre des voix, mettre du
vocable, du verbal. Peut-être que cette espèce de son qui se recouvre indéfiniment… Mais
ce n’est pas facile, parce que si vous faites entendre à quelqu’un du bruit blanc, ça ne fait
pas le même effet. Donc voilà, l’idéal pour John Cage, c’était ça. Je crois que beaucoup de
gens accèdent au silence comme ça, alors que pour d’autres ce sera autre chose, bien sûr.
Le silence, c’est beaucoup de choses. Certains films récents ont redécouvert ou recréé le
silence justement par le numérique. Je suis critique par rapport au numérique sur beaucoup
de plans. Parfois ça fait des sons très laids, notamment dans les synthèses. Par contre, dans
les films, ça fait parfois des sons très beaux parce qu’on a des vrais silences entre les
phrases, quand les gens parlent. C’est merveilleux d’aller dans des salles de cinéma et de
voir des gens qui souvent sont très bruyants, qui font du bruit avec leur portable, et en fait
quand le film marche, ils sont vraiment silencieux, et authentiquement silencieux, ils ne se
forcent pas. J’ai vu il y a deux ou trois mois un film qui m’a beaucoup ému, et je ne suis pas
le seul, c’est le film Brokeback Mountain. C’est un film qui est assez bouleversant. Il y avait
une séquence où un cow-boy vient dans l’appartement occupé par son ami (son
compagnon, puisque c’est une histoire d’amour), il est là dans une pièce au premier étage, il
regarde les vêtements qui ont appartenu à son amant. Il y avait un silence incroyable dans la
salle, et dans le film aussi. J’ai trouvé ça magnifique. Les gens n’auraient jamais l’idée dans
une église (en plus, les églises sont bruyantes maintenant) pour entendre ça, et là c’est
authentique, c’est un rituel de silence. On entend tout ce qui nous manque à la télévision :
des intervalles, un silence après le film. Sur Arte, c’est horrible, ils cassent le générique de
fin. Je trouve ça d’une barbarie monstre, de casser les silences à la fin d’un film. Par contre,
on va dans une salle de cinéma et on retrouve ça. En fait, il y a aussi le silence au sens du
recueillement des gens qui sont là. L’un des endroits les plus rituels aujourd’hui, ce sont les
salles de cinéma. Pas partout, bien sûr, mais à Paris en tout cas, Dieu sait pourtant si les
gens sont mondains parfois, on aime vraiment le cinéma et on retrouve cette ferveur, ce
silence qui est créé à la fin par le film et aussi le silence que les gens font pour être présents
à ce qui se passe sur l’écran. Ça ne marche pas toujours, mais des fois ça marche et c’est
quelque chose. C’est un autre sens du mot « silence », bien sûr. Mais c’est vrai que le
numérique, enfin le Dolby, a recréé le silence, c’est clair, parce que le rapport signal/bruit,

21
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

c’est-à-dire entre le son et pas de son, est beaucoup plus profond, beaucoup plus creux.
Quand quelqu’un parle, qu’il se tait et qu’il reparle, par exemple. Un film qui m’a beaucoup
frappé aussi à ce niveau-là, c’est Mulholland Drive de David Lynch. Il y a un silence
incroyable dans le film, et peu à peu la salle s’inscrit dans ce silence-là. C’est un film où il y a
quelqu’un qui est dans une salle de théâtre et (?). C’est la recréation du silence. Et pourtant,
pour moi, c’est le contraire absolu de choses que je n’aime pas personnellement (c’est mon
goût), certaines installations sonores où on a des bruits partout, des images partout, et en
fait rien ne se passe. J’ai été très déçu par l’exposition « Le mouvement des images » qui se
tient en ce moment à Beaubourg, c’est une sorte de foutoir (pardon) où il y a cinq films côte
à côte. Chaque film demanderait à être perçu pour lui-même, ce sont des films très précieux,
les projeter côte à côte avec d’autres films et avec des gens qui passent, ça n’a aucun sens,
on perd tout. Pour moi, c’est un scandale. Il y a des recherches audiovisuelles très précises
qui ont été faites par des gens pour être vues dans une salle de projection, on les passe
dans un couloir à Beaubourg, ça défile comme ça, les gens passent devant, comme une
sorte d’installation. Pour moi, c’est du massacre. Tant pis. Enfin, ce sont des films qu’on peut
acheter maintenant en VHS ou en DVD, donc on peut les avoir, alors qu’autrefois c’était
difficile. Il n’empêche que les projeter comme ça, dans un lieu bruyant, avec des projections
entassées un peu partout, pour moi c’est un massacre.

Serge TISSERON : Ça marche ? On a un problème de son…

Michel CHION : Le mot « son » et le mot « problème » sont souvent associés.

Serge TISSERON : On a eu un problème d’image aussi. De ce point de vue, ça s’est bien


confusionné. Merci beaucoup pour toutes ces pistes de réflexion. Je veux juste faire une
remarque qui va apporter de l’eau à votre moulin et vous poser une question, parce qu’il y a
un point sur lequel je suis un peu resté sur ma faim. C’est un vieux problème que je me
pose, alors vous allez peut-être pouvoir m’éclairer. D’abord, pour apporter de l’eau à votre
moulin, cette belle phrase que vous avez dite : le continu, c’est ce qui n’est pas discontinu.
Je vais apporter de l’eau à votre moulin simplement par rapport au développement
psychique du nouveau-né. Le nouveau-né ne commence à s’approprier la durée qu’à partir
de la perception qu’il a de l’espace de son corps, et cette perception est complètement
immergée dans les rythmes. Notre corps est tout entier rythmes, ce qui fait que nous nous
approprions à la fois notre espace intérieur et notre espace environnant à travers des
rythmes, ce qui fait que nous ne pouvons pas concevoir la perception de quoi que ce soit
autrement qu’à travers un rythme. Et, comme vous le dites justement, le continu, c’est ce qui
n’est pas discontinu. C’est-à-dire que le continu se définit négativement par rapport à ce
qu’est notre perception continuelle de nous-mêmes et du monde, à savoir le discontinu.
Vous avez d’ailleurs un livre là-dessus du psychanalyste Nicolas Abraham qui est très bien
fait, qui s’appelle Le Temps, le rythme et l’inconscient. Je vous le dis, parce que la dimension
de l’inconscient était peu présente dans ce que vous avez dit, mais ce sont des choses sur
lesquelles non seulement les bioneurologistes travaillent actuellement, avec les caméras à
positons, des choses comme ça, le rôle des lobes temporaux dans la transmodalité, le

22
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

sonnet des voyelles de Rimbaud, etc., mais en plus c’est un domaine où les psychanalystes
ont pas mal travaillé.
Voici maintenant ma question. Pourquoi, tout au moins dans notre culture, quand on
demande à des gens d’évoquer un film qu’ils ont vu, donc un ensemble constitué de sons et
d’images, pratiquement tout le monde parle d’images ? Alors qu’on sait bien que l’impact de
certaines séquences d’images est lié à la bande-son. Il y a quelqu’un qui l’a très bien dit,
c’est Hitchcock : il a affirmé clairement que dans la scène du meurtre dans la baignoire, dans
son film Psychose, la bande-son est pour beaucoup dans l’impact sur le spectateur. Si on
demande en revanche aux gens de dire ce dont ils se souviennent dans cette séquence, ils
ne vont parler que des images.

Michel CHION : Pour Psychose, tout le monde parle des sons stridents qu’on entend à ce
moment-là.

Serge TISSERON : Vous avez cette expérience, vous ? Moi pas. Alors ma question est la
suivante, justement : est-ce qu’il y a des gens qui ont plus une mémorisation des séquences
à travers les sons, est-ce que d’autres ont plus une mémorisation des séquences à travers
les images ? Est-ce que c’est lié à des personnalités ? Est-ce que c’est lié à des cultures ?
Est-ce que c’est lié à des tranches d’âge ? Est-ce qu’il y a des tranches d’âge dans
lesquelles on aurait une sensibilité plus grande aux sons ou plus grandes aux images ?
Notamment chez les petits, qui aujourd’hui sont d’énormes consommateurs des mêmes
spectacles que les adultes ? Ce ne sont pas des questions en l’air. Quand on veut parler
avec un tout petit, on ne sait finalement pas très bien aujourd’hui ce qui l’a impressionné.
Moi, par exemple, quand je regarde des actualités ou des films animaliers avec un enfant de
2 ou 3 ans, je m’aperçois que ce qui le fait s’éloigner de l’écran parce qu’il est bouleversé,
c’est lorsqu’il y a des ruptures de plan. Quand on voit par exemple un chien courir dans le
lointain et puis le chien courir en gros plan, il a un mouvement de recul. Donc des choses qui
ne font pas bouleversement pour l’adulte, font bouleversement pour l’enfant. J’imagine que
peut-être la perception du rapport son/image est aussi quelque chose de très différent chez
l’enfant de ce qu’il est chez nous autres adultes, et peut-être aussi d’une culture à une autre.

Michel CHION : Vous parlez de « bande-son », mais je l’ai dit, il n’y a pas de « bande-son ».
Prenons la séquence de Psychose. Aujourd’hui, peut-être à cause du disque, du réemploi de
la musique de Bernard Herrmann dans des émissions, il y a des gens qui sont très
conscients de la musique. La musique des films, maintenant, est souvent diffusée
indépendamment. Vous avez une radio en ce moment (que j’écoute de temps en temps,
mais d’autres fois elle m’énerve), Radio Classique, sur cinq musiques qu’ils passent, il y a
une musique de film. Ils ne font pas ça pour rien : il y a beaucoup de gens qui écoutent de la
musique de films, donc ça leur donne une sorte de conscience distincte. Mais évidemment je
n’en déduirai pas pour autant que c’est la musique qui compte le plus, parce que pour moi ce
côté répartition des importances n’a pas de sens. C’est le rapport entre les deux, la
combinaison entre les deux. Je n’ai pas dit qu’ils fusionnaient, j’ai dit qu’une partie fusionnait.
À une séquence donnée, vous avez des choses qui sont synchrones, vous avez des choses

23
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

qui ne le sont pas, etc. Ça fusionne partiellement. Ce fusionnement se traduit souvent en un


souvenir qu’on attribue à ce qu’on a vu. C’est ce que j’appelle la « valeur ajoutée ». C’est un
fait que, dans beaucoup de cas, ce qu’on a entendu influence ce qu’on voit et s’incorpore à
ce qu’on voit au point qu’on peut penser avoir vu ce qu’en fait on a « audio-vu ». Ce qui m’a
fait prendre conscience de ça (on pourrait donner des centaines d’exemples), c’est un film
que j’avais vu petit et que j’ai revu à la fin des années 1970 quand j’ai commencé à travailler
là-dessus. C’est un film de Bresson qui s’appelle Un condamné à mort s’est échappé,
l’histoire d’un résistant qui est enfermé en prison et qui s’évade. Presque tout le film se
passe dans cette prison, avec une sorte de point de vue assez strict qui fait que quand il est
dans sa cellule, on n’est que dans la cellule, la caméra ne sort pas de là où il est, donc
partage ce point de vue. J’étais persuadé que, dans ce film que j’avais vu à 10 ou 12 ans, il y
avait d’immenses images en perspective de la prison avec des couloirs. Et quand j’ai revu le
film avec des étudiants, j’ai dit : « On va regarder, on va le revoir. » Il venait de passer sur
une chaîne de télé, donc on l’avait copié sur le magnétoscope. On a coupé le son. Et j’ai dit :
« C’est fou, il n’y a jamais eu un plan large dans ce film ! On voit trois marches, un pas… on
n’a jamais une image large. Un petit peu à un moment donné, pendant 5 secondes. Et
pourtant, dans ma tête, il y avait des images. » Ces images-là, c’est une représentation
mentale d’un grand lieu qui est donnée non pas par le son tout seul, mais par la combinaison
de ce qu’on voit, c’est-à-dire un cadre serré, et des sons de pas réverbérés qui s’approchent,
qui s’éloignent. Donc c’est une combinaison de ce qu’on entend et de ce qu’on voit, qui fait
une sorte de produit, qu’on appelle « image » aussi. Mais quand je me disais que je voyais
un plan de prison, en fait je ne le voyais pas avec mes yeux. C’est une représentation
mentale qu’on appelle visuelle parce que le mot « image » en français, comme vous le
savez, a aussi le sens de « représentation, représentation mentale ». Quand on dit : « j’ai
l’image mentale de ceci », c’est comme le chien dont je parlais tout à l’heure, on croit que
c’est visuel, mais ce n’est pas seulement visuel. C’est un autre emploi du mot « image ». Le
mot « image » est très glissant en français. Deleuze a fait deux livres, L’Image-temps et
L’Image en mouvement, je les ai bien lus, d’autant qu’il me cite. D’accord, l’image chez
Deleuze c’est tout ce qu’on veut. À un moment donné, il dit : « Il y a quand même le son.
Alors on va dire que le son est une composante de l’image. » Bon, d’accord, s’il veut, mais à
ce moment-là le mot « image » est ce qu’on appelle un blob en science-fiction, une espèce
de gelée rosâtre qui bouffe tout, une espèce de mousse qui progresse et qui s’incorpore tout
ce qui est à sa portée. Donc c’est un mot « blobant » en français. Alors que le mot « son »
résiste, parce que c’est un mot technique. C’est amusant d’ailleurs, on en revient à la
question des mots. Quand j’ai sorti mon livre Le Son au cinéma, c’était un livre d’esthétique,
un livre d’histoire, mais certains libraires de cinéma ne savaient pas où le mettre, alors ils
l’ont mis à « techniques », parce que « son » est un mot technique. Pourquoi pas d’ailleurs ?
Ça fait que j’ai été acheté par des ingénieurs du son, par des gens qui n’auraient peut-être
jamais acheté ce livre. Mais en même temps… Je pense que c’est lié aux mots, je pense
que ce n’est pas visuel. Quand on dit « image », ce n’est pas forcément visuel. Au point que
le compositeur François Bell, que je connais bien, qui est un ami, a parlé d’« image de son »
sur des sons que moi j’appelle des sons « fixés ». Maintenant, la question qui est
passionnante : y a-t-il des gens qui… Même si des gens ont une sorte de sensibilité

24
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

acoustique particulière, ça se mélange à ce qu’ils voient, et vice-versa. Je pense que ça ne


peut pas être purement acoustique. Comment ferait-on ? Même pour les aveugles de
naissance, ça ne peut pas être seulement sonore. Je n’ai pas travaillé là-dessus, mais on
sait que c’est articulé à la représentation de l’espace, et cette représentation s’acquiert par la
motricité. Il y a des gens qui naissent sans membres et qui ne peuvent pas se déplacer dans
l’espace, donc ils n’ont pas cette perception haptique de l’espace qu’a l’enfant qui peut se
déplacer. Ils voient la même chose que nous, mais en même temps ils ne la voient pas.
C’est autre chose. J’ai fait une expérience. Une fois, j’étais à l’hôpital, immobilisé pendant
deux mois dans un centre de réa, je ne pouvais pas bouger, littéralement, j’étais ligoté, et je
me suis aperçu que je ne voyais plus du tout la même chose. Je n’arrivais pas à me faire
une représentation de ce que je voyais autour de moi, qui était toujours la même chose : une
pendule, un mur sur lequel il y avait des relevés, des courbes, etc. Je n’arrivais plus à me
rendre compte de la taille réelle de ce qu’il y avait. Faites cette expérience, si vous y arrivez :
vous vous faites ligoter pendant dix ou douze heures dans un endroit où, de préférence, on
vous a amené la nuit les yeux bandés, et regardez comme la représentation de l’espace se
transforme et comment ce que vous voyez n’est plus du tout la même chose parce que vous
ne pouvez plus vous déplacer. Donc un enfant, a fortiori… Ce qu’on voit, c’est lié à la
possibilité ou non de s’y déplacer, ça se construit. Tout ça, on l’exprime comme on peut en
termes d’images et de sons, mais on sait très bien que ce sont des mots très pauvres.
Quand on pense que justement il n’y a pas encore de mots très précis pour les rythmes…
Tout ça est évident au niveau de la perception, et pourtant il n’y a pas encore d’élaboration…
Il y a des gens qui commencent, il y a des travaux très intéressants, mais pour le moment…
Donc je pense que quand les gens disent « son » ou « image », ils disent ce qu’ils peuvent,
selon la langue, selon la culture, mais en fait leur perception est beaucoup plus riche.
Ensuite, quand ils verbalisent, ils emploient les mots qui sont à leur portée par rapport à la
nécessité de verbaliser rapidement. Je pense que quelqu’un à qui on demande : « Qu’est-ce
que vous avez entendu ? », il dira ce qu’il peut par rapport à son vocabulaire actif, qui n’est
pas le même pour tout le monde. La plupart des gens ont un vocabulaire actif, c’est-à-dire
mobilisable immédiatement, pour des raisons… c’est une sorte de cercle vicieux, ça
s’entretient parce que dans l’usage courant ils emploient des mots qui semblent visuels. Il y
a une autre chose aussi avec le cinéma, c’est qu’on croit qu’on peut parler effectivement de
l’image parce qu’on peut faire un arrêt sur l’image (freeze-frame). C’est d’ailleurs pour ça
qu’on a fait des analyses de films, on s’est dit : on a soixante photogrammes, ce n’est pas
une image puisque ça ne bouge pas et dans le film ça bouge, mais on peut quand même
geler une image alors qu’on ne peut pas geler un son. Ça ressemble à de l’eau, on a
l’impression que ça fuit. Il y a des formes, qui sont dans le temps. Pierre Schaeffer s’est
affronté aux fameux « objets temporels », à mon avis il a ouvert des pistes très importantes.
Il y a bien des « objets temporels », mais on commence à peine à en parler et on a
l’impression que le son est une sorte de flux où on ne peut rien découper, dont on ne peut
parler que de manière impressionniste, etc. Il y a aussi une chose toute bête, c’est une
grande découverte et je suis très content d’avoir formulé ça : 95 % de ce que nous voyons
(c’est un pourcentage arbitraire, disons 90-95 %) est fixe. Regardez ce que vous voyez
maintenant. Vous voyez quelque chose qui bougeotte dans un cadre fixe. Ça gigote un petit

25
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

peu, ça palpite pour vos yeux, mais presque tout est fixe, sauf les ondulations qu’on crée en
bougeant. Par contre, tout ce que vous entendez depuis une heure est mobile, puisque ça
change du tout au tout d’un moment à l’autre selon que quelqu’un parle, qu’il ne parle pas,
qu’il dit tel mot. À partir du moment où on considère que 90 % (pourcentage arbitraire) de ce
qu’on entend est mobile, dans les conditions moyennes, et 90 % de ce qu’on voit est fixe, ça
change beaucoup de choses dans la possibilité de le nommer, de l’appréhender. Il y a des
choses qu’on peut nommer au niveau visuel parce qu’elles ne bougent pas : la taille de la
salle, la perspective que je vois…, ça ne bouge pas, je le retrouve. Par contre, au niveau du
son, je ne retrouve rien. Je l’ai entendu il y a dix secondes, mais ce n’est plus ça, c’est déjà
autre chose maintenant. C’est pour cela que j’ai intitulé un chapitre de ce livre : « Dans
l’éternité d’un passé composé de l’écoute ». L’écoute est au passé composé, en grande
partie : j’ai entendu ça, mais je ne l’entends plus. Dans un film de Bergman, il y a un
personnage qui dit à son frère : « Oh, tu as entendu ? Il y avait un coucou ! » Il n’y a plus de
coucou, mais elle l’a entendu, c’est éternisé, mais c’est au passé composé. Vous essayez de
réentendre le coucou : « Ah, je l’entends ! Mais ce n’est plus le même. » Ça, c’est le son.

Ann MARCHI : J’aimerais bien que vous reveniez sur l’histoire de la bande-son, la bande-son
qui n’existe pas. Au cinéma, il y a la bande-son, c’est le mixage, c’est tout un langage, et
c’est un langage aussi par rapport à l’image. Donc je suis étonnée que vous disiez que la
bande-son n’existe pas.

Michel CHION : Elle existe techniquement, mais ce n’est pas parce qu’elle existe
techniquement qu’elle existe perceptivement.

Ann MARCHI : Pour moi, ce n’est pas technique, c’est tout un langage, c’est toute une
construction, y compris par rapport à l’image, parce qu’elle n’est pas là, comme
malheureusement parfois c’est le cas, pour redire ce que dit l’image, pas du tout. Je ne
comprends pas que vous puissiez dire que la bande-son n’existe pas.

Michel CHION : C’est une pure fabrication.

Ann MARCHI : Mais l’image, le film, c’est une pure fabrication, c’est pareil.

Michel CHION : Pour le dire autrement, c’est que pour analyser ce qui se passe entre des
sons et des images, ça ne sert strictement à rien de dire qu’il y a une bande-son et de
considérer que dans ce qu’on appelle « la bande-son », par exemple, il y a en même temps
une musique et des dialogues, et des bruits. C’est un cas assez fréquent, banal. « Bande-
son » voudrait dire qu’il y a une sorte d’entité structurée où les sons se structurent les uns
par rapport aux autres dans une certaine unité qu’on appellerait « bande sonore ». Bien sûr,
si on écoute quelque chose à la radio, c’est une bande-son, si on veut, parce qu’il n’y a pas
d’image. Mais à partir du moment où vous avez une image figurative, certaines choses que
vous entendez vont être projetées dans ce que vous voyez, puisque par exemple elles sont
corrélées par le phénomène de synchrèse, donc elles vont être aspirées par ce qu’on voit et

26
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

elles vont devenir un élément de ce qu’on voit, évidemment imaginaire. D’autres sons qui ne
s’inscrivent pas là-dedans, par exemple les sons non diégétiques, vont se décoller des
autres sons qu’on entend en même temps et vont dans un autre espace. Quand je dis qu’il
n’y a pas de bande-son, c’est une manière de dire que c’est aussi arbitraire de dire qu’il y a
une bande-son que de dire : je prends une partition de Bach, je vais d’abord analyser la main
gauche, ensuite la main droite. Non, parce que tout est dans la relation, comme vous l’avez
dit vous-même. Mais il n’y a pas d’entité « main gauche », pas d’entité « partie de la main
droite ». Bien sûr, c’est écrit sur deux portées, mais c’est tout. Ça n’a strictement aucun sens
d’analyser l’un sans l’autre. Analyser un film sans tenir compte de ce qu’on entend, à partir
du moment où ce film est sonore, ça n’a pas de sens, c’est partiel, mais pourquoi pas, c’est
une sorte de cache qu’on emploie. C’est dans les deux sens. Quand je dis qu’il n’y a pas de
bande-son, je veux dire par là que les sons se décollent les uns des autres et certains sont
absorbés par ce qu’on voit. Ça ne veut pas dire qu’ils n’existent pas, ça veut dire qu’ils
s’impriment dans ce qu’on voit, c’est ce que j’appelle une « audio-image ». D’autres ne sont
pas dans l’audio-image, puisqu’ils ne sont pas diégétiques, ils ne sont pas visualisés. Donc
la formule bande son fausse les choses. Qu’est-ce qui fait qu’il y a une bande-image ? Si
vous voyez quelque chose dans le cadre d’une image de cinéma, qui est généralement
rectangulaire, c’est bien un lieu d’image. Ça veut dire que tel élément qui est dans la gauche
de l’image, par rapport à tout ce qui est à droite, ça se structure comme ça, il y a des règles
de composition dont une partie vient de la peinture, du décor de théâtre, etc. Mais pour le
son il n’y a pas de règles de composition puisqu’il n’y a pas de cadre sonore des sons. Il y a
un son et en même temps un autre son, il n’y a pas de cadre. Donc le mot « bande-son »
nous induit en erreur. D’abord, il nous conduit à penser en termes symétriques : puisqu’il y a
une bande-image, il doit y avoir une bande-son. Et puis ça ne veut rien dire. Il n’y a pas de
structure des sons en eux-mêmes puisque c’est par rapport à ce qu’on voit. Ça ne veut pas
du tout dire que l’image est plus importante que le son, pas du tout, ça veut dire que ça
fonctionne comme ça. C’est un fait qu’on ne peut pas nier. Si on analyse une partie de la
musique occidentale, on verra qu’il y a ce qu’on appelle « l’harmonie » ; c’est justement un
modèle dont on a cherché à sortir avec la musique du XXe siècle, le modèle de la mélodie-
harmonie, la mélodie accompagnée. À partir d’un certain stade, dans la musique
occidentale, vous avez une musique basée sur le principe de la mélodie accompagnée,
c’est-à-dire que vous avez la mélodie et vous avez l’harmonie. On ne peut pas jouer et
comprendre la musique sans ça. Maintenant, d’ailleurs, c’est mondial, puisqu’une bonne
partie de la musique mondiale a adopté l’harmonie occidentale. Il y a des musiques qui
n’avaient pas du tout d’harmonie, pas de système d’accords. Dans la mélodie accompagnée,
vous savez très bien que telle chose qui vient du contexte harmonique va colorer les notes
de la mélodie que vous entendez d’une certaine manière, ce qui fait que même quand on
chantonne la mélodie pour soi, on entend l’harmonie. Mais si vous demandez à quelqu’un
d’analyser, il va chanter la mélodie. De la même façon, si quelqu’un parle d’un film, il va
parler d’images. Je dis que, à ce moment-là, on ne peut pas faire comme si l’harmonie n’était
pas quelque chose qui parfois projette une sorte de signification, d’effet sur la note, au point
que les gens, pensant mémoriser seulement une mélodie, en fait mémorisent l’harmonie,
même les gens qui ne connaissent pas la musique. Donc il y a effectivement une sorte de

27
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

dissymétrie, de rapport de projection où on projette sur la mélodie ce que l’harmonie fait


entendre. La preuve, c’est que si vous arrangez différemment tel air connu, les gens vont
dire : ce n’est pas la même chose. Mais la plupart des gens vont projeter sur la mélodie
l’effet de l’harmonie, sauf les gens qui ont travaillé. Ce que j’ai exposé là, je peux faire qu’en
une semaine tout le monde entende les sons distincts des images, à la fois ressentir l’effet,
comme n’importe quelle figure de cinéma, et comprendre comment il est construit.
N’empêche qu’il n’y a pas de bande-son. C’est un modèle qui ne correspond pas. À part ça,
dans certains cas, quand on entend un son à la fois, par exemple la voix de Marguerite
Duras et l’image, on peut dire qu’il y a une bande-son.

Ann MARCHI : Mais une bande-son, c’est un langage, c’est pour ça que je ne comprends pas
ce que vous dites.

Michel CHION : Je ne peux pas le dire autrement, je suis désolé.

Ann MARCHI : Même s’il y a une construction avec l’image, qui est le montage…

Michel CHION : Comme vous dites, « avec l’image ».

Ann MARCHI : L’image elle-même seule, la bande-image, c’est une construction. Pour le son,
c’est pareil. Les sons ne sont pas là par hasard, ce n’est pas n’importe quoi, ou alors c’est un
très mauvais film, c’est une émission de télé où tout le monde parle…

Michel CHION : Je n’ai pas parlé de n’importe quoi. Il y a des lois, il y a des procédés, il y a
une rhétorique, je l’ai dit tout à l’heure. Vous prenez un film avec des sons et des images,
vous pouvez dire : je vais analyser les images seules. Vous pouvez le faire, mais c’est
comme si vous preniez une ligne sur deux d’un texte.

Ann MARCHI : Je peux prendre une bande-son et n’analyser que la bande son.

Michel CHION : Parce que vous tenez au mot « bande-son », je n’y peux rien.

Ann MARCHI : Mais c’est une construction, la bande-son, ce n’est pas juste un son et puis un
autre et puis un autre !

Michel CHION : Vous êtes nominaliste, qu’est-ce que vous voulez que je vous dise ! Parce
que vous pouvez dire « bande-son », vous pensez qu’il y a une bande-son.

Ann MARCHI : Je ne comprends pas où est le langage là-dedans pour vous. En plus, double
langage : langage aussi avec l’image, pas seulement le langage en soi.

Michel CHION : Je ne comprends pas.

28
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

Ann MARCHI : Moi non plus !

Michel CHION : « Bande-son », c’est une façon de dire. Est-ce que vous savez ce que vous
dites quand vous dites « bande-son » ? Vous ne faites que répéter le mot « bande-son ». Je
suis désolé de dire ça comme ça.

Ann MARCHI : Une bande-son, pour moi, ça va être le mixage de plusieurs sons que je vais
avoir choisis en faisant un film, tel souvenir, telle musique, tel silence…

Michel CHION : D’accord, mais ils seront mixés, ils seront démixés par l’image. À partir du
moment où quelqu’un a mixé un film une fois dans sa vie, il sait qu’il mixe par rapport à
l’image. Et même s’il ne le fait pas consciemment, l’image s’en charge. Vous pouvez faire
tout ce que vous voulez, vous pouvez mixer des sons et dire : je ne veux pas voir l’image, et
ensuite, au dernier moment, quelqu’un colle l’image sur le son ; eh bien, l’image va démixer
tout ça et on n’y peut rien. Ce sont des choses qui sont naturelles, c’est tout. Il y a un film où
il y a une image bleue pendant une heure et demie, le film de Jerman (?), Blue, et même
dans ce cas-là où il n’y a rien à voir sauf du bleu, il y a des sons mélangés, la voix du
réalisateur, etc., il y a quand même des rapports différents entre tel son et ce qu’on voit, et ils
sont démixés. Pas démixés techniquement, mais démixés perceptivement.

– Il faut accepter la formule.

Ann MARCHI : Je n’ai pas à accepter ou pas la formule. Je fais des films, je sais ce que je fais
quand je fais une bande-son, excusez-moi, quand je monte un film et que je le monte pour
l’image et pour le son, c’est tout. Je n’ai pas à accepter une formule qui viendrait du ciel.

Michel CHION : Je trouve ça très français. Peu importe que vous appeliez ça « bande son »
ou pas.

Ann MARCHI : Peu importe, mais ça m’intrigue parce que pour moi c’est une telle construction
et c’est un tel langage…

Serge TISSERON : Il se place au niveau de la réception, pas dans la production.

Régine CHANIAC : Je crois que l’ambiguïté, c’est que Michel Chion parle de comment nous,
on reçoit cet ensemble avec un lieu d’images et une absence de lieu de sons, et comment
certains sons sont effectivement aspirés par l’image et pas d’autres. C’est dans ce sens-là
qu’il l’emploie. Ce n’est pas par rapport à ce que vous, vous faites, c’est par rapport à ce que
le récepteur perçoit, reçoit. C’est peut-être ça qui peut aider à débloquer la situation, mais ce
n’est pas sûr.

Michel CHION : On est tous plus ou moins nominalistes, mais ça ne change rien, de toute
façon, vous pouvez appeler ça « bande son », ça ne me dérange pas. Je dis ça dans ce

29
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

cadre-là par rapport à un certain exposé. Moi-même j’ai fait des films. Si le monteur me parle
de la bande-son, je ne vais pas lui dire : « Ah ! Il n’y a pas de bande-son ! » C’est dans tel
contexte, on s’entend. Mais si on décrit, on analyse historiquement le rapport son/image, je
dis qu’il n’y a pas de bande-son, bien sûr. Mais ce n’est pas un article de foi où les gens
défilent devant en disant : il n’y a pas de bande-son. Vous voyez ce que je veux dire ?
Simplement, il y a des mots tout faits qui font qu’on se prend parfois la tête, par exemple le
mot « image », parce qu’on les emploie dans des contextes très différents. Dans le contexte
dont vous parlez, bien sûr, il y a une bande-son. Mais dans le contexte dont je parlais, il n’y
en a pas. C’est très clair. Maintenant, il m’a semblé que depuis vingt ans, en France, on
s’accroche beaucoup à des façons de dire. Il y a parfois des gens – pas vous – qui disent : il
y a une bande-son, parce que le mot « bande-son » leur plaisait. Il faut pouvoir le prononcer.
Il y a des étudiants qui disaient « bande-son » et ils n’avaient pas la moindre idée de ce que
ça voulait dire. Simplement, ils éprouvaient le besoin de prononcer les phonèmes « bande-
son ». C’est très curieux, ce rapport au signifiant, c’est quelque chose de pétrifié. C’est ce
que j’appelle le « nominalisme français », c’est-à-dire qu’il faut avoir le droit de dire « bande-
son », donc tout le monde dit « bande son ». Moi aussi je peux le dire : bande-son, bande-
son, bande-son…

François JOST : D’abord, j’aimerais poser une question simple : quand on est à l’opéra, est-
ce qu’il y a une musique ? Au fond, la situation du cinéma, sauf que ça nous met face à une
image, est la même que celle qu’on a à l’opéra, c’est-à-dire qu’on a des sons et on a des
actions. Un auditeur de Wagner, un bon auditeur, va quand même décomposer très
largement la partition, sinon il va rater beaucoup de choses. Il va l’associer à des choses qui
ne se passent pas dans de l’image, mais sur la scène. Alors on pourrait dire, si je comprends
bien ce que tu dis, que, de même qu’il n’y a pas de bande-son au cinéma, il n’y a pas de
musique non plus à l’opéra, il n’y a que des actions…

Michel CHION : Il n’y a pas de musique « pure », effectivement.

François JOST : Dire qu’il y a une bande-son ou pas de bande-son, c’est une décision
méthodologique. Personnellement, je n’ai jamais pensé comme ça. J’apporterai deux
éléments de réflexion. Le premier, c’est qu’on sait bien que, du point de vue cognitif, il y a
deux fonctionnements : la mémoire de situations et la mémoire de textes. Effectivement, la
plupart du temps, quand on voit un film, on retient des situations, des actions, et on annule
même les plans. Le spectateur est une machine à annuler les plans. Mais il y a aussi le
spectateur cinéphile, ou le spectateur analyste, étudiant en cinéma, qui décompose et
analyse, etc., et celui-ci peut tout à fait décomposer la bande-son. Moi, j’ai appris un peu à
analyser la bande sonore avec Michel Fano, il me jouait les parties pour piano de l’opéra de
Berg, Lulu, et on écoutait ensuite l’ensemble. Il décomposait chaque partie. J’en sortais…
j’allais dire « grandi », ce qui est un grand mot. Cela dit, il y a toujours des gens qui m’ont
dit : mais comment tu fais pour écouter si tu décomposes tout ? Ce sont des constructions
d’auditeurs qui sont très différentes. Je crois qu’il faut pouvoir tenir deux choses à la fois : la
bande-son est un continuum sonore, c’est-à-dire que le paradoxe, c’est que c’est bien un

30
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

continuum sonore, c’est un tout, avec du bruit, des paroles et de la musique, mais je peux
aussi l’analyser exactement comme une partition. Je préfère parler de « partition » plutôt que
de « bande sonore ». Évidemment, dans un film « réaliste », on n’est pas amené à faire ça,
sauf qu’on peut se dire de temps en temps : c’est marrant que, dans Star Wars, on entende
dans le vide tous ces bruits, c’est assez étonnant ! Mais on peut aussi, pour certains films,
avoir une écoute totalement analytique qui décompose ce continuum. Ce sont plutôt des
attitudes différentes, qui ne relèvent pas d’un dogme pour lequel une position serait meilleure
que l’autre.

Michel CHION : Quand on voit un opéra en salle, ce qui est maintenant le fait d’une petite
partie de la population, il y a […]. C’est divisé. Moi j’ai tendance à voir les subdivisions et
comment c’est clivé assez vite. Pour moi, la musique, dans le cas de la musique
instrumentale, dans le cas d’un quatuor à cordes, je trouve que c’est un singulier qui ne veut
plus dire grand-chose parce qu’on voit très bien qu’il y a des niveaux superposés. Je dis
bien, « superposés », et pas forcément coordonnés les uns aux autres, parce que ce fameux
continuum, sur lequel j’insiste (je ne suis pas du tout d’accord avec le continuum de Michel
Fano), je le vois aussi par exemple dans le niveau rythmique d’une musique et le niveau
harmonique. Ce sont des niveaux tout à fait différents. Bien sûr, si tel enchaînement
harmonique est fait à une certaine vitesse, ça produit tel effet, mais la musique
apparemment la plus homogène du monde, la plus pensée, par exemple la musique de
Bach, il y a des choses qui sont strictement écrites pour des valeurs de hauteur et de durée,
de rapports de durée (L’Art de la fugue, qu’on cite toujours), déjà, entre les successions
rythmiques et le jeu des hauteurs, c’est compliqué parce que ce sont deux systèmes
superposés et non étroitement coordonnés. Donc moi j’ai tendance à voir l’éclatement assez
vite. Maintenant, pour l’opéra, c’est la même chose. On parle de la musique par rapport à
l’opéra, parce que beaucoup de gens maintenant écoutent des opéras à la radio ou chez
eux, mais avant ça n’avait pas tellement de sens, il y avait des réductions au piano. Déjà, il y
a des personnages, donc un opéra, ce n’est pas seulement de la musique, c’est clair. La
question du continuum. Il y a effectivement un choix. Si par « continuum » il est question de
ce que j’ai lu dans un texte de Michel Fano sur le continuum entre paroles, musique et bruits,
je n’y crois pas. Pas pour le plaisir de t’embêter, mais je ne le constate pas. J’ai réfléchi là-
dessus, j’ai fait des expériences. Il est clair que quand on écoute quelque chose… Prenons
l’exemple d’un film souvent cité, sur lequel a travaillé Michel Fano, le film de Robbe-Grillet,
L’Homme qui ment, que tu connais bien, je suis désolé, je ne vois pas où est le continuum
sonore. Quand j’entends la voix de Trintignant qui raconte quelque chose, je reconnais la
voix de Trintignant, il dit des mots que j’entends puisque c’est en français et que je suis
français, mais je ne ferais pas du tout le moindre rapport de continuum avec les bruits qu’on
entend par ailleurs. C’est sonore, mais où est le continuum ? C’est vrai que la perception
sonore est, peut-être encore plus que la perception visuelle – c’est une généralité, tant pis –,
un lieu de basculement, c’est-à-dire qu’on est dans tel registre d’une écoute par exemple
linguistique et on bascule dans autre chose. Ça peut être simultanément sur le même objet.
Par exemple quand quelqu’un chante, si quelqu’un chante en psalmodiant d’un rythme
régulier, on a le mot et on a le rythme auquel c’est fait, ça se produit en même temps mais

31
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

ce n’est pas un continuum, ce sont bien deux choses distinctes superposées. Quelqu’un qui
parle à un rythme, on peut faire du rap, c’est-à-dire qu’on parle de manière rythmée, et en
même temps il y a ce qui est dit, c’est une superposition de niveaux. Il n’y a pas de
corrélation étroite. Même des gens comme Mallarmé, qui se sont creusé la tête, qui ont
travaillé au fond pour (?) le son et le sens, mais ces choses-là, qu’on considère comme
acquises, c’était désespéré, c’est pour ça que c’est beau. Il faut lire Mallarmé, les œuvres
complètes de Mallarmé dans la « Pléiade ». Dès qu’on est dans le langage, c’est un
problème incroyable, on cherche le son parallèlement, on constate que c’est irréconciliable,
le son et le sens, le langage, c’est un gouffre. Dès qu’on est dans les questions linguistiques,
c’est fou, on n’en sort pas. Je pense que, à la limite, si Fano avait voulu faire des continuums
sonores, il n’y aurait surtout pas de langage, pas de paroles, parce que dès qu’il y a des
mots c’est beaucoup trop compliqué, il y a trente-six niveaux superposés.

François JOST : Je ne pensais pas à Fano en l’occurrence, je pensais plutôt à ce que j’ai écrit
avec Dominique Chateau dans notre ouvrage Nouveau cinéma, Nouvelle sémiologie, par
exemple, et je pense que c’est une décision méthodologique. Quand on disait tout à l’heure
que la perception, dans la vie, c’est discontinu, il est évident qu’on trouve autant de
psychologues qui disent exactement le contraire. Ce qui est miraculeux, c’est la continuité de
la perception, on le sait bien, il y a mille exemples, je ne vais pas développer et faire un
cours là-dessus. Donc c’est un choix méthodologique. Soit l’écoute se fait de façon
totalement analytique, soit elle se fait de façon totalement synthétique, sans analyse. On
peut travailler à partir des deux hypothèses et dire des choses très intéressantes à partir des
deux.

Michel CHION : Je ne parle pas en termes analyse/synthèse. C’est effectivement une manière
de structurer les choses qui ne me vient pas à l’esprit. Je n’ai pas de réponse, là, parce que
je n’ai jamais pensé en termes d’analyse. Quand il y a une perception d’une séquence des
Oiseaux, ce n’est pas de l’analyse que fait le spectateur, c’est une sorte de structuration qui
se fait et c’est tout. Ce n’est ni une analyse ni une synthèse, c’est une structuration des
choses, un regroupement des sens, des effets. C’est une structuration.

François JOST : Il y a quand même une matière qui s’appelle « analyse de films » et qui a
donné beaucoup de…

Michel CHION : Bien sûr, mais je pense que quelqu’un qui voit un film organise sa perception
d’une certaine manière. Quand on analyse le film, on cherche aussi à retrouver quelque
chose de cet ordre, on ne se contente pas de découper les choses en pièces détachées, on
cherche la structure des choses.

Serge TISSERON : Il faut bien distinguer entre la perception et la structuration de la


perception. Les sens nous informent en continu, mais nous n’arrivons à construire notre
personnalité et à commencer à maîtriser les sensations que dans la création de rythmes.
Donc il faut bien distinguer les deux niveaux. Quand je regarde un film, dieu merci je ne suis

32
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

pas immergé dans la sensation, dans le continuum de la sensation, sinon je n’y


comprendrais rien. C’est uniquement parce que je crée un rythme, une narrativité, des
coupures, des ruptures, et mes propres ruptures d’ailleurs, que je crée du sens. Donc le
sens n’advient qu’à partir du rythme. Avant le rythme, il y a un continuum de sensations
dénué de sens.

Michel CHION : Quelque chose me vient à l’esprit maintenant, c’est la question des clins
d’yeux. Il y a quelqu’un que je connais bien, à qui j’ai dédié un de mes livres, qui s’appelle
Walter Murch, qui est un monteur, qui a créé l’idée même de conception sonore au cinéma.
Je l’ai rencontré plusieurs fois aux États-Unis, il connaît mon travail, c’était une grande joie
parce que c’est quelqu’un qui est dans la pratique. On a eu l’occasion de dialoguer. Il a écrit
un texte intéressant, qui n’est pas traduit en français, sur les clins d’yeux. Il s’est aperçu que
quand il montait (il était monteur image), sans s’en rendre compte, quand il passait de
l’image d’un acteur à un autre plan, il tenait compte du moment où l’acteur cligne des yeux. Il
s’est dit : quand je regarde moi-même, je cligne des yeux. Comme vous le savez, on cligne
des yeux inconsciemment. C’est d’ailleurs pour ça que les créatures de dessins animés, de
mangas, etc., si elles ne clignent pas des yeux, elles ont l’air un peu égaré, donc
mécaniquement, de temps en temps, on les fait cligner des yeux. C’est fondamental, le clin
d’œil. Ça introduit un découpage. Et lui allait jusqu’à dire, ça faisait partie de ses
spéculations de monteur : quand on regarde, on monte déjà. C’est intéressant parce que là
on retrouve le côté du continu. C’est comme le film de Kubrick, Orange mécanique, où on
empêche le type de cligner des yeux. Ce n’est pas seulement qu’il ne peut pas se dérober
au spectacle de ce qu’on lui montre sur un écran, c’est qu’il ne peut pas cligner des yeux.
Évidemment, il ne faut pas voir tout sur le modèle du clin d’œil, mais c’est quand même
intéressant. Pour le son, on ne peut pas cligner de l’oreille, c’est connu, il n’y a pas de
paupière pour l’oreille et c’est très important. Par contre, dans notre conscience des choses,
on fait un zapping permanent. Mettez-vous par rapport à un spectacle sonore et essayez de
l’entendre continuellement, c’est strictement impossible. Il y a eu beaucoup de choses
écrites là-dessus. On ne peut pas cligner de l’oreille, il n’y a pas de paupière pour l’oreille.
Ça joue un rôle important.

Carole SAULAY : Est-ce que vous pouvez nous dire deux trois choses – il y a un livre de vous
qui a été mentionné sur le sujet et vous n’en avez pas tellement parlé – sur les rapports du
son et de l’inconscient ? Vous venez juste de l’évoquer un petit peu, je crois, mais est-ce que
vous pouvez nous dire deux trois choses qui sont dans le livre, deux trois choses sur
lesquelles vous avez travaillé ?

Michel CHION : Le son et l’inconscient… Il est certain que si on parle du son et de


l’inconscient, au sens psychanalytique, la question de la nature phonétique, sonore du
signifiant entre en jeu. Les jeux de mots, c’est du sonore. Les jeux de mots, l’équivoque
acoustique, qui est tellement importante dans l’analyse, les choses qui se structurent par
rapport à… Ce n’est pas Lacan qui a inventé ça, chez Freud il y a beaucoup d’analyses de
choses, les signifiants, etc. Le signifiant, c’est une ambiguïté, c’est quelque chose qui est lié

33
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

à l’équivoque acoustique. L’équivoque acoustique, le fait que le signifiant sonore se miroite


de différentes façons, en même temps c’est quelque chose qui est incrusté. Il y a même un
psychanalyste, qu’on ne lit peut-être plus beaucoup, Serge Leclaire, qui est décédé il n’y a
pas très longtemps, qui avait isolé au cours de l’analyse certains de ses analysants. Il disait
que c’est comme s’il y avait un noyau dans chaque personne, Untel était le signifiant frrr ou
ksss. Il trouvait qu’il y avait des mots. Récemment, je faisais un texte sur Michel Leiris, qui a
beaucoup écrit sur des souvenirs sonores. Leiris, qui a écrit Biffure, Fibrilles, Fourbis… Il a
réfléchi aux signifiants. Il a écrit un texte très intéressant, que j’ai cité dans un de mes livres,
qui s’appelle « Le promeneur écoutant », où il a cité ses impressions (il est né au début du
e
XX siècle) en écoutant les premiers phonographes, ça faisait frrr frrr frrr. C’est amusant
parce que, très consciemment, il a fait des livres avec des sonorités frrr frrr et il était
spécialiste de l’Afrique en tant qu’ethnologue. L’Afrique. On est content, on a isolé un
signifiant qui est évidemment acoustique, frrr frrr frik frik, et on se dit qu’on ne peut pas aller
au-delà. Forcément, cette question du signifiant lié au mot, on ne peut pas en sortir, dans la
mesure où on en revient toujours à ça. En même temps, c’est dans le langage, ce n’est pas
purement sonore. Je ne suis pas très qualifié là-dessus, mais je crois que dans la littérature
psychanalytique on parle souvent du son, parce que l’analyse consiste souvent à faire
advenir des signifiants qui sont acoustiques. Avec mon père, on avait des discussions, il
disait : « Lacan, c’est quand même bidon, parce que si on est dans une autre langue,
l’inconscient est différent. » C’est vrai, parce que les mots sont différents, le rapport entre ce
qu’on lit et ce qu’on entend est différent, et Lacan en était très conscient. Au-delà de ces
questions du langage, qui sont fondamentales, est-ce que le sonore a rapport avec
l’inconscient ? Je ne sais pas. Ce qui est certain, c’est que dans la vie intra-utérine, on le sait
maintenant, il y a des sensations déjà structurées. L’oreille ne se développe pas
complètement, en plus on est dans le milieu liquide. Quand on naît, l’oreille doit se vider du
liquide et on s’adapte à un autre milieu. Alors peut-on appeler sonores ces variations
rythmées que perçoit le fœtus ? C’est une façon de dire, parce que ce n’est pas
complètement sonore. Qu’est-ce qu’on appelle « sonore » ? Moi, il me semble (je suis de
nouveau en train de rediviser) que parfois il y a des problèmes qui seraient évités ou qui
seraient mieux compris si on se disait que ce qu’on appelle « son » est en fait bisensoriel
dans certains cas. Ça veut dire que quand un son est grave, a une fréquence grave assez
forte, nous percevons très distinctement quelque chose dans la fenêtre acoustique, boum
boum, un son grave, et quelque chose qui rythme, qu’on sent par les percussions sur les os,
sur la peau. C’est simultané et c’est la même cause puisque c’est par exemple la membrane
d’un haut-parleur dans un concert. Ce n’est pas du tout la même sensation, mais du fait
qu’elle est simultanée, elle est perçue comme la même chose. Alors c’est une question qui
peut sembler académique, mais qu’est-ce qu’entendent les sourds ? Beaucoup de gens qui
sont sourds complets, sourds profonds perçoivent des variations rythmées. Je ne sais pas si
vous avez vu le film Les Enfants du silence, vous avez des gens à divers degrés de surdité,
parce que c’est très complexe, la surdité, et il y en a qui dansent, bien sûr. Le professeur leur
apprend à sentir la membrane du haut-parleur. C’est rythmé. Appelons ça du son, si on veut.
L’entendant a deux perceptions radicalement différentes, mais elles sont simultanées. Et
comme elles sont simultanées, qu’elles proviennent de la même cause et que le mot

34
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

employé est le même, on se dit que c’est la même chose, mais ce n’est pas la même chose.
Excusez-moi, j’ai dérivé sur une autre question, mais c’est vrai que dans certains cas, quand
on parle du son, et notamment pour l’inconscient, ça renvoie au rythme. Est-ce que le rythme
est sonore ? Je dis que ce n’est ni sonore ni visuel, c’est le rythme. Alors il y a des modalités
d’apparition du phénomène rythmique, on en a parlé. Forcément, si vous parlez de
l’inconscient, le signifiant est fondamental. Est-ce que c’est sonore ? Pas spécialement. Je
pense que c’est trans-sensoriel, donc la question sonore/visuel ne se pose plus. Ce qui est
certain, c’est que, étant donné la prégnance du son par rapport à nos rythmes, le fait que ça
peut nous toucher pas seulement par les oreilles mais par des vibrations autrement, c’est
différent de l’image, bien sûr, puisque avec l’image vous pouvez fermer les yeux ou tourner
la tête, c’est terminé, ça n’existe plus. Sauf si on vous maintient les yeux écarquillés, comme
dans le film de Kubrick. J’aurais tendance à penser que, du point de vue de l’inconscient, il y
a la question du langage, à laquelle on n’échappe pas, c’est-à-dire le fait que le langage
instaure un découpage. Je pourrais vous répondre mieux en vous citant des livres qui me
paraissent fondamentaux, que je n’ai pas encore complètement analysés, je voudrais faire
un travail là-dessus. Il y a quelqu’un qui a travaillé sur le son et un écrivain. Je pense à une
nouvelle de Kafka qui est extraordinaire, qui s’appelle Le Terrier. C’est une créature qui
raconte. Cette créature s’est construit un terrier et elle entend un bruit qui la dérange. Sur la
persécution sonore, sur le son, l’invasion du son dans notre vie, ce texte est extraordinaire.
C’est raconté par une bête, on ne sait pas quel genre d’animal, il entend un son et il se
demande d’où ça vient, c’est extraordinaire. Un autre texte qui à mon avis est fondamental,
qui n’a peut-être pas été analysé complètement, sur lequel j’ai un peu écrit dans mon livre Le
Promeneur écoutant, c’est Alice au pays des merveilles. Si on lit bien le texte, c’est issu d’un
récit acoustique qu’a inventé Lewis Carroll pour une petite fille qui s’appelle Alice Liddel. On
raconte qu’elle lui a dit : « Je voudrais bien que ce soit écrit », written down, mis par écrit.
C’est une histoire pleine de jeux de mots, mais que Lewis Carroll a mise par écrit, a couchée
par écrit, ça veut dire que certaines équivoques n’ont plus le même sens parce que c’est du
texte à lire, ce n’est pas la même chose. Et à la fin d’Alice, ce qu’on oublie tout le temps (moi
je l’ai trouvé en le relisant, j’en ai fait un article qui est dans un de mes livres), c’est que ça
ne finit pas pareil, ça finit par la petite sœur d’Alice, ou la grande sœur d’Alice qui se met
dans le même endroit. La grande sœur ferme les yeux et elle entend les sons de la prairie où
Alice était au début, et en fait tous les sons se transforment en les sons de l’histoire qu’il a
racontée à Alice. En fait, c’est comme si l’histoire était un glissement à partir de ce qu’elle a
entendu. Donc là, il y a le lieu d’un glissement. Je ne sais pas si quelqu’un a fait un livre
entier d’analyse du son dans Alice au pays des merveilles, mais je pense que c’est un livre
fondamental. Si j’avais le temps, je ferais ça. C’est extraordinaire. Une réponse serait peut-
être à trouver dans certains textes qui ont été à peine analysés sur ce plan. Le texte de
Kafka, si j’avais le temps, ou si on me payait, je passerais un an sur Kafka et le son. Il y a là
une mine théorique. Lewis Carroll et quatre ou cinq auteurs comme ça. Dante, aussi, mais
Lacan a plus parlé de Dante, donc il y a des choses. Sur Joyce, évidemment, Lacan a fait un
séminaire sur Joyce et il avait beaucoup lu Dante. Le côté acoustique, le son. Je pense
qu’en cherchant des auteurs fondamentaux comme ça… Souvent, c’est lié, articulé à la
question du langage, c’est clair.

35
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

Gérald CAHEN : Je voudrais juste vous poser une question sur le rapport entre le son et
l’inconscient. Vous dites, de manière très convaincante, qu’au cinéma, le son est aspiré en
partie par l’image, et je me demandais si vous aviez réfléchi au rapport entre le son et
l’image dans le rêve…

Michel CHION : Non, mais c’est un point intéressant. Parfois je note mes rêves, ça m’est
arrivé d’avoir des rêves musicaux et de pouvoir noter la mélodie que j’avais entendue en
rêve, mais c’est rare. Je ne sais pas, je pense que c’est un domaine vaste. Je pense pour les
récits de rêves, il y a la façon dont on arrive à les raconter. J’aurais tendance à penser (je
redivise tout, comme vous avez vu) que, quand il y a des notes de la mélodie, c’est déjà de
la musique, c’est déjà des intervalles, donc c’est autre chose que du sonore. Même si une
mélodie n’existe que pour quelqu’un qui a entendu des sons. Un sourd de naissance, je ne
vois pas comment il pourrait s’imaginer des intervalles. Ensuite, à partir du moment où vous
entendez des intervalles, donc les mélodies, c’est plus que du sonore, ça passe à un autre
niveau. Donc je ne sais pas, si vous connaissez des choses intéressantes, je pense que
c’est important. Maintenant, il y a une chose qu’on voit dans la littérature des récits de rêves,
c’est que souvent les gens racontent des rêves où il n’y a pas de bruits, des choses sans
bruits. Et quand au cinéma on veut traduire des impressions oniriques, parfois on voit des
gens qui parlent et on ne les entend pas. Une autre chose, dans les rêves, comme vous
savez, tout le monde a rêvé de ça, on pousse un appel dans son rêve et on entend que la
voix ne porte pas. Si vous allez un jour dans une chambre sourde, il y a des endroits
acoustiques qui ont été étudiés pour des recherches sonores, parfois aussi pour des
émissions de radio, où il n’y a aucune réverbération, strictement aucune, donc quand vous
émettez un son, il reste au niveau de votre corps, il ne franchit pas les limites du corps. Ça,
c’est important aussi, ça apparaît dans certains rêves. Je crois qu’il y a des pistes comme
ça, une série de choses, pas mal de films ont représenté des récits de rêves, et il y a des tas
de récits de rêves dans la littérature. Théophile Gautier, par exemple, a raconté un rêve avec
des choses sans bruits, c’est typique, comme le cinéma muet. Le cinéma muet, c’est
fondamental. Ma théorie du cinéma sonore, c’est que c’est du muet plus du son, c’est-à-dire
que je pense que le cinéma sonore est un art palimpseste : si on retire le son, il y a encore
quelque chose, il y a l’idée que, même si les choses qu’on voit à l’écran font du bruit qu’on
entend, il y a aussi un niveau où le son qu’on voit, enfin qui correspond à ce qu’on voit, ne se
borne à celui qu’on entend. Il y a une couche muette dans le cinéma sonore. Encore une
fois, c’est un truc par couches. Excusez-moi, j’ai un peu dévié de votre question.

Serge TISSERON : Un petit mot sur le son et l’inconscient. C’est compliqué parce qu’il faut
distinguer ce qui est inconscient parce que ce n’est pas conscient à un moment donné, de
l’Inconscient comme système. Toutes les empreintes sonores et visuelles qui datent des
deux premières années ne font pas forcément partie de cet Inconscient comme système
décrit par Freud, qui est alimenté par le refoulement. De façon plus globale, le problème du
son et de l’inconscient est très compliqué à cause du processus primaire que Freud appelle
« symbolisation », c’est-à-dire le principe de visualisation, c’est-à-dire que l’inconscient a

36
Institut national de l’audiovisuel - www.ina.fr
Collège iconique du 7 juin 2006 : Le son et l’image

tendance à tout visualiser. Serge Leclaire donne l’exemple d’un patient pour lequel la
formule emblématique qui est mémorisée par lui est « porjeli ». Ça n’imprègne pas
forcément son discours mélodique, mais ça imprègne les images qu’il se construit à partir de
« port », « porte », « joli », etc. En fait, Leclaire repère la formule sonore autant à travers des
constructions imagées qu’à travers le fait que cette séquence sonore se reproduirait dans
son langage.

37
Institut national de l’audiovisuel - www.ina.fr

Vous aimerez peut-être aussi