Vous êtes sur la page 1sur 16

Intellectica.

Revue de
l'Association pour la Recherche
Cognitive

Cognition et émotion musicales


Emmanuel Bigand, Suzanne Filipic

Citer ce document / Cite this document :

Bigand Emmanuel, Filipic Suzanne. Cognition et émotion musicales. In: Intellectica. Revue de l'Association pour la
Recherche Cognitive, n°48-49, 2008/1-2. Musique et Cognition. pp. 37-50;

doi : https://doi.org/10.3406/intel.2008.1239

https://www.persee.fr/doc/intel_0769-4113_2008_num_48_1_1239

Fichier pdf généré le 24/02/2020


Résumé
La musique est une objet culturel qui n'a pas de valeur adaptative évidente pour l'espèce humaine
mais qui provoque cependant des réponses émotionnelles aussi intenses que certaines
stimulations biologiquement pertinentes. Pour cette raison, la musique constitue un domaine
privilégié pour approfondir les relations complexes qui existent entre la cognition et les émotions.
Dans cet article nous considérerons les résultats actuels dans le domaine des neurosciences et
de la psychologie de la musique qui permettent de mieux comprendre ces relations. Selon une
première approche, la réponse émotionnelle précède les traitements cognitifs. Cette primauté de
l'émotion se traduit notamment par le fait qu'une réponse émotionnelle peut être obtenue dès les
premiers centièmes de seconde d'écoute d’une pièce de musique. Nous résumerons d'autres
études qui, tout en confirmant l'extrême rapidité des réponses émotionnelles, suggèrent que ces
réponses émotionnelles pourraient provenir de traitements cognitifs implicites mis en oeuvre dans
les trois cent premières millisecondes de l''écoute. Nous présenterons une méthodologie
permettant de pister avec précision le décours de ces réponses dans le cerveau. Etant donné
l'état actuel des recherches, nous soulignerons que l'extrême rapidité des réponses cognitives et
émotionnelles aux stimuli musicaux ne peut pas être anodine : elle indique selon nous
l'importance adaptative que ces stimuli revêtent pour l'espèce humaine.

Abstract
Musical Cognition and Emotion. Music is a cultural stimulus that has no obvious adaptive value for
the human species, but that nevertheless provokes emotional responses as intense as other
stimuli that are biologically relevant. For this reason, music is a privileged medium to study the
complex interactions between cognition and emotion. In this article, we will consider the present
knowledge from neurosciences and psychology of music that make it possible to better understand
these interactions. According to a first viewpoint, the emotional response occurs before cognitive
processes can take place. An emotional response can therefore occur within the first hundredths
of a second, when listening to music. We will summarize other studies which, though confirming
the extreme speed of emotional responses, suggest that these responses may result from implicit
cognitive processes that occur within the first three hundredths of a second. We will describe a
methodology that makes it possible to track the time-course of these responses in the brain with
great precision. Given the state of research today, we will underline that the extreme speed of
cognitive and emotional responses to musical stimuli cannot be fortuitous – for us it indicates the
adaptive importance of these stimuli for the human species.
Intellectica, 2008/1-2, 48-49, pp. 37-50

Cognition et émotion musicales

Emmanuel Bigand et Suzanne Filipic


RÉSUMÉ : La musique est une objet culturel qui n'a pas de valeur adaptative évidente
pour l'espèce humaine mais qui provoque cependant des réponses émotionnelles aussi
intenses que certaines stimulations biologiquement pertinentes. Pour cette raison, la
musique constitue un domaine privilégié pour approfondir les relations complexes qui
existent entre la cognition et les émotions. Dans cet article nous considérerons les
résultats actuels dans le domaine des neurosciences et de la psychologie de la musique
qui permettent de mieux comprendre ces relations. Selon une première approche, la
réponse émotionnelle précède les traitements cognitifs. Cette primauté de l'émotion se
traduit notamment par le fait qu'une réponse émotionnelle peut être obtenue dès les
premiers centièmes de seconde d'écoute d’une pièce de musique. Nous résumerons
d'autres études qui, tout en confirmant l'extrême rapidité des réponses émotionnelles,
suggèrent que ces réponses émotionnelles pourraient provenir de traitements cognitifs
implicites mis en œuvre dans les trois cent premières millisecondes de l'écoute. Nous
présenterons une méthodologie permettant de pister avec précision le décours de ces
réponses dans le cerveau. Etant donné l'état actuel des recherches, nous soulignerons
que l'extrême rapidité des réponses cognitives et émotionnelles aux stimuli musicaux
ne peut pas être anodine : elle indique selon nous l'importance adaptative que ces
stimuli revêtent pour l'espèce humaine.
Mots clés : Emotion, musique, cognition, primauté
ABSTRACT: Musical Cognition and Emotion. Music is a cultural stimulus that has
no obvious adaptive value for the human species, but that nevertheless provokes
emotional responses as intense as other stimuli that are biologically relevant. For this
reason, music is a privileged medium to study the complex interactions between
cognition and emotion. In this article, we will consider the present knowledge from
neurosciences and psychology of music that make it possible to better understand
these interactions. According to a first viewpoint, the emotional response occurs
before cognitive processes can take place. An emotional response can therefore occur
within the first hundredths of a second, when listening to music. We will summarize
other studies which, though confirming the extreme speed of emotional responses,
suggest that these responses may result from implicit cognitive processes that occur
within the first three hundredths of a second. We will describe a methodology that
makes it possible to track the time-course of these responses in the brain with great
precision. Given the state of research today, we will underline that the extreme speed
of cognitive and emotional responses to musical stimuli cannot be fortuitous – for us
it indicates the adaptive importance of these stimuli for the human species.
Keywords: Emotion, music, cognition, primacy
POURQUOI ETUDIER LES REPONSES EMOTIONELLES A LA MUSIQUE ?
La musique est une structure acoustique et temporelle complexe qui induit


Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du
Développement, Boulevard Gabriel; F-21000 Dijon, France ; Tel. +33 (0)380395782; Fax. +33
(0)380395767; bigand@u-bourgogne.fr.

© 2008 Association pour la Recherche Cognitive.


38 E. BIGAND, S. FILIPIC

chez les auditeurs une grande variété d’émotions et de sentiments. Elle peut
tout aussi bien stimuler les fonctions vitales des hommes au point de les
conduire à affronter avec ardeur l’angoisse de la mort sur les champs de
bataille, que calmer et réguler leurs humeurs comme cela s’observe aisément
chez les bébés et chez les patients atteints de différentes pathologies
neurodégénératives. L’importance que revêtent les activités musicales dans
toutes les civilisations humaines s’explique probablement par ce fort pouvoir
expressif. Ces observations trouvent aujourd’hui une validation dans les
recherches récentes en neurosciences. Ainsi, Blood & Zatorre (2001) ont
montré que l’écoute de pièces musicales pouvait activer les circuits neuronaux
de gratification (mésencéphale, striatum ventral et cortex orbitofrontal droit), et
réduire les activations des régions cérébrales impliquées dans les émotions
négatives (cortex préfrontal ventromedian, amygdale et hippocampe). La
musique agirait sur le plan neurophysiologique comme certains stimuli ayant
des implications biologiques évidentes, tels que les stimulations sexuelles, la
nourriture ou la drogue. De façon similaire, Khalfa et ses collaborateurs
(Khalfa et al., 2003) ont montré que l’écoute de la musique augmente la
résistance au stress, ce qui permet dans de nombreux cas de réduire les
prescriptions médicales des patients. Comment un stimulus artificiel qui n’a
pas d’implication biologique immédiate pour la survie, l’adaptation, la
nutrition ou la reproduction de l’espèce peut-il avoir un tel impact sur notre
cerveau ? Selon Blood et Zatorre (2001), la formation de liens anatomiques et
fonctionnels entre des systèmes cérébraux anciens et des zones cognitives plus
récentes permettrait d’attribuer des significations à des stimuli abstraits, et d’en
tirer plaisir.
Ces résultats qui ont des implications évidentes en musicothérapie n’en
restent pas moins surprenants sur le plan scientifique. La musique est un
stimulus abstrait qui ne renvoie à aucune réalité concrète du monde extérieur et
qui n’a pas d’implication adaptative immédiate. A ce titre, elle se différencie
radicalement des stimulations aversives (par exemple : chocs électriques,
photos de prédateurs, etc.) ou appétitives (nourriture) utilisées dans de
nombreuses études sur les émotions. Selon Pinker (1999) la musique serait une
« sucrerie auditive » anecdotique pour l’évolution de l’espèce qui pourrait
disparaître du jour au lendemain sans que les civilisations humaines en soient
affectées. La position de Pinker a pour principal mérite de forcer la
communauté scientifique à répondre de façon convaincante aux questions
suivantes : Pourquoi un stimulus aussi « anecdotique » en apparence que la
musique peut-il acquérir le pouvoir de stimuler des circuits émotionnels si
fondamentaux ? Comment se déroule la réponse émotionnelle à la musique ?
Quelles en sont les étapes et à quelle vitesse se réalisent-elles ? La réponse
émotionnelle précède-t-elle ou résulte-t-elle des traitements cognitifs ? C’est
autour de ces questions que nous allons orienter la suite de cet article.
L’EMOTION PRECEDE T ELLE LA COGNITION EN MUSIQUE ?
Il existe plusieurs manières de rendre compte des réponses émotionnelles en
musique. La première s’inspire des résultats obtenus dans le domaine des
neurosciences. On considère depuis une dizaine d’années que les émotions
reposent sur deux circuits neuronaux distincts mais interactifs (les réseaux
affectifs et cognitifs) qui ont pu être identifiés par des travaux en imagerie
cérébrale et des études de patients cérébrolésés. Le réseau affectif serait plus
rapide et son développement serait plus précoce dans la phylogenèse et
Cognition et émotion musicales 39

l’ontogenèse que le réseau cognitif (Zajonc, 1980 ; 1984). Ces différences


anatomiques et fonctionnelles expliqueraient pourquoi une réponse
émotionnelle à un stimulus aversif se produit avant même que le sujet ait pu
identifier le stimulus (LeDoux, 2000). L’indépendance de ces réseaux a été
amplement démontrée dans le domaine visuel par des cas de double
dissociation. Certaines lésions cérébrales altèrent la capacité de reconnaître
l’expression faciale des visages tout en préservant la capacité de reconnaître
leur identité. D’autres lésions altèrent la reconnaissance de l’identité sans
perturber la reconnaissance des expressions. Une indépendance similaire
pourrait être envisagée dans le domaine auditif : l’émotion induite par un
stimulus auditif pourrait être traitée par des circuits neuronaux différents de
ceux qui analysent les caractéristiques structurelles du stimulus et qui
permettent son identification. De la même façon, l’expression induite par le son
(le timbre de la voix par exemple) pourrait être traitée plus rapidement que
l’identité du locuteur.
La primauté de la réponse émotionnelle peut aisément se comprendre
lorsque l’on considère des stimuli ayant une grande importance pour le sujet
(image aversive de rat ou de serpent, timbre de la voix). Elle semble cependant
moins plausible dans le cas d’un stimulus fortement culturel comme la
musique. Certaines émotions induites par la musique proviennent sans doute
des propriétés immanentes du son (amplitude sonore, rugosité spectrale,
registre). L’infinie richesse des sentiments induits par la musique ne se réduit
cependant pas à la combinaison adroite de ces qualités sonores premières. La
composition d’une œuvre musicale met en œuvre des conventions culturelles
spécifiques à chaque société, ou même à des groupes sociaux spécifiques. Son
effet expressif ne peut être pleinement compris hors de ces conventions et des
traitements cognitifs réalisés sur le signal acoustique (Meyer, 1956, 2001;
Jackendoff, 1991). En reprenant la théorie des émotions de Mandler (1975),
Meyer (1956) développe ainsi l’idée que l’émotion induite par une œuvre
dépend de la façon dont la composition répond aux attentes structurelles de
l’auditeur. Ces attentes, qui peuvent provenir des différents paramètres
structuraux (harmonie, rythme, mélodie, relations thématiques), peuvent être
résolues au moment attendu, ou de façon retardée, ou encore de façon
surprenante, ce qui engendre alors un second niveau d’attente. Elles peuvent
également ne pas être résolues du tout. Dans bien des cas, ces attentes ne sont
pas perçues consciemment par le sujet : il s’agit du phénomène d’amorçage (cf
Tillmann & Poulin-Charronnat, ce volume), mais elles déterminent cependant
l’expression ressentie. La conception de Meyer, qui se retrouve formulée
différemment chez Lerdahl et Jackendoff (1983) puis Jackendoff (1991),
implique donc que la réponse émotionnelle succède au traitement cognitif.
Bien évidemment, la mise en compétition des traitements cognitifs et
émotionnels en musique n’a d’autre intérêt que de comprendre la nature des
processus qui influencent l’expérience émotionnelle et de déterminer si la
musique présente de ce point de vue une spécificité par rapport aux autres
stimulations de l’environnement. Eclairer ces questions permet également de
mieux comprendre la fonction de la musique pour nos sociétés. Nous
reviendrons sur ces points en conclusion de cet article. A l’heure actuelle, les
travaux en sciences cognitives de la musique conduisent à des observations
contradictoires. Cependant, étant donné leur nouveauté, les études sur
l’émotion musicale n’ayant pris leur essor que très récemment tant en
psychologie (Gabrielsson & Juslin, 1996, 2003 ; Robinson, 1997 ; Sloboda &
40 E. BIGAND, S. FILIPIC

Juslin, 2001 ; Gabrielsson, 2001 ; Gabrielsson, & Lindström, 2001) qu’en


neurophysiologie (Bartlett, 1996 ; Peretz 2001 ; Scherer & Zentner, 2001),
cette contradiction reste très positive puisqu’elle montre que les méthodes
expérimentales permettent d’obtenir des résultats suffisamment clairs et
consistants pour pouvoir conduire à des conclusions contrastées.
Plusieurs auteurs ont rapporté des résultats empiriques soulignant
l’importance des traitements cognitifs pour la réponse émotionnelle (Sloboda,
1991, 1992 ; Sloboda & Juslin, 2001 ; Gabrielsson, 2001). Les méthodes
utilisées permettent de montrer les liens directs existant entre les réactions
émotionnelles et certains traits structuraux précis (modulation, note
ornementale, changement de rythme, marche harmonique, répétition de motif,
par exemple). Peretz, Gagnon et Bouchard (1998) ont ainsi mis en évidence
que le tempo et le mode (majeur versus mineur) influencent de façon
systématique les réponses émotionnelles : les pièces induisent des émotions
différentes si elles sont jouées en mode majeur ou en mineur et/ou lorsque leur
tempo est lent ou rapide.
Cette approche cognitive de l’émotion a été remise en question récemment
par deux types de données. Tout d'abord, il a été montré que les réponses
émotionnelles à la musique pouvaient être extrêmement rapides, ce qui est peu
compatible avec une phase de traitement cognitif. Les traitements cognitifs
impliquent l’activation de nombreux circuits corticaux et l’on considère
généralement que ces activations sont relativement lentes. Peretz et ses
collaborateurs (Peretz, Gagnon et Bouchard, 1998) furent les premiers à
montrer que des sujets peuvent discriminer des émotions musicales simples de
façon consistante et non équivoque après seulement 250 millisecondes
d’écoute. Cette rapidité suggère que certaines émotions musicales
fonctionneraient comme des réflexes sous corticaux sans aucune médiation
cognitive, conformément au modèle des émotions de LeDoux (2000).
Un second type d’évidence allant à l’encontre des approches cognitives de
l’émotion est fournie par l’étude de cas en neuropsychologie. Peretz et ses
collaborateurs ont rapporté le cas d’une patiente amusique à la suite d’une
lésion cérébrale (I.R.) qui, bien que souffrant d’un déficit cognitif considérable
et spécifique au domaine musical, continue à apprécier la musique. Le déficit
d’I.R. est majeur et se traduit par exemple par le fait qu’elle ne peut pas
reconnaître des airs populaires très connus, dont elle reconnaît sans hésitation
les paroles. I.R. a également beaucoup de mal à détecter des modifications
flagrantes du rythme ou même des notes d’une chanson qu’elle vient
d’entendre, et éprouve de grosses difficultés à constater que deux pièces
musicales sont différentes. Cependant, malgré ce déficit sévère, I.R. reste
capable de différencier les émotions induites par des morceaux de musique gais
de celles induites par des morceaux tristes, et dans cette tâche ses performances
ne se distinguent pas de celles de sujets normaux. Qui plus est, I .R. se
comporte normalement lorsqu’elle doit différencier les émotions exprimées par
des extraits musicaux qui ne durent que 250 ms. Certaines de ses performances
sont encore plus troublantes : ainsi I.R. ne peut pas reconnaître qu’une pièce a
été modifiée lorsqu’elle lui est présentée d’abord dans le mode majeur, puis
dans le mode mineur (et réciproquement), mais par contre elle peut très bien
dire que les expressions qu'induisent ces deux versions d'une pièce sont
différentes. I .R. présente donc un cas de dissociation entre les traitements
cognitifs et émotionnels : les réponses émotionnelles à la musique peuvent
chez elle s’effectuer indépendamment des traitements cognitifs.
Cognition et émotion musicales 41

DECOURS TEMPORELS DES REPONSES EMOTIONNELLES A LA MUSIQUE


On objectera peut-être que les travaux qui précèdent portent sur des
réponses émotionnelles élémentaires à la musique (gai/triste) et que les
résultats obtenus dans ce type de cas peuvent difficilement être généralisés à
l’ensemble des expériences émotionnelles en musique. Certains contrastes
drastiques d’émotions pourraient impliquer des réflexes sous corticaux sans
pour autant qu’il en aille ainsi lorsque les pièces musicales provoquent des
émotions plus subtiles. C’est pour répondre à cet argument que nous avons
prolongé les études précédentes, en modifiant toutefois sensiblement la
méthodologie expérimentale.
Dans la première étude, nous avons présenté aux auditeurs 27 extraits de 20
à 30 secondes en moyenne en leur demandant de regrouper les extraits qui
induisaient chez eux des sentiments ou des émotions équivalentes. La tâche
encourageait l’auditeur à répondre subjectivement, c’est à dire en fonction de
son expérience propre, et sans qu’il ait besoin de caractériser cette expérience
émotionnelle à l’aide de labels linguistiques (cf. Bigand et al., 2005, pour une
présentation détaillée de cette recherche). Les extraits musicaux étaient
présentés sur un écran d’ordinateur sous la forme d’icônes, que les auditeurs
devaient grouper spatialement sur l’écran. Les icônes regroupées
correspondaient ainsi aux œuvres ayant induit des expériences émotionnelles
similaires pour les sujets. Les 27 extraits de musique classique instrumentale
utilisés dans cette étude avaient été sélectionnés sous le contrôle d’un
collaborateur agrégé de musicologie et en fonction de plusieurs critères. Les
extraits devaient : être représentatifs de différents types d’émotions musicales,
appartenir aux différentes périodes stylistiques (baroque, classique,
romantique, moderne), faire intervenir des formations instrumentales variées
et, autant que possible, ne pas provenir de morceaux trop connus des sujets.
Notre objectif était que les sujets ne répondent ni en fonction de paramètres
stylistiques ou acoustiques, ni en fonction d’émotions extra-musicales qui
auraient pu être associées aux extraits (comme pour une musique de film connu
par exemple). Les participants pouvaient écouter les extraits autant de fois
qu’ils le souhaitaient; l’étude durait une heure environ.
Deux groupes de participants avec et sans formation musicale ont fait cette
expérience à deux reprises, les deux sessions étant séparées d’au moins sept
jours. La comparaison des réponses obtenues aux deux sessions permettait
d’évaluer la fiabilité des réponses. Dans cette étude, nous avons surtout
manipulé la durée des extraits. Dans une condition, les participants écoutaient
des extraits qui duraient entre 20 et 30 secondes. Dans l'autre condition, un
autre groupe de participants commençait par faire l’expérience en écoutant
seulement la première seconde de ces mêmes extraits. Cette première partie
terminée, ils refaisaient à nouveau l’expérience mais en écoutant les extraits en
entier. L’analyse des résultats reprend les principes de l’analyse
multidimensionnelle (MultiDimensionnalScaling, MDS) couramment utilisée
en psychophysique et en psycho-acoustique. A l’issue de l’étude, nous pouvons
ainsi pu évaluer combien de fois les extraits ont été groupés ensemble par les
sujets : des extraits ayant une fréquence de cooccurrence élevée peuvent être
considérés comme émotionnellement proches puisque les sujets les ont très
fréquemment associés dans les groupements. A l’inverse, deux extraits n’ayant
jamais été regroupés par les sujets sont probablement émotionnellement
éloignés. Les fréquences de cooccurrence moyenne des extraits définissent
donc une matrice de proximité émotionnelle dont la structure peut être analysée
42 E. BIGAND, S. FILIPIC

par des analyses statistiques telles que la MDS. Cette analyse extrait le nombre
de dimensions qui sous-tendent cette matrice, puis elle propose une solution
géométrique qui positionne les extraits musicaux dans cet espace en respectant
au mieux les distances émotionnelles qui les séparent. Cette représentation peut
être considérée comme une cartographie des expériences émotionnelles
ressenties pour l’ensemble du corpus d’extraits. De la même façon, à partir
d’une matrice des distances entre les différentes villes de France, une MDS
pourrait produire la représentation cartographique à deux ou trois dimensions
la plus appropriée pour localiser les villes étudiées tout en respectant les
distances qui les séparent. Si aucune ville de montagne n’était considérée, une
représentation bidimensionnelle contenant les axes Nord Sud et Est-Ouest
suffirait pour fournir une représentation appropriée. Si des villes de montagne
étaient incluses, une représentation tridimensionnelle incluant la dimension
d’altitude fournirait une meilleure solution à la matrice des distances initiales.
L’hypothèse qui nous intéressait le plus dans cette étude concernait
l’influence de la durée des extraits sur la structure des matrices de similarité
émotionnelle. Si l’expérience émotionnelle induite par la musique est très
rapide et s’effectue dès les premiers centièmes de seconde, alors les
groupements émotionnels des sujets qui ont écouté la version longue des
extraits (20 à 30 secondes de musique) ne devraient pas être très différents de
ceux des sujets qui n’ont écouté que la version courte de ces mêmes extraits (la
première seconde). Les principaux résultats de cette étude peuvent se résumer
ainsi. Les auditeurs réalisent en moyenne 7 groupes de pièces, ce qui indique
que les émotions ressenties à l’écoute de ces 27 pièces ne se réduisent pas aux
4 grandes catégories d’émotions musicales (tristesse, sérénité, gaîté, colère).
On constate également que les sujets répondent de façon très consistante d’une
session à l’autre, ce qui confirme la fiabilité de la démarche. Peu de différences
ont été observées entre les groupements de pièces effectués par les auditeurs
avec formation musicale, et ceux effectués par les auditeurs sans formation
musicale. Ce résultat suggère que l’expertise musicale n’est pas un déterminant
majeur des émotions ressenties à l’écoute de ces extraits. L’ensemble de ces
résultats préalables démontre qu’il existe une forte consistance dans les
réponses émotionnelles d'un sujet d’une session à l’autre, et entre les sujets
(deux groupes indépendants d’auditeurs donnent des réponses quasi
identiques).
Les résultats de l’analyse dimensionnelle font apparaître que trois
dimensions principales structurent l’espace des similarités émotionnelles.
L’analyse de ces dimensions suggère que la première dimension oppose les
pièces qui induisent des émotions de forte énergie à celles induisant des
émotions de faible tonus (cf. Figure 1). Le second axe oppose les pièces
induisant des sentiments de valence positive (gaîté-sérénité) à des sentiments
de valence négative (désespoir ou colère). Enfin, un dernier axe (non
représenté sur la Figure 1), plus difficile à interpréter, oppose des pièces qui
induisent des dynamiques motrices contrastées (longs mouvements continus
versus mouvement saccadés). Selon Francès (1958), la musique activerait les
affects liés aux expériences sensori-motrices du sujet et ces activations
viendraient ensuite « colorer » les émotions induites par les œuvres (cf
Damasio, 1994 pour une version plus ancrée dans les découvertes récentes en
neurosciences de cette approche motrice de l’émotion musicale). Cette
troisième dimension pourrait être l’expression de l’activation de ces cartes
sensori-motrices. Ces trois dimensions définissent la structure de l’expérience
Cognition et émotion musicales 43

émotionnelle induite par ce corpus de 27 extraits. Cette structure n’est bien sûr
pas spécifique à ces extraits et les trois dimensions citées sont celles que les
données suggèrent dans la plupart des études sur les émotions.
Chacune des 27 pièces se positionne de façon spécifique dans cet espace
(Figure 1). On peut bien sûr identifier 4 grandes catégories d’émotions
correspondant globalement à la « sérénité », « la gaîté » (section droite de
l’espace), à la colère et la tristesse (section gauche de l’espace). Toutefois on
remarque aussi que les 27 pièces du corpus permettent de délimiter des
changements continus dans les expériences émotionnelles ressenties
(représentés par les lignes sur la Figure 1) : ainsi peut-on passer
progressivement de pièces très sereines à des pièces très gaies, sans changer la
valence (positive) des expressions. De la même façon, on peut passer assez
progressivement de pièces très lugubres à des pièces sereines, sans modifier le
dynamisme interne des émotions ressenties1. D’autres trajectoires
émotionnelles continues seraient sans doute possible si nous avions pris un
échantillon d’extraits beaucoup plus grand. L’important pour notre propos est
de constater que l’écoute des 27 extraits a bien provoqué des réponses
émotionnelles suffisamment riches pour remplir cet espace. Un autre point
important est la consistance des réponses : l’analyse des réponses données
lorsque les sujets n’ont écouté que la première seconde des extraits aboutit
exactement à la même représentation tridimensionnelle : les 27 extraits d’une
seconde se positionnent quasiment de la même façon dans cet espace que les
extraits de 20-30 secondes. Cette très forte convergence des réponses
émotionnelles confirme le résultat de Peretz, Gagnon et Bouchard (1998). Des
réponses émotionnelles riches, variées et consistantes entre les sujets sont
induites très rapidement dès la première seconde de musique.
Quels aspects sonores et musicaux sont susceptibles d’entraîner si
rapidement ces réponses émotionnelles ? Trois catégories de marqueurs
émotionnels sont distinguables lorsque l’on écoute ces extraits d'une seconde.
Certains dépendent des caractéristiques élémentaires du signal sonore (registre,
nombre de notes, intensité, timbre, dissonance). D’autres marqueurs sont
relatifs à l’harmonie tonale (fonction harmonique de l’accord entendu). Enfin,
certains extraits qui ne comportent qu’une note sont malgré tout très bien
caractérisés émotionnellement, ce qui suggère que d’autres éléments liés à
l’interprétation musicale suffisent pour induire sur une note une expression
précise. Il semble naturel qu’un instrumentiste s’apprêtant à jouer une œuvre
ayant un caractère expressif précis induise ce caractère dès la première note de
la pièce. Ainsi la première note d’une pièce sereine aura-t-elle des
caractéristiques sonores bien différentes de la première note d’une œuvre
mélancolique. Un auditeur occidental a probablement une connaissance
implicite de la signification de ces différences d’interprétations, et cette
connaissance intervient probablement pour induire l’émotion caractéristique de
l’extrait. Cette analyse qualitative suggère que la réponse émotionnelle peut
être très rapide, mais qu’elle pourrait cependant résulter de traitements
cognitifs (traitement de l’harmonie, notamment) qui se déroulent eux aussi très
rapidement.
Deux objections importantes peuvent toutefois être apportées à l’étude que
nous venons de résumer. Tout d’abord, on peut légitimement se demander si

1
Nous invitons le lecteur à effectuer cette écoute en consultant la page web http://leadserv.u-
bourgogne.fr/sons/.
44 E. BIGAND, S. FILIPIC

les sujets ont bien ressenti une émotion : ils pourraient être parvenus à
reconnaître l’émotion des extraits présentés sans pour autant la ressentir.
Reconnaître et ressentir une émotion (faciale par exemple) semble à priori deux
opérations bien distinctes : on peut voir qu’un visage est triste sans toutefois
devenir triste. Bien que cette distinction fût longtemps au cœur des débats dans
le domaine de la psychologie des émotions, elle apparaît aujourd’hui bien
moins justifiée qu’on a pu le croire. En effet, les recherches en
neuropsychologie ont montré que les sujets qui, suite à une lésion (cérébrale)
du lobe frontal, ne parvenaient plus à ressentir une émotion, avaient également
des troubles manifestes dans la reconnaissance des émotions (Damasio, 1994).
De plus, d’autres travaux s’inscrivant dans le courant de la cognition incarnée
ont montré que les performances de reconnaissance des émotions (faciales)
diminuent significativement si on empêche le sujet de ressentir l’émotion qu'il
doit reconnaître. Un artifice expérimental simple mais astucieux permet
d’empêcher le sujet de ressentir l’émotion. Selon le type d’émotion à
reconnaître, le sujet doit en effet tenir un crayon avec les lèvres, ou avec ses
dents, ou avec les lèvres et les dents. La façon dont il tient le crayon bloque les
muscles qui interviennent de façon spécifique pour les expressions de gaîté ou
de tristesse. Les résultats montrent que la capacité des sujets à reconnaître les
émotions peut être altérée par la position qu’on leur demande d’adopter. Ces
travaux suggèrent que ressentir et reconnaître une émotion ne sont en fait que
les faces différentes d’un même phénomène. Si le sujet parvient à reconnaître
une émotion, c’est que d’une certaine façon il éprouve, même faiblement,
l’émotion reconnue. La seconde objection possible porte sur la durée de nos
extraits. Dans l’étude précédente (Bigand et al., 2005), les extraits les plus
courts étaient relativement longs : ils duraient une seconde. Est-il possible
d’observer des réponses émotionnelles subtiles pour des durées plus courtes?
L’objectif de l’étude suivante fut de répondre à ces deux objections. La
tâche des sujets consistait cette fois à indiquer si l’extrait entendu leur semblait
émotionnellement neutre ou fort. Ils devaient répondre sur une échelle en 10
points. Bien que très subjective en apparence, cette tâche avait l’avantage de
forcer les sujets à focaliser leur attention sur ce qu’ils ressentaient, sans qu’ils
aient à caractériser ou à catégoriser leur émotion. Dans cette expérience, nous
avons manipulé la durée des extraits présentés. Les participants écoutaient
d'abord les premières 250 millisecondes de chaque morceau, puis les premières
500 ms, la première seconde, 2 secondes, 5 secondes, et enfin 15 à 20
secondes. Chaque participant commençait donc l’étude en entendant les 250
premières ms de tous les extraits et pour chacun d’eux il donnait une réponse.
Pour rendre cet exercice plus écologique, nous leur disions que la situation
s’apparentait un peu à la recherche d'une musique agréable à la radio. Ils
enchaînaient ensuite l’expérience en écoutant les 500 premières ms de tous les
extraits, puis la première seconde de tous les extraits, et ainsi de suite jusqu’à
l’extrait entier (15 à 20 secondes selon les cas). L’analyse des résultats a
débuté en utilisant les réponses données lorsque les extraits étaient présentés
dans leur intégralité pour séparer les extraits qui avaient été jugés comme
fortement émouvants de ceux qui avaient été jugés comme relativement
neutres. Ces deux groupes d’extraits étant identifiés pour chaque sujet, les
autres réponses ont été analysées pour identifier la durée à partir de laquelle les
sujets donnaient des réponses qui différenciaient (significativement) ces deux
groupes d’extraits. Si on estime que les réponses émotionnelles sont très
rapidement induites chez les auditeurs, on pouvait supposer que ceux-ci
Cognition et émotion musicales 45

auraient une intuition (même faible) sur le caractère plus ou moins émouvant
de l’extrait entendu dès les premiers centièmes de seconde.
Cette étude a été menée avec deux groupes d’auditeurs (avec et sans
formation musicale) et deux corpus d’extraits de style bien différents (musique
classique et musique populaire) dont la familiarité variait en fonction des
groupes d’auditeurs (le corpus classique étant plus familier aux experts que le
corpus populaire). Chacun de ces corpus contenait des pièces de faible et fort
dynamisme musical. L’analyse des résultats montre tout d’abord que l’émotion
ressentie par les sujets augmente avec la durée, notamment pour les pièces
appartenant au groupe des pièces émouvantes. Le résultat le plus surprenant est
de constater que dès l'écoute des extraits de 250 ms, les sujets ont donné des
jugements différents aux pièces émouvantes par rapport aux pièces neutres.
Autrement dit, une ébauche de réponse émotionnelle se produit dès les
premières 250 ms qui leur permet de différencier de façon statistiquement
significative les deux groupes de pièces. Cette différenciation augmente bien
sûr avec la durée des extraits pour atteindre une valeur maximale pour la durée
la plus longue. Ce résultat s’observe pour les deux corpus de pièces aussi bien
chez les sujets ayant une très bonne formation musicale que chez les sujets
novices. Enfin, pour les morceaux dynamiques pris séparément, les participants
ne jugent les morceaux émouvants comme plus émouvants que les morceaux
neutres qu’après avoir écouté les extraits de 500 ms. Tout ce passe donc
comme si les pièces de fort dynamisme provoquaient automatiquement une
réponse émotionnelle qui serait ensuite affinée. De façon très métaphorique,
nous pourrions dire que la dynamique musicale pourrait être à la réponse
émotionnelle en musique ce que la sensation de fraîcheur est à l’appréciation
de la saveur d’un produit : la sensation de fraîcheur s’impose immédiatement,
avant que la saveur du produit puisse être analysée.
CONCLUSION
Les études expérimentales qui viennent d’être résumées ici démontrent de
façon consistante l’extrême rapidité des réponses émotionnelles à la musique.
Dès les premiers centièmes de seconde de musique, le cerveau humain répond
émotionnellement de façon subtile aux stimuli. Ce résultat est compatible avec
de nombreuses autres études sur les émotions qui montrent que quelques
centièmes de seconde de présentation suffisent pour que des stimuli ayant une
importance biologique et psychologique pour les sujets (visages ou
mouvements corporels humains) déclenchent une émotion. Il est remarquable
qu’un objet culturel tel que la musique qui n’a pas d’implication adaptative
directe puisse entraîner une réponse émotionnelle aussi rapidement. Le fait que
ce résultat soit obtenu indifféremment auprès de sujets musicalement experts
ou novices et avec des corpus stylistiques d’œuvres qui ne présentent pas la
même familiarité pour les sujets souligne la robustesse du phénomène observé.
La rapidité d’un engagement émotionnel avec le stimulus musical pourrait
donc être une caractéristique très générale de l’écoute musicale que l’on soit ou
non expert, et que l'on soit familier ou non avec les œuvres entendues.
La question demeure désormais de savoir quel processus médiatise cette
réponse émotionnelle. Une première conception (à la LeDoux, 2000)
soulignerait que des réponses émotionnelles aussi rapides sont peu compatibles
avec l’activation de réseaux corticaux. Ces réponses pourraient donc résulter de
l’activation immédiate des réseaux affectifs sous corticaux qui court-
circuiteraient les processus cognitifs. Ces derniers pourraient toutefois
46 E. BIGAND, S. FILIPIC

intervenir dans un second temps pour moduler à leur tour les réponses
émotionnelles. Cette interprétation compatible avec les données de la
neuropsychologie (Peretz, Gagnon et Bouchard, 1998) ne nous semble pas
entièrement convaincante dans la mesure où l’analyse des informations
musicales contenues dans certains des extraits très courts révèle que seuls des
éléments liés aux connaissances de l’auditeur sur le système musical tonal
(harmonie) ou sur les règles de l’interprétation musicale peuvent rendre compte
de la réponse du sujet. Pour ces extraits, il semble ainsi que la réponse
émotionnelle ait été déclenchée au terme d'un traitement cognitif. Or on sait
que les traitements cognitifs qui mettent en œuvre les connaissances implicites
des auditeurs peuvent eux aussi se dérouler très rapidement. Par exemple, la
compréhension de la fonction tonale d’un accord en contexte ne semble
prendre que quelques centièmes de seconde. Cette rapidité des processus
cognitifs peut être démontrée dans des tâches d’amorçage musical (cf. Bigand
et al. 2003, ou encore Tilllmann & Poulin-Charronat, ce volume), ou par
l’analyse des potentiels évoqués. Les potentiels évoqués correspondent à des
micro-courants électriques enregistrés à la surface du crâne. On sait que les
composantes d’un potentiel évoqué traduisent différents aspects des traitements
cognitifs qu’un auditeur effectue à l’écoute du langage mais aussi de la
musique (Besson et Schön, 2001). Par exemple, la présence d’un accord
plausible mais peu attendu dans un contexte musical induit des changements
significatifs dans ces potentiels évoqués dans les 350 premières ms de
traitement (Regnault, Bigand et Besson, 2001; Koelsch et Siebel, 2005 pour
une revue). Autrement dit, les traitements cognitifs qui s’effectuent à l’écoute
de la musique sont eux aussi extrêmement rapides lorsqu’ils reposent sur des
processus implicites, et ils peuvent donc potentiellement moduler les réponses
émotionnelles des sujets dès leur origine.
Nous pouvons ici donner deux autres illustrations de cette intervention
précoce des processus cognitifs sur l’émotion. Dans une expérience récente
(Filipic et Bigand, 2005), nous présentions aux sujets des paires d’extraits
musicaux : les deux extraits d'une même paire pouvaient soit induire le même
type d’émotion (soit les deux extraits étaient sereins, soit les deux extraits
étaient tristes) soit des émotions distinctes (sérénité et tristesse). La tâche des
auditeurs étaient de dire aussi rapidement que possible si le second morceau
induisait en eux la même émotion que le premier, en appuyant sur deux
touches d’un clavier d’ordinateur étiquetées « même » et « différent ». Cette
tâche avait été élaborée pour permettre de mesurer un « temps de réponse »
(c’est-à-dire la durée de temps minimum nécessaire avant que les participants
soient conscients de ressentir une émotion), sans pour autant demander aux
participants de fournir une réponse verbale. La variable manipulée était la
tonalité dans laquelle les extraits étaient joués. Pour certaines paires, les
morceaux étaient entendus dans la même tonalité, pour d’autres paires, les
morceaux étaient joués dans des tonalités différentes. Notre hypothèse était que
si la réponse émotionnelle est médiatisée par un traitement cognitif, il est fort
probable que le changement de tonalité ralentisse ce traitement et donc retarde
sensiblement le jugement émotionnel du sujet. C’est bien ce qui fut constaté
dans cette expérience : le changement de tonalité retarde de 200 ms en
moyenne la réponse émotionnelle du sujet. Ce résultat va à l’encontre d’une
approche postulant la primauté de l’émotion sur la cognition dans les réponses
émotionnelles. Il indique au contraire que très probablement les deux circuits
(affectif et cognitif) interagissent dès les premiers centièmes de seconde en
Cognition et émotion musicales 47

musique.
Cette hypothèse est actuellement testée en collaboration avec l’équipe du
Professeur Liégeois-Chauvel à l’Hopital La Timone de Marseille (Inserm EMI-
U 9926). Cette étude consiste à pister les activations enregistrées
simultanément dans le cortex auditif (qui traite les aspects structuraux et
cognitifs du stimulus musical) et les régions sous-corticales impliquées dans
les réponses émotionnelles (l’amygdale notamment). L’analyse de la
corrélation des activités observées dans ces régions, en relation avec l’analyse
acoustique et musicologique des extraits musicaux présentés, permet de
préciser le type d’éléments structuraux auxquels ces deux régions cérébrales
répondent. De plus, le degré de résolution temporelle de la méthode de mesure
utilisée est suffisamment précis pour pouvoir établir quelle région est active en
premier. En l’état actuel, nos résultats montrent que les deux régions répondent
de façon corrélée à des traits musicaux pertinents d’un point de vue
musicologique (modulation, marche harmonique, notes ornementales,
répétition de motif). Dans de nombreux cas, la réponse est d’abord enregistrée
dans le cortex auditif puis dans l’amygdale, mais des contre-exemples existent.
Nos résultats actuels confirment toutefois les études comportementales
résumées ci-dessus : des réponses significatives sont obtenues dans l’amygdale
dès les premiers centièmes de seconde d’écoute du morceau. Une fois encore,
ces résultats sont obtenus avec des auditeurs sans formation musicale, ce qui
souligne que la rapidité des réponses émotionnelle à la musique n’est pas une
particularité des auditeurs experts en musique.
On nous objectera sans doute que les émotions dont il est question dans ces
études ne correspondent pas exactement aux réactions émotionnelles
auxquelles on se réfère habituellement lorsque l’on parle d’émotions en
musique. Le plus souvent, ce terme désigne des réactions suffisamment fortes
pour que le sujet en prenne conscience (frisson dans le dos, envie de sourire, ou
de pleurer etc.). Il va de soi que des réponses aussi intenses ne sont pas
déclenchées par des stimuli musicaux aussi courts que ceux que nous avons
utilisés, et qu’une durée d’écoute beaucoup plus longue est indispensable pour
ressentir des émotions de cette intensité. Le point que nous voulons souligner
dans ces études est qu’un processus de réponse émotionnelle semble s’engager
immédiatement à l’écoute de la musique. Ce processus est de faible intensité
dans les premiers centièmes de seconde, mais cette intensité est toutefois
suffisamment grande pour que ce processus puisse être mis en évidence par des
études comportementales ou des analyses fines de tracés neurophysiologiques.
Cette faible intensité explique pourquoi l’écoute de morceaux aussi courts ne
nous donne pas nécessairement consciemment l'impression d'être ému. Le
processus émotionnel n’en est pas moins engagé pour autant. Il est évident que
cette ébauche de réponse émotionnelle va s’intensifier et s’enrichir au fur et à
mesure de l’écoute (comme le démontrent d’ailleurs les résultats résumés ci-
dessus) pour n’atteindre des climax d’intensité que plus tardivement et,
probablement, qu’en certains points précis des œuvres. Les résultats résumés
ici nous semblent importants parce qu'ils montrent que la musique déclenche
quasiment immédiatement des réponses cognitives et émotionnelles subtiles, y
compris chez des auditeurs non spécialistes et non familiers avec les styles
présentés. En d’autres termes, il semble aussi difficile de ne pas s’engager dans
le traitement cognitif et émotionnel d’un stimulus dans le cas de la musique,
que comme dans le cas d’autres stimuli de l’environnement dont les
implications adaptatives sont évidentes (langage, visages ou mouvements
48 E. BIGAND, S. FILIPIC

corporels). Ce résultat est peu compatible avec la conception proposée par


Pinker selon laquelle la musique ne serait pour l’espèce humaine qu’une sorte
de « sucrerie auditive » dont la disparition n’aurait aucune implication pour
l’espèce. Si la musique avait si peu d’implication adaptive pour l’espèce, on
voit mal comment et pourquoi elle aurait la possibilité de déclencher dans un
large public des réponses émotionnelles et cognitives aussi immédiates que
celles induites par les stimuli biologiquement pertinents. A nos yeux, la
rapidité de ces réponses suggère que le cerveau humain reconnaît ici un
stimulus qui a une fonction adaptative essentielle. La nature de cette fonction
nous échappe peut être encore, mais l’investissement neuronal et cognitif
semble suffisamment important pour penser que la disparition de ce stimulus
aurait pour l’espèce des conséquences potentiellement aussi importantes que la
disparition du langage.
RÉFÉRENCES BIBLIOGRAPHIQUES
Bartlett, D.L. (1996). Physiological Responses to Music and Sound Stimuli. In D. A.
Hodges (ed.), (2nd ed), Handbook of Music Psychology, San Antonio, TX: IMR,
pp. 343-85.
Besson, M. & Schön, D. (2001). Comparison between Language and Music. Annals of
the New York Academy of Science, 930, pp. 232-258.
Bigand, E., Poulin, B., Tillmann, B., Madurell, F. & D’Adamo, D. (2003). Sensory
Versus Cognitive Components in Harmonic Priming. Journal of Experimental
Psychology: Human Perception and Performance, 29, pp. 159-171.
Bigand, E., Vieillard, S., Madurell, F., Marozeau, J. & Dacquet, A. (2005).
Multidimensional Scaling of Emotional Responses to Music: The Effect of Musical
Expertise and of the Duration of the Excerpts. Cognition and Emotion, 19, pp.
1113-1139.
Blood, A.J. & Zatorre, R.J. (2001). Intensely Pleasurable Responses to Music Correlate
with Activity in Brain Regions Implicated in Reward and Emotion. Proceedings of
the National Academy of Sciences, 98, (20), pp. 11818-23.
Filipic, S. & Bigand, E., (2005). Key Processing Precedes Emotional Categorization of
Western Music. Annals of the New York Academy of Sciences, 1060, pp. 443-445.
Francès, R. (1958) La perception de la musique. Paris : Vrin.
Gabrielsson, A. (2001). Emotions in Strong Experiences with Music. In J.A. Sloboda &
P. N. Juslin, Eds., Music and Emotion: Theory and Research. New York: Oxford
University Press, pp. 431-449.
Gabrielsson, A. & Juslin, P.N. (1996). Emotional Expression in Music Performances:
Between the Performer's Intention and the Listener's Experience. Psychology of
Music,24, pp. 68-91.
Gabrielsson, A. & Lindström, E. (2001). The Influence of Musical Structure on
Emotional Expression. In J. A. Sloboda & P. N. Juslin, Eds, Music and Emotion:
Theory and Research. New York: Oxford University Press, pp. 223-249.
Gabrielsson, A. & Juslin, P.N. (2003). Emotional Expression in Music. In R. J.
Davidson, K. R. Scherer & H. H. Goldsmith, Eds, Handbook of affective sciences.
New York: Oxford University Press, pp. 503-535
Jackendoff, R. (1991). Musical Parser and Musical Affect. Music Perception, 9, 2,
pp.199-230.
Khalfa S., Dalla Bella S., Roy M., Peretz I. & Lupien S. (2003). Effects of Relaxing
Music on Salivary Cortisol Level after Psychological Stress. Annals of the New
York Academy of Sciences, 999, pp. 374-376.
Koelsch, S. & Siebel, W.A. (2005). Towards a Neural Basis of Music Perception.
Trends in Cognitive Sciences, 9 (12), pp. 578-584.
LeDoux, J.E. (2000). Emotion Circuits in the Brain. Annual Review of Neuroscience,
23, pp. 155-184.
Cognition et émotion musicales 49

Lerdahl, F. & Jackendoff, R. (1983). A generative theory of tonal music. Cambridge:


Massachusetts Institute of Technology Press.
Mandler, G. (1975). Mind and Emotion. New York, NY: Wiley.
Meyer, L.B. (1956). Emotion and meaning in music. Chicago, IL: The University of
Chicago Press.
Meyer, L.B. (2001). Music and Emotion: Distinctions and Uncertainties. In J. A.
Sloboda & P. N. Juslin, Eds., Music and Emotion: Theory and Research. New
York: Oxford University Press, pp. 341-360.
Peretz, I., Gagnon, L. & Bouchard, B. (1998). Music and Emotion: Perceptual
Determinants, Immediacy, and Isolation after Brain Damage. Cognition, 68,
pp. 111-141.
Peretz, I. (2001). Listen to the Brain: A Biological Perspective on Music and Emotion.
In J. A. Sloboda & P. N. Juslin, Eds., Music and Emotion: Theory and Research;
New York: Oxford University Press, pp. 105-135.
Pinker, S. (1999). How the Mind Works. New York: W. W. Norton & Company.
Regnault, P., Bigand, E. & Besson, M. (2001). Different Brain Mechanisms Mediate
Sensitivity to Sensory Consonance and Harmonic Context: Evidence from Auditory
Event Related brain Potentials. Journal of Cognitive Neurosciences, 13, pp. 1-17.
Robinson, J. (1997). Music and Meaning. Cornell University Press. Ithaca, NY.
Scherer, K.R. & Zentner, M.R. (2001). Emotional Effects of Music Productions Rules.
In J. A. Sloboda & P. N. Juslin, Eds., Music and Emotion: theory and research.
New York: Oxford University Press, pp. 361-392.
Sloboda, J.A. (1991) Music Structure and Emotional Response: Some Empirical
Findings. Psychology of Music, 19, pp. 110-120.
Sloboda, J.A. (1992). Empirical Studies of Emotional Response to Music. In M.R.
Jones & S. Holleran (Eds.), Cognitive Bases of Musical Communication.
Washington, DC: American Psychological Association, pp. 33-46.
Sloboda, J.A. & Juslin, P.N. (2001). Music and Emotion: Theory and Research. New
York: Oxford University Press.
Zajonc, R.B. (1980). Feeling and Thinking. Preferences Need no Inferences. American
Psychologist, 35, pp. 151-175.
Zajonc, R.B. (1984). On the Primacy of Affect. American Psychologist, 39, pp. 117-
123.
50 E. BIGAND, S. FILIPIC

Figure 1 : Représentation des 27 extraits musicaux dans un espace émotionnel bidimensionnel composé
d’une première dimension de dynamisme (arousal) et d’une seconde dimension de valence. Ces extraits
peuvent être écoutés sur le site web http://leadserv.u-bourgogne.fr/sons/.

Vous aimerez peut-être aussi