Académique Documents
Professionnel Documents
Culture Documents
Revue de
l'Association pour la Recherche
Cognitive
Bigand Emmanuel, Filipic Suzanne. Cognition et émotion musicales. In: Intellectica. Revue de l'Association pour la
Recherche Cognitive, n°48-49, 2008/1-2. Musique et Cognition. pp. 37-50;
doi : https://doi.org/10.3406/intel.2008.1239
https://www.persee.fr/doc/intel_0769-4113_2008_num_48_1_1239
Abstract
Musical Cognition and Emotion. Music is a cultural stimulus that has no obvious adaptive value for
the human species, but that nevertheless provokes emotional responses as intense as other
stimuli that are biologically relevant. For this reason, music is a privileged medium to study the
complex interactions between cognition and emotion. In this article, we will consider the present
knowledge from neurosciences and psychology of music that make it possible to better understand
these interactions. According to a first viewpoint, the emotional response occurs before cognitive
processes can take place. An emotional response can therefore occur within the first hundredths
of a second, when listening to music. We will summarize other studies which, though confirming
the extreme speed of emotional responses, suggest that these responses may result from implicit
cognitive processes that occur within the first three hundredths of a second. We will describe a
methodology that makes it possible to track the time-course of these responses in the brain with
great precision. Given the state of research today, we will underline that the extreme speed of
cognitive and emotional responses to musical stimuli cannot be fortuitous – for us it indicates the
adaptive importance of these stimuli for the human species.
Intellectica, 2008/1-2, 48-49, pp. 37-50
Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du
Développement, Boulevard Gabriel; F-21000 Dijon, France ; Tel. +33 (0)380395782; Fax. +33
(0)380395767; bigand@u-bourgogne.fr.
chez les auditeurs une grande variété d’émotions et de sentiments. Elle peut
tout aussi bien stimuler les fonctions vitales des hommes au point de les
conduire à affronter avec ardeur l’angoisse de la mort sur les champs de
bataille, que calmer et réguler leurs humeurs comme cela s’observe aisément
chez les bébés et chez les patients atteints de différentes pathologies
neurodégénératives. L’importance que revêtent les activités musicales dans
toutes les civilisations humaines s’explique probablement par ce fort pouvoir
expressif. Ces observations trouvent aujourd’hui une validation dans les
recherches récentes en neurosciences. Ainsi, Blood & Zatorre (2001) ont
montré que l’écoute de pièces musicales pouvait activer les circuits neuronaux
de gratification (mésencéphale, striatum ventral et cortex orbitofrontal droit), et
réduire les activations des régions cérébrales impliquées dans les émotions
négatives (cortex préfrontal ventromedian, amygdale et hippocampe). La
musique agirait sur le plan neurophysiologique comme certains stimuli ayant
des implications biologiques évidentes, tels que les stimulations sexuelles, la
nourriture ou la drogue. De façon similaire, Khalfa et ses collaborateurs
(Khalfa et al., 2003) ont montré que l’écoute de la musique augmente la
résistance au stress, ce qui permet dans de nombreux cas de réduire les
prescriptions médicales des patients. Comment un stimulus artificiel qui n’a
pas d’implication biologique immédiate pour la survie, l’adaptation, la
nutrition ou la reproduction de l’espèce peut-il avoir un tel impact sur notre
cerveau ? Selon Blood et Zatorre (2001), la formation de liens anatomiques et
fonctionnels entre des systèmes cérébraux anciens et des zones cognitives plus
récentes permettrait d’attribuer des significations à des stimuli abstraits, et d’en
tirer plaisir.
Ces résultats qui ont des implications évidentes en musicothérapie n’en
restent pas moins surprenants sur le plan scientifique. La musique est un
stimulus abstrait qui ne renvoie à aucune réalité concrète du monde extérieur et
qui n’a pas d’implication adaptative immédiate. A ce titre, elle se différencie
radicalement des stimulations aversives (par exemple : chocs électriques,
photos de prédateurs, etc.) ou appétitives (nourriture) utilisées dans de
nombreuses études sur les émotions. Selon Pinker (1999) la musique serait une
« sucrerie auditive » anecdotique pour l’évolution de l’espèce qui pourrait
disparaître du jour au lendemain sans que les civilisations humaines en soient
affectées. La position de Pinker a pour principal mérite de forcer la
communauté scientifique à répondre de façon convaincante aux questions
suivantes : Pourquoi un stimulus aussi « anecdotique » en apparence que la
musique peut-il acquérir le pouvoir de stimuler des circuits émotionnels si
fondamentaux ? Comment se déroule la réponse émotionnelle à la musique ?
Quelles en sont les étapes et à quelle vitesse se réalisent-elles ? La réponse
émotionnelle précède-t-elle ou résulte-t-elle des traitements cognitifs ? C’est
autour de ces questions que nous allons orienter la suite de cet article.
L’EMOTION PRECEDE T ELLE LA COGNITION EN MUSIQUE ?
Il existe plusieurs manières de rendre compte des réponses émotionnelles en
musique. La première s’inspire des résultats obtenus dans le domaine des
neurosciences. On considère depuis une dizaine d’années que les émotions
reposent sur deux circuits neuronaux distincts mais interactifs (les réseaux
affectifs et cognitifs) qui ont pu être identifiés par des travaux en imagerie
cérébrale et des études de patients cérébrolésés. Le réseau affectif serait plus
rapide et son développement serait plus précoce dans la phylogenèse et
Cognition et émotion musicales 39
par des analyses statistiques telles que la MDS. Cette analyse extrait le nombre
de dimensions qui sous-tendent cette matrice, puis elle propose une solution
géométrique qui positionne les extraits musicaux dans cet espace en respectant
au mieux les distances émotionnelles qui les séparent. Cette représentation peut
être considérée comme une cartographie des expériences émotionnelles
ressenties pour l’ensemble du corpus d’extraits. De la même façon, à partir
d’une matrice des distances entre les différentes villes de France, une MDS
pourrait produire la représentation cartographique à deux ou trois dimensions
la plus appropriée pour localiser les villes étudiées tout en respectant les
distances qui les séparent. Si aucune ville de montagne n’était considérée, une
représentation bidimensionnelle contenant les axes Nord Sud et Est-Ouest
suffirait pour fournir une représentation appropriée. Si des villes de montagne
étaient incluses, une représentation tridimensionnelle incluant la dimension
d’altitude fournirait une meilleure solution à la matrice des distances initiales.
L’hypothèse qui nous intéressait le plus dans cette étude concernait
l’influence de la durée des extraits sur la structure des matrices de similarité
émotionnelle. Si l’expérience émotionnelle induite par la musique est très
rapide et s’effectue dès les premiers centièmes de seconde, alors les
groupements émotionnels des sujets qui ont écouté la version longue des
extraits (20 à 30 secondes de musique) ne devraient pas être très différents de
ceux des sujets qui n’ont écouté que la version courte de ces mêmes extraits (la
première seconde). Les principaux résultats de cette étude peuvent se résumer
ainsi. Les auditeurs réalisent en moyenne 7 groupes de pièces, ce qui indique
que les émotions ressenties à l’écoute de ces 27 pièces ne se réduisent pas aux
4 grandes catégories d’émotions musicales (tristesse, sérénité, gaîté, colère).
On constate également que les sujets répondent de façon très consistante d’une
session à l’autre, ce qui confirme la fiabilité de la démarche. Peu de différences
ont été observées entre les groupements de pièces effectués par les auditeurs
avec formation musicale, et ceux effectués par les auditeurs sans formation
musicale. Ce résultat suggère que l’expertise musicale n’est pas un déterminant
majeur des émotions ressenties à l’écoute de ces extraits. L’ensemble de ces
résultats préalables démontre qu’il existe une forte consistance dans les
réponses émotionnelles d'un sujet d’une session à l’autre, et entre les sujets
(deux groupes indépendants d’auditeurs donnent des réponses quasi
identiques).
Les résultats de l’analyse dimensionnelle font apparaître que trois
dimensions principales structurent l’espace des similarités émotionnelles.
L’analyse de ces dimensions suggère que la première dimension oppose les
pièces qui induisent des émotions de forte énergie à celles induisant des
émotions de faible tonus (cf. Figure 1). Le second axe oppose les pièces
induisant des sentiments de valence positive (gaîté-sérénité) à des sentiments
de valence négative (désespoir ou colère). Enfin, un dernier axe (non
représenté sur la Figure 1), plus difficile à interpréter, oppose des pièces qui
induisent des dynamiques motrices contrastées (longs mouvements continus
versus mouvement saccadés). Selon Francès (1958), la musique activerait les
affects liés aux expériences sensori-motrices du sujet et ces activations
viendraient ensuite « colorer » les émotions induites par les œuvres (cf
Damasio, 1994 pour une version plus ancrée dans les découvertes récentes en
neurosciences de cette approche motrice de l’émotion musicale). Cette
troisième dimension pourrait être l’expression de l’activation de ces cartes
sensori-motrices. Ces trois dimensions définissent la structure de l’expérience
Cognition et émotion musicales 43
émotionnelle induite par ce corpus de 27 extraits. Cette structure n’est bien sûr
pas spécifique à ces extraits et les trois dimensions citées sont celles que les
données suggèrent dans la plupart des études sur les émotions.
Chacune des 27 pièces se positionne de façon spécifique dans cet espace
(Figure 1). On peut bien sûr identifier 4 grandes catégories d’émotions
correspondant globalement à la « sérénité », « la gaîté » (section droite de
l’espace), à la colère et la tristesse (section gauche de l’espace). Toutefois on
remarque aussi que les 27 pièces du corpus permettent de délimiter des
changements continus dans les expériences émotionnelles ressenties
(représentés par les lignes sur la Figure 1) : ainsi peut-on passer
progressivement de pièces très sereines à des pièces très gaies, sans changer la
valence (positive) des expressions. De la même façon, on peut passer assez
progressivement de pièces très lugubres à des pièces sereines, sans modifier le
dynamisme interne des émotions ressenties1. D’autres trajectoires
émotionnelles continues seraient sans doute possible si nous avions pris un
échantillon d’extraits beaucoup plus grand. L’important pour notre propos est
de constater que l’écoute des 27 extraits a bien provoqué des réponses
émotionnelles suffisamment riches pour remplir cet espace. Un autre point
important est la consistance des réponses : l’analyse des réponses données
lorsque les sujets n’ont écouté que la première seconde des extraits aboutit
exactement à la même représentation tridimensionnelle : les 27 extraits d’une
seconde se positionnent quasiment de la même façon dans cet espace que les
extraits de 20-30 secondes. Cette très forte convergence des réponses
émotionnelles confirme le résultat de Peretz, Gagnon et Bouchard (1998). Des
réponses émotionnelles riches, variées et consistantes entre les sujets sont
induites très rapidement dès la première seconde de musique.
Quels aspects sonores et musicaux sont susceptibles d’entraîner si
rapidement ces réponses émotionnelles ? Trois catégories de marqueurs
émotionnels sont distinguables lorsque l’on écoute ces extraits d'une seconde.
Certains dépendent des caractéristiques élémentaires du signal sonore (registre,
nombre de notes, intensité, timbre, dissonance). D’autres marqueurs sont
relatifs à l’harmonie tonale (fonction harmonique de l’accord entendu). Enfin,
certains extraits qui ne comportent qu’une note sont malgré tout très bien
caractérisés émotionnellement, ce qui suggère que d’autres éléments liés à
l’interprétation musicale suffisent pour induire sur une note une expression
précise. Il semble naturel qu’un instrumentiste s’apprêtant à jouer une œuvre
ayant un caractère expressif précis induise ce caractère dès la première note de
la pièce. Ainsi la première note d’une pièce sereine aura-t-elle des
caractéristiques sonores bien différentes de la première note d’une œuvre
mélancolique. Un auditeur occidental a probablement une connaissance
implicite de la signification de ces différences d’interprétations, et cette
connaissance intervient probablement pour induire l’émotion caractéristique de
l’extrait. Cette analyse qualitative suggère que la réponse émotionnelle peut
être très rapide, mais qu’elle pourrait cependant résulter de traitements
cognitifs (traitement de l’harmonie, notamment) qui se déroulent eux aussi très
rapidement.
Deux objections importantes peuvent toutefois être apportées à l’étude que
nous venons de résumer. Tout d’abord, on peut légitimement se demander si
1
Nous invitons le lecteur à effectuer cette écoute en consultant la page web http://leadserv.u-
bourgogne.fr/sons/.
44 E. BIGAND, S. FILIPIC
les sujets ont bien ressenti une émotion : ils pourraient être parvenus à
reconnaître l’émotion des extraits présentés sans pour autant la ressentir.
Reconnaître et ressentir une émotion (faciale par exemple) semble à priori deux
opérations bien distinctes : on peut voir qu’un visage est triste sans toutefois
devenir triste. Bien que cette distinction fût longtemps au cœur des débats dans
le domaine de la psychologie des émotions, elle apparaît aujourd’hui bien
moins justifiée qu’on a pu le croire. En effet, les recherches en
neuropsychologie ont montré que les sujets qui, suite à une lésion (cérébrale)
du lobe frontal, ne parvenaient plus à ressentir une émotion, avaient également
des troubles manifestes dans la reconnaissance des émotions (Damasio, 1994).
De plus, d’autres travaux s’inscrivant dans le courant de la cognition incarnée
ont montré que les performances de reconnaissance des émotions (faciales)
diminuent significativement si on empêche le sujet de ressentir l’émotion qu'il
doit reconnaître. Un artifice expérimental simple mais astucieux permet
d’empêcher le sujet de ressentir l’émotion. Selon le type d’émotion à
reconnaître, le sujet doit en effet tenir un crayon avec les lèvres, ou avec ses
dents, ou avec les lèvres et les dents. La façon dont il tient le crayon bloque les
muscles qui interviennent de façon spécifique pour les expressions de gaîté ou
de tristesse. Les résultats montrent que la capacité des sujets à reconnaître les
émotions peut être altérée par la position qu’on leur demande d’adopter. Ces
travaux suggèrent que ressentir et reconnaître une émotion ne sont en fait que
les faces différentes d’un même phénomène. Si le sujet parvient à reconnaître
une émotion, c’est que d’une certaine façon il éprouve, même faiblement,
l’émotion reconnue. La seconde objection possible porte sur la durée de nos
extraits. Dans l’étude précédente (Bigand et al., 2005), les extraits les plus
courts étaient relativement longs : ils duraient une seconde. Est-il possible
d’observer des réponses émotionnelles subtiles pour des durées plus courtes?
L’objectif de l’étude suivante fut de répondre à ces deux objections. La
tâche des sujets consistait cette fois à indiquer si l’extrait entendu leur semblait
émotionnellement neutre ou fort. Ils devaient répondre sur une échelle en 10
points. Bien que très subjective en apparence, cette tâche avait l’avantage de
forcer les sujets à focaliser leur attention sur ce qu’ils ressentaient, sans qu’ils
aient à caractériser ou à catégoriser leur émotion. Dans cette expérience, nous
avons manipulé la durée des extraits présentés. Les participants écoutaient
d'abord les premières 250 millisecondes de chaque morceau, puis les premières
500 ms, la première seconde, 2 secondes, 5 secondes, et enfin 15 à 20
secondes. Chaque participant commençait donc l’étude en entendant les 250
premières ms de tous les extraits et pour chacun d’eux il donnait une réponse.
Pour rendre cet exercice plus écologique, nous leur disions que la situation
s’apparentait un peu à la recherche d'une musique agréable à la radio. Ils
enchaînaient ensuite l’expérience en écoutant les 500 premières ms de tous les
extraits, puis la première seconde de tous les extraits, et ainsi de suite jusqu’à
l’extrait entier (15 à 20 secondes selon les cas). L’analyse des résultats a
débuté en utilisant les réponses données lorsque les extraits étaient présentés
dans leur intégralité pour séparer les extraits qui avaient été jugés comme
fortement émouvants de ceux qui avaient été jugés comme relativement
neutres. Ces deux groupes d’extraits étant identifiés pour chaque sujet, les
autres réponses ont été analysées pour identifier la durée à partir de laquelle les
sujets donnaient des réponses qui différenciaient (significativement) ces deux
groupes d’extraits. Si on estime que les réponses émotionnelles sont très
rapidement induites chez les auditeurs, on pouvait supposer que ceux-ci
Cognition et émotion musicales 45
auraient une intuition (même faible) sur le caractère plus ou moins émouvant
de l’extrait entendu dès les premiers centièmes de seconde.
Cette étude a été menée avec deux groupes d’auditeurs (avec et sans
formation musicale) et deux corpus d’extraits de style bien différents (musique
classique et musique populaire) dont la familiarité variait en fonction des
groupes d’auditeurs (le corpus classique étant plus familier aux experts que le
corpus populaire). Chacun de ces corpus contenait des pièces de faible et fort
dynamisme musical. L’analyse des résultats montre tout d’abord que l’émotion
ressentie par les sujets augmente avec la durée, notamment pour les pièces
appartenant au groupe des pièces émouvantes. Le résultat le plus surprenant est
de constater que dès l'écoute des extraits de 250 ms, les sujets ont donné des
jugements différents aux pièces émouvantes par rapport aux pièces neutres.
Autrement dit, une ébauche de réponse émotionnelle se produit dès les
premières 250 ms qui leur permet de différencier de façon statistiquement
significative les deux groupes de pièces. Cette différenciation augmente bien
sûr avec la durée des extraits pour atteindre une valeur maximale pour la durée
la plus longue. Ce résultat s’observe pour les deux corpus de pièces aussi bien
chez les sujets ayant une très bonne formation musicale que chez les sujets
novices. Enfin, pour les morceaux dynamiques pris séparément, les participants
ne jugent les morceaux émouvants comme plus émouvants que les morceaux
neutres qu’après avoir écouté les extraits de 500 ms. Tout ce passe donc
comme si les pièces de fort dynamisme provoquaient automatiquement une
réponse émotionnelle qui serait ensuite affinée. De façon très métaphorique,
nous pourrions dire que la dynamique musicale pourrait être à la réponse
émotionnelle en musique ce que la sensation de fraîcheur est à l’appréciation
de la saveur d’un produit : la sensation de fraîcheur s’impose immédiatement,
avant que la saveur du produit puisse être analysée.
CONCLUSION
Les études expérimentales qui viennent d’être résumées ici démontrent de
façon consistante l’extrême rapidité des réponses émotionnelles à la musique.
Dès les premiers centièmes de seconde de musique, le cerveau humain répond
émotionnellement de façon subtile aux stimuli. Ce résultat est compatible avec
de nombreuses autres études sur les émotions qui montrent que quelques
centièmes de seconde de présentation suffisent pour que des stimuli ayant une
importance biologique et psychologique pour les sujets (visages ou
mouvements corporels humains) déclenchent une émotion. Il est remarquable
qu’un objet culturel tel que la musique qui n’a pas d’implication adaptative
directe puisse entraîner une réponse émotionnelle aussi rapidement. Le fait que
ce résultat soit obtenu indifféremment auprès de sujets musicalement experts
ou novices et avec des corpus stylistiques d’œuvres qui ne présentent pas la
même familiarité pour les sujets souligne la robustesse du phénomène observé.
La rapidité d’un engagement émotionnel avec le stimulus musical pourrait
donc être une caractéristique très générale de l’écoute musicale que l’on soit ou
non expert, et que l'on soit familier ou non avec les œuvres entendues.
La question demeure désormais de savoir quel processus médiatise cette
réponse émotionnelle. Une première conception (à la LeDoux, 2000)
soulignerait que des réponses émotionnelles aussi rapides sont peu compatibles
avec l’activation de réseaux corticaux. Ces réponses pourraient donc résulter de
l’activation immédiate des réseaux affectifs sous corticaux qui court-
circuiteraient les processus cognitifs. Ces derniers pourraient toutefois
46 E. BIGAND, S. FILIPIC
intervenir dans un second temps pour moduler à leur tour les réponses
émotionnelles. Cette interprétation compatible avec les données de la
neuropsychologie (Peretz, Gagnon et Bouchard, 1998) ne nous semble pas
entièrement convaincante dans la mesure où l’analyse des informations
musicales contenues dans certains des extraits très courts révèle que seuls des
éléments liés aux connaissances de l’auditeur sur le système musical tonal
(harmonie) ou sur les règles de l’interprétation musicale peuvent rendre compte
de la réponse du sujet. Pour ces extraits, il semble ainsi que la réponse
émotionnelle ait été déclenchée au terme d'un traitement cognitif. Or on sait
que les traitements cognitifs qui mettent en œuvre les connaissances implicites
des auditeurs peuvent eux aussi se dérouler très rapidement. Par exemple, la
compréhension de la fonction tonale d’un accord en contexte ne semble
prendre que quelques centièmes de seconde. Cette rapidité des processus
cognitifs peut être démontrée dans des tâches d’amorçage musical (cf. Bigand
et al. 2003, ou encore Tilllmann & Poulin-Charronat, ce volume), ou par
l’analyse des potentiels évoqués. Les potentiels évoqués correspondent à des
micro-courants électriques enregistrés à la surface du crâne. On sait que les
composantes d’un potentiel évoqué traduisent différents aspects des traitements
cognitifs qu’un auditeur effectue à l’écoute du langage mais aussi de la
musique (Besson et Schön, 2001). Par exemple, la présence d’un accord
plausible mais peu attendu dans un contexte musical induit des changements
significatifs dans ces potentiels évoqués dans les 350 premières ms de
traitement (Regnault, Bigand et Besson, 2001; Koelsch et Siebel, 2005 pour
une revue). Autrement dit, les traitements cognitifs qui s’effectuent à l’écoute
de la musique sont eux aussi extrêmement rapides lorsqu’ils reposent sur des
processus implicites, et ils peuvent donc potentiellement moduler les réponses
émotionnelles des sujets dès leur origine.
Nous pouvons ici donner deux autres illustrations de cette intervention
précoce des processus cognitifs sur l’émotion. Dans une expérience récente
(Filipic et Bigand, 2005), nous présentions aux sujets des paires d’extraits
musicaux : les deux extraits d'une même paire pouvaient soit induire le même
type d’émotion (soit les deux extraits étaient sereins, soit les deux extraits
étaient tristes) soit des émotions distinctes (sérénité et tristesse). La tâche des
auditeurs étaient de dire aussi rapidement que possible si le second morceau
induisait en eux la même émotion que le premier, en appuyant sur deux
touches d’un clavier d’ordinateur étiquetées « même » et « différent ». Cette
tâche avait été élaborée pour permettre de mesurer un « temps de réponse »
(c’est-à-dire la durée de temps minimum nécessaire avant que les participants
soient conscients de ressentir une émotion), sans pour autant demander aux
participants de fournir une réponse verbale. La variable manipulée était la
tonalité dans laquelle les extraits étaient joués. Pour certaines paires, les
morceaux étaient entendus dans la même tonalité, pour d’autres paires, les
morceaux étaient joués dans des tonalités différentes. Notre hypothèse était que
si la réponse émotionnelle est médiatisée par un traitement cognitif, il est fort
probable que le changement de tonalité ralentisse ce traitement et donc retarde
sensiblement le jugement émotionnel du sujet. C’est bien ce qui fut constaté
dans cette expérience : le changement de tonalité retarde de 200 ms en
moyenne la réponse émotionnelle du sujet. Ce résultat va à l’encontre d’une
approche postulant la primauté de l’émotion sur la cognition dans les réponses
émotionnelles. Il indique au contraire que très probablement les deux circuits
(affectif et cognitif) interagissent dès les premiers centièmes de seconde en
Cognition et émotion musicales 47
musique.
Cette hypothèse est actuellement testée en collaboration avec l’équipe du
Professeur Liégeois-Chauvel à l’Hopital La Timone de Marseille (Inserm EMI-
U 9926). Cette étude consiste à pister les activations enregistrées
simultanément dans le cortex auditif (qui traite les aspects structuraux et
cognitifs du stimulus musical) et les régions sous-corticales impliquées dans
les réponses émotionnelles (l’amygdale notamment). L’analyse de la
corrélation des activités observées dans ces régions, en relation avec l’analyse
acoustique et musicologique des extraits musicaux présentés, permet de
préciser le type d’éléments structuraux auxquels ces deux régions cérébrales
répondent. De plus, le degré de résolution temporelle de la méthode de mesure
utilisée est suffisamment précis pour pouvoir établir quelle région est active en
premier. En l’état actuel, nos résultats montrent que les deux régions répondent
de façon corrélée à des traits musicaux pertinents d’un point de vue
musicologique (modulation, marche harmonique, notes ornementales,
répétition de motif). Dans de nombreux cas, la réponse est d’abord enregistrée
dans le cortex auditif puis dans l’amygdale, mais des contre-exemples existent.
Nos résultats actuels confirment toutefois les études comportementales
résumées ci-dessus : des réponses significatives sont obtenues dans l’amygdale
dès les premiers centièmes de seconde d’écoute du morceau. Une fois encore,
ces résultats sont obtenus avec des auditeurs sans formation musicale, ce qui
souligne que la rapidité des réponses émotionnelle à la musique n’est pas une
particularité des auditeurs experts en musique.
On nous objectera sans doute que les émotions dont il est question dans ces
études ne correspondent pas exactement aux réactions émotionnelles
auxquelles on se réfère habituellement lorsque l’on parle d’émotions en
musique. Le plus souvent, ce terme désigne des réactions suffisamment fortes
pour que le sujet en prenne conscience (frisson dans le dos, envie de sourire, ou
de pleurer etc.). Il va de soi que des réponses aussi intenses ne sont pas
déclenchées par des stimuli musicaux aussi courts que ceux que nous avons
utilisés, et qu’une durée d’écoute beaucoup plus longue est indispensable pour
ressentir des émotions de cette intensité. Le point que nous voulons souligner
dans ces études est qu’un processus de réponse émotionnelle semble s’engager
immédiatement à l’écoute de la musique. Ce processus est de faible intensité
dans les premiers centièmes de seconde, mais cette intensité est toutefois
suffisamment grande pour que ce processus puisse être mis en évidence par des
études comportementales ou des analyses fines de tracés neurophysiologiques.
Cette faible intensité explique pourquoi l’écoute de morceaux aussi courts ne
nous donne pas nécessairement consciemment l'impression d'être ému. Le
processus émotionnel n’en est pas moins engagé pour autant. Il est évident que
cette ébauche de réponse émotionnelle va s’intensifier et s’enrichir au fur et à
mesure de l’écoute (comme le démontrent d’ailleurs les résultats résumés ci-
dessus) pour n’atteindre des climax d’intensité que plus tardivement et,
probablement, qu’en certains points précis des œuvres. Les résultats résumés
ici nous semblent importants parce qu'ils montrent que la musique déclenche
quasiment immédiatement des réponses cognitives et émotionnelles subtiles, y
compris chez des auditeurs non spécialistes et non familiers avec les styles
présentés. En d’autres termes, il semble aussi difficile de ne pas s’engager dans
le traitement cognitif et émotionnel d’un stimulus dans le cas de la musique,
que comme dans le cas d’autres stimuli de l’environnement dont les
implications adaptatives sont évidentes (langage, visages ou mouvements
48 E. BIGAND, S. FILIPIC
Figure 1 : Représentation des 27 extraits musicaux dans un espace émotionnel bidimensionnel composé
d’une première dimension de dynamisme (arousal) et d’une seconde dimension de valence. Ces extraits
peuvent être écoutés sur le site web http://leadserv.u-bourgogne.fr/sons/.