Vous êtes sur la page 1sur 225

Licence 3 et Magistère de physique

Physique Statistique :
des processus élémentaires aux phénomènes collectifs

Christophe Texier

14 mars 2016
Table des matières

1 Le périmètre de la physique statistique 1


I À quoi sert la physique statistique ? . . . . . . . . . . . . . . . . . . . . . . . . . 1
II Processus élémentaires et phénomènes collectifs . . . . . . . . . . . . . . . . . . . 2
II.A Échelle microscopique : l’hypothèse atomique . . . . . . . . . . . . . . . . 2
II.B La dichotomie micro/macro . . . . . . . . . . . . . . . . . . . . . . . . . . 3
II.C La physique statistique par rapport à la thermodynamique . . . . . . . . 3
II.D La relation avec la thermodynamique comme guide . . . . . . . . . . . . . 4
III Fin du réductionnisme et émergence . . . . . . . . . . . . . . . . . . . . . . . . . 5
III.A La démarche de la physique statistique . . . . . . . . . . . . . . . . . . . . 5
III.B Phénomènes collectifs et auto-organisation . . . . . . . . . . . . . . . . . . 5
III.C Universalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
IV Conseils bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Annexe 1.A : Repères historiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 L’approche probabiliste 15
I Nécessité de l’approche probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.A Une nécessité pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.B Une nécessité de principe : chaos, perturbations extérieures et mécanique
quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
II Quelques éléments de théorie des probabilités . . . . . . . . . . . . . . . . . . . . 17
II.A Évènements et probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . 17
II.B Variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
II.C Variable aléatoire continue – Distribution/densité de probabilité . . . . . 18
II.D Loi jointe – loi marginale . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
II.E Moyenne, variance, moments, cumulants, corrélations,... . . . . . . . . . . 20
II.F Fonctions génératrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II.G Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
II.H Remarque : et si les moments n’existent pas ? . . . . . . . . . . . . . . . . 25
II.I Théorème de la limite centrale . . . . . . . . . . . . . . . . . . . . . . . . 26
III Microétats, macroétats, information et entropie statistique . . . . . . . . . . . . . 28
III.A Microétats, macroétats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
III.B Quantifier l’information manquante : entropie statistique . . . . . . . . . 28
III.C Propriétés de l’entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Annexe 2.A : Fonction de grande déviation . . . . . . . . . . . . . . . . . . . . . . . . . 32
Annexe 2.B : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3 Postulat fondamental – Ensemble microcanonique 37


I Première approche dans un cadre classique . . . . . . . . . . . . . . . . . . . . . 39
I.A Espace des phases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
I.B Pourquoi l’espace des phases ? Théorème de Liouville . . . . . . . . . . . . 39

v
TABLE DES MATIÈRES TABLE DES MATIÈRES

I.C Expérience (numérique) des sphères dures – Du problème de Sinai au


postulat fondamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
I.D Ergodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
I.E Énoncé du postulat fondamental . . . . . . . . . . . . . . . . . . . . . . . 44
II Description quantique : espace de Hilbert . . . . . . . . . . . . . . . . . . . . . . 47
II.A Rappel des postulats de la mécanique quantique . . . . . . . . . . . . . . 47
II.B Microétats et macroétats, moyennes . . . . . . . . . . . . . . . . . . . . . 48
II.C Dénombrer les microétats : densité d’états . . . . . . . . . . . . . . . . . . 49
II.D Densité d’états pour des particules identiques (donc indiscernables) . . . . 53
III Postulat fondamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
III.A La distribution microcanonique . . . . . . . . . . . . . . . . . . . . . . . . 56
III.B Entropie microcanonique . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
IV Relâchement de contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
IV.A Variables externes et variables internes . . . . . . . . . . . . . . . . . . . . 60
IV.B Contact thermique entre deux systèmes – Température microcanonique . 60
IV.C Échange de volume – Pression microcanonique . . . . . . . . . . . . . . . 64
IV.D Échange de particules – Potentiel chimique microcanonique . . . . . . . . 66
IV.E Cas général : distribution d’une variable interne quelconque . . . . . . . . 67
V Irréversibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
VI Remarques sur le rôle de l’indiscernabilité . . . . . . . . . . . . . . . . . . . . . . 69
VI.A Validité du traitement semi-classique de l’indiscernabilité – cas du gaz
parfait monoatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
VI.B Entropie de mélange et paradoxe de Gibbs . . . . . . . . . . . . . . . . . 70
Annexe 3.A : La méthode des multiplicateurs de Lagrange . . . . . . . . . . . . . . . . 74
Annexe 3.B : Rappel de mécanique quantique : postulat de symétrisation . . . . . . . . 75
Annexe 3.C : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Problème Isothermes et isentropes des gaz parfaits . . . . . . . . . . . . . . . . . . 77

4 Ensemble canonique 79
I Ensemble canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
I.A Distribution canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
I.B Propriétés de l’ensemble canonique . . . . . . . . . . . . . . . . . . . . . . 82
II Relâchement d’une contrainte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
II.A Contexte physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
II.B Relâchement de la contrainte . . . . . . . . . . . . . . . . . . . . . . . . . 86
II.C Énoncé du théorème de minimisation . . . . . . . . . . . . . . . . . . . . . 87
II.D Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
III Ensembles microcanonique et canonique . . . . . . . . . . . . . . . . . . . . . . . 88
III.A Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
III.B Analyse d’un exemple : le cristal paramagnétique . . . . . . . . . . . . . . 89
III.C Analyse générale de l’équivalence entre ensembles . . . . . . . . . . . . . . 90
IV Retrouver les  principes  de la thermodynamique . . . . . . . . . . . . . . . . . 92
V Formulation semi-classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
V.A Distribution canonique classique et fonction de partition . . . . . . . . . . 94
V.B Distribution de Maxwell des vitesses . . . . . . . . . . . . . . . . . . . . . 95
V.C Théorème d’équipartition de l’énergie . . . . . . . . . . . . . . . . . . . . 95
VI Indiscernabilité et approximation de Maxwell-Boltzmann . . . . . . . . . . . . . . 95
VI.A Indiscernabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
VI.B Approximation de Maxwell-Boltzmann . . . . . . . . . . . . . . . . . . . . 96
VI.C Apparition des effets quantiques . . . . . . . . . . . . . . . . . . . . . . . 98

vi
TABLE DES MATIÈRES TABLE DES MATIÈRES

Annexe 4.A : Transformations de Legendre et potentiels thermodynamiques . . . . . . 100


Annexe 4.B : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

5 Description semi-classique des gaz 105


I Gaz parfait monoatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
I.A Propriétés thermodynamiques . . . . . . . . . . . . . . . . . . . . . . . . . 105
I.B Ordres de grandeur dans un gaz d’Argon . . . . . . . . . . . . . . . . . . 107
II Gaz parfaits moléculaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
II.A Aspects microscopiques : cas des molécules diatomiques . . . . . . . . . . 108
II.B Thermodynamique des gaz de molécules diatomiques hétéronucléaires . . 109
II.C Molécules diatomiques homonucléaires : cas de H2 . . . . . . . . . . . . . 113
II.D Molécules polyatomiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
III Gaz réels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

6 Thermodynamique des oscillateurs harmoniques 117


I Molécule diatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
I.A Analyse classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
I.B Traitement quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
II Vibrations d’un corps solide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
II.A Aspects microscopiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
II.B Thermodynamique des vibrations . . . . . . . . . . . . . . . . . . . . . . . 123
III Thermodynamique du rayonnement . . . . . . . . . . . . . . . . . . . . . . . . . 128
III.A Description du problème du corps noir . . . . . . . . . . . . . . . . . . . . 128
III.B Modes propres du champ électromagnétique dans une cavité . . . . . . . . 128
III.C Thermodynamique du rayonnement . . . . . . . . . . . . . . . . . . . . . 130
Annexe 6.A : Modes propres d’une chaı̂ne de ressorts . . . . . . . . . . . . . . . . . . . 136
Annexe 6.B : Corde vibrante : quantification  classique  versus  quantique  . . . 138
Annexe 6.C : Cristal – Approximation harmonique et indiscernabilité . . . . . . . . . . 140

7 Transitions de phase – Approximation de champ moyen 143


I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
II Liquide-gaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
II.A Description du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
II.B Approximation de champ moyen . . . . . . . . . . . . . . . . . . . . . . . 144
II.C Analyse des isothermes de van der Waals – transition liquide-gaz . . . . . 147
III Para-Ferro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
III.A Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
III.B Traitement de champ moyen du modèle d’Ising Ferro . . . . . . . . . . . . 153
III.C Brisure spontanée de symétrie et paramètre d’ordre . . . . . . . . . . . . 161
III.D Comparaison avec la transition liquide-gaz . . . . . . . . . . . . . . . . . . 162
Annexe 7.A : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

8 Ensemble grand canonique 167


I Ensemble grand canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
I.A Introduction : Position du problème . . . . . . . . . . . . . . . . . . . . . 167
I.B Ensemble grand canonique . . . . . . . . . . . . . . . . . . . . . . . . . . 168
I.C Propriétés de l’ensemble grand canonique . . . . . . . . . . . . . . . . . . 170
II Particules identiques sans interaction . . . . . . . . . . . . . . . . . . . . . . . . . 170
II.A Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
II.B Description microscopique : facteurs d’occupation . . . . . . . . . . . . . . 174
II.C Décomposition de la grande fonction de partition . . . . . . . . . . . . . . 174

vii
TABLE DES MATIÈRES TABLE DES MATIÈRES

II.D Occupation des états individuels . . . . . . . . . . . . . . . . . . . . . . . 175

9 Statistique de Fermi-Dirac 181


I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
I.A Contexte physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
I.B Les électrons d’un métal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
II Gaz parfait de fermions libres complètement dégénéré (T = 0) . . . . . . . . . . . 185
II.A Formules grand canoniques . . . . . . . . . . . . . . . . . . . . . . . . . . 185
II.B Interprétation canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
III Développements de basse température . . . . . . . . . . . . . . . . . . . . . . . . 187
III.A Rappel des formules grand canoniques . . . . . . . . . . . . . . . . . . . . 187
III.B Stratégie de l’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
III.C Développements de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . 188
III.D Potentiel chimique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
III.E Énergie et chaleur spécifique . . . . . . . . . . . . . . . . . . . . . . . . . 190
III.F Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
III.G Équation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

10 Statistique de Bose-Einstein 195


I Phonons et photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
I.A Rappel : description canonique . . . . . . . . . . . . . . . . . . . . . . . . 195
I.B Description grand canonique . . . . . . . . . . . . . . . . . . . . . . . . . 196
I.C Remarque sur le cas où µ = 0 : Gap ou masse ? . . . . . . . . . . . . . . . 196
II Gaz parfait de bosons libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
II.A Gaz de bosons libres – Information microscopique . . . . . . . . . . . . . 197
II.B Analyse du potentiel chimique . . . . . . . . . . . . . . . . . . . . . . . . 197
II.C Énergie et chaleur spécifique pour T < TBE . . . . . . . . . . . . . . . . . 202
II.D Équation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
II.E Entropie et chaleur latente . . . . . . . . . . . . . . . . . . . . . . . . . . 204
III Réalisations expérimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
III.A Diverses réalisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
III.B Condensation dans un piège harmonique . . . . . . . . . . . . . . . . . . . 205

11 Aspects cinétiques 209


I Théorie cinétique des gaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

12 La physique statistique : mode d’emploi 211


I Quelques notions importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
II La  boı̂te à outils  de la physique statistique . . . . . . . . . . . . . . . . . . . 211

A Formulaire 217

B Corrections 221

Bibliographie 222

Index 225

viii
Chapitre 1

Le périmètre de la physique
statistique

Plan du chapitre
I À quoi sert la physique statistique ? . . . . . . . . . . . . . . . . . . . 1
II Processus élémentaires et phénomènes collectifs . . . . . . . . . . . . 2
II.A Échelle microscopique : l’hypothèse atomique . . . . . . . . . . . . . . . 2
II.B La dichotomie micro/macro . . . . . . . . . . . . . . . . . . . . . . . . . 3
II.C La physique statistique par rapport à la thermodynamique . . . . . . . 3
II.D La relation avec la thermodynamique comme guide . . . . . . . . . . . . 4
III Fin du réductionnisme et émergence . . . . . . . . . . . . . . . . . . . 5
III.A La démarche de la physique statistique . . . . . . . . . . . . . . . . . . . 5
III.B Phénomènes collectifs et auto-organisation . . . . . . . . . . . . . . . . . 5
III.C Universalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
IV Conseils bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Annexe 1.A : Repères historiques . . . . . . . . . . . . . . . . . . . . . . . . 11

I À quoi sert la physique statistique ?


La physique statistique est l’une des plus importantes théories physiques  cadre , fondée
(dans sa version classique) dans la seconde moitié du XIXe siècle (Clausius, Maxwell, Boltzmann
& Gibbs), puis fertilisée par le développement de la mécanique quantique au cours de la première
moitié du XXe siècle. Elle s’attelle à l’étude des systèmes à très grand nombre de degrés de liberté.

La physique statistique permet de déduire, par l’utilisation de méthodes probabilistes, les


propriétés des systèmes aux échelles macroscopiques à partir des lois qui gouvernent les
constituants élémentaires aux échelles microscopiques.

Cette proposition montre qu’il aurait mieux valu poser la question :  à quoi ne sert pas la
physique statistique ?  ! On peut en effet en juger en examinant la petite liste (loin d’être
exhaustive) d’exemples d’application de la physique statistique (dont nous étudierons certaines) :

1. Propriétés thermodynamiques des gaz et des fluides (fluides normaux, superfluides),...


2. Une grande partie de la physique des solides :

1
II Processus élémentaires et phénomènes collectifs Le périmètre de la physique statistique

• vibrations des atomes des cristaux


• dynamique des électrons
(métaux, semiconducteurs, semi-métaux, supraconductivité,...)
• Défauts et alliages
• Propriétés magnétiques
(paramagnétisme, ferromagnétisme, antiferromagnétisme, ferrimagnétisme,...)
• etc
3. Thermodynamique du rayonnement dans une étoile.
4. Stabilité des étoiles naines blanches (pression quantique des électrons) et des étoiles à
neutrons.
5. Matière molle :
• polymères
• cristaux liquides (phases nématique, smectique,...)
• micelles
• etc
6. Physique des plasmas
7. thermo-chimie
8. biophysique (encore un sujet très vaste)
Les questions posées peuvent concerner aussi bien des situations à l’équilibre (thermodynamique
d’un solide, vibrations,...) que des aspects hors équilibre (transport de la chaleur,...)
Plus récemment les méthodes de la physique statistique ont été appliquées dans des domaines
plus éloignés de la physique :
9. étude des réseaux (réseaux de neurones, réseaux de communication,..)
10. informatique théorique : optimisation combinatoire (ex : problème du voyageur de com-
merce), problème de satisfabilité de contraintes,...
11. modèles socio-économiques : réseaux sociaux, propagation d’épidémie, modèle de vote,
étude des marchés financiers, etc.
12. etc.

II Processus élémentaires et phénomènes collectifs


La diversité des exemples d’applications, qui sortent même du champ de la physique, nous
conduit à redéfinir le micro et le macroscopique. La distinction entre  microscopique  et
 macroscopique  ne doit pas être prise trop littéralement et n’est pas nécessairement corrélée

à des échelles microscopiques ou macroscopiques au sens strict. Il s’agit plutôt d’une distinction
entre des processus élémentaires et des phénomènes collectifs.

II.A Échelle microscopique : l’hypothèse atomique


Il semble une tautologie de souligner que la physique statistique postule l’existence d’une échelle
 microscopique  où la physique est contrôlée par des processus élémentaires. Autrement dit

il existe une échelle où la description de la matière perd le caractère continu perceptible aux
grandes échelles qui nous sont familières, et acquiert un caractère discret. Historiquement, la
physique statistique s’est développée pour construire une théorie cinétique des gaz, dans le
contexte de laquelle on parlait au XIXe siècle  d’hypothèse atomique . Cette dernière est
ancienne et remonte à l’antiquité grecque (Démocrite (460-370 av JC) ;  ατ oµoς , indivisible).
Bien que les développements de la chimie au XIXe siècle en fournissaient de précieux indices, avec

2
Le périmètre de la physique statistique II Processus élémentaires et phénomènes collectifs

la  loi des proportions définies , l’hypothèse atomique a rencontré une incroyable résistance
dans la communauté des physiciens à la fin du XIXe siècle, dont une partie étaient en faveur
d’une description purement continue. On peut dire que ce n’est qu’à l’orée du XXe siècle que
l’hypothèse atomique fut validée définitivement dans une expérience de physique par Jean Perrin
(en 1908) avec son étude du mouvement brownien fournissant estimation du nombre d’Avogadro.
Il est intéressant de chercher à comprendre la raison de la résistance d’une partie des phy-
siciens du XIXe : tout d’abord, comme nous l’avons dit, les preuves d’existence des atomes ne
sont venues qu’au début du XXe . Mais plus profondément, l’idée que la description la plus fon-
damentale 1 (la physique statistique) repose sur une formulation de nature probabiliste était
inconcevable (d’un point de vue philosophique) pour de nombreux scientifiques [3].

II.B La dichotomie micro/macro


L’existence d’une échelle microscopique étant acquise, nous aurons toutefois à clarifier un certain
nombre de contradictions apparentes qui semblent opposer les deux échelles et que nous résumons
dans le tableau :
Microscopique Macroscopique
• discret • continu
• petit nombres de lois • diversité, complexité,
simples (postulats de la MQ, ⇒ Physique
statistique
⇒ grand nombre de théories
équations de Maxwell,...) effectives
• comportement aléatoire • déterministe
• équations réversibles • irréversibilité

Table 1.1 : L’opposition micro-macro.

II.C La physique statistique par rapport à la thermodynamique


Comme il n’aura pas échappé au lecteur, le champ d’étude de la physique statistique recouvre
partiellement celui de la thermodynamique, aussi il convient de préciser la relation entre les
deux théories. Contrairement à la physique statistique, la thermodynamique ne cherche pas
à fonder ses résultats à partir d’une description microscopique, mais se place directement à
l’échelle macroscopique. La thermodynamique est donc une théorie phénomènologique par
opposition à la physique statistique qui permet de construire des théories microscopiques.
Cette dernière se fixe donc des objectifs beaucoup plus ambitieux que la première et possède
une puissance prédictive nettement supérieure.

Exemple 1 : Gaz.– En supposant qu’il est justifié de décrire la dynamique des molécules
d’un gaz par la mécanique newtonienne, la physique statistique permet de déduire les propriétés
thermodynamiques de celui-ci : équation d’état, coefficients calorimétriques, etc.

Exemple 2 : Coefficients calorimétriques.– Les coefficients calorimétriques jouent un rôle


très important en thermodynamique : capacités calorifiques CV = ∂T V et Cp = ∂H
2 ∂E

∂T p , com-
1 ∂V 1 ∂V
 
pressibilité κT = − V ∂p T , coefficient de dilatation α = V ∂T p , etc). La thermodynamique
1
fondamental  dans le sens de  fondation  ou  fondement .

2
CX caractérise la chaleur reçue pour un accroissement de température, lorsque la grandeur X est fixée :
d̄Qrev = CX dT + a dX ou encore, puisque d̄Qrev = T dS, CX = T (∂S/∂T )X .
Si X → V , on a CV = T (∂S/∂T )V . En utilisant dE = T dS − p dV on déduit CV = (∂E/∂T )V .
Si X → p, on a Cp = T (∂S/∂T )p et il faut plutôt commencer par effectuer une transformation de Legendre en
introduisant l’enthalpie H = E + pV , d’où dH = T dS + V dp et Cp = (∂H/∂T )p .

3
II Processus élémentaires et phénomènes collectifs Le périmètre de la physique statistique

CV /Nk B
experiment
theory
3

1 Trot Tvib
T (K)
0
5 10 50 100 500 1000 5000

Figure 1.1 : Chaleur spécifique du dihydrogène deutéré (molécule HD formée d’un atome
d’hydrogène 11 H et de son isotope 21 H (noté D). Données tirées du livre de R. Balian [3] (p. 378).

permet de trouver des relations entre ces coefficients, telles la relation de Mayer Cp − CV =
 ∂p 
T ∂V 2
∂T p ∂T V = T V α /κT , cependant ces contraintes ne permettent pas de déterminer tous
ces coefficients et en laissent au moins un indéterminé, par exemple CV . À l’inverse la phy-
sique statistique fournit les moyens de calculer (en principe) le potentiel thermodynamique qui
encode toutes les propriétés thermodynamiques – l’équation d’état, l’ensemble des coefficients
calorimétriques, etc – en fonction des paramètres microscopiques du modèle. Par exemple, nous
serons en mesure de prédire l’allure des courbes à la structure aussi complexe que les courbes de
chaleurs spécifiques de gaz diatomiques représentées sur la figure 1.1 (ce qui est hors de portée
de la thermodynamique, mais sera à celle du lecteur dans dès le chapitre 5).

II.D La relation avec la thermodynamique comme guide


Une idée qui nous aidera dans les développements ultérieurs, par exemple pour définir des
quantités comme la température, la pression, etc, est la correspondance avec la thermodynamique
dans une certaine limite que nous préciserons.
Il est intéressant de rappeler brièvement les bases sur lesquelles se construit la thermodyna-
mique, une théorie axiomatique dont nous pouvons ébaucher le squelette :

• Le postulat fondamental : l’existence d’une fonction d’état, caractérisant l’état d’équilibre


macroscopique du système, l’énergie E(S, V, N, · · · ) fonction de l’entropie S, du volume
V , du nombre de particules N (et éventuellement d’autres paramètres comme le champ
magnétique, etc), et dont la différentielle (l’égalité fondamentale de la thermodynamique) 3

dE = T dS} −p dV +µ dN + · · ·
| {z (1.1)
| {z }
d̄Qrev d̄W rev

définit température, pression, potentiel chimique, etc.


La donnée de cette fonction de ces paramètres encode l’ensemble des propriétés thermo-
dynamiques. En pratique, cette fonction n’est en général pas connue.
+ La physique statistique nous permettra justement de calculer E(S, V, N, · · · ) en termes
des paramètres microscopiques.
• Le premier principe de la thermodynamique (1847) postule l’équivalence entre travail et
chaleur : la somme du travail et de la chaleur, deux quantités qui dépendent du  che-
min  suivi lors d’une transformation, est égale à la variation de la fonction d’état, qui
ne dépend que des points initial et final de la transformation : ∆E = Q + W . Dans une
version infinitésimale, dE = d̄Q + d̄W .
+ Cette distinction entre travail et chaleur apparaı̂tra dans le cadre de la physique statistique
comme une séparation entre différents termes de la variation d’énergie moyenne.
3
La notation d̄Q désigne une quantité infinitésimale qui n’est pas la différentielle d’une fonction.

4
Le périmètre de la physique statistique III Fin du réductionnisme et émergence

• L’étude des machines thermiques, initiée par Sadi Carnot, conduisit Clausius à formuler
le second principe (1954) : d̄Q
H
T > 0 pour tout cycle de transformations (nul si le cycle est
H d̄Qrev
réversible T = 0). Par conséquent dS = d̄Qrev /T est la différentielle d’une fonction
d’état S(E, V, N, · · · ) (fonction inverse de la précédente).
+ Le second  principe  sera démontré dans le cadre de la physique statistique (déduit du
théorème H de Boltzmann par exemple).

III Fin du réductionnisme et émergence


III.A La démarche de la physique statistique
Comme nous l’avons dit, la physique statistique permet de faire des prédictions en partant de
l’information sur la dynamique aux échelles microscopiques. Elle n’est pas auto-suffisante et se
présente donc comme une  sur-couche  de la description microscopique. Par conséquent la
démarche procédera toujours en deux temps :
1. Caractérisation de la dynamique à l’échelle microscopique. Cette échelle de description
peut être classique ou quantique (en fonction des besoins... et de notre courage).
2. Ces ingrédients microscopiques seront utilisés, avec des considérations probabilistes, pour
construire la théorie physique décrivant la dynamique à l’échelle macroscopique.

Figure 1.2 : La physique statistique est une sur-couche au dessus d’une description microsco-
pique.

III.B Phénomènes collectifs et auto-organisation


Il faut maintenant dissiper un malentendu qui aurait pu émerger à la lecture des précédentes
remarques. Puisque qu’au cœur d’un modèle développé dans le cadre de la physique statistique,
nous trouvons des informations sur l’échelle microscopique, il pourrait sembler à première vue
que là réside le niveau fondamental de la théorie. C’est la logique réductionniste (la  théorie
du tout ) : caractérisons la dynamique à l’échelle la plus élémentaire, puis nous pourrons
remonter à toutes les échelles supérieures. Pour caricaturer : le comportement de l’univers est
contenu dans la dynamique des quarks !

5
III Fin du réductionnisme et émergence Le périmètre de la physique statistique

Nous allons prendre l’exact contre-pied de cette logique, car attention :

Élémentaire 6= Fondamental

La physique statistique pulvérise le mythe réductionniste : chaque échelle requiert


son propre niveau d’analyse. La physique à l’échelle microscopique ne dit que très peu sur
celle à l’échelle macroscopique. L’origine du découplage entre les échelles repose sur l’existence
de puissants principes d’auto-organisation à l’échelle macroscopique, ce qui explique en grande
partie la disparition de l’information sur l’échelle microscopique, et une certaine universalité
de nombreuses propriétés à l’échelle macroscopique [1, 22].
Probablement une des meilleures illustrations de l’idée d’émergence et d’auto-organisation
est fournie par l’étude des transitions de phases. Par exemple si nous partons d’une description
microscopique d’un ensemble d’atomes formant un fluide, nous pouvons prendre en compte dans
le modèle l’interaction inter-atomique. Pour des atomes
  simples, celle-ci est bien décrite par le
a 12 a 6
potentiel de Lennard-Jones u(r) = u0 r − r . Nous serons en mesure de montrer plus
tard que cette interaction conduit à la possible organisation du fluide en deux phases, 4 liquide
ou gazeuse, i.e. à des comportements très différents à l’échelle macroscopique, quand bien même
aucun des ingrédients microscopiques n’a changé (figure 1.3) !

0.3

0.2

0.1
%
u(r)/u0

← -0.1

-0.2

-0.3
0 0.5 1 1.5 2 2.5 3
r/a

&
N ∼ 1023
&

Figure 1.3 : Émergence.– Les mêmes détails microscopiques (ici un modèle simple d’interac-
tion à deux corps) peuvent conduire à des phénomènes collectifs très différents (lorsque N → ∞) :
des phases gazeuse, liquide ou solide (notons que le potentiel d’interaction entre molécules d’eau
est plus complexe).

À l’échelle macroscopique, il y a émergence de phénomènes collectifs, imprévisibles avec


la seule compréhension de la dynamique à l’échelle microscopique.

Le niveau fondamental est donc dans le passage du microscopique au macroscopique, rendu


possible grâce aux concepts transversaux de la physique statistique, i.e. conduisant à une vision
unificatrice des sciences macroscopiques [3].

4
Le modèle prédit également une troisième phase solide, même si nous ne serons pas en mesure de le prouver.

6
Le périmètre de la physique statistique III Fin du réductionnisme et émergence

III.C Universalité
Afin de souligner la puissance des principes d’auto-organisation en œuvre aux échelles macro-
scopiques, discutons deux exemples concrets illustrant la notion d’universalité, une idée centrale
de la physique statistique des transitions de phases.

Champ magnétique
uide C
Pression Liq Aimantation >0
Solide
C
Gaz
T
Aimantation <0
Température T

Figure 1.4 : Deux diagrammes de phases : liquide-gaz-solide et para-


ferromagnétique. Le point critique est repéré par un C.

Le point critique de la transition liquide-gaz La phénomènologie du diagramme de phases


d’un fluide simple est bien connue : on peut représenter un diagramme de phase p − T où les
lignes séparent les phases gazeuse, liquide et solide (figure 1.4). Ces lignes correspondent à des
transitions de phases  du premier ordre , caractérisée par l’existence d’une chaleur latente
(par exemple la conversion, à p et T fixés, d’une certaine quantité de liquide en gaz, a un coût
énergétique dont toute personne sortant de sa douche a une perception claire). La transition
liquide-gaz a toutefois une particularité qui est l’interruption de la ligne en un point appelé point
de  l’opalescence critique . En ce  point critique , noté C, la distinction entre liquide et gaz
s’estompe et la chaleur latente de vaporisation s’annule. On dit que ce point correspond à une
transition de phase  du second ordre  (nous expliquerons cette terminologie et reviendrons sur
la physique des transitions de phases dans un chapitre ultérieur). Au point critique, la physique
devient invariante d’échelle et de nombreuses quantités physiques présentent des comportements
en loi de puissance. Par exemple si on mesure la chaleur spécifique, on observe qu’elle diverge
au point critique comme C(T ) ∼ |T − Tc |−α pour un exposant α = 0.111(1), mesuré sur un
fluide de CO2 (cf. tableau 1.2). L’écart à la densité critique (le  paramètre d’ordre ) de ce
même fluide de CO2 se comporte, sous la température critique, comme ρ(T ) − ρc ∼ (Tc − T )β
pour β = 0.324(2). La compressibilité du gaz (maintenant du xenon), κT = ρ1 ∂ρ
def 
∂p T , présente
également un comportement divergent au point critique κT (T ) ∼ |T − Tc |−γ pour γ = 1.246(10).
Le point remarquable est que si des études similaires sont menées pour d’autres fluides, on
observe que la température critique Tc dépend du fluide (propriété non-universelle), alors que
les exposants sont tout à fait comparables (propriétés universelles).

Transition paramagnétique-ferromagnétique en champ nul On considère maintenant la


transition paramagnétique-ferromagnétique dans un aimant. En l’absence de champ magnétique
et au dessus d’une température dı̂te de Curie Tc , le matériau est dans une phase paramagnétique
(pas d’aimantation). En dessous de la température de Curie on voit apparaı̂tre une aimantation
spontanée m(T ) (segment épais de la figure 1.4). On étudie de même les comportements de
différentes quantités au voisinage du point critique (la transition para-ferro en champ nul) pour
un matériau FeF2 : on obtient une chaleur spécifique divergente : C(T ) ∼ |T − Tc |−α pour
un exposant α = 0.11(3), une aimantation m(T ) ∼ (Tc − T )β pour β = 0.325(2). Finalement
def −γ pour γ = 1.25(1) (cf.
on analyse la susceptibilité magnétique χ(T ) = ∂m

∂B B=0 ∼ |T − Tc |

7
III Fin du réductionnisme et émergence Le périmètre de la physique statistique

Transition liquide-gaz para-ferro


Chaleur CO2 FeF2
spécifique C(T ) ∼ |t|−α α = 0.111(1) C(T ) ∼ |t|−α α = 0.11(3)
Paramètre densité CO2 aimantation FeF2
d’ordre ρ(T ) − ρc ∼ (−t)β β = 0.324(2) m(T, 0) ∼ (−t)β β = 0.325(2)
Suscep- Compressibilité Xe Susceptibilité FeF2
tibilité κT (T ) ∼ |t|−γ γ = 1.246(10) χ(T ) ∼ |t|−γ γ = 1.25(1)

Table 1.2 : Exposants critiques des transitions liquide-gaz et para-ferromagnétique.


def
(Transitions de phases de la classe d’universalité d’Ising 3D). t = (T − Tc )/Tc mesure l’écart au
point critique. Données expérimentales tirées de H. W. Blöte, E. Luijten & J. R. Heringa, J.
Phys. A 28, 6289 (1995).

tableau 1.2). Là encore, si la température critique Tc varie d’un matériau à l’autre, on observe
une universalité des exposants critiques.

Coarse-graining et universalité Il est extrêmement frappant que des phénomènes à première


vue aussi différents que la transition liquide-gaz et la transition paramagnétique-ferromagnétique,
présentent de telles similarités : toute une gamme d’exposants critiques identiques au pourcent
près ! Des études numériques (cf. tableau 1.3) ont permis de prédire des valeurs des exposants
très proches des valeurs mesurées expérimentalement (cf. tableau 1.2). Aujourd’hui l’origine de
ces similarités est bien comprise : elle réside dans les propriétés d’universalité des phénomènes
critiques et l’invariance d’échelle. Si la physique statistique fonde ses résultats sur une descrip-
tion microscopique, les détails de celle-ci sont gommés (coarse-graining) lorsqu’on s’intéresse à
la physique de grande échelle, ce qui explique que certaines propriétés (comme les exposants
critiques introduits plus haut) soient complètement insensibles aux détails sous-jacents. Les
résultats universels sont obtenus pour une large classe de problèmes physiques appartenant tous
à la même  classe d’universalité  (ici la  classe d’universalité d’Ising 3D ) : l’appartenance
à une classe d’universalité dépend de propriétés très générales, comme la dimension d’espace, la
nature du paramètre d’ordre (pour le modèle d’Ising, un scalaire) et les symétries du problème.

Quantité exposant
C(T ) ∼ |t|−α α = 0.110(1)
m(T, 0) ∼ (−t)β β = 0.3265(3)
χ(T ) ∼ |t|−γ γ = 1.2372(5)
m(Tc , B) ∼ B 1/δ δ = 4.789(5)
def
Table 1.3 : Exposants critiques du modèle d’Ising 3D (théorie). t = (T − Tc )/Tc .
Résultats théoriques obtenus pour le modèle d’Ising 3D, tirées de la revue : Andrea Pelissetto
& Ettore Vicari,  Critical phenomena and renormalization-group theory , Phys. Rep. 368,
549–727 (2002)

Dans la classe d’universalité d’Ising 3D, on trouve des problèmes physiques aussi divers
que : la transition liquide-gaz et para-ferro, donc, les fluides binaires (mélanges), les alliages
désordonnés, les systèmes ferroélectriques, etc.

, Les idées importantes


• La distinction entre processus élémentaires et phénomènes collectifs.

8
Le périmètre de la physique statistique III Fin du réductionnisme et émergence

+ Pour en savoir plus


• Pour ceux qui sont intéressés par les aspects historiques, je recommande le chapitre d’introduc-
tion de l’ouvrage de Roger Balian [3] et le paragraphe §3.4 sur l’histoire de la thermodynamique.

9
IV Conseils bibliographiques Le périmètre de la physique statistique

IV Conseils bibliographiques
A. Physique statistique
Les ouvrages les plus faciles d’accès :
• Un livre d’introduction : volume V du cours de Berkeley de F. Reif [31].
• Un livre au classicisme très français plutôt synthétique et plaisant : R. Castaing [7].
• Pédagogique et plutôt synthétique : C. & H. Ngô [27].
• L’excellent polycopié de cours d’A. Georges & M. Mézard [12] (difficile à se procurer ?)
• Très (trop ?) complet et pédagogique : B. Diu, C. Guthmann, D. Lederer & B. Roulet [11]. Ne
pas se laisser effrayer par le volume (∼1000 pages) : le cœur de l’ouvrage (la partie  cours )
ne fait que 235 pages, le reste étant une série de  compléments  et illustrations.

Autres ouvrages :
• Un ouvrage très agréable, avec une longue discussion sur les transitions de phases et les
phénomènes critiques : R. K. Pathria & P. D. Beale [28].
• Les ouvrages récents de M. Kardar méritent très certainement d’être mentionnés [16, 15] (le
premier tome correspond davantage à notre programme).
• Deux ouvrages intéressants sont ceux de K. Huang [13] et plus original, celui de S.-K. Ma [25].
• Pour rester du côté asiatique on peut mentionner le classique livre de R. Kubo et alter [35] et,
sur des sujets plus avancés (aspects hors équilibre,...) [20].

Ouvrages de référence :
• Re-citons : B. Diu, C. Guthmann, D. Lederer & B. Roulet [11].
• Un livre classique très complet est celui de F. Reif [30].
• Un autre classique (plus difficile) : le  Landau & Lifchitz  [21]. Discussion détaillée des
symétries.
• Très profond et complet, mais également plus difficile : R. Balian [3, 4].

Exercices :
• L. Couture, C. Chahine & R. Zitoun [10]
• Récemment : H. Krivine & J. Treiner [19].

B. Réviser la mécanique quantique


• Un grand classique : C. Cohen-Tannoudji, B. Diu & F. Laloë [8].
• Deux excellents livres récents : J.-L. Basdevant & J. Dalibard [5] et M. Le Bellac. [23].
• Encore plus récent, assez condensé et avec une légère coloration  matière condensée/physique
SCIENCES SUP Christophe Texier
C. TEXIER

MATHÉMATIQUES
PHYSIQUE
CHIMIE
SCIENCES DE L’INGÉNIEUR
INFORMATIQUE
SCIENCES DE LA VIE

mésoscopique , [34] (fait spécialement pour le magistère d’Orsay ,).


Christophe Texier

Mécanique
SCIENCES DE LA TERRE
COURS

quantique
Cours et exercices corrigés 2e édition

Christophe Texier

Mécanique
Ce manuel est destiné aux étudiants des licences et mas-
est maître de conférences
ters de physique, aux candidats au CAPES ou à l’Agréga-
Mécanique quantique

à l’université Paris Sud,


tion, ainsi qu’aux élèves ingénieurs. chercheur au laboratoire

C. Physique du solide Le cours, illustré par de nombreuses expériences, aborde


les points essentiels de la mécanique quantique, parmi
lesquels : l’étude de l’équation d’onde de Schrödinger, le
de Physique Théorique et
Modèles Statistiques.

quantique
rôle des symétries, le problème de l’indiscernabilité des
particules identiques, les méthodes d’approximation et les
problèmes dépendant du Temps. Sont abordées également
la théorie de la collision ou l’étude de la dynamique d’une
particule en champ magnétique.

• Un livre assez descriptif et agréable : C. Kittel [17]. Une centaine d’exercices et de problèmes sont proposés
et accompagnés de corrigés détaillés mettant en évidence
la méthodologie.
Dans cette seconde édition actualisée, des exemples,
Cours et exercices corrigés
des problèmes et des expériences ont été ajoutés afin de
2e édition
• Un classique assez détaillé : N. Ashcroft & N. Mermin [2].
faciliter la compréhension des notions les plus complexes.

! Licence 3
! Master
! CAPES
! Agrégation

9:HSMBKA=\WVZYW:
2544489
2e
ISBN 978-2-10-072154-2

Texier170x240 v3.indd 1 23/09/14 15:23

10
Le périmètre de la physique statistique IV Conseils bibliographiques

Annexe 1.A : Repères historiques


Je reprends l’introduction des livres de Balian et de Pathria [3, 28]. La physique statistique s’est
développée dans la seconde moitié du XIXe siècle. Les précurseurs sont Daniel Bernouilli (1700-
1782), John Herapath (1790-1868) et James Prescott Joule (1818-1889) pour leurs tentatives
de construction d’une théorie cinétique des gaz. Cependant les véritables pères de la physique
statistiques semblent être Rudolf J. E. Clausius (1822-1888), James Clerk Maxwell (1831-1879) et
surtout Ludwig Eduard Boltzmann (1844-1906) et Josiah Willard Gibbs (1839-1903). Quelques
dates importantes sont :
• 1727 : travaux précurseurs de Bernouilli qui propose une interprétation cinétique de la pression,
due aux chocs des molécules.
• 1820 : La théorie cinétique se développe avec les travaux de Herapath et Joule (1821).
• 1847 : 1er principe de la thermodynamique, i.e. équivalence travail-chaleur, établie par Joule.
• 1854 : 2ème principe de la thermodynamique. Clausius montre que d̄Q
H
T >H 0 pour tout cycle
rev
de transformations (nul s’il s’agit d’un cycle de transformations réversibles d̄QT = 0 ; Par
conséquent dS = d̄Qrev /T est la différentielle d’une fonction d’état, appelée l’entropie).
• 1857 : Clausius retrouve la loi des gaz parfaits à partir de l’image microscopique de particules
en mouvement à l’aide de concepts statistiques ; il discute l’effet des collisions (et introduit la
notion de libre parcours moyen élastique), ce qui jouera un rôle important dans le travail de
Boltzmann.
• 1860 : le mémoire de Maxwell sur la théorie cinétique des gaz dans lequel il dérive la célèbre
distribution des vitesses.
• 1866 : Influencé par les idées de Maxwell, Boltzmann comprend qu’il faut introduire des
concepts statistiques.
• 1867 : Paradoxe du démon de Maxwell.
• 1868-1871 : Boltzmann développe la théorie cinétique, généralisant les résultats de Maxwell.
Il introduit le théorème d’équipartition.
• 1872 : Boltzmann propose son équation et démontre son célèbre théorème H, qui étend la
notion d’entropie à une situation hors équilibre et donne une fondation microscopique au se-
cond principe de la thermodynamique. L’idée d’irréversibilité est introduite sur de solides bases
(travaux violemment critiqués par Loschmidt, Zermelo). En particulier Boltzmann montre que
la distribution de Maxwell-Boltzmann est la seule distribution stable sous l’effet des collisions,
vers laquelle toute autre distribution converge. Boltzmann subit également des critiques des
énergétistes (en faveur de la thermodynamique et d’une vision purement continue de la matière,
Mach, Duhem, Ostwald).
• 1874-1876 : Paradoxe de l’irréversibilité (Thomson & Loschmidt) : comment des équations
microscopiques réversibles peuvent donner naissance à l’irréversibilité macroscopique ? Cf. § V.
• 1875 : Paradoxe de Gibbs (problème de l’indiscernabilité, cf. § VI.B).
• 1900 : Planck propose la loi éponyme décrivant la thermodynamique du rayonnement (cf.
§ III.C). Il résout une difficulté majeure de la physique classique. Le problème est à l’intersection
de plusieurs théories fondamentales : physique statistique, électrodynamique, et signe l’acte de
naissance de la théorie quantique.
• 1902 : Gibbs propose la théorie des ensembles dans son ouvrage  Elementary principles of

11
IV Conseils bibliographiques Le périmètre de la physique statistique

statistical mechanics .
• 1900-1927 : développement de la mécanique quantique.
• 1907 : Einstein développe une première théorie de la chaleur spécifique des solides (cf. § II.B).
• 1912 : Debye améliore la théorie d’Einstein et explique les comportements de basse température
de la chaleur spécifique des solides CVvib ∝ T 3 (cf. § II.B).
• 1912 : Smoluchowski lève le paradoxe du démon de Maxwell pour un démon automatique.
• 1912 : Otto Sackur (1880-1914) et Hugo Tetrode (1895-1931) proposent (indépendamment)
une formule pour l’entropie du gaz monoatomique. 5 La physique statistique classique permettait
d’aboutir (en tenant du paradoxe de Gibbs) à S(E, V, N ) = N kB ln(V /N ) + 32 ln(E/N ) + s0


où s0 est une constante indéterminée. En utilisant des arguments théoriques et des données
expérimentales sur la vapeur de Mercure, ils introduisent la constante de Planck 6 afin de
discrétiser le problème du comptage des microétats accessibles, ce qui fixe la constante s0 (cf.
§ III.B).
• Années 1910 : premières théories des milieux magnétiques : (expériences de Curie), Weiss,
Langevin, Brillouin (plus tard).
• 1924 : Statistique de Bose-Einstein pour des particules indiscernables de nature bosonique
(dont la fonction d’onde est symétrique sous l’échange de particules).
• 1925 : Einstein applique ces idées aux gaz atomiques et prédit la possible condensation de
Bose-Einstein (qui sera proposée comme explication du phénomène de supraconductivité par
London en 1938). Cf. § II et II.
• 1926 : Suivant les idées de Pauli (principe de Pauli), Fermi et Dirac proposent (indépendamment)
la statistique de Fermi-Dirac pour des particules indiscernables de nature fermionique (dont la
fonction d’onde est antisymétrique sous l’échange). Cf. § II.
• 1927 : Landau et von Neumann introduisent la notion de matrice densité, l’équivalent quantique
de la notion de distribution dans l’espace des phases classique.
• 1928 : Sommerfeld produit sa théorie des électrons dans les métaux (théorie de Drude-
Sommerfeld). Cf. § III.
• 1937 : Théorie phénomènologique de Landau des transitions de phases du second ordre.
• Fin des années 1930 : théorie de la superfluidité par Landau (qui lui vaudra le prix Nobel en
1962).
• 1939 : Théorème spin-statistique (Pauli, Fierz et Belinfante) : les propriétés de permutabilité
de la fonction d’onde de particules identiques sont contrôlées par le spin de celles-ci (entier ou
demi-entier).
• 1944 : Lars Onsager (prix Nobel de chimie 1968) obtient la solution exacte pour le modèle
d’Ising bidimensionnel en champ magnétique nul (calcul de Z(T, B = 0)).
• 1948 : Théorie de l’information (Shannon & Weaver).
• 1950 : En interprétant le “paradoxe du démon de Maxwell” avec les idées de la théorie de
5
On pourra consulter l’article récent de W. Grimus,  100th anniversary of the Sackur-Tetrode equation ,
Ann. Phys. (Berlin) 512(3), A32–A35 (2013) ; disponible sur arXiv :1112.3748.
6
Jusque là la constante de Planck était apparue dans l’étude de la thermodynamique du rayonnement (Planck
1900, Einstein 1905), mais aussi dans la théorie d’Einstein de la chaleur spécifique des solides (Einstein, 1907).

12
Le périmètre de la physique statistique IV Conseils bibliographiques

l’information, Léon Brillouin montre comment lever le paradoxe pour un démon qui serait un
être vivant et pas seulement un automate.
• Années 1950 : formulation du problème à N corps. Stimulera la recherche de nouveaux états
de la matière.
• 1957 : théorie de la supraconductivité par John Bardeen, Leon Neil Cooper et John Robert
Schrieffer (prix Nobel 1972).
• Années 1970 : théorie des phénomènes critiques.

13
IV Conseils bibliographiques Le périmètre de la physique statistique

14
Chapitre 2

L’approche probabiliste

Plan du chapitre
I Nécessité de l’approche probabiliste . . . . . . . . . . . . . . . . . . . 15
I.A Une nécessité pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.B Une nécessité de principe : chaos, perturbations extérieures et mécanique
quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
II Quelques éléments de théorie des probabilités . . . . . . . . . . . . . 17
II.A Évènements et probabilités . . . . . . . . . . . . . . . . . . . . . . . . . 17
II.B Variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . 18
II.C Variable aléatoire continue – Distribution/densité de probabilité . . . . 18
II.D Loi jointe – loi marginale . . . . . . . . . . . . . . . . . . . . . . . . . . 20
II.E Moyenne, variance, moments, cumulants, corrélations,... . . . . . . . . . 20
II.F Fonctions génératrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II.G Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
II.H Remarque : et si les moments n’existent pas ? . . . . . . . . . . . . . . . 25
II.I Théorème de la limite centrale . . . . . . . . . . . . . . . . . . . . . . . 26
III Microétats, macroétats, information et entropie statistique . . . . . 28
III.A Microétats, macroétats . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
III.B Quantifier l’information manquante : entropie statistique . . . . . . . . 28
III.C Propriétés de l’entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Annexe 2.A : Fonction de grande déviation . . . . . . . . . . . . . . . . . . 32
Annexe 2.B : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

I Nécessité de l’approche probabiliste


Comme nous l’avons dit, la physique statistique s’intéresse aux systèmes ayant un très grand
nombre de degrés de liberté, typiquement de l’ordre du nombre d’Avogadro N ∼ NA , où

NA = 6.022 141 29(27) 1023 mol−1 (2.1)

La physique statistique tourne à son avantage le fait que le nombre de constituants élémentaires
soit extraordinairement grand, ce qui justifie d’abandonner l’idée de suivre l’évolution de chaque
constituant élémentaire et de plutôt suivre une approche probabiliste.

15
I Nécessité de l’approche probabiliste L’approche probabiliste

I.A Une nécessité pratique

Si l’impossibilité pratique d’analyser la dynamique (classique) de tous les constituants d’un gaz
était évidente à la fin du XIXe siècle, examinons ce qu’il en est à l’heure de l’informatique.
Considérons 1 cm3 de gaz parfait monoatomique dans les conditions normales de température
et de pression (T = 300 K' 27 o C et p = 1 atm= 105 Pa) et cherchons à caractériser l’état
microscopique du système à un instant donné, entreprise dont les fruits semblent bien modestes !

Le nombre d’atomes dans le gaz est

10−3
N= NA ' 2.5 1020 atomes (2.2)
24

Calculons le volume d’information que nous devons stocker pour caractériser à un instant t
toutes les positions et les vitesses des N atomes.
Première question : combien de chiffres significatifs sont nécessaires pour carcatériser les
positions/vitesses des atomes ? La distance typique entre atomes est δ = n−1/3 où n = N/V est
la densité moyenne. Il faut au moins avoir la position d’un atome à une fraction 1/p de cette
échelle, par rapport à la taille de la boı̂te L = V 1/3 . Une coordonnée x d’un atome doit donc
être repérée sur un segment [0, L] ayant au moins pL/δ graduations (p = 10 veut dire qu’il y a
dix graduations à l’échelle de δ). Il nous faut donc log10 (pLn1/3 ) chiffres significatifs par atome
et par coordonnée (il y en a six : trois coordonnées d’espace et trois pour les vitesses). Donc
l’information totale que nous devons stocker est, mesurée en octets (1 octet=8 bits, i.e. un chiffre
entre 0 et 15),

# de chiffres significatifs conversion


par atome (base 10) en octets
z }| {
ln 10
z }| {
Mém = N × log10 (pLn1/3 ) × 6 × (2.3)
| {z ln 16 }
# d’octets par atome

soit
N ln(p3 N )
Mém = (2.4)
2 ln 2

Application numérique (pour une précision p = 3 très modeste) : Mém ≈ 1021 octets, soit 1010
disques durs de 100 Go (la capacité standard aujourd’hui).
Conclusion, si chaque être humain sur terre (environ 7 109 ) possédait un disque dur de
100 Go, cela suffirait à peine à stocker l’information (de la mécanique classique) correspondant
à une  photographie  du gaz contenu dans 1 cm3 !

D’un point de vue pratique, il est donc exclu de chercher à prédire la dynamiques de l’en-
semble des parties élémentaires d’un corps macroscopique. Non seulement l’objectif est hors
de portée (les expériences numériques de dynamique moléculaire peuvent suivre aujourd’hui
quelques milliers de particules sans problème ; la limite des capacités numériques atteint plutôt le
million de particules) mais soulignons également qu’il n’a pas d’intérêt. En effet, le nombre d’in-
formations  intéressantes  que l’on souhaite extraire est en général très faible : témpérature,
pression, densité, à la rigueur des distributions,... la connaissance du nombre faramineux de
données spécifiant les positions et les vitesses des particules ne nous dit pas clairement comment
remonter à ces informations intéressantes.

16
L’approche probabiliste II Quelques éléments de théorie des probabilités

I.B Une nécessité de principe : chaos, perturbations extérieures et mécanique


quantique
D’un point de vue plus fondamental remarquons que la capacité prédictive des lois microsco-
piques sur l’évolution est très faible pour plusieurs raisons.

1. Dans le cadre classique : dès que la dynamique d’un système à grand nombre de degrés
de liberté est un peu complexe, ses propriétés sont essentiellement chaotiques. L’absence
d’intégrabilité (i.e. la faiblesse du nombre de constantes du mouvement, comme l’énergie),
conduit à une extrême sensibilité de la dynamique dans les conditions initiales. C’est-à-
dire que des variations infimes sur l’état initial du système se répercutent extrêmement
rapidement par des évolutions divergentes.

2. Pour insister encore sur la faiblesse prédictive des équations du mouvement pour un
nombre macroscopique de constituants, remarquons qu’il est difficile en pratique de définir
précisément l’hamiltonien du système. Tout système  isolé  réel sera soumis à des per-
turbations extérieures résiduelles perturbant sa dynamique.

3. La seconde raison fondamentale a trait à la nature intrinsèquement probabiliste de la


description quantique des constituants élémentaires.

II Quelques éléments de théorie des probabilités


II.A Évènements et probabilités
Lorsque l’occurence d’un phénomène présente un caractère stochastique, soit pour des raisons
intrinsèque comme dans le cadre quantique, soit pour des raisons pratiques, parce que le résultat
dépend d’un trop grand nombre de paramètres qu’on ne peut pas contrôler, il est plus efficace
de raisonner en termes probabilistes. C’est par exemple le cas si l’on joue à pile ou face (pour
la seconde raison) ou si l’on étudie la désintégration d’un noyau atomique instable (pour la
première raison).
Pour formaliser le problème on introduit l’espace des évènements (ou éventualités) pouvant se
produire lors d’une expérience reproductible, E = {e1 , e2 , · · · , eM }, que nous avons ici supposés
dénombrables et en nombre fini (M ). Chaque évènement représente un résultat possible lors de
la réalisation de l’expérience.

Exemple : Pile ou face.– Dans le jeu de pile ou face, M = 2 et E = {pile, face}.

Considérons N réalisations de l’expérience telles que l’évènement em se produise Nm fois


(donc M
P
m=1 m = N ). Remarquons que ce nombre est aléatoire : si on réalise N autres fois
N
l’expérience, em se produira Nm0 fois, a priori différent de N . La probabilité de l’évènement e
m m
est
def Nm
Pm = lim (2.5)
N →∞ N

Par construction on a 0 6 Pm 6 1 et les M probabilités satisfont la condition de normalisation

M
X
Pm = 1 (normalisation) . (2.6)
m=1

17
II Quelques éléments de théorie des probabilités L’approche probabiliste

II.B Variable aléatoire discrète


On considère une variable X prenant la valeur X (m) si l’évènement em est réalisé (X est entier,
ou réel, ou complexe,...) : X est donc une variable aléatoire. Sa distribution est reliée aux
probabilités {Pm } comme

X M
X
def
P (x) = Proba{X = x} = Pm = Pm δx,X (m) , (2.7)
m t.q. X (m) =x m=1

où le symbole de Kronecker δi,j (0 si les arguments sont distincts, 1 s’ils sont égaux) nous a
permis de déplacer la contrainte ailleurs que sur la sommation. Notons que si les valeurs X (m)
sont toutes distinctes, on a plus simplement P (X (m) ) = Pm .

Exemple : Machine à sous.– On joue avec une machine à sous qui peut sortir aléatoirement
trois chiffres entre 0 et 9, i.e. M = 103 = 1000 résultats. Les 1000 évènements sont équiprobables :
P1 = · · · = P1000 = 1/1000 (sinon le casino triche).
• Les 10 évènements pour lesquels les trois chiffres sont iden-
def
tiques, notés e1 (000) à e10 (999), font gagner s1 = S (1) =
· · · = S (10) = 100 e.

• Les 10 × 9 × 3 = 270 évènements pour lesquels deux chiffres


sont égaux sur les trois, notés e11 (100), e12 (200),... , e19
def
(900), e20 (010),... , e280 (998), font gagner s2 = S (11) = · · · =
S (280) = 10 e.
def
• Les 720 autres évènements ne font rien gagner s3 = S (281) =
· · · = S (1000) = 0 e.
La somme S est donc une variable aléatoire qui peut prendre trois valeurs, s1 = 100 e
avec probabilité P (s1 ) = 1/100, s2 = 10 e avec probabilité P (s2 ) = 27/100 et s3 = 0 e avec
probabilité P (s3 ) = 18/25 (figure 2.1)

Figure 2.1 : Distributions. distribution d’une variable aléatoire discrète (à gauche). À droite :
distribution d’une variable continue (loi exponentielle).

II.C Variable aléatoire continue – Distribution/densité de probabilité


Nous avons jusqu’à présent discuté le cas d’une variable aléatoire discrète, prenant des valeurs
parmi un ensemble dénombrable, {0e, 10e, 100e} dans l’exemple. Toutefois, dans de nombreux
cas l’espace des évènements n’est pas un ensemble dénombrable et la variable aléatoire peut
varier dans un certain domaine de R (ou de C, ou de Rn , etc) : on dit qu’il s’agit d’une variable
aléatoire continue.

18
L’approche probabiliste II Quelques éléments de théorie des probabilités

Exemple : Mouvement brownien.– Si on considère le mouvement brownien d’un grain


de pollen à la surface de l’eau, sa position sera une variable aléatoire vectorielle (x, y) ∈ R2
distribuée dans le plan (selon une loi gaussienne, ainsi que l’a mesuré Jean Perrin en 1908),
cf. Fig. 2.2.

Figure 2.2 : Mouvement brownien d’un grain de pollen.

Nous avons déjà introduit la notion de distribution d’une variable aléatoire discrète : (2.7)
est la probabilité pour que la variable aléatoire X prenne la valeur x parmi un ensemble discret
de valeurs {x1 , x2 , · · · , xV } (notons que le nombre de valeurs distinctes est V 6 M puisque la
même valeur peut être réalisée pour plusieurs évènements, comme on l’a vu sur notre exemple
de machine à sous).
Si la variable est continue, on introduit la densité de probabilité w(x) qui mesure la probabilité
pour que la variable aléatoire X prenne la valeur x :
def 
w(x) dx = Proba X ∈ [x, x + dx] . (2.8)

La condition de normalisation est alors


Z
w(x) dx = 1 (2.9)

où l’intégrale porte sur le domaine de définition de w(x), le  support de la distribution .

Remarque : changement de variable.– Considérons une variable (aléatoire) fonction de la


variable aléatoire Y reliée à la variable X par X = f (Y ) où la fonction inverse f −1 est supposée
bijective sur le support de la distribution de X. Question : étant donnée la distribution w(x) de
X, quelle est la distribution p(y) de Y ?

p(y) dy = Proba X ∈ [f (y), f (y) + f 0 (y)dy ] = w (f (y) f 0 (y) dy ⇒ p(y) = w (f (y) f 0 (y)
  
| {z }
dx
R (2.10)
Nous vérifions que cette transformation respecte la condition de normalisation p(y) dy =
R
w(x) dx = 1 ; c’est un bon moyen de se rappeler que p(y) dy = w(x) dx .
1 2
Exemple : considérons une particule en une dimension d’énergie E = 2m p . Connaissant la
p √
distribution de l’impulsion f (p), nous obtenons la distribution de son énérgie p(E) = E/mf ( 2mE).

19
II Quelques éléments de théorie des probabilités L’approche probabiliste

II.D Loi jointe – loi marginale


Considérons le cas de n variables scalaires aléatoires X1 , X2 ,..., Xn (remarquons que nous pou-
vons regrouper ces variables scalaires dans une unique variable vectorielle X). ~ La distribution
de ces variables est une fonction à plusieurs variables, appelée la  loi de distribution jointe  :
w(x1 , · · · , xn ). I.e.

w(x1 , · · · , xn )dx1 · · · dxn = Proba X1 ∈ [x1 , x1 + dx1 ] & · · · & Xn ∈ [xn , xn + dxn ] . (2.11)
Nous rencontrerons de nombreuses situations où la loi jointe de plusieurs variables est connue
mais où seule une de ces variables nous intéresse. La distribution de la variable X1 , sa loi
marginale, est obtenue en intégrant sur les autres variables :
Z Z
w1 (x1 )dx1 = dx1 dx2 · · · dxn w(x1 , · · · , xn ) (2.12)

= Proba X1 ∈ [x1 , x1 + dx1 ] sachant que les n − 1 autres variables
peuvent valoir n’importe quoi} . (2.13)

II.E Moyenne, variance, moments, cumulants, corrélations,...


Supposons que l’on réalise N expériences dont l’espace des évènements est E = {e1 , e2 , · · · , eM }.
Lors de chaque expérience on mesure la variable aléatoire X pouvant prendre V valeurs (dans
l’exemple de la machine à sous : X → S, M = 1000 et V = 3). L’expérience est réalisée N fois :
se produisent les évènements em1 ,..., emN , auxquels nous pouvons associer la suite de valeurs
X (m1 ) ,..., X (mN ) .

Moyenne
Une information intéressante est donnée par la moyenne statistique sur un ensemble de N
réalisations :
N M
(N ) 1 X (mi ) 1 X
X = X = Nm X (m) (2.14)
N N
i=1 m=1
La première somme porte sur les N évènements qui se sont effectivement réalisés (la suite pile,
face, face, pile, etc), alors que la seconde porte sur l’ensemble des M évènements (les deux
possibilités pile ou face), ce pourquoi nous avons réintroduit le nombre d’occurences Nm de
l’évènement em . Remarquons que si nous réalisons un autre ensemble de N expériences, nous
obtenons une suite d’évènements différente (et des Nm 0 distincts) et la moyenne statistique est
(N ) 0(N )
également différente X 6= X .
Nous définissons maintenant la moyenne probabiliste (aussi appelée  espérance mathématique ,
def (N )
notée E(X)) comme la limite de la moyenne statistique pour N → ∞ : hXi = limN →∞ X =
0(N )
limN →∞ X = · · · (à la limite N → ∞, les moyennes statistiques obtenues pour toute les
suites distinctes d’évènements coı̈ncident, ce qui sera prouvé plus bas). Nous déduisons que la
moyenne probabiliste peut s’exprimer en termes de la distribution des évènements
M
X
hXi = Pm X (m) (2.15)
m=1

Remarquons que lorsqu’on s’intéresse aux propriétés de la variable aléatoire, il est plus naturel
d’exprimer les moyenne à l’aide de la distribution de celle-ci :
V
X
hXi = P (xv ) xv (2.16)
v=1

20
L’approche probabiliste II Quelques éléments de théorie des probabilités

où la somme porte sur les valeurs distinctes prises par la variable aléatoire. Par exemple, sur
l’exemple de la machine à sous discuté ci-dessus, la variable S ne prend que trois valeurs,
sv ∈ {0 e , 10 e , 100 e}. Sa distribution P (sv ) a été donnée plus haut.
Dans le cas d’une variable continue distribuée selon la densité de probabilité w(x), par
analogie avec l’expression précédente, nous voyons que la moyenne prend la forme
Z
hXi = dx w(x) x . (2.17)

Remarquons finalement que les formules (2.16) et (2.17) peuvent être généralisées pour cal-
culer la moyenne de n’importe quelle fonction de la variable aléatoire,
V
X
hf (X)i = P (xv ) f (xv ) (2.18)
v=1

pour une variable aléatoire discrète et


Z
hf (X)i = dx w(x) f (x) (2.19)

pour une variable aléatoire continue.

Variance et écart-type
hXi nous dit en moyenne quelle valeur prendra la variable aléatoire si elle est mesurée un nombre
N → ∞ de fois. Une autre information intéressante serait de caractériser l’ordre de grandeur
des écarts à la moyenne X − hXi. Pour cela nous définissons la variance 1

Var(X) = (X − hXi)2 = X 2 − hXi2


def


(2.20)

où l’ordre de grandeur des fluctuations de la variable aléatoire autour de sa moyenne est ca-
ractérisé par l’écart type (qui a la dimension de X)
def
p
σX = Var(X) (2.21)

Ce qui veut dire que si on réalise une expérience, la variable prendra une valeur (en gros)
X (m) ≈ hXi à ±σX près ; notons que cette formulation approximative n’a d’intérêt que si
σX  | hXi |, sinon nous ne pouvons pas synthétiser aussi simplement l’information contenue
dans la distribution.

Exemple : loi exponentielle Considérons par exemple la loi exponentielle w(x) = a1 e−x/a
pour x > 0 (figure 2.1). Nous obtenons hXi = a et hX 2 i = 2a2 , donc Var(X) = a2 et σX = a.

Indépendance et corrélations
Considérons deux évènements A et B. S’ils sont statistiquement indépendants (non corrélés) la
probabilité d’occurence des deux évènements est donnée par le produit des probabilités
P (A&B) = P (A) P (B) (définition de l’indépendance statistique) (2.22)
En revanche, cette propriété ne sera pas respectée si les deux évènements sont corrélés, P (A&B) 6=
P (A) P (B).
1
Nous pourrions introduire une autre quantité pour caractériser cette information, comme h|X − hXi |i. Nous
allons voir plus loin pourquoi considérer cette quantité n’est pas très judicieux.

21
II Quelques éléments de théorie des probabilités L’approche probabiliste

Exemple : Considérons une situation simple : les deux évènements correspondent à A = {Alice
dans la salle C20} et B = {Bob dans la salle C115}. Chaque jour les étudiants se distribuent
aléatoirement parmi les cinq groupes de TD. Trois situations :

1. Premier jour de la rentrée, Alice et Bob ne se connaissent pas, les étudiants se répartissent
aléatoirement dans les salles de TD ⇒ P (A&B) = P (A) P (B).

2. Après un mois, des affinités se sont formées, Alice et Bob souhaitent être dans le même
groupe de TD (corrélations sur leurs positions) ⇒ P (A&B) < P (A) P (B).

3. Après deux mois, premières brouilles, Alice et Bob sont fâchés et s’évitent (anti-corrélations
sur leurs positions) ⇒ P (A&B) > P (A) P (B).

Variables indépendantes ou corrélées.– Dans la pratique il est courant de chercher à


révéler l’existence de corrélations par l’étude de propriétés simples de variables aléatoires plutôt
que par l’analyse de la distribution complète.
Considérons par exemple deux variables aléatoires XA et XB (par exemple les positions
de Alice et Bob). Nous pouvons rencontrer trois situations (correspondant à trois types de
distributions de ces deux variables) :

1. Les deux variables sont indépendantes, la moyenne du produit est :


X
hXA XB i = x y Proba{XA = x & XB = y} = hXA i hXB i (2.23)
| {z }
x, y
=Proba{XA =x} Proba{XB =y}
P
où la somme x porte sur les différentes valeurs prises par les deux variables aléatoires
(par exemple les positions des salles de TD dans lesquelles se trouvent Alice et Bob).

2. Les positions sont corrélées (Alice et Bob veulent rester ensemble) : une fluctuation de
XA autour de hXA i sera corrélée à une fluctuation de XB autour de hXB i de même signe

hXA XB i > hXA i hXB i . (2.24)

3. Les positions sont anti-corrélées (Alice et Bob s’évitent) : une fluctuation de XA −hXA i >
0 sera corrélée à une fluctuation XB − hXB i < 0 :

hXA XB i < hXA i hXB i . (2.25)

De manière générale, si l’on considère N variables aléatoires, il est commode d’introduire la


matrice des covariance
def
Cij = hXi Xj i − hXi i hXj i = h(Xi − hXi i)(Xj − hXj i)i (2.26)

afin de caractériser les corrélations entre elles :



= 0
 Xi & Xj indépendantes
Cij > 0 Xi & Xj corrélées

<0 Xi & Xj anti-corrélées

Remarquons que Cii = Var(Xi ). En outre on peut montrer que la matrice Cij est symétrique
définie positive, i.e. il existe une matrice orthogonale
P O telle que C = O diag(σ12 , · · · , σN
2 ) OT .

Autrement dit les nouvelles variables Yi = j Oji Xj sont des variables indépendantes de va-
riances σi2 .

22
L’approche probabiliste II Quelques éléments de théorie des probabilités

Moments et cumulants
La notion de  moment  généralise la notion de moyenne et de valeur quadratique moyenne. Le
def
nième moment est par définition µn = hX n i. Notons que la donnée de l’ensemble des moments
est aussi informative que la donnée de la distribution (sauf distribution pathologique) : il s’agit
de deux manières d’encoder l’information sur les propriétés statistiques de la variable aléatoire.
Si les fluctuations relatives de la variable sont faibles σX  | hXi |, nous voyons que le second
moment est essentiellement dominé par le premier moment : hX 2 i = hXi2 + Var(X) ' hXi2 .
L’information intéressante (dans le sens  l’information apportée par hX 2 i qui n’est pas contenue
dans hXi ) est donc masquée, ce qui permet de comprendre l’intérêt de la notion de variance
def
dans ce cas. La variance est aussi appelée le second cumulant c2 = Var(X) de la distribution (la
def
moyenne étant le premier c1 = hXi). On peut également généraliser la notion et introduire le
cumulant d’ordre supérieur d’ordre n, noté cn , caractérisant l’information statistique qui n’est
pas contenue dans les cumulants précédents. Précisons ce point :
def
1. Moyenne.– La première information est donnée par la moyenne c1 = µ1 = hXi.
def def
2. Variance.– Le second cumulant c2 = µ2 − (µ1 )2 = Var(X) = hX̃ 2 i, où X̃ = X − hXi,
caractérise la largeur de la distribution (cf. figure 2.3).
0.35

0.30

0.25

0.20

0.15

0.10 Xx\
0.05

2 4 6 8 10 12 x

p
Figure 2.3 : L’écart type σ = Var(X) donne une mesure de la largeur de la distribution.

3. Skewness.– Le second cumulant indique l’ordre de grandeur des fluctuations autour de la


moyenne, mais ne dit pas si ces fluctuations sont préferentiellement positives ou négatives.
def
Nous introduisons le troisième cumulant c3 = µ3 − 3µ1 µ2 + 2(µ1 )3 = hX̃ 3 i caractérisant
l’asymétrie de la distribution autour de sa moyenne (c3 > 0 signifie que les fluctuations
positives sont plus probables). Le coefficient de dissymétrie ( skewness ), adimensionné,
3/2
est défini comme γ1 = c3 /c2 . Cf. figure 2.4.

0.35 0.35

0.30 0.30

0.25 0.25

0.20 c3>0 0.20 c3<0


0.15 0.15

0.10 0.10

0.05 0.05

-6 -4 -2 2 4 6 x -6 -4 -2 2 4 6 x

Figure 2.4 : À gauche : la loi de Gumbel f (x) = exp(−x − e−x ) a pour premiers cumulants :
c1 = C = 0.577... (constante d’Euler), c2 = π 2 /6, c3 = 2ζ(3) (fonction zeta de Riemann),
c4 = π 4 /15, etc. Le signe de c3 indique si les fluctuations positives ou négatives (relativement à
hXi sont favorisées.

4. Kurtosis.– La distribution entièrement caractérisée par ses deux premiers cumulants est la
distribution gaussienne pour laquelle hX̃ 4 i = 3hX̃ 2 i2 . Nous introduisons une quantité qui

23
II Quelques éléments de théorie des probabilités L’approche probabiliste

def
caractérise la déviation à la gaussienne : c4 = µ4 − 3(µ2 )2 + 12µ2 (µ1 )2 − 4µ3 µ1 − 6(µ1 )4 =
hX̃ 4 i−3hX̃ 2 i2 (c4 > 0 veut dire que les grandes fluctuations sont plus favorables que dans le
cas d’une distribution gaussienne). On définit un coefficient d’aplatissement ( kurtosis )
γ2 = c4 /c22 , adimensionné. Cf. figure 2.5.
0.7 0.4
1
0.1 0.6
0.01
0.3
0.001 0.5

10-4
0.4
10-5
-6 -4 -2 0 2 4 6
0.3
0.2 c4<0
0.2 c4>0 0.1

0.1

-6 -4 -2 2 4 6 x -4 -2 2 4 x
√  q a 
a Γ(3/a)
Figure 2.5 : La distribution symétrique ga (x) = exp − Γ(3/a)
Γ(1/a) , ici tracée pour
x

2Γ(1/a)3/2
a = 1 et a = 4, a pour premiers cumulants (non nuls) : c2 = 1, c4 = Γ(1/a)Γ(5/a)
Γ(3/a)2
− 3, etc. Le
quatrième cumulant change de signe pour a = 2. La courbe rose est la distribution gaussienne
(a = 2).

Il ne semble pas évident de poursuivre cette construction afin de définir des coefficients c5 , c6 ,
etc. Nous expliquons dans le paragraphe suivant comme définir systématiquement les cumulants.

II.F Fonctions génératrices


L’intérêt de l’analyse des moments (ou des cumulants) est de proposer un moyen de caractériser
les propriétés statistique, autre que l’analyse directe de la distribution w(x), souvent plus intuitif
comme l’a montré la discussion sur la moyenne et l’écart type. Dans les problèmes concrets il
s’avère bien souvent commode de calculer la fonction génératrice des moments :
Z
g(p) = e−pX = dx w(x) e−px
def

(2.27)

qui représente la transformée de Laplace de la distribution (nous considérons le cas d’une variable
aléatoire continue ; nous aurions aussi bien pu discuter le cas discret). Notons que la condition
de normalisation prend la forme g(0) = 1. Le paramètre p pourra être complexe pour assurer la
convergence de l’intégrale : g(ik) est alors la transformée de Fourier de la distribution. L’intérêt de
cette notion est qu’il s’agit souvent de la quantité aisée à calculer, la physique statistique nous en
donnera de multiples illustrations. La fonction génératrice ne porte pas de sens  physique  mais
def
son intérêt est qu’étant connue, elle permet d’obtenir directement les moments µn = hX n i par
dérivation puisque

X (−p)n
g(p) = µn ⇒ µn = (−1)n g (n) (0) . (2.28)
n!
n=0
De même nous introduisons la fonction génératrice des cumulants :

def
X (−p)n
ω(p) = cn ⇒ cn = (−1)n ω (n) (0) . (2.29)
n!
n=1
On prendra maintenant la relation entre les deux fonctions génératrices
ω(p) = ln g(p) (2.30)
comme une définition des cumulants. En identifiant les deux développements en puissance
de p, on peut vérifier que l’on retrouve les définitions des quatre premiers cumulants données
plus haut. Par exemple (à l’ordre 2) −c1 p + 21 c2 p2 + O(p3 ) = ln[1 − µ1 p + 21 µ2 p2 + O(p3 )], d’où,
en développant le logarithme, −c1 p + 12 c2 p2 + O(p3 ) = −µ1 p + 21 (µ2 − µ21 )p2 + O(p3 ). Qed.

24
L’approche probabiliste II Quelques éléments de théorie des probabilités

II.G Exemples
Loi binomiale.– Considérons N évènements, chacun associé à deux éventualités possibles
(par exemple pile ou face). L’évènement  pile  se produit avec probabilité p et l’évènement
face avec probabilité 1−p. La probabilité pour que n évènements pile se produisent est : ΠN (n) =
CNn pn (1 − q)N −n (attention, ici N est un paramètre fixé, tandis que n est la variable aléatoire).
def
Il est commode de prendre la définition suivante pour la fonction génératrice : gN (s) = hsn i (si
on écrit s = e−p , cela correspond à la définition donnée ci-dessus). On obtient sans difficulté :
gN (s) = [1 + p(s − 1)]N . On peut trouver les deux premiers cumulants en utilisant hni = gN 0 (1)

et hn(n − 1)i = gN 00 (1), d’où hni = N p et Var(n) = N p(1 − p).

Loi de Poisson.– Considérons des évènements indépendants. La probabilité pour qu’un évènement
se produise pendant un intervalle de temps infinitésimal dt est indépendante du temps, donnée
par λdt. Par exemple il peut s’agir du passage des électrons arrachés à la cathode d’une lampe à
vide (Schottky, 1918) ; dans ce cas qe λ est le courant électrique moyen. La probabilité pour que
n évènements se produisent pendant un temps T (avec ν = λT ) est donnée par la loi de Poisson
n
Pν (n) = νn! e−ν . Les fonctions génératrices des moments et des cumulants sont respectivement
gν (p) = exp ν(e −1) et ων (p) = ν(e−p −1), ce qui montre que les cumulants sont tous égaux :
−p


ck = ν. En particulier hni = Var(n) = ν.

Distribution gaussienne.– Considérons une variable continue X distribuée selon la loi (à
2
deux paramètres) : pa,σ (x) = √ 1 2 exp − (x−a)
2σ 2
. Nous calculons sans difficulté la fonction
2πσ
génératrice ga,σ (p) = exp[−ap + 12 σ 2 p2 ]. La fonction génératrice des cumulants est quadratique
ωa,σ (p) = −ap + 21 σ 2 p2 , ce qui montre que la loi gaussienne est la seule loi dont seuls les deux
premiers cumulants c1 = hXi = a et c2 = Var(X) = σ 2 sont non nuls.

II.H Remarque : et si les moments n’existent pas ?


En écrivant (2.28), nous avons implicitement admis l’existence des moments µn . On peut tou-
tefois imaginer des situations où les moments deviennent infinis : il suffit que la distribution
décroisse à l’infini en loi de puissance. Par exemple si w(x) ∼ |x|−µ−1 pour |x| → ∞, le moment
µn est fini si n < µ. L’existence de moments divergents se manifeste dans la fonction génératrice
par un comportement non analytique.

Exemples

Loi de Cauchy.– Considérons par exemple la loi w(x) = a2a/π +x2


(l’exposant est µ = 1, donc
tous les moments sont divergents, µn = ∞ ∀ n). Nous pouvons calculer la fonction génératrice
g̃(k) = he−ikX i = e−a|k| . Cette fonction est C0 (R), i.e. continue, mais non dérivable en k = 0, ce
def

qui signale l’absence d’un développement de Taylor (2.28), i.e. la divergence de tous les moments
hX 2n i = ∞.

4/π
Un autre exemple.– Étudions maintenant la loi w(x) = 4+x 4 ; en utilisant le théorème
−ikX −|k| ∈ C2 (R) (en effet g̃(k) =
 
des résidus, on vérifiera que g̃(k) = he i = cos k + sin |k| e
2 2 3 4
1 − k + 3 |k| + O(k )) ce qui indique que seuls les deux premiers moments sont finis : hXi = 0,
hX 2 i = 2 et hX 2n i = ∞ pour n > 1.

25
II Quelques éléments de théorie des probabilités L’approche probabiliste

II.I Théorème de la limite centrale


Un problème tout à fait générique est le suivant : considérons un ensemble de N variables
aléatoires X1 , · · · , XN
• statistiquement indépendantes, non corrélées (hypothèse 1).
• Identiques, i.e. toutes distributées selon la même loi de probabilité que nous notons p(x)
(hypothèse 2).
• Nous ne faisons aucune hypothèse sur la forme de la distribution p(x), sinon que ses deux
premiers moments existent hXn i < ∞ et hXn2 i < ∞ (hypothèse 3).
Nous souhaitons déterminer la distribution de la somme de ces variables aléatoires
N
X
S= Xn (2.31)
n=1

(qui est elle même une variable aléatoire).

Illustrations : Nous pouvons donner deux illustrations concrètes :


(N )
= N1 N
P
• Nous avons introduit plus haut la moyenne statistique X n=1 Xn , qui coı̈ncide en
effet à la variable S, à un facteur 1/N près. Une question intéressante est de caractériser les
fluctuations de la moyenne statistique (pour contrôler l’erreur qui serait faı̂te en pratique
par un statisticien).

• Si nous considérons un gaz d’atomes ou de molécules, son énergie est dominée par l’énergie
cinétique (c’est presque la définition du gaz, l’énergie potentielle caractérisant l’inter-
action entre atomes/molécules est négligeable devant l’énergie cinétique, Ec  Eint ).
Une question pourrait être de caractériser la distribution de l’énergie du gaz atomique
Ec = N 1 2
P
i=1 2m i .
p
~

Détermination de la distribution de S : Afin de déterminer la distribution PN (S) de


la variable S, la manière la plus simple de procéder est de faire appel à la notion de fonc-
def
tion génératrice.
PN Considérons la fonction génératrice de la somme GN (p) = hexp(−pS)i =
hexp(−p n=1 Xn )i. En utilisant l’indépendance statistique des variables (hyp.1), nous faisons
apparaı̂tre le produit des fonctions génératrices GN (p) = N −pXn i. Le fait que les variables
Q
n=1 he
soient identiquement distribuées (hyp.2) nous permet de relier simplement la fonction génératrice
des variables à celle de leur somme :

GN (p) = [g(p)]N . (2.32)

Cette relation nous suggère d’écrire la fonction génératrice sous une forme exponentielle g(p) =
def
exp ω(p), i.e. de faire apparaı̂tre la fonction génératrice des cumulants. Nous notons ΩN (p) =
P∞ (−p)k
k=1 k! Ck = ln GN (p) la fonction génératrice des cumulants de S. Nous obtenons

X (−p)k
ΩN (p) = N ω(p) = N ck i.e. Ck = N ck (2.33)
k!
k=1

Pour les premiers :

hSi = N hXi (évident), (2.34)


Var(S) = N Var(X) (déjà moins trivial), (2.35)
etc.

26
L’approche probabiliste II Quelques éléments de théorie des probabilités

En particulier la seconde relation montre que les écarts types (i.e. l’ordre de grandeur des
fluctuations) sont reliés comme

σS = N σX (2.36)
Les fluctuations de la somme√de N variables indépendantes se comportent typique-
ment 2 comme δS ∼ σS ∝ N . Nous justifions maintenant que dans la limite N → ∞
nous pouvons négliger les autres cumulants de la variables S. La raison est la suivante : tous les
cumulants de S croissent linéairement avec N : Ck ∝ N , or ce dernier contribue aux fluctuations
def
de S comme δk S = (Ck )1/k ∝ N 1/k . Cette contribution décroı̂t plus vite que celle du second
cumulant :
(Ck )1/k /(C2 )1/2 ∝ N −(k−2)/(2k) −→ 0
N →∞

(cette relation peut être comprise par analyse dimensionnelle puisque [Ck ] = [S]k ). Finalement
cela justifie de négliger tous les cumulants Ck avec k > 2 :
1 2
GN (p) ' e−N c1 p+ 2 N c2 p pour N → ∞ (2.37)

i.e. ( )
1 (S − N hXi)2
PN (S) ' p exp − pour N  1 . (2.38)
2πN Var(X) 2N Var(X)

Théorème de la limite centrale : Soit S = N


P
n=1 Xn la somme de N variables aléatoires
identiques et indépendantes dont les deux premiers moments sont finis, hXi < ∞ et hX 2 i <
∞.
Dans la limite N → ∞, la distribution de S tend √ vers une loi gaussienne centrée sur
hSi = N hXi et d’écart type (i.e. de largeur) σS = N σX .

Le théorème offre une illustration assez simple de la notion d’émergence introduite dans
le premier chapitre : quelle que soit la distribution p(x), pourvu que ses deux premiers mo-
ments soient finis, dans la limite N → ∞ la distribution PN (S) tend vers une loi gaussienne.
L’émergence de cette loi universelle n’est pas contenue dans les détails  microscopiques  de
départ, la loi p(x), mais dans le passage du microscopique au macroscopique (la limite N → ∞).

Ce théorème sera d’une importance cruciale pour la physique statistique où nous aurons très
souvent à considérer des grandeurs physiques (macroscopiques) somme d’un très grand nombre
(N ∼ NA ) d’autres grandeurs (microscopiques) ; par exemple l’énergie d’un gaz, somme des
énergies des particules qui le constituent.

Remarque : Une approche plus élégante consiste à  rescaler  la variable S en introduisant

def S − N hXi
Y = p . (2.39)
N Var(X)

Nous calculons la fonction génératrice de Y :


 P 
def −pY (Xn − c1 )
γN (p) = he i = exp −p n √ (2.40)
N c2
2

Un point subtil : l’écart-type σS ∝ N caractérise des fluctuations typiques (i.e. les plus probables), ce qui
n’interdit pas l’existence de fluctuations atypiques (très peu probables). L’étude de ces dernières est dénommée
l’étude des  grandes déviations  (cf. annexe).

27
III Microétats, macroétats, information et entropie statistique L’approche probabiliste

où nous avons utilisé la notation c1 = hXi et c2 = Var(X). Introduisons g̃(p) = g(p) ec1 p , la
fonction génératrice de X − hXi. Nous obtenons
  N "  2  3 #
p 1 p 1 p
γN (p) = g̃ √ = exp N c2 √ − c3 √ + ··· (2.41)
N c2 2 N c2 6 N c2
  3 
1 2 p
= exp p + O √ (2.42)
2 N
1 2
Dans la limite N → ∞ nous retrouvons la fonction génératrice γ∞ (p) = e 2 p correspondant à la
1 2
distribution gaussienne normalisée p(y) = √12π e− 2 y . Qed.

III Microétats, macroétats, information et entropie statistique


Dans la section précédente nous avons introduit les notions (le  vocabulaire ) de base qui nous
serviront pour mettre en œuvre l’approche probabiliste dans le cadre de la physique statistique.
Nous cherchons maintenant un principe nous guidant afin de construire la distribution de pro-
babilité (l’ensemble des Pm ) associée à un problème physique. Une notion centrale pour remplir
cet objectif est celle d’entropie statistique.

III.A Microétats, macroétats


Nous introduisons deux notions essentielles pour la suite. Pour cela nous considérons l’exemple
précis d’un gaz de particules (exemple ô combien important historiquement). Le gaz est décrit
dans le cadre de la mécanique classique.

• Microétat (état pur).– Si tous les paramètres microscopiques définissant l’état du


système (toutes les positions et les vitesses des particules) sont connus, nous disons que le
système se trouve dans un  microétat  ou  état pur .
Dans cette section nous notons {em } les microétats (on a repris la notation de la section II,
i.e. un microétat est ici vu comme une éventualité de l’état du système parmi un ensemble
d’états possibles) :
em ↔ microétat .

• Macroétat (mélange statistique).– Si nous ne savons pas précisément dans quel mi-
croétat le système se trouve, nous pouvons en revanche caractériser avec quelle probabilité
il occupe les différents microétats. La donnée des probabilités d’occupation {Pm } des mi-
croétats définit un  macroétat  ou  mélange statistique  (de microétats)

distribution {Pm } ↔ macroétat .

Dans le cas du gaz, le macroétat est spécifié en précisant la densité de probabilité pour
que les particules se trouvent en différentes positions de l’espace avec certaines vitesses.

III.B Quantifier l’information manquante : entropie statistique


La distinction entre les notions de microétat et de macroétat fait référence à l’information dont
nous disposons sur le système : soit toute l’information nécessaire permettant de spécifier l’état
microscopique (soit pile, soit face), soit l’information partielle spécifiant avec quelles probabilités
sont occupés les microétats (l’ensemble des probabilités {Ppile , Pface }).
Il est donc essentiel de disposer d’un  outil  permettant une mesure de l’information, ou de
la perte d’information liée à notre absence de connaissance de l’occupation précise des microétats.

28
L’approche probabiliste III Microétats, macroétats, information et entropie statistique

La grandeur permettant de mesurer le manque d’information lié à l’occupation aléatoire des


microétats est  l’entropie statistique (ou entropie de Shannon, ou de Gibbs) :

def
X
S({Pm }) = −kB Pm ln Pm (2.43)
m

où la constante kB est arbitraire et correspond au  quantum d’entropie  (i.e. le quantum


d’information manquante) ; nous la choisirons égale à la constante de Boltzmann, le rapport de
la constante des gaz parfaits et du nombre d’Avogadro kB = R/NA , afin d’assurer la correspon-
dance avec l’entropie de la thermodynamique : 3

kB = 1.380 6505(24) × 10−23 J.K−1 (2.44)

III.C Propriétés de l’entropie


D’où vient la définition (2.43) de l’entropie ? La définition (2.43) a été proposée en recher-
chant une fonction obéissant à un certain nombre de propriétés que nous énonçons maintenant.
L’entropie de von Neumann (2.43) est une fonction des {Pm } qui obéit à toutes ces propriétés
 raisonnables .
4 On peut même montrer que l’entropie de von Neumann (2.43) est la seule

fonction qui permet de retrouver une entropie extensive avec la taille du système (on pourra
consulter l’article pédagogique [14]).

Minimum L’entropie d’un microétat est mimimum. Dans ce cas il ne manque aucune infor-
mation pour spécifier l’état microscopique.

Smin = S(microétat) = 0 (2.45)

Très facile à vérifier puisque les probabilités associées au microétat e` sont Pm = δm,` .

Maximum Le cas où nous avons le moins d’information sur l’occupation des M microétats
est lorsque ceux-ci sont équiprobables, Pm = 1/M ∀m. Dans ce cas

Smax = S(1/M, · · · , 1/M ) = kB ln M (2.46)

(pour une démonstration, cf. annexe 3.A 74).

Croissance L’entropie maximale croı̂t avec le nombre de microétats M .

Évènements impossibles L’existence de microétats inaccessibles (i.e. d’évènements impos-


sibles) ne change pas l’entropie :

S(P1 , · · · , PM , 0, · · · , 0) = S(P1 , · · · , PM ) (2.47)

Symétrie Les microétats jouent des rôles symétriques du point de vue de la mesure de l’in-
formation, i.e. S(P1 , · · · , PM ) est une fonction symétrique sous l’échange de ses arguments.
3
En théorie de l’information, l’information est mesurée en bit. Le manque d’information maximum sur un bit
étant ln 2 on choisit plutôt kB → 1/ ln 2 dans ce contexte.
4 def kB P α

Un autre choix possible est l’entropie de Rényi Sα ({Pm }) = 1−α ln m Pm , qui tend vers l’entropie de
max
von Neumann dans la limite α → 1. Remarquons Sα = kB ln M , comme pour l’entropie de von Neumann,
cependant elle ne vérifie pas toutes les propriétés énoncées plus bas.

29
III Microétats, macroétats, information et entropie statistique L’approche probabiliste

Additivité Nous pourrions séparer arbitrairement l’ensemble des microétats E = {e1 , · · · , eM }


en deux sous ensembles A = {e1 , · · · ,P
em } et B = {em+1 , · · · , eM }. La probabilité de se trouver
dans un des microétats de A est qA = n∈A Pn . Les probabilités {P1 /qA , · · · , Pm /qA } définissent
donc un ensemble de probabilités normalisées associées aux microétats du sous ensemble. On
vérifie la propriété d’additivité
choix entre A et B
z }| {
S(P1 , · · · , PM ) = S(qA , qB ) +qA S(P1 /qA , · · · , Pm /qA ) +qB S(Pm+1 /qB , · · · , PM /qB ) (2.48)
| {z } | {z }
entropie du sous ensemble A entropie du sous ensemble B
L’équation (2.48), que nous pouvons écrire plus schématiquement S(A ⊕ B) = S(qA , qB ) +
qA S(A) + qB S(B), exprime comment additionner les entropies des deux sous ensembles A et B,
le premier terme S(qA , qB ) correspondant à l’information manquante quant au choix entre A
et B.

Sous-additivité Considérons des microétats spécifiés par la donnée de deux informations. Par
exemple si nous disposons de deux sous systèmes, l’un dans un microétat parmi A ∈ {e1 , · · · , eN }
et l’autre parmi B ∈ {e01 , · · · , e0M }. L’état du système complet est spécifié par la donnée de l’état
de chaque sous système : en,m = en ⊗ e0m (j’utilise la notation de la mécanique quantique puisque
le point que nous discutons correspond précisément à la notion de produit tensoriel). Le microétat
en,m est réalisé avec probabilité pn,m . Nous introduisons la probabilité
X X
pAn = p n,m resp. pB
m = pn,m (2.49)
m∈B n∈A

pour que le système A (resp. B) se trouve dans le microétat en (resp. e0m ), indépendamment
de toute information sur l’état du système de B (resp. A). Remarquons qu’en général on aura
pn,m 6= pA B A B
n pm , et c’est seulement lorsque les deux systèmes sont décorrélés que pn,m = pn pm .
Nous prouvons facilement l’égalité
 
A B
X pn,m
S({pn,m }) = S({pn }) + S({pm }) − kB pn,m ln , (2.50)
n,m
pA B
n pm
| {z }
corrélation C(A,B)>0
ce que nous écrivons plus schématiquement S(A ⊗ B) = S(A) + S(B) − C(A, B). En remarquant
que le terme de corrélation est positif, 5,6 nous obtenons l’inégalité

S({pn,m }) 6 S({pA B
n }) + S({pm }) (2.52)

Si les systèmes sont indépendants, pn,m = pA B


n pm , alors les entropies s’ajoutent simplement et
l’égalité est réalisée : il y a alors autant d’information à les considérer comme un tout, en ⊗ e0m ,
ou séparemment, en et e0m . En revanche si les systèmes sont corrélés, les considérer comme un
tout contient une information supplémentaire (sur les corrélations entre A et B) par rapport à
la situation où ils sont séparés : A ⊗ B contient plus d’information (son entropie est plus petite)
que A et B.
5
Nous avons notée la corrélation C(A, B) : ce terme porte une  information  (d’où le signe −), i.e. convention
inverse de l’entropie (manque d’information).
6
Montrons que C(A, B) > 0 : nous utilisons l’inégalité de convexité ln(x) 6 x − 1, donc ln(x) > 1 − 1/x :
pA B
   
def
X pn,m X n pm
X
C(A, B) = kB pn,m ln A pB
> k B p n,m 1 − = kB (pn,m − pA B
n pm ) = 0 . (2.51)
n,m
p n m n,m
p n,m
n,m

Remarquons que lorsque A ⊗ B décrit un état pur, S(A ⊗ B) = 0, les corrélations C(A, B), si elles existent, sont
de nature purement quantique et on parle plutôt d’entropie  d’intrication .

30
L’approche probabiliste III Microétats, macroétats, information et entropie statistique

Illustration de la propriété de sous-additivité : corrélations entre deux spins.– Nous


considérons deux particules A et B de spin 1/2. Chaque particule peut être dans deux états de
spin ∈ {| ↑ i, | ↓ i}. Nous considérons deux situations pour lesquelles la probabilité de trouver
chaque spin dans l’un ou l’autre état est p↑ = p↓ = 1/2. L’entropie associée à cette distribution
est S(A) = S(B) = kB ln 2
• Dans un premier temps nous considérons la situation où les états de spin accessibles sont
non corrélés et étudions le  macroétat  A ⊗ B décrivant la situation où les quatre états de
l’espace de Hilbert | ↑ iA ⊗ | ↑ iB , | ↑ iA ⊗ | ↓ iB , | ↓ iA ⊗ | ↑ iB et | ↓ iA ⊗ | ↓ iB , sont occupés de
manière équiprobable. Par commodité, les probabilités sont regroupées dans une matrice
 
1 1 1
pσ,σ0 : (2.53)
4 1 1
A, B
Ce qui montre que pσ,σ0 se factorise comme pσ,σ0 = pA B
σ pσ 0 avec pσ = 1/2. La probabilité qu’un
spin soit dans l’état | ↑ i ou | ↓ i est indépendante de l’état de l’autre spin. L’entropie des deux
spins non corrélés est S(A ⊗ B) = S(A) + S(B) = kB ln 4.
• Nous considérons maintenant la situation où les états des deux spins sont corrélés. Le  ma-
croétat  A
^ ⊗ B décrit l’occupation équiprobable des deux états 7 | ↑ iA ⊗ | ↓ iB et | ↓ iA ⊗ | ↑ iB .
Les probabilités sont maintenant  
1 0 1
p̃σ,σ0 : (2.54)
2 1 0
On vérifie que la Pprobabilité d’occupation d’un état de spin est la même que dans le cas
A
précédent : p̃σ = σ0 p̃σ,σ0 = 1/2 pour σ =↑ et ↓. Les probabilités d’occupation des états à
un spin sont inchangées par rapport au cas précédent. Cependant si l’on connait l’état d’un
spin, cela donne l’information sur l’état du second spin, ce qui n’était pas le cas avec le premier
macroétat. Le macroétat {p̃σ,σ0 } contient donc plus d’information que {pσ,σ0 }. Son entropie est
inférieure : S(A^⊗ B) = kB ln 2 6 S(A ⊗ B) = S(A) + S(B).

On trouvera une présentation d’autres propriétés de l’entropie dans les références données
ci-dessous. En particulier les théorèmes de Shannon sur les problèmes de communication et de
traitement de données.

, Les idées importantes


• Quelques notions de probabilité : distribution, comment calculer des moyennes, variance, écart-
type.
• Si l’introduction de la notion de fonction génératrice est apparue trop technique, nous la
rencontrerons à nouveau dans des contextes plus physiques.
• Garder en tête le théorème de la limite centrale nous aidera à comprendre bien des choses plus
tard.
• Important : microétat/macroétat. La définition de l’entropie statistique.

+ Pour en savoir plus


• Sur l’entropie : Chapitre III du livre de R. Balian [3]. Article de E. T. Jaynes [14].
7
1
 Attention à ne pas confondre la superposition quantique (cohérente) entre les deux états quantiques,
| ↑ iA ⊗ | ↓ iB ± | ↓ iA ⊗ | ↑ iB , et le mélange statistique {p↑↓ = 12 , p↓↑ = 12 }. Pour mieux comprendre la


2
nuance entre les deux situations, on peut utiliser le formalisme de la matrice densité ([3], complément I.H de
[11],...) qui permet de décrire les deux types d’états sur un pied d’egalité (cf. note de bas de page no 9 page 49).

31
III Microétats, macroétats, information et entropie statistique L’approche probabiliste

Annexe 2.A : Fonction de grande déviation


2.A.1. Préliminaires : méthode du col et approximation de la phase station-
naire
a) Méthode du col
Il arrive très souvent que l’on ait à considérer des intégrales de la forme
Z b
I(λ) = dx e−λϕ(x) (2.55)
a

où λ ∈ R+ est un  grand  paramètre et ϕ(x) une fonction réelle. Dans ce cas il est possible de
trouver une bonne approximation de l’intégrale à l’aide la méthode du col, dont nous exposons
l’idée lorsque la fonction ϕ(x) possède un unique minimum (absolu) en x∗ ∈]a, b[,  loin  des
bords (on suppose de plus que ϕ00 (x∗ ) > 0, non nul). Dans la limite λ → ∞ l’intégrale est
dominée par les contributions du voisinage du minimum :
Z b  
ϕ(x∗ )+ 21 ϕ00 (x∗ )(x−x∗ )2 +O((x−x∗ )3 )
I(λ) = dx e−λ (2.56)
a

λϕ00 (x∗ )(b−x∗ )
e−λϕ(x∗ ) +
Z
1 2 +O(u3 λ−1/2 )
= p √ du e− 2 u (2.57)
λϕ00 (x∗ ) − λϕ00 (x∗ )(x∗ −a)
| {z }
R +∞ −1 2 √
−→ du e 2u = 2π
λ→∞ −∞

Finalement, on obtient : s

I(λ) ' e−λϕ(x∗ ) (2.58)
λ→+∞ λϕ00 (x∗ )
(les restrictions venant des hypothèses énoncées précédemment sont faciles à lever ; on pourra
obtenir des généralisations de cette formule lorsque toutes ces hypothèses ne sont pas satisfaites,
par exemple a = x∗ , etc).

Figure 2.6 : Méthode du col.

b) Approximation de la phase stationnaire


La méthode du col peut-être étendue dans le plan complexe. Considérons l’intégrale
Z b
I(iλ) = dx e−iλϕ(x) (2.59)
a

où λ ∈ R est un  grand  paramètre et ϕ(x) Rune fonction réelle. La phase de l’exponentielle
oscille alors très rapidement et l’on s’attend à dx e−iλϕ(x) ∼ 0. Cependant l’intégrale est do-
minée par les extrema de ϕ(x) qui correspondent à des points où la phase est  stationnaire .

32
L’approche probabiliste III Microétats, macroétats, information et entropie statistique

L’analogue de (2.58) est s



I(iλ) ' e−iλϕ(x∗ ) (2.60)
λ→±∞ iλϕ00 (x∗ )
lorsque la fonction ϕ(x) possède un unique extremum (maximum ou minimum) dans l’intervalle.

2.A.2. Théorème de la limite centrale versus grandes déviations


Nous revenons sur l’analyse très importante du problème de la distribution de N variables
aléatoires {X1 , · · · , XN } indépendantes et identiquement distribuées (i.i.d.) par une loi p(x).
Nous avons montré que la somme de ces variables,
N
X
S= Xn , (2.61)
n=1

est distributée par une loi gaussienne centrée sur hSi = √ N hXi et de variance Var(S) =
N Var(X), i.e. caractérisant des fluctuations d’ordre δS ∼ N . Ce résultat est très général : la
forme de la distribution de S est universelle, i.e. est indépendante

2 de la forme particulière de
la loi p(x), pourvu que ses deux premiers moments hXi et X soient finis. Ce résultat ignore
toutefois que la distribution de S présente des queues caractérisant des évènements rares,√sur
des échelles S & N , qui n’ont pas le caractère universel de la forme de la loi pour δS ∼ N .
Nous allons discuter ce point que nous illustrerons sur un cas simple.

a) Fonction de grande déviation


Afin de caractériser commodément les propriétés statistiques des variables {Xn }, nous introdui-
sons la fonction génératrice des cumulants (cf. chapitre 2)

D E X cn
ω(ik) = ln e−ikX =
def
(−ik)n (2.62)
n!
n=1

où cn est le cumulant d’ordre n (on rappelle que c1 = hXi et c2 = Var(X)).


Nous pouvons donc écrire la distribution de la somme sous la forme
Z
dk N [iky+ω(ik)]
PN (S = N y) = (p ∗ · · · ∗ p)(S) = e . (2.63)
| {z } R 2π
N fois

Dans la limite N → ∞, nous nous attendons à ce que l’intégrale soit génériquement dominée
par un unique point col k∗ dans le plan complexe, qui correspond au point stationnaire de la
d

fonction dans l’exponentielle dk iky + ω(ik) = 0 ou

ω 0 (ik) + y = 0 dont la solution est notée k = k∗ (2.64)

(k∗ est fonction de y). La méthode du col (étendue dans le plan complexe) conduit à
Z
dk N [iky+ω(ik)] 1
e ' p eN [ik∗ y+ω(ik∗ )] (2.65)
R 2π N →∞ −2πN ω 00 (k∗ )
(Attention : si l’équation (2.64) admet plusieurs solutions, les déformations du contour d’intégration
dans le plan complexe permettant de visiter ces solutions ne sont pas toutes licites ; nous en ver-
rons un exemple plus bas). Finalement la distribution de S prend la forme d’échelle
  
S
PN (S) ∼ exp −N Φ où Φ(y) = −ik∗ y − ω(ik∗ ) (2.66)
N →∞ N

33
III Microétats, macroétats, information et entropie statistique L’approche probabiliste

est appelée la fonction de grande déviation. Remarquons que le théorème de la limite centrale
doit être compris comme une limite particulière de ce résultat. On peut en effet le retrouver
de la manière suivante : dans la limite y → 0, la solution de (2.64) est obtenue en utilisant
le développement de la fonction génératrice ω(ik) ' − 12 c2 k 2 (nous supposons c1 = 0 pour
simplifier). La solution prend donc la forme k∗ ' iy/c2 . D’après (2.66) on obtient donc
y2
Φ(y) ' . (2.67)
y→0 2c2
La fonction de grande déviation présente donc un comportement universel, quadratique, à y → 0
(théorème de la limite centrale), 8 mais également un comportement non universel, i.e. dépendant
de p(x) via ω(ik), pour |y| & 1, caractérisant les grandes déviations.

PN (S)
Universel
Non universel Non universel
Gaussienne
Grandes Grandes
déviations déviations

~ N évènements
rares

S
~N

Figure 2.7 : Allure schématique de la distribution de S. Au centre la distribution prend la forme


gaussienne universelle (indépendante de p(x)) alors que les grandes déviations caractérisant les
évènements rares dépendent des détails de la loi.

b) Application : loi exponentielle symétrique


À titre d’illustration nous considérons une loi exponentielle
1 −|x|
p(x) = e . (2.68)
2
La fonction génératrice (des moments) correspondante est g(k) = he−ikX i = 1
1+k2
et la fonction
génératrice des cumulants :
ω(ik) = − ln(1 + k 2 ) . (2.69)
L’équation (2.64) déterminant le point dominant l’intégrale prend donc la forme
 r 
2 2i 1 1
k + k+1=0 dont les solutions sont k± = i ± + 1 − (2.70)
y y2 y
Pour savoir quelle solution de l’équation algébrique (2.64) correspond au point col, rappelons
nous que l’intégrale contient un terme eN iky . Pour visiter le point col k∗ , le contour d’intégration
de l’intégrale (2.63) doit être déformé dans le plan complexe de la variable k. Le terme exponentiel
de l’intégrand impose de déformer le contour par le haut si y > 0 puisque |eN iky | = e−N y Im(k)
(cf. figure 2.8). Si y > 0 le point col dominant l’intégrale est k∗ = k+ (et k∗ = k− si y < 0). Pour
y > 0, nous obtenons Φ(y) = −ik+ y − ω(ik+ ), i.e.
p !
y2 + 1 − 1 p
Φ(y) = ln 2 + y2 + 1 − 1 , (2.71)
y2
8
On comprend mieux la terminologie  théorème de la limite centrale  puisque celui-ci caractérise le
 centre  de la distribution PN (S).

34
L’approche probabiliste III Microétats, macroétats, information et entropie statistique

Im k
si y>0
k+
Re k
k−

Figure 2.8 : Déformation du contour d’intégration de l’intégrale (2.63) dans le plan complexe
permettant de visiter le point col en k+ .

(finalement cette expression est aussi valable pour y < 0 puisque la loi est symétrique). La
2
fonction est tracée sur la figure 2.9. Nous vérifions bien que Φ(y) ' y4 , qui est l’expression du
y→0
théorème de la limite centrale puisque c2 = 2, i.e.
1 1 2
PN (S) ' √ e− 4N S pour |S|  N . (2.72)
N →∞ 4πN
D’autre part le comportement Φ(y) ' |y| − ln |y| de la fonction de grande déviation pour |y|  1
montre que la distribution de la somme présente le comportement

PN (S) ∼ |S|N e−|S| pour |S|  N . (2.73)


N →∞

Ce comportement, qui est donc assez différent de la décroissance gaussienne, est en effet typique
de la convolution de N lois exponentielles.
ln PN HS=NyL

-2

-4
N®¥ N
1
-FHyL= lim

-6

-8
-6 -4 -2 0 2 4 6

y=SN

Figure 2.9 : Fonction de grandes déviations (2.71) ; comparaison avec la parabole (i.e. la dis-
tribution gaussienne).

En conclusion, retenons que si l’on s’intéresse à la statistique des évènements rares (grandes
déviations), ceux-ci ne sont pas caractérisés par le théorème de la limite centrale qui ne décrit
que les déviations  normales  (sur l’exemple discuté, la forme approchée de la distribution
donnée par le théorème de la limite centrale sous estime beaucoup le résultat correct).

35
III Microétats, macroétats, information et entropie statistique L’approche probabiliste

Annexe 2.B : Exercices


- Exercice 2.1 Séance de travaux pratiques : Au cours d’une séance de travaux pratiques,
des étudiants répètent N fois la mesure d’une grandeur physique X. Chaque étudiant obtient
N données X1 , · · · , XN et donne une analyse statistique : il déduit une moyenne statistique
m = N1 N 2 1/2 . Ces deux grandeurs sont elles-
P  1 PN 
n=1 Xn et un écart-type Σ = N n=1 (Xn − m)
mêmes aléatoires et diffèrent d’un étudiant à un autre.
a) En supposant que N  1, donner les formes approchées des distributions de m et Σ (exprimer
la moyenne et la variance de ces deux lois en fonction de N et des moments de Xn ).
b) Discuter la limite N → ∞ de la distribution de m.
- Exercice 2.2 : Entropie d’une distribution.– Considérons N variables xi distribuées
dans un intervalle I = [a, b]. Soit ρ(x) la distribution de ces variables :
N
1 X
ρ(x) = δ(x − xi ) , (2.74)
N
i=1

i.e. ρ(x)dx est la fraction des variables se trouvant dans l’intervalle [x, x + dx].
La donnée de la distribution contient moins d’information sur la position des variables que la
données des positions {xi }. En particulier on perd une information sur l’ordonnancement des
variables (si x1 < x2 ou x1 > x2 par exemple). On souhaite analyser l’entropie associée à cette
perte d’information.
a) Supposons que l’intervalle I est découpé en M intervalles de largeurs égales  = (b − a)/M :
I = I1 ∪ I2 ∪ · · · ∪ IM . On note nα le nombre de variables dans l’intervalle Iα . Pour un choix
particulier d’une séquence d’occupations {nα }, combien y-a-t’il de façons Ω[{nα }] de distribuer
les N variables dans les M intervalles ? Trouver une forme approchée de l’entropie S = ln Ω dans
la limite où nα  1.
b) Soit Xα = a + (α − 1/2), avec α ∈ {1, · · · , M − 1} la position de l’intervalle Iα . En écrivant
que la densité est  ρ(Xα ) ≈ nα /N , exprimer l’entropie de la distribution S[ρ].

Réponse :
a) Ω = n1 !n2N!···n
!
P P
M!
, d’où ln Ω ' N ln N − α nα ln nα = − α nα ln(nα /N ).
P P  
b) L’entropie associée à la distribution est donc S[ρ] = ln Ω ≈ − α nα ln(nα /N ) = −N α ρ(Xα ) ln ρ(Xα ) .
Si ρ(x) varie lentement à l’échelle de , on remplace la somme par une intégrale :
Z
 
S[ρ] = −N dx ρ(x) ln ρ(x) (2.75)

36
Chapitre 3

Postulat fondamental – Ensemble


microcanonique

Plan du chapitre
I Première approche dans un cadre classique . . . . . . . . . . . . . . . 39
I.A Espace des phases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
I.B Pourquoi l’espace des phases ? Théorème de Liouville . . . . . . . . . . . 39
I.C Expérience (numérique) des sphères dures – Du problème de Sinai au
postulat fondamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
I.D Ergodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
I.E Énoncé du postulat fondamental . . . . . . . . . . . . . . . . . . . . . . 44
II Description quantique : espace de Hilbert . . . . . . . . . . . . . . . . 47
II.A Rappel des postulats de la mécanique quantique . . . . . . . . . . . . . 47
II.B Microétats et macroétats, moyennes . . . . . . . . . . . . . . . . . . . . 48
II.C Dénombrer les microétats : densité d’états . . . . . . . . . . . . . . . . . 49
II.D Densité d’états pour des particules identiques (donc indiscernables) . . . 53
III Postulat fondamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
III.A La distribution microcanonique . . . . . . . . . . . . . . . . . . . . . . . 56
III.B Entropie microcanonique . . . . . . . . . . . . . . . . . . . . . . . . . . 57
IV Relâchement de contraintes . . . . . . . . . . . . . . . . . . . . . . . . 60
IV.A Variables externes et variables internes . . . . . . . . . . . . . . . . . . . 60
IV.B Contact thermique entre deux systèmes – Température microcanonique 60
IV.C Échange de volume – Pression microcanonique . . . . . . . . . . . . . . 64
IV.D Échange de particules – Potentiel chimique microcanonique . . . . . . . 66
IV.E Cas général : distribution d’une variable interne quelconque . . . . . . . 67
V Irréversibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
VI Remarques sur le rôle de l’indiscernabilité . . . . . . . . . . . . . . . 69
VI.A Validité du traitement semi-classique de l’indiscernabilité – cas du gaz
parfait monoatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
VI.B Entropie de mélange et paradoxe de Gibbs . . . . . . . . . . . . . . . . 70
Annexe 3.A : La méthode des multiplicateurs de Lagrange . . . . . . . . . 74
Annexe 3.B : Rappel de mécanique quantique : postulat de symétrisation 75
Annexe 3.C : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Problème Isothermes et isentropes des gaz parfaits . . . . . . . . . . . 77

37
Postulat fondamental – Ensemble microcanonique

Dans ce chapitre nous discutons la physique statistique des systèmes isolés à l’équilibre
macroscopique. Nous introduisons le postulat fondamental, le socle de la physique statistique
d’équilibre.

La situation étudiée : système isolé à l’équilibre macroscopique

Dans ce chapitre nous donnons une description des systèmes isolés, i.e. dont l’état macroscopique
est caractérisé par un certain nombre de paramètres fixés comme : l’énergie du système E, le
nombre de particules N , le volume V , et éventuellement d’autres quantités.
L’essentiel du cours sera consacré à la physique statistique des systèmes à l’équilibre.
Considérons un exemple précis pour introduire la notion d’équilibre macroscopique.
1111111111111111
0000000000000000
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
Nv(t)
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111 δNv ~1010
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111 Nv =10 20
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111 t
0000000000000000
1111111111111111
0000000000000000
1111111111111111 0

Figure 3.1 : Équilibre macroscopique et fluctuations.– On mesure le nombre de particules


Nv (t) contenues dans un petit volume d’un gaz. Pour un volume v ∼ 1 cm3 de gaz dans les
conditions de température et de pression normales, nous avons vu que Nv ∼ 1020 .

Nous isolons par la pensée un volume v dans un gaz (figure 3.1), ce qui constitue  le
système . Le nombre de particules dans le volume, que nous notons Nv (t), est une quantité qui
fluctue au cours du temps : des particules entrent et sortent du volume en permanence, traduisant
l’agitation thermique dans le gaz. Parce que la densité est uniforme dans le volume, le nombre
de particules vaut en moyenne
Z t0 +T
(T,t0 ) 1
Nv (t) = dt Nv (t) ' n v pour T “grand”, (3.1)
T t0

où n = N/V est la densité moyenne dans l’enceinte (moyennée spatialement). On pourrait
également chercher à caractériser d’autres propriétés du système : les fluctuations de Nv (t),
l’énergie des particules, etc. Si l’ensemble est isolé et ne subit aucune perturbation extérieure,
(T,t0 )
on peut supposer que la moyenne Nv (t) est indépendante de t0 , à condition que T soit
 assez grand . Dans ces conditions toutes les grandeurs macroscopiques sont stationnaires. En

outre il n’y a globalement aucun flux d’une quelconque quantité physique (flux de particules, flux
d’énergie, flux d’entropie, etc) : le flux des particules entrant dans le volume v est exactement
compensé, en moyenne, par les particules sortant du volume. Le petit volume est dans un état
d’équilibre macroscopique, bien qu’à l’échelle microscopique les particules soient animées d’un
mouvement incessant.
Retenons que 1
l’équilibre macroscopique requiert
(i) la stationnarité des quantités macroscopiques, et
(ii) l’absence de flux.

1
Stationnaire=indépendant du temps. Équilibre=stationnaire et tous les flux nuls.

38
Postulat fondamental – Ensemble microcanonique I Première approche dans un cadre classique

I Première approche dans un cadre classique


I.A Espace des phases
Considérons un système de N particules en mécanique classique. L’état microscopique est ca-
ractérisé par la donnée des 3N composantes des positions des particules, 2 notées {qi }i=1,··· ,3N ,
et par les 3N composantes de ses impulsions, 3 {pi }i=1,··· ,3N . L’espace des phases est l’espace
de dimension 6N des coordonnées {qi , pi }i=1,··· ,3N . La donnée de la position dans l’espace des
phases caractérise entièrement l’évolution du système, contrôlée par les équations de Hamilton

∂H
q̇i (t) = ({qi (t), pi (t)}) (3.2)
∂pi
∂H
ṗi (t) = − ({qi (t), pi (t)}) (3.3)
∂qi

où H({qi , pi }) est la fonction de Hamilton (l’énergie sur une trajectoire physique). Deux tra-
jectoires physiques sont représentées par deux lignes qui ne s’intersectent pas. Un microétat
(classique) correspond donc à un point dans l’espace des phases.

microétat = un point de l’espace des phases

La notion de macroétat correspond à la donnée d’une distribution de probabilité d’occupation


des microétats. Puisque ces derniers forment un espace continu, on a

macroétat = densité de probabilité ρ({qi , pi }) dans l’espace des phases


Q
où
Q ρ({q i , pi }) i dqi dpi est la probabilité pour que l’état du système soit dans un volume
i dqi dpi autour de ({qi , pi }).

Q: Comment trouver ρ({qi , pi }) ?

I.B Pourquoi l’espace des phases ? Théorème de Liouville


Pourquoi l’espace des phases, i.e. des couples de variables canoniquement conjuguées, joue-t-il
un rôle si important ? Pourquoi ne pas considérer d’autres fonctions des qi et pi ? Ce point est
éclairci par l’énoncé du théorème de Liouville, que nous discutons maintenant.
Considérons l’évolution pendant un intervalle de temps  petit  δt :

qi (t + δt) ' qi (t) + q̇i (t) δt (3.4)


pi (t + δt) ' pi (t) + ṗi (t) δt (3.5)

D’après les équations de Hamilton, nous pouvons interpréter ces équations comme une transfor-
mation en général non linéaire des coordonnées :
  ..

.. .. .. ..
      
.
.  .  .  .   ∂H

qi  qi (t) q̃i  qi (t + δt)  q i + ∂p i
({q i , pi }) δt 
 ≡
pi  pi (t) −→ p̃i  ≡ pi (t + δt) =  (3.6)
      
∂H

         pi − ∂qi ({qi , pi }) δt
.. .. .. .. 
..

. . . . .
2
Il n’est en fait pas nécessaire que les 3N degrés de liberté soient des degrés de liberté de translation, comme
c’est implicite ici. On reviendra plus tard sur ce point.
3 def ∂L
l’impulsion est le moment canoniquement conjugué, i.e. obtenu à partir du lagrangien pi = ∂ q̇i
.

39
I Première approche dans un cadre classique Postulat fondamental – Ensemble microcanonique

t’>t p

Figure 3.2 : Théorème de Liouville. On a représenté des trajectoires physiques dans l’espace
des phases. L’évolution temporelle conserve le volume dans l’espace des phases, i.e. les deux
volumes hachurés, représentant un ensemble de microétats à deux instants de leur évolution,
sont égaux.

Le Jacobien de cette transformation est donné par


 
.. ..
 . . 
· · · ∂2H ∂2H
def
 ∂qi ∂pi ∂p2i
· · ·

J = det(1 + K δt) où K = 2 2H
 (3.7)
· · · − ∂∂qH2 − ∂q∂ i ∂p · · ·
 
i i
.. ..
 
. .

En remarquant que 4 det(1 + K δt) ' 1 + Tr(K) δt, nous obtenons finalement
X  ∂2H ∂2H

J '1+ − δt = 1 . (3.8)
∂qi ∂pi ∂qi ∂pi
i

Autrement dit (théorème de Liouville 5 )


Y Y
dq̃i dp̃i = dqi dpi (3.9)
i i

i.e. si l’on considère un domaine dans l’espace des phases, il évoluera au cours du temps de telle
sorte que son volume soit conservé (figure 3.2).
Remarquons qu’il est important d’avoir identifié la mesure conservée lors de l’évolution
temporelle, ainsi toute la dépendance temporelle peut-être reportée dans la densité de probabi-
lité ρ(· · · ; t).
4
On peut prouver cette relation à partir de la définition du déterminant en identifiant les termes d’ordre 1 en δt.
On peut également écrire : det(1+K δt) = exp ln det(1+K δt) = exp Tr ln(1+K δt) ' exp Tr(K δt) ' 1+Tr(K δt).
5
Stricto sensu la formulation du théorème de Liouville est un peu différente, même si elle porte le même sens :
on introduit la densité de probabilité ρ({qi , pi }; t) dansQl’espace des phases. Localement, sa variation au cours du
temps est donnée par ∂ρ/∂t. Considérons un volume i dqi dpi autour d’une trajectoire physique ({qi (t), pi (t)})
solution des équations du mouvement. Ce volume se meut au cours du temps. La variation de la densité,  dans
le volume suivant le flot défini par les équations du mouvement, est donnée par dρ ∂ρ ∂ρ
+ ∂ρ
P
dt
= i q̇i ∂qi
+ ṗ i ∂pi ∂t
,
dρ ∂ρ def P ∂A ∂B ∂A ∂B

ce que l’on peut écrire comme dt = {ρ, H} + ∂t , où {A, B} = i ∂qi ∂pi − ∂pi ∂qi est un crochet de Poisson

(cf. cours de mécanique analytique). Le théorème de Liouville est dt = 0. Si on note V ~ = (· · · , q̇i , ṗi , · · · ) le
champ de “vitesse” dans l’espace des phases, on remarque l’analogie avec la mécanique des fluides, où (ρ, ρV ~)
définit la densité de probabilité et son courant associé. Le théorème de Liouville prend la forme de l’équation
de conservation ∂ρ + div(ρV~ ) = 0, où la divergence implique les dérivées partielles par rapport à l’ensemble des
∂t
coordonnées de l’espace des phases.

40
Postulat fondamental – Ensemble microcanonique I Première approche dans un cadre classique

Exemple : mouvement sur une sphère.– Nous considérons une particule de masse m
se déplaçant sur la surface d’une sphère de rayon R. Sa position est repérée par un couple
d’angles (θ, ϕ), où θ est l’angle entre l’axe vertical et le vecteur position et ϕ l’angle azimutal
(le problème est équivalent à l’analyse du mouvement de rotation d’un segment, une molécule
diatomique rigide, dans l’espace tridimensionnel). Si le mouvement est libre, le Lagrangien est
I 2
donné par l’énergie cinétique de rotation L = 2 θ̇ + sin θ ϕ̇ , où I = mR2 est un moment
2 2


d’inertie. Nous obtenons les deux moments canoniquement conjugués pθ = I θ̇ et pϕ = I sin2 θ ϕ̇


en terme desquels nous exprimons l’hamiltonien
!
1 2
p2ϕ
H= pθ +
2I sin2 θ

La mesure d’intégration dans l’espace des phases conservée par l’évolution temporelle est donc
dθdpθ dϕdpϕ .

I.C Expérience (numérique) des sphères dures – Du problème de Sinai au


postulat fondamental
En introduisant la notion de  macroétat , nous avons suggéré qu’il sera plus efficace d’étudier
les propriétés d’un système à l’aide de l’information probabiliste contenue dans la densité de pro-
babilité ρ({qi , pi }). Il faut maintenant nous donner les moyens de déterminer cette distribution.
Dans le cours, nous proposerons diverses manières de  construire  différentes distributions, ce
qui correspondra aux différents  ensembles  de la physique statistique. Dans ce chapitre nous
nous sommes placés dans la situation la plus épurée, cas d’un système isolé, afin d’introduire
un postulat fondamental. Dans quelle direction chercher pour faire émerger le postulat fonda-
mental ? Pour cela nous nous plaçons dans une situation particulière dont l’analyse va nous
permettre, par induction, d’énoncer un principe qui transcendera cette expérience spécifique.
Nous nous plaçons ainsi dans une position analogue à celle de Galilée étudiant le mouvement de
divers objets au fond de la cale d’un bateau, observations qui le conduiront à proposer le principe
d’inertie de la mécanique classique. Nous choisissons ici une expérience numérique donnant une
description simplifiée d’un gaz de particules (considérer le cas d’un gaz est naturel : nous verrons
que celui-ci est le système modèle sur lequel nous appliquerons systématiquement les concepts
de la physique statistique).

Figure 3.3 : Le gaz de sphères dures et le problème de Sinai. À gauche : nous pouvons
grossièrement modéliser un gaz atomique comme un gaz de boules impénétrables (des  sphères
dures ) de rayon fini, s’entrechoquant et frappant les parois. On a indiqué quelques mouvements
ultérieurs des sphères dures. À droite : pour simplifier encore l’étude de la dynamique des sphères
dures, nous isolons par la pensée une sphère, placée dans un environnement de quatre autres
sphères supposées immobiles aux coins d’un carré.

Une description simplifiée d’un gaz atomique est de modéliser les atomes comme des petites

41
I Première approche dans un cadre classique Postulat fondamental – Ensemble microcanonique

boules impénétrables (des  sphères dures ) de rayon fini R. On prend ainsi en compte la partie
fortement répulsive de l’interaction entre atomes. Les sphères s’entrechoquent en permanence
et frappent les parois du volume qui les contient. Un des intérêts de ce modèle simplifié est de
n’introduire aucune échelle d’énergie (puisque le potentiel  inter-atomique  est soit nul soit
infini) : seul importe l’analyse des possibles configurations spatiales, ce qui offre un avantage
certain pour visualiser la dynamique du système en profitant du découplage position-impulsion
(figure 3.3). Ce problème reste néanmoins extrêmement riche et difficile. Aussi nous allons encore
le simplifier en nous plaçant tout d’abord dans la situation bidimensionnelle, mais surtout en
nous focalisant sur une unique sphère, dont nous supposerons l’environnement gelé. Afin de
 forcer le destin  de cette sphère et induire de fréquentes collisions, nous la plaçons dans

un carré de côté égal à 2R, aux quatre coins duquel sont placées quatre sphères immobiles
(partie droite de la figure 3.3). Nous espérons ainsi rendre compte de l’histoire d’une sphère
dure au sein du gaz et de l’effet des collisions avec les autres particules. Bien que nous ayons
drastiquement simplifié le problème du gaz de sphères dures, nous allons pouvoir maintenant
tirer des conclusions simples à l’aide d’un petit programme simulant le mouvement de la sphère.

Figure 3.4 : Ergodicité dans le problème de Sinai. Trajectoire du centre de la sphère dure
après 10, 50 et 500 chocs. (Remerciements à Alberto Rosso pour le programme python).

Nous lançons la sphère dans une direction quelconque et suivons le mouvement de son centre.
La première partie de la figure 3.4 montre la trajectoire obtenue après 10 chocs, la figure du
centre après 50 chocs, et la figure de droite après 500 chocs. Nous constatons que la trajectoire
semble avoir exploré tout l’espace que les contraintes lui permettent de visiter. Autrement dit,
la distribution de probabilité de trouver la sphère en un endroit est non nulle partout où les
contraintes stériques l’autorisent. Si nous introduisons ρ(~r) la densité de probabilité pour trouver
la sphère en ~r, le résultat de la simulation suggère que cette fonction est non nulle partout,
cependant nous ne connaissons pas encore la valeur de la distribution elle-même.
Un autre petit programme nous fournit toutefois cette information : tout au long de l’évolution,
ce nouveau programme mesure la fraction du temps dτ (x, y) passé dans un petit élément de sur-
face dxdy. Le résultat est représenté sur la figure 3.5 et montre que la particule passe autant de
temps partout où elle a le droit de se trouver (aux fluctuations numériques près, qui diminue-
raient si la trajectoire de la sphère était analysée sur un temps T plus long). On peut donc écrire
dτ (x,y)
T = Sdxdy
autor
, où Sautor est la surface totale visitée, où encore que la densité de probabilité
est un uniforme : ρ(~r) = 1/Sautor si ~r ∈ domaine permis.
En conclusion, pour ce problème ultra-simplifié d’une sphère dans un espace bidimensionnel,
en interaction avec quatre sphères immobiles, l’espace des phases accessible est visité
uniformément. Nous allons donc postuler que cette assertion reste vraie pour des systèmes
plus complexes (gaz de sphères dures ou gaz plus réalistes), avec un nombre macroscopique
de degrés de liberté. La justification est que nous pouvons espérer que la complexité et les
interactions vont favoriser une exploration de l’espace des phases accessible.

42
Postulat fondamental – Ensemble microcanonique I Première approche dans un cadre classique

Figure 3.5 : Ergodicité dans le problème de Sinai. La densité de probabilité de présence


est uniforme dans la région de l’espace des phases que la sphère dure est autorisée à explorer.
(Remerciements à Alberto Rosso).

+ Pour en savoir plus sur le gaz de sphères dures : l’ouvrage (spécialisé) de Werner
Krauth [18].

I.D Ergodicité
Nous pouvons maintenant formaliser les conclusions de l’étude de l’expérience numérique.

Moyenne temporelle (sur une réalisation)

Considérons une grandeur physique, fonction des coordonnées dans l’espace des phases A({qi , pi }).
Cette fonction pourrait être l’énergie, ou le nombre de particules Nv (t) dans un sous volume du
gaz (figure 3.1). Cette grandeur physique est mesurée pendant d’une expérience : le résultat de
cette mesure est a priori une certaine fonction du temps (qui dépend des conditions initiales).
Typiquement l’observable est mesurée sur un temps expérimental T très grand devant les échelles
caractérisant la dynamique microscopique et, plutôt qu’une valeur instantanée, on mesure en
général une moyenne temporelle :
Z T
(T ) 1
A = dt A({qi (t), pi (t)}) , (3.10)
T 0

où {qi (t), pi (t)} sont les solutions des équations du mouvement.

Moyenne probabiliste (moyenne d’ensemble)

Le langage probabiliste que nous avons introduit plus haut nous permet de définir un autre type
de moyenne. Un macroétat est défini par la donnée d’une distribution ρ({qi , pi }) dans l’espace
des phases caractérisant les probabilités d’occupation des microétats. La moyenne (probabiliste)
de la grandeur physique A, lorsque le système est dans le macroétat, est donnée par
Z Y
def
hAi = dqi dpi ρ({qi , pi }) A({qi , pi }) . (3.11)
i

43
I Première approche dans un cadre classique Postulat fondamental – Ensemble microcanonique

Hypothèse ergodique
D’un point de vue théorique, les calculs des deux moyennes (3.10) et (3.11) requièrent des in-
formations très différentes : la première demande l’ensemble de l’information microscopique,
i.e. la connaissance de la solution des équations du mouvement (3.2,3.3), une masse d’informa-
tion en pratique phénomènale. La seconde moyenne requière une information probabiliste sur
l’occupation des microétats, dont nous montrerons qu’elle découlera de règles simples.
Si le temps d’observation T est très  long , permettant au système d’explorer une grand
partie de son espace des phases, nous pouvons supposer que la moyenne (3.10) tend vers une
limite lorsque T → ∞ (cf. figure 3.1). Bien que cela soit difficile à prouver rigoureusement, la
raison sous jacente est très proche de la discussion autour du théorème de la limite centrale et
de la distinction entre moyenne statistique et moyenne probabiliste (cf. justification ci-dessous).
Cette hypothèse nous permet de remplacer la moyenne temporelle par une moyenne
d’ensemble (moyenne probabiliste) :

hyp.
(T ) ergod.
lim A = hAi (3.12)
T →∞

Cette hypothèse centrale de la physique statistique, l’hypothèse ergodique, correspond à


remplacer la moyenne temporelle sur un unique système, par une moyenne sur un ensemble
(virtuel) de systèmes ayant tous les mêmes propriétés à l’échelle macroscopique.

Figure 3.6 : Ergodicité. Deux trajectoires initialement très proches évoluent de manière très
différentes sur la couche d’iso-énergie (attention, l’espace des phases a en principe une dimension
paire !). Il a été prouvé rigoureusement que la distance entre les deux trajectoires croı̂t comme
exp γt (où γ est un exposant de Lyapunov).

I.E Énoncé du postulat fondamental


Reformulons l’idée maı̂tresse que nous venons d’extraire de notre expérience numérique dans
un cadre plus général. La question est de discuter la distribution ρ({qi , pi }) dans l’espace des
phases. Une première indication est donnée par le théorème de Liouville, tel qu’il est formulé
dans la note de bas de page no 5 page 40, caractérisant l’évolution temporelle de la densité de
probabilité dans l’espace des phases ∂ρ∂t = −{ρ, H}. Nous cherchons une mesure stationnaire,
P ∂ρ ∂H ∂ρ ∂H 
i.e. le crochet de Poisson est nul {ρ, H} = i ∂qi ∂pi − ∂p i ∂qi
= 0, ce qui nous permet de
déduire que la mesure dans l’espace des phases est une fonction de l’hamiltonien :

densité stationnaire ⇒ ρ({qi , pi }) = fct H({qi , pi }) . (3.13)

Nous déterminons maintenant la fonction, à l’aide d’arguments physiques. Si le système est isolé,
en l’absence d’autre constante du mouvement, la seule contrainte est celle de la conservation de

44
Postulat fondamental – Ensemble microcanonique I Première approche dans un cadre classique

l’énergie et la trajectoire dans l’espace des phases de dimension 6N évolue sur une  surface  (de
dimension 6N − 1) d’iso-énergie, i.e. le sous espace de l’espace des phases tel que
E = H({qi , pi }) . (3.14)
On  espère  qu’après un temps T  assez long , la trajectoire ait exploré uniformément la
surface d’iso-énergie (figure 3.6). Cela revient à postuler que la mesure est uniforme dans
l’espace des phases accessible :
Z Y
∗ 1    
ρ ({qi , pi }) = δ E − H({qi , pi }) où Σ(E) = dqi dpi δ E − H({qi , pi }) . (3.15)
Σ(E)
i

La présence de Σ(E),  l’aire  de la  surface  iso-énergie, assure la normalisation. ρ∗ ({qi , pi })


est appelée la distribution microcanonique.
Le théorème de LiouvilleQ nous montre que la mesure uniforme est en effet stable sous
l’évolution temporelle : si i dqi dpi est invariante lors de l’évolution, alors ρ∗ ({qi , pi }) =cste
est une solution stationnaire. Le point subtil est qu’il n’est pas évident de démontrer que toute
mesure converge vers la mesure invariante.
Remarquons qu’il sera souvent plus agréable (et plus physique ?) de considérer que l’énergie
est fixée à une incertitude expérimentale près δE et d’écrire :
 1

 si E 6 H({qi , pi }) 6 E + δE
ρ ({qi , pi }) = V(E, δE) où V(E, δE) = Σ(E) δE
0 sinon

(3.16)
est le volume de l’espace des phases délimité par les deux contraintes E 6 H({qi , pi }) 6 E +
δE. Cette écriture rendra plus aisée la discussion de la correspondance quantique→classique.
L’équation (3.16) est l’écriture du postulat fondamental de la physique statistique, dans le cadre
classique.

Exemple : oscillateur harmonique.– Petit exercice académique mais instructif : nous


étudions la distribution microcanonique pour un oscillateur harmonique unidimensionnel H(q, p) =
1 2 2
2 (p + q ) (pour simplifier nous posons m = ω = 1). Si nous notons E l’énergie de l’oscillateur,
la  surface  iso-énergie est le cercle 2E = p2 + q 2 . La distribution microcanonique corres-
pond à l’occupation équiprobable de tous les points du cercle. Calculons la normalisation de la
distribution :
Z   Z +√2E Z 1
1 2 2
 2dq dt
Σ(E) = dqdp δ E − p +q = √ p =2 √√ (3.17)
2 − 2E 2E − q 2 0 t 1−t
 | √ {z

} 
1 2 )+δ(p+ 2)
δ(p− 2E−q 2E−q
|p| = 2 B(1/2, 1/2) = 2π (3.18)
où nous avons utilisé (A.16). La dernière intégrale est reliée à la fonction Beta d’Euler (A.4).
Finalement :
1
ρ∗ (q, p) = δ 2E − p2 − q 2 .

(3.19)
π
Nous déduisons la probabilité de présence au point q :
Z
1 √
w(q) = dp ρ∗ (q, p) = p pour |q| 6 2E (3.20)
π 2E − q 2
(le calcul utilise à nouveau (A.16)). La distribution dans l’espace physique nous permet de
calculer des moyennes de fonctions de la position. Par exemple :
Z
1 2 1 1
hq i = dq w(q) q 2 = E (3.21)
2 2 2

45
I Première approche dans un cadre classique Postulat fondamental – Ensemble microcanonique

(l’intégrale est à nouveau donnée par (A.4)). Finalement nous reconnaissons un résultat bien
connu : la moyenne temporelle de l’énergie potentielle de l’oscillateur harmonique, sur une période
d’oscillation, est la moitié de l’énergie mécanique Epot (t) = 12 q(t)2 = 21 E. Sur cet exemple trivial,
nous avons vérifié l’hypothèse ergodique d’équivalence entre moyenne d’ensemble et moyenne
temporelle.

Remarques

Le postulat fondamental déduit d’un principe d’entropie maximale.– En supposant


la distribution d’équilibre uniforme sur la surface d’iso-énergie, i.e. que tous les microétats per-
mis par la contrainte (énergie fixée) sont équiprobables, nous avons choisi la distribution ayant
l’entropie maximale. La démarche est analogue avec l’analyse du problème de pile ou face : on ne
sait avancer aucune prédiction sur l’état final de la pièce tournoyant en l’air, on postule donc que
le  macroétat  est celui ayant l’entropie la plus grande (i.e. associé avec le minimum d’infor-
mation), la distribution uniforme Ppile = Pface = 1/2. De même pour le système macroscopique
isolé : en l’absence de toute contrainte autre que la conservation de l’énergie, nous postulons
que le macroétat effectivement réalisé est celui ayant la plus grande entropie, i.e. que tel tous
les microétats d’énergie E soient équiprobables.

La terminologie : les ensembles de la physique statistique.– Nous avons expliqué l’ori-


gine de la dénomination  ensemble microcanonique  : cette terminologie fait référence à un
ensemble virtuel d’une infinité de systèmes équivalents sur lequel la moyenne probabiliste est
réalisée ; les systèmes virtuels ont tous les mêmes propriétés à l’échelle macroscopique, compa-
tibles avec les contraintes imposées (système isolé, donc E, V , N ,... fixés). À la fin du XIXe ,
Gibbs a compris comment introduire d’autres  ensembles  correspondant à d’autres manières
de construire des macroétats en fixant des contraintes différentes (par exemple, au chapitre
suivant nous remplacerons la contrainte de conservation de l’énergie par une contrainte sur la
température).

Hypothèse ergodique et théorème de la limite centrale.– Essayons de comprendre com-


ment nous pouvons justifier le passage de la moyenne temporelle (3.10) à la moyenne d’ensemble
(terminologie de la physique statistique pour désigner la moyenne probabiliste). Pour cela nous
discutons l’existence de quelques temps caractéristiques contrôlant la dynamique du système
macroscopique (par exemple un gaz).

• Tout d’abord nous pouvons introduire un temps microscopique τmicro ; par exemple le
temps de collision entre particules, τcoll ∼ 1 ns dans un gaz dans les conditions normales
de température et de pression, le temps typique entre deux collisions successives subies
par un atome (i.e. pendant τcoll , les N ∼ 1023 atomes subissent chacun typiquement une
collision).

• Nous pouvons introduire un temps de corrélation τcorr A caractérisant la décroissante de la

fonction de corrélation de l’observable en question, i.e. la largeur temporelle de la fonction


CA (t − t0 ) = hA(t)A(t0 )i − hA(t)ihA(t0 )i.

• Enfin nous introduisons un temps ergodique τerg (temps de Poincaré), qui est le temps
nécessaire à la trajectoire pour explorer l’espace des phases accessible. À cause de la très
grande dimension de celui-ci (6N − 1), ce temps est faramineux !
A ≪τ .
Typiquement on attend la hiérarchie τmicro  τcorr erg

46
Postulat fondamental – Ensemble microcanonique II Description quantique : espace de Hilbert

Nous admettons que le temps  expérimental  T dans (3.10) est très grand devant le
A et découpons l’intégrale en N morceaux associés à des intervalles de temps ∆T =
temps τcorr T
A :
T /NT & τcorr
"Z Z NT ∆T #
∆T Z 2∆T
(T ) 1 dt dt dt
A = A(t) + A(t) + · · · + A(t) . (3.22)
NT 0 ∆T ∆T ∆T (NT −1)∆T ∆T

Puisque ∆T & τcorrA , les morceaux d’intégrales sont statistiquement indépendants. Le théorème
(T )
de la limite√centrale nous montre que A est une quantité fluctuante dont les fluctuations sont
d’ordre 1/ NT , i.e.
(T ) √
A = hAi + O(1/ T ) (3.23)
| {z }
terme aléatoire
Notons que notre argument n’a réglé qu’une partie du problème puisque nous n’avons pas prouvé
que les morceaux d’intégrales sont des échantillons représentatifs d’une moyenne d’ensemble, i.e.
que leur distribution correspond à la distribution uniforme sur la couche d’iso-énergie.
La recherche de résultats rigoureux sur la question de l’ergodicité fait l’objet d’un domaine
appelé  théorie ergodique . Toutefois assez peu de résultats exacts ont été prouvés (on peut
toutefois citer la preuve de l’ergodicité pour le gaz classique de sphères dures par Ya. Sinai en
1963).
Pour terminer, remarquons que, si la question de l’ergodicité repose en principe sur la com-
plexité de la dynamique du système macroscopique, les faibles perturbations extérieures (isoler
un système n’est qu’une vue de l’esprit) peuvent jouer en pratique un rôle important.

II Description quantique : espace de Hilbert


II.A Rappel des postulats de la mécanique quantique
La mécanique quantique est le cadre définissant les lois de la physique aux échelles élémentaires.
Rappelons les quelques règles qui régissent la dynamique quantique (les postulats) ; je renvoie à
[5, 8, 24, 34] pour plus de détails.

• États quantiques.– L’état quantique d’un système est décrit par un vecteur d’état | ψ i,
élément d’un espace vectoriel des états, l’espace de Hilbert H , construit sur le corps
des nombres complexes. L’espace de Hilbert est muni d’un produit scalaire satisfaisant
h ψ | φ i = h ψ | φ i∗ .

• Interprétation probabiliste.– Le produit scalaire s’interprète comme l’amplitude de proba-


bilité de transition (instantanée) entre deux états A(ψ ← φ) = h ψ | φ i, i.e. la probabilité
de transition 6 est Proba(ψ ← φ) = |h ψ | φ i|2 .

• Observables et postulats de mesure.– Les observables (grandeurs physiques) sont représentées


par des opérateurs linéaires agissant dans l’espace de Hilbert. Une observable A est ca-
ractérisée par son spectre de valeurs propres et vecteurs propres {an , | ϕn i}. Si le système
est dans un état | ψ i, le résultat d’une mesure de A est une des valeurs propres an avec pro-
babilité Proba(ϕn ← ψ) = |h ϕn | ψ i|2 . L’état du système après mesure est | ϕn i (réduction
du paquet d’ondes). Le processus de mesure s’accompagne une évolution stochastique et
irréversible de l’état quantique.
6
Autrement dit : Proba(ψ ← φ) = |h ψ | φ i|2 est la probabilité pour observer le système dans l’état | ψ i, sachant
qu’il se trouve dans l’état | φ i.

47
II Description quantique : espace de Hilbert Postulat fondamental – Ensemble microcanonique

• Évolution temporelle.– L’évolution temporelle du vecteur d’état est contrôlée par l’équation
d
de Schrödinger i~ dt | ψ(t) i = H| ψ(t) i où H est l’opérateur représentant l’énergie (l’hamil-
tonien). C’est donc une évolution déterministe et réversible (d’un objet de nature proba-
biliste).

• Permutabilité des particules identiques.– La description de l’état quantique en termes d’am-


plitudes de probabilité conduit à postuler l’indiscernabilité des particules identiques, i.e.
que les états à plusieurs particules possèdent une symétrie sous la permutation de deux
particules. Notons ψ(~r) = h~r | ψ i la fonction d’onde, i.e. ψ(~r) est l’amplitude de proba-
bilité de trouver la particule en ~r. L’état à N particules est fonction de N coordonnées
ψ(~r1 , · · · , ~ri , · · · , ~rj , · · · , ~rN ). Les particules sont classées en deux groupes :
Les bosons (photon,...) dont l’état quantique est invariant sous la permutation. Pour
deux bosons : ψ(~r1 , ~r2 ) = ψ(~r2 , ~r1 ).
Les fermions (électron, proton, neutron,...) dont l’état quantique est antisymétrique
sous la permutation. Pour deux fermions : ψ(~r1 , ~r2 ) = −ψ(~r2 , ~r1 ).
Le théorème spin-statistique montre que les propriétés de permutabilité sont liées au spin
(moment cinétique intrinsèque) : les bosons ont un spin entier et les fermions un spin
demi-entier.

Puisque nous aurons à considérer un nombre macroscopique de particules identiques, le dernier


point (postulat de symétrisation) jouera un rôle important. 7

II.B Microétats et macroétats, moyennes


Le vecteur d’état contient toute l’information quantique sur le système (une information de
nature probabiliste) et correspond donc à la notion de microétat (état pur) :

microétat = un vecteur d’état | ψ i

Si on ne connaı̂t pas exactement dans quel état quantique se trouve le système mais savons
qu’un état | ψm i est occupé avec probabilité Pm , on parle de mélange statistique. L’ensemble
de ces vecteurs {| ψm i} doit former une base orthonormée (pour que les évènements s’excluent
mutuellement),

macroétat = ensemble des probabilités d’occupation {Pm } des vecteurs {| ψm i}

Nous devrons donc prendre garde à ce qu’il y a une double incertitude sur l’occupation d’un
état : quantique et statistique. 8 Ceci est bien illustré en écrivant les règles de projection pour
un état pur et un mélange statistique :

Proba φ ← état pur ψm = |h φ | ψm i|2



(3.24)
 X
Proba φ ← mélange statistique {Pm } = Pm |h φ | ψm i|2 (3.25)
m

7
En principe les particules ne sont pas uniquement caractérisées par leur état dans l’espace physique mais
possèdent souvent des dégrés de liberté interne, comme le spin (son moment cinétique intrinsèque). Dans ce cas
on doit également introduire une  coordonnée de spin  que nous notons σ (la projection d’une des composantes
du moment cinétique intrinsèque. La fonction d’onde dépend également de cette coordonnée. Si on regroupe les
coordonnées ξ ≡ (~r, σ) alors on écrira en toute généralité pour deux particules ψ(ξ1 , ξ2 ) = ±ψ(ξ2 , ξ1 ) (+ pour des
bosons et − pour des fermions).
8
Attention : dorénavant nous abolirons la distinction entre  probabiliste  et  statistique  (car le deuxième
adjectif est d’usage courant en physique pour désigner la première notion).

48
Postulat fondamental – Ensemble microcanonique II Description quantique : espace de Hilbert

Pm caractérise notre ignorance sur l’état quantique occupé par le système ; |h φ | ψm i|2 traduit
l’incertitude pour que, l’état initial état supposé parfaitement connu, le système soit observé
dans l’état final | φ i.
Si nous considérons une grandeur physique A, nous aurons à considérer sa moyenne associée
au macroétat. D’après le postulat de mesure, si le système est dans l’état | ψm i, la moyenne
quantique de l’observable est hAiψm = h ψm |A| ψm i (moyenne du résultat des mesures répétées,
toujours à partir du même état | ψm i). Ces moyennes quantiques doivent être pondérées par les
probabilités d’occupation des états (moyenne statistique ) :

moyenne statistique
z }| {
X
hAi = Pm h ψm |A| ψm i (3.26)
mélange | {z }
statistique m
moyenne quantique

Exemple : spin 1/2.– Considérons un spin 1/2 dont une base de l’espace de Hilbert est
{| ↑ i, | ↓ i}, vecteurs propres de la composante du spin selon Oz, représentée par la matrice de
Pauli  
~ 1 0
Sz = . (3.27)
2 0 −1
Nous étudions la moyenne de la composante du spin Sx :
 
~ 0 1
Sx = . (3.28)
2 1 0

Un état pur.– Tout d’abord nous étudions la situation où le spin est dans l’état pur | ψ i =
√1 | ↑ i + | ↓ i (superposition quantique des deux vecteurs de base). Les probabilités pour se

2  
trouver dans l’un ou l’autre des états propres de Sz sont Proba ↑← ψ = Proba ↓← ψ = 1/2.
Nous vérifions sans peine que hSx iψ = h ψ |Sx | ψ i = ~2 .

Mélange statistique.– Nous considérons maintenant le mélange statistique décrit par les
probabilités P↑ = P↓ = 1/2 (qui coı̈ncident avec les probabilités quantiques Proba ↑← ψ
et Proba ↓← ψ pour l’état pur précédent). Cependant la moyenne de la composante est
hSx imelange = P↑ h ↑ |Sx | ↑ i + P↓ h ↓ |Sx | ↓ i = 0.

+ Pour en savoir plus : Les deux situations peuvent être décrites sur un pied d’égalité
grâce à la notion d’opérateur densité. 9 Cf. [3] ou [11].

II.C Dénombrer les microétats : densité d’états


Définition et motivation
Nous avons vu que le postulat fondamental (le cœur de la physique statistique) fait inter-
venir le volume de l’espace des phases (classique) accessible. Dans la version quantique, la
9 def
P Opérateur densité ρ.– Afin de décrire le mélange statistique, on introduit l’opérateur densité ρ =
m Pm | ψm ih ψm |, où {| ψm i} est une base orthonormée. La condition de normalisation des probabilités prend
la forme tr{ρ} = 1 et la moyenne hAi = tr{ρA}. L’entropie de von Neumann (2.43) s’écrit S = −kB tr{ρ ln ρ}.

- Exercice 3.1 les entropies associées à (i) ρm = 12 | ↑ ih ↑ | + | ↓ ih ↓ |



: On considère un spin 1/2. Calculer
puis (ii) ρp = 12 | ↑ ih ↑ | + | ↑ ih ↓ | + | ↓ ih ↑ | + | ↓ ih ↓ | (indication : diagonaliser ρ dans chaque cas). Interpréter les
 

résultats. Comprenez-vous pourquoi les termes non diagonaux de ρp sont appelés  cohérences  ?
Calculer tr{ρm Sx } puis tr{ρp Sx }.

49
II Description quantique : espace de Hilbert Postulat fondamental – Ensemble microcanonique

problématique correspondante nous amènera à un calcul de nombre d’états quantiques acces-


sibles, i.e. au problème de dénombrement des états quantiques ayant une certaine énergie. La
notion de densité d’états va nous fournir le langage approprié pour étudier cette question.
Nous verrons que la densité d’états encodera bien souvent toute l’information microscopique
suffisante pour la construction d’un modèle dans le cadre de la physique statistique.

Définitions Dans tout problème spectral, comme la caractérisation du spectre {En } de l’ha-
miltonien de Schrödinger, une information intéressante est fournie par la densité spectrale, i.e.
la distribution des valeurs propres :
def
X
ρ(E) = δ(E − En ) (3.29)
n

où la somme porte sur les états quantiques (ce qui se confond avec une somme sur les ni-
veaux d’énergies uniquement en l’absence de dégénérescences ; en présence de dégénérescences
on peut relier la sommeP sur lesP états à la somme sur les niveaux d’énergie en introduisant les
dégénérescences dn : n · · · = En dn · · · ). Cette quantité mesure le nombre d’états dans un
intervalle :
ρ(E) dE = # d’états dans [E, E + dE] (3.30)
En général cette fonction est extrêmement irrégulière : pour un spectre discret il s’agit d’une
somme de pics δ (ce n’est même pas une fonction, mais une distribution singulière). Pour éviter
de manipuler une distribution singulière, on préfère introduire la densité d’états intégrée
Z E X
dE 0 ρ(E 0 ) =
def
Φ(E) = θH (E − En ) = # d’états d’énergies inférieures à E , (3.31)
−∞ n

qui s’avèrera plus simple à analyser. Φ(E) présente des discontinuités lorsque E coı̈ncide avec
une valeur propre de l’énergie.
Si le spectre devient très dense (i.e. tend vers un continuum), la nature discrète de la distri-
bution des énergies s’estompe. Autrement dit, sur des échelles d’énergie grandes devant l’écart
entre niveaux, on peut considérer que la fonction Φ(E) est une fonction régulière de l’énergie
(figure 3.7).

Terme de Weyl – Exemple de l’oscillateur harmonique 1D Considérons par exemple


un oscillateur harmonique unidimensionnel dont le spectre est
 
1
En = ~ω n + n∈N. (3.32)
2
Dans ce cas la densité d’états intégrée Φ(E) est une fonction en marches d’escalier régulières
(Fig. 3.7). Elle est bien approximée par le terme lisse ΦWeyl (E) = E/~ω (la droite qui passe au
milieu des marches). On peut ainsi déduire de cette fonction le terme lisse de la densité d’états
(la densité d’états moyennée à l’échelle de l’écart entre niveaux) ρWeyl (E) = Φ0Weyl (E) = 1/~ω,
ce qui nous dit qu’il y a en moyenne un état dans un intervalle de largeur ~ω (alors que la densité
d’états est un peigne de Dirac régulier). Le terme lisse de la densité d’états est appelé  terme
de Weyl .

Motivation L’intéret de ces notions réside dans le fait que nous aurons souvent à considérer
des sommes d’une fonction de l’énergie de la forme
X Z
f (En ) = dE ρ(E) f (E) . (3.33)
n

50
Postulat fondamental – Ensemble microcanonique II Description quantique : espace de Hilbert

# d’etats Φ(E ) # d’etats


4 Φ ( )
Weyl
E
3
2
1 hω ∆ E >> hω
E E
0 E
0 E1 E2 E3 E4
Resolution quantique Resolution "classique"

Figure 3.7 : Densité d’états intégrée de l’oscillateur harmonique. Comparaison de


la densité d’états intégrée Φ(E) avec son approximation semi-classique ΦWeyl (E).  Vue de
près  (gauche) et  vue de loin  (droite).

Souvent, f (x) sera une fonction qui varie lentement à l’échelle des écarts entre niveaux ; nous
pourrons plus simplement écrire (approximation semi-classique)
X Z
f (En ) ' dE ρWeyl (E) f (E) , (3.34)
n

où l’intégrale réalise la moyenne locale sur une échelle plus grande que les écarts entre niveaux :

dE 0
Z E+∆E
ρWeyl (E) ' ρ(E 0 ) avec ∆E  En+1 − En , (3.35)
E ∆E
mais encore petite devant des échelles macroscopiques (plus précisément devant l’échelle ca-
ractéristique sur laquelle varie la fonction
P f (E)).
Insistons : le calcul de la somme n f (En ) requiert
R la connaissance précise de l’ensemble des
valeurs propres de l’énergie, alors que l’intégrale dE ρWeyl (E) f (E) seulement leur répartition
moyenne sur l’axe réel. Il sera donc en général beaucoup plus facile de calculer l’intégrale (3.34)
que la somme (3.33).
En outre, alors que la connaissance du spectre est un problème quantique (difficile), nous
allons voir que la détermination de la densité moyenne ρWeyl (E) peut être formulée en termes
purement classique (facile).

Densité d’états à l’approximation semi-classique (ou plutôt  semi-quantique )


Nous discutons la densité d’états pour des particules libres, et montrons comment le calcul de
cette quantité, qui caractérise la distribution des énergies des états quantiques, peut être formulé
en termes classiques dans une certaine limite.

Particule libre La démonstration générale de la formule semi-classique pour ρWeyl (E) fait
appel à des outils que nous n’introduisons pas dans ce cours. Nous considérons plutôt l’exemple
précis (et important) des particules libres afin d’établir la formulation semi-classique du calcul de
la densité d’états intégrée, puis nous étendrons (sans démonstration) le résultat au cas général.
Une particule de masse m se meut dans un espace de dimension d. Elle est confinée dans une
boı̂te de forme hypercubique de volume V = Ld . Nous supposons des conditions aux limites
périodiques, ce qui simplifiera l’analyse (on peut montrer que le terme de Weyl est indépendant
de la nature des conditions aux bords). Les états propres du problème sont les ondes planes
1 ~ 2π
ψ~k (~r) = √ eik·~r où ~k = (n1 , · · · , nd ) (3.36)
V L

51
II Description quantique : espace de Hilbert Postulat fondamental – Ensemble microcanonique

avec ni ∈ Z (la quantification du vecteur d’onde est imposée par les conditions aux limites
périodiques). La densité d’états intégrée est
!
X ~2~k 2
Φ(E) = θH E − (3.37)
2m
~k
P P P
où la somme porte sur tous les vecteurs d’onde quantifiés selon (3.36) (i.e. ~k ≡ n1 ∈Z · · · nd ∈Z ).
θH (x) est la fonction de Heaviside. Autrement
√ dit (3.37) compte tous les ~k (quantifiés) à
l’intérieur d’une hypersphère de rayon 2mE/~. Si le volume est  grand  (i.e. E  √ ~2 /mL2 ),
nous pouvons estimer que Φ(E) est donné par le volume de l’hypersphère de rayon 2mE/~,
divisé par le volume (2π/L)d occupé par un état quantique dans l’espace des vecteurs d’onde
~k (figure 3.8). Cela revient à faire une approximation continue et remplacer la somme par une
intégrale :
Z
X V
−→ d~k (3.38)
(2π)d
~k

Finalement nous substituons l’intégrale sur le vecteur d’onde par une intégrale sur l’impulsion
p~ = ~~k, et le volume par une intégrale sur les positions :

p~ 2
Z Z  
1
ΦWeyl (E) = d d~r d~ p θH E − (3.39)
h V 2m

L’intérêt de ce dernier changement de variable est d’avoir re-formulé le calcul de ΦWeyl (E), une
fonction comptant les énergies propres (problème quantique), en termes de grandeurs purement
classiques. Nous interprétons donc ce résultat comme

1
ΦWeyl (E) = (volume occupé par les microétats de l’espace des phases d’énergies < E)
hd
(3.40)
d
h , où h = 2π~ est la constante de Planck, s’interprète comme le volume qu’occuperait un état
quantique dans l’espace des phases classique. d doit ici être interprété comme le nombre de
degrés de liberté, i.e. la moitié de la dimension de l’espace des phases. Notons que ce résultat
est réminiscent de la relation de Heisenberg δqδp ∼ h.
Nous pouvons terminer le calcul √ dans le cas d’une particule libre : ΦWeyl (E) est donné par
le volume de l’hypersphère de rayon 2mE dans un espace de dimension d : 10
 d/2
V mE
ΦWeyl E) = d
. (3.41)
Γ( 2 + 1) 2π~2

Cas général Nous admettrons que la règle semi-classique (3.40) s’applique pour un hamilto-
nien général H({qi , pi }) :

d
Z Y
dqi dpi
ΦWeyl (E) = θH (E − H({qi , pi })) (3.42)
h
i=1

En pratique, l’approximation semi-classique est justifiée lorsque le spectre des valeurs propres de
l’énergie est extrêmement dense, i.e. lorsqu’on n’est pas sensible aux effets de la quantification
de l’énergie, ce qui est toujours le cas pour un volume macroscopique.
10
Le volume de l’hypersphère de rayon 1 est Vd = π d/2 /Γ( d2 + 1).

52
Postulat fondamental – Ensemble microcanonique II Description quantique : espace de Hilbert

ky d
(2πL )

kx

2 mE
h

Figure 3.8 : Dans l’espace des vecteurs d’onde ~k, chaque état quantique d’une particule libre est
représenté par un nœud d’un réseau hypercubique de pas 2π/L. Chaque état quantique occupe
donc un volume (2π/L)d dans l’espace des ~k = p~/~. La densité d’états intégrée Φ(E)
√ correspond
au nombre de nœuds du réseau compris à l’intérieur de l’hypersphère de rayon 2mE/~.

L’intérêt des équations (3.40) et (3.42) est de relier une quantité quantique, la densité
d’états intégrée, à une propriété purement géométrique de l’espace des phases classique (le
calcul d’un volume).

Exemple : oscillateur harmonique.– Appliquons la formule précédente au cas de l’oscilla-


1 2
teur harmonique unidimensionnel : H(q, p) = 2m p + 12 mω 2 q 2 . Nous obtenons
Z √ r Z
dqdp 2m 2 1
dQdP θH E − P 2 − Q2 =

ΦWeyl (E) = θH (E − H(q, p)) = 2
E.
h h mω ~ω
| {z }
surface disque =πE
(3.43)
Nous avons retrouvé le résultat discuté au début du paragraphe (figure 3.7).

II.D Densité d’états pour des particules identiques (donc indiscernables)


Indiscernabilité et postulat de symétrisation.– Examinons les conséquences du dernier
des postulats de la mécanique quantique concernant les propriétés de permutabilité des états à
plusieurs particules identiques. Le postulat de symétrisation a des conséquences extrêmement
importantes sur la structure des états quantiques et de l’espace de Hilbert, dont il affecte no-
tamment la dimension. Pour le problème qui nous intéressera essentiellement, le comptage des
états quantiques à travers la densité d’états, son effet est toutefois plus simple à discuter.

Un exemple très simple : deux particules dans un puits harmonique.– Pour clarifier
ce point, commençons par un exemple très simple : deux particules sans interaction se déplaçant
sur une ligne et soumises à un confinement harmonique. C’est un problème séparable, le spectre
des énergies de l’hamiltonien à deux particules est simplement donné par l’addition des spectres
à une particule : les énergies sont repérées par deux nombres quantiques (un par particule)
En,m = ~ω(n + m + 1). Si l’on souhaite compter les états, calculer Φ(E), il nous faut dénombrer
les états, i.e. caractériser les dégénérescences des niveaux d’énergie. Examinons trois cas.

• Deux particules discernables.— À chaque énergie En,m sont associés deux états | n i ⊗ | m i
et | m i ⊗ | n i (suivant que la particule 1 occupe | n i et la 2 occupe | m i, ou l’inverse).

53
II Description quantique : espace de Hilbert Postulat fondamental – Ensemble microcanonique

L’énergie En,n est associée à un unique état | n i ⊗ | n i. Une représentation graphique de


ces états quantiques est donc l’ensemble des couples (n, m) ∈ N2 dans le quart de plan
(figure 3.9). La densité d’états intégrée est donnée par
∞ X
X ∞
Φdisc (E) = θH (E − En,m ) (3.44)
n=0 m=0
| {z }
sommes indep.

où la sommation sur les états quantiques est faı̂tes à l’aide de deux sommes indépendantes
sur les deux nombres quantiques. Le calcul explicite de Φdisc (E) peut se faire comme suit :
Φdisc (E) s’interprète comme le nombre de points du diagramme sous une ligne n + m =
E 2
E/(~ω) − 1. Dans la limite E/(~ω)  1, le nombre de microétats Φdisc (E) ≈ 12 ~ω

est
la surface du triangle.
...

...

...
...
...
...
...
...

...
...
...
...
...

...
...
...
...
...
m m m
... ... ...
... ... ...
... ... ...
... ... ...

n n n
discernables bosons fermions

Figure 3.9 : Représentation graphique des états quantiques pour deux particules dans un puits
harmonique. Les états sont indiqués en trait gras.

• Deux bosons.— L’état physique est invariant par permutation des particules, i.e.
| particule 1 dans n; particule 2 dans m i = | particule 1 dans m; particule 2 dans n i. Un
tel état peut être fabriqué à l’aide des états à un corps : | n, m ibosons = √12 | n i ⊗ | m i +

| m i ⊗ | n i . Cet état est invariant par échange des nombres quantiques : | n, m i = | m, n i,
i.e. les niveaux d’énergie sont non dégénérés. Pour compter les états, il ne faut som-
mer qu’une fois des couples d’entiers distincts. La représentation graphique des états
| n, m ibosons montre qu’ils ne couvrent qu’un huitième du plan (figure 3.9). La densité
d’états intégrée prend alors la forme
∞ X
X ∞
Φbosons (E) = θH (E − En,m ) (3.45)
m=0 n=m
| {z }
sommes contraintes

Le postulat de symétrisation affecte le comptage des microétats : les sommations sur les
nombres quantiques ne sont plus indépendantes pour tenir compte du fait que | n, m ibosons
et | m, n ibosons désignent le même état quantique.
• Deux fermions.— Les états quantiques à deux fermions sont  antisymétriques sous la per-
1

mutation, i.e. | n, m ifermions = 2 | n i ⊗ | m i − | m i ⊗ | n i . Cette fois encore nous devons

sommer une unique fois sur les couples d’entiers distincts. Par rapport au cas des bosons,
nous devons exclure les états tels que n = m (principe de Pauli). La densité d’états pour
les deux fermions est donc
X∞ ∞
X
Φfermions (E) = θH (E − En,m ) . (3.46)
m=0 n=m+1
| {z }
sommes contraintes

54
Postulat fondamental – Ensemble microcanonique II Description quantique : espace de Hilbert

Lorsque E/(~ω)  1, et puisque les états pour deux bosons et deux fermions ne couvrent que
le huitième du plan, nous pouvons écrire très grossièrement que
1
Φbosons (E) ' Φfermions (E) ' Φdisc (E) . (3.47)
2!

Cas du gaz parfait de particules libres.– Considérons le cas d’un ensemble de N parti-
cules libres identiques se mouvant dans un espace tridimensionnel. Si les particules sont sans
interaction, les états propres de l’hamiltonien sont des produits tensoriels d’ondes planes
~2~ki 2
| ~k1 i ⊗ · · · ⊗ | ~kN i (états non symétrisés) d’énergie E~k1 ,··· ,~kN = N
P
i=1 2m . Les états physiques
satisfaisant le postulat de symétrisation sont symétriques sous l’échange des particules : ils sont
obtenus en appliquant un opérateur de symétrisation sur l’état non symétrisé. Alors que l’état
non symétrisé | Ψnon sym i = | ~k1 i ⊗ · · · ⊗ | ~kN i est repéré par la suite ordonnée des nombres quan-
tiques (quelle particule est dans quel état), l’état symétrisé | Ψsym i = | ~k1 , · · · , ~kN i est repéré par
la donnée de la suite non ordonnée des nombres quantiques (quel état est occupé par n’importe
laquelle des N particules). Autrement dit il ne faut pas sommer indépendamment sur les
N vecteurs d’ondes, mais tenir compte des permutations des nombres quantiques
correspondant à des états quantiques équivalents : par exemple si tous les nombres quan-
tiques sont distincts, N ! permutations des indices correspondent au même état quantique. Dans
le cas des bosons, on a
N
!
X n~k ! · · · n~k ! X
1 N
Φbosons (E) = θH E − ~ki (3.48)
N!
~k1 ,··· ,~kN i=1

2~ 2
où n~ki est le nombre de particules occupant l’état individuel | ~ki i, et ~ki = ~ 2m
ki
. Les facteurs n~ki !
tiennent compte de l’éventualité que plusieurs vecteurs d’onde coı̈ncident lors de la sommation
(si deux vecteurs coı̈ncident, le nombre de permutations équivalentes est en effet inférieur à N !).
Pour des fermions, on doit exclure de la somme les termes où plusieurs particules occupent le
même état individuel (principe de Pauli) :
N
!
1 X X
Φfermions (E) = θH E − ~ki . (3.49)
N!
~k1 , · · · , ~kN i=1
tous différents

La difficulté du calcul réside dans le fait que les sommations sur les vecteurs d’onde ne sont pas
indépendantes puisqu’elles sont affectées par des facteurs combinatoires non triviaux pour les
bosons, et sont contraintes par le principe de Pauli pour les fermions.

Facteurs d’occupation.– Nous introduisons une formulation qui se révèlera très utile pour
discuter les statistiques quantiques, vers la fin du cours. L’état quantique respectant le postu-
lat de symétrisation est caractérisé par la donnée des états individuels occupés (sans préciser
l’identité des particules occupant ces états). Autrement dit l’état quantique symétrisé | Ψsym i =
| {n~k } i peut être spécifié par la donnée de l’ensemble des facteurs d’occupations des états quan-
tiques individuels, où n~k est le nombre de particules dans l’état | ~k i. La densité d’états intégrée
du problème à N particules s’écrit en ces termes :
(
X  X  n~k ∈ N (bosons)
Φindisc (E) = θH E − n~k ~k . (3.50)
~k n~k
∈ {0, 1} (fermions)
{n~ } tq.
P k
k n~
~ k = N

55
III Postulat fondamental Postulat fondamental – Ensemble microcanonique

P
Contrairement aux expressions (3.48) et (3.49), la somme ~k ne porte plus sur les particules, ou
plutôt sur les états effectivement occupés par des particules, mais sur l’ensemble des états indi-
viduels (en nombre infini en général). La somme sur les états à N particules (i.e. sur l’ensemble
des facteurs d’occupation) est clairement contrainte pour que la somme des occupations coı̈ncide
avec le nombre de particules. Pour des bosons n~k ∈ N alors que pour des fermions n~k ∈ {0, 1}.

Limite diluée.– Lorsque l’on considère la limite d’un fluide dilué (haute température/faible
densité), la somme sur les états est dominée par des termes tels que les occupations des états
individuels soient petites. En effet, lorsque l’énergie du système est  grande , le nombre de
manières de distribuer cette énergie parmi les états individuels est en général faramineux : le
nombre d’états accessibles est beaucoup plus grand que le nombre de particules. L’occupation
d’un état n~ki vaut la plupart du temps 0, rarement 1 et est encore plus rarement supérieur à
1. On peut alors négliger les contraintes sur les nombres quantiques lors des sommations dans
(3.48) et (3.49). Nous obtenons alors un résultat identique pour les bosons et les fermions
N
!
1 X X ~2~ki 2
Φindisc (E) ' θH E − (3.51)
N! 2m
~k1 ,··· ,~kN i=1

Autrement dit, si nous introduisons Φindisc (E) ' Φbosons (E) ' Φfermions (E), on a

1
Φindisc (E) ' Φdisc (E) (3.52)
N!

où dans l’approximation semi-classique, Φdisc (E) est donné par (3.42). L’approximation faite ici
est équivalente à  l’approximation de Maxwell-Boltzmann  qui sera discutée plus tard (les
expressions (3.48,3.49,3.50,3.52) deviendront plus claires aux chapitres 9 et 10).
Dans le cas des particules libres, en remarquant que la sommation sur les N vecteurs tridi-
mensionnels est équivalente à la sommation sur un unique vecteur de dimension d = 3N , nous
pouvons écrire Φdisc (E) sous la forme (3.37), et donc
3N/2 N  3N/2
VN e5N/2
 
1 mE Stirling V mE
Φlibres
indisc (E) ' ' √ , (3.53)
N ! Γ( 3N
2 + 1)
2π~2 π 6N N 3π~2 N

où V = L3 est maintenant le volume dans l’espace tridimensionnel.

III Le postulat fondamental de la physique statistique


Nous donnons une formulation générale du postulat fondamental de la physique statistique.

Notations Notons (`) les microétats du système. Dans le cas classique, (`) représente un point
{qi , pi } de l’espace des phases. Dans le cas quantique, il désigne un état quantique | ` i de l’espace
de Hilbert.

III.A La distribution microcanonique


Dans le cas classique, l’hypothèse ergodique nous a conduit à l’idée que la mesure (la probabilité
d’occupation des microétats) est uniforme sur la  surface  de l’espace des phases d’énergie E.
Dans le cas quantique la dynamique complexe et les perturbations permettent au système d’ex-
plorer tous les états quantiques d’énergie fixée.

56
Postulat fondamental – Ensemble microcanonique III Postulat fondamental

Postulat fondamental : tous les microétats accessibles d’un système isolé et à l’équilibre
(macroscopique) sont équiprobables.

Nous introduisons Ω(E), le nombre d’états accessibles (le nombre de microétats dont l’énergie
est E, à une incertitude δE près). Il s’exprime en termes de la densité d’états

Ω(E) = ρ(E) δE (3.54)

La probabilité pour que le système soit dans le microétat (`) d’énergie E` est :

1

 si E 6 E` 6 E + δE
P`∗ = Ω(E) (3.55)
0 sinon

Qu’on appelle la distribution microcanonique.

Remarque no 1 : Si nous choisissons δE = 0, le nombre d’états accessibles Ω(E) se confond


avec la notion de dégénérescence d’un niveau d’énergie. Si δE 6= 0, le nombre Ω(E) est la somme
des dégénérescences des niveaux dans [E, E + δE].

Remarque no 2 : Dans le cas classique, (3.55) est une re-écriture de (3.16) (la correspon-
dance précise est assurée en remarquant que le nombre de microétats accessibles est Ω(E) =
V(E, δE)/hd où d est le nombre de degrés de liberté ; notons qu’au niveau de (3.16), l’effet de
l’indiscernabilité n’avait pas encore été discuté, ce qui explique l’absence du facteur 1/N ! dans
cette dernière expression).

Remarque no 3 : Une démonstration du postulat ? Nous avons déjà remarqué dans la


section I que la distribution microcanonique peut-être déduite d’un  principe d’entropie maxi-
male , compte tenu des contraintes en présence (on parle parfois de  principe de désordre
maximal ). On peut rendre l’argument assez précis : nous montrons dans l’annexe page 74
comment poser le problème de maximisation de l’entropie sous contrainte : nous prouvons que,
compte tenu de la contrainte sur l’énergie, la distribution microcanonique maximise l’entropie
statistique (2.43).

III.B Entropie microcanonique


D’après la définition (2.43), nous déduisons que l’entropie (l’information manquante) de la dis-
tribution canonique est
S ∗ (E) = kB ln Ω(E) (3.56)

Nous allons voir que l’entropie microcanonique, en fonction des paramètres macroscopiques du
problème, volume V , nombre de particules N , etc, S ∗ (E, V, N, · · · ), est la fonction fondamen-
tale permettant d’obtenir les propriétés thermodynamiques du système.11 S ∗ jouera le rôle de
fonction génératrice des propriétés thermodynamiques. Cette observation souligne le caractère
remarquable de la relation fondamentale (3.56) qui relie Ω(E), une fonction qui dénombre des
microétats, à des propriétés mesurables (équation d’état, chaleur spécifique,....).
11
Il s’agit du postulat fondamental de la thermodynamique : cf. § II.

57
III Postulat fondamental Postulat fondamental – Ensemble microcanonique

Figure 3.10 : La tombe de Ludwig Boltzmann (1844-1906) à Vienne.

Extensivité de l’entropie
Variabes extensives et intensives Les grandeurs thermodynamiques peuvent être classées
selon deux catégories : les variabes extensives et les variables intensives. Considérons un système
isolé de N particules, d’énergie E, occupant un volume V . Si le système est dupliqué, les variables
 extensives  le sont également N → 2N , E → 2E, V → 2V , etc alors que les variables

 intensives  sont inchangées (densité n = N/V , température T , pression p, etc).

Propriétés d’extensivité de l’entropie pour des interactions à courte portée Nous


considérons un système physique au sein duquel les interactions entre constituants sont à courte
portée, ce qui sera toujours le cas dans les exemples que nous étudierons. 12 Nous séparons
le système S en N sous-systèmes S1 ,..., SN . L’hypothèse d’interactions à courte portée nous
permet d’affirmer que l’entropie du système global est la somme des entropies des sous-systèmes :

S(S1 ⊗ · · · ⊗ SN ) ≈ S(S1 ) + · · · + S(SN ) (3.57)

où nous avons utilisé la propriété de sous-additivité de l’entropie (2.52), ou plutôt (2.50) ; nous
avions remarqué que l’égalité est réalisée lorsque les deux systèmes sont non corrélés, or seuls les
sous-systèmes voisins sont faiblement corrélés si nous suppons que les interactions sont à courte
portée.

1 2 3
...

... N

Figure 3.11 : Un système S est subdivisé en N sous-systèmes S1 ,..., SN (avec de faibles


interactions mutuelles).

L’entropie est donc une grandeur extensive, i.e. qui croı̂t linéairement avec la taille du
système : S ∝ N . Puisque l’énergie est également une grandeur extensive, nous concluons que
12
Un contre exemple : les systèmes de particules en interaction gravitationnelle.

58
Postulat fondamental – Ensemble microcanonique III Postulat fondamental

l’entropie est une fonction de la forme :


 
E
S(E, N ) = N × fct (3.58)
N

Si nous réintroduisons la dépendance dans le volume, également extensif, nous obtenons la


structure  
E V
S(E, N, V ) = N s , (3.59)
N N
où s(E, V ) est une entropie par particule. Bien que l’état d’un fluide simple soit caractérisé par
trois grandeurs thermodynamiques, E, V et N , l’extensivité contraint la  fonction entropie ,
qui fait intervenir une fonction de deux variables, et non trois.
Nous déduisons que le nombre de microétats accessibles croı̂t exponentiellement avec N (qui
est macroscopique)   
E
Ω(E, N ) ∼ exp N fct . (3.60)
N
C’est donc un nombre faramineux en général (cf. section I.B sur les ordres de grandeur) !

Exemple : entropie du gaz parfait monoatomique (formule de Sackur Tetrode)


Nous considérons un gaz parfait isolé de N atomes contenu dans une boı̂te de volume V .
Nous avons calculé plus haut la densité d’états d’un gaz de particules libres indiscernables
(3.53), dont nous pouvons déduire la densité d’états et le nombre de microétats accessibles
Ω(E) = ρ(E)δE = Φ0 (E)δE, puis l’entropie microcanonique (3.56). Remarquons toutefois qu’il
est possible en pratique de s’épargner la dérivation par rapport à l’énergie : puisque la densité
3N
−1
d’états est une loi de puissance Φ(E) ∝ E 3N/2 on a ρ(E) = 3N 2E Φ(E) ∝ E
2 , d’où :
   
∗ 3N δE h 3N δE i
S = kB ln Φ(E) = kB ln Φ(E) + ln . (3.61)
2E | {z } 2E
extensif O(N ) | {z }
intensif O(N 0 )

Si N est un nombre de l’ordre de NA on peut simplement négliger le second terme et écrire :

S ∗ ' kB ln [Φ(E)] pour N → ∞ (3.62)

Autrement dit, pour le calcul de l’entropie à la limite thermodynamique N → ∞, on peut


prendre indifféremment comme argument du logarithme, soit le volume des états accessibles
(couche d’épaisseur δE autour de l’énergie E dans l’espace des phases), soit le volume des états
d’énergies inférieures à E. La croissance de Φ(E) avec E est tellement formidable, que sa valeur
est dominée par l’effet de bord : on peut injecter dans le logarithme, soit Φ0 (E), soit Φ(E).
En utilisant (3.53), on arrive à la formule de Sackur-Tetrode (cf. commentaires historiques
de l’annexe page 11)
"  3/2 !#
∗ 5 V mE
S (E, V, N ) = N kB + ln (3.63)
2 N 3π~2 N

On peut vérifier qu’elle présente les bonnes propriétés d’extensivité discutées plus
√ haut. Notons
toutefois qu’en passant de (3.62) à (3.63), nous avons négligé un terme −kB ln(π q 6N )  N kB ,
1 3 δE

i.e. au total, de la formule générale (3.56) au résultat (3.63), un terme kB ln π 2 E . Ce terme
est non extensif, mais complètement négligeable, d’ordre O(ln N ).

59
IV Relâchement de contraintes Postulat fondamental – Ensemble microcanonique

Remarque : la prédiction de la thermodynamique.– Nous pouvons comparer ce résultat


à celui obtenu dans le cadre de la thermodynamique. Des considérations générales permettent
de montrer V dans
  ce cadre que l’entropie du gaz parfait classique est de la forme S(E, V, N ) =
E α
N kB ln N N + S0 . La thermodynamique ne donne cependant aucune indication pour faire
une prédiction sur la valeur de l’exposant α, ni sur la constante S0 , qui doivent être déduits de
l’expérience.

IV Relâchement de contraintes – Distribution d’une variable


interne
Nous avons introduit précédemment l’entropie microcanonique S ∗ dont nous avons dit qu’elle
jouera un rôle fondamental. La question que nous allons maintenant aborder est de savoir com-
ment extraire l’information physique  intéressante  (pertinente expérimentalement ?) de cette
fonction fondamentale. En particulier, si la formule de Sackur-Tetrode (3.63) encode de l’infor-
mation sur le gaz parfait monoatomique, comme extraire celle-ci ? Par exemple comment obtenir
la pression du gaz, i.e. son équation d’état, etc.

IV.A Variables externes et variables internes


Nous n’avons pour l’instant introduit que des variables fixées caractérisant le système isolé : son
énergie, le nombre de particules, etc. On parle de  variables externes .
On peut aussi considérer des variables macroscopiques fluctuantes, comme le nombre de
particules Nv du volume fictif de la figure 3.1. Dans ce cas on parle de  variables internes .

1 2 1 2

δE

Figure 3.12 : Contact thermique. Deux systèmes initialement isolés sont mis en contact
thermique ; ils peuvent alors échanger de l’énergie.

IV.B Contact thermique entre deux systèmes – Température microcano-


nique
Nous étudions le contact thermique entre deux systèmes S1 et S2 initialement isolés (fi-
gure 3.12). Chaque système est caractérisé par son entropie microcanonique S1∗ (E1 ) = kB ln Ω1 (E1 )
et S2∗ (E2 ) = kB ln Ω2 (E2 ), où Ω1, 2 sont les nombres d’états accessibles des systèmes lorsqu’ils
sont isolés. À un certain instant on met les deux systèmes en contact thermique (la paroi
isolante devient une paroi  diatherme  laissant passer la chaleur), puis on laisse évoluer
le système global vers l’équilibre macroscopique. Lorsqu’ils sont en contact, les systèmes
échangent de l’énergie, E1 et E2 deviennent des variables internes, bien que l’énergie totale reste
fixée (avant et après le contact), puisque l’ensemble est isolé.

Hypothèse importante : interactions à courte portée


Nous admettons que les interactions entre les deux systèmes sont faibles (mais pas inexistantes
sinon ils n’échangeraient pas d’énergie). L’énergie totale est alors la somme de l’énergie de chacun

60
Postulat fondamental – Ensemble microcanonique IV Relâchement de contraintes

des sous systèmes


int
E = E1 + E2 + E1↔2 ' E1 + E2 . (3.64)
int repose sur l’hypothèse d’interactions à
La justification à négliger l’énergie d’interaction E1↔2
courte portée. Dans ce cas, on s’attend à ce que l’interaction soit un effet de surface, E1↔2 int ∝
2/3
N , négligeable devant les énergies des sous systèmes qui intègrent une énergie en volume,
E1 & E2 ∝ N .
L’hypothèse de faibles interactions a une conséquence importante sur le comptage des états
accessibles : puisque l’énergie E1 de S1 est indépendante de l’état de S2 , ceci reste vrai pour le
nombre de microétats accessibles Ω1 (E1 ). Si E1 et E2 sont fixées (i.e. avant le contact thermique),
le nombre de microétats de S1 ⊗S2 accessibles est Ω1⊗2 avant = Ω1 (E1 ) Ω2 (E2 ). Si E1 et E2 sont
des variables internes (après le contact thermique), nous devons additionner tous les nombres
Ω1 (E1 ) Ω2 (E2 ) compatibles avec la contrainte E1 + E2 = E :
X
Ω1⊗2 (E) = Ω1 (E1 ) Ω2 (E − E1 ) . (3.65)
E1

Clarifions le sens de la somme discrète sur l’énergie en revenant à la formulation en termes des
densités d’états. Nous notons ρ1,2 (E1,2 ) la densité d’états de S1,2 , liée au nombre de microétats
accessibles par Ω1,2 (E1,2 ) = ρ1,2 (E1,2 )δE. Nous écrivons naturellement :
P
ρ1⊗2 (E)= `1 ,`2 δ(E−E`1 −E`2 )
z
Z Z }| {
Ω1⊗2 (E) = δE dE1 ρ1 (E1 ) dE2 ρ2 (E2 ) δ(E − E1 − E2 ) (3.66)
Z Z
dE1
= δE dE1 ρ1 (E1 ) ρ2 (E − E1 ) = Ω1 (E1 ) Ω2 (E − E1 ) . (3.67)
δE
| P{z }
 E1 

Entropie réduite et distribution de E1


Nous étudions la distribution de l’énergie E1 (la variable interne). L’hypothèse précédente nous
permet d’écrire le nombre de microétats accessibles pour S1 ⊗ S2 , lorsque E1 est fixée, comme :
def
ω(E1 ; E) = Ω1 (E1 ) Ω2 (E − E1 ). D’après le postulat fondamental, la probabilité p∗ (E1 ; E) est
égale à la fraction des états accessibles ayant l’énergie E1 :
 
ω(E1 ; E) Ω1 (E1 ) Ω2 (E − E1 ) 1 e∗ (E1 ;E)−S ∗ (E)
S
p∗ (E1 ; E) = = = e kB 1⊗2
, (3.68)
Ω1⊗2 (E) Ω1⊗2 (E)
où nous avons introduit l’entropie réduite :
Se∗ (E1 ; E) = kB ln ω(E1 ; E) = S1∗ (E1 ) + S2∗ (E − E1 ) ,
def
(3.69)

P de∗ S1 ⊗ S2 , lorsque E1 est fixée. La condition de normalisation


qui correspond à l’entropie
de (3.68) est évidente E1 p (E1 ; E) = 1. Remarquons que l’additivité des entropies repose
sur l’hypothèse d’interaction à courte portée (i.e. nous avons encore utilisé la propriété (2.50)).
Comme nous l’avons vu, les nombres d’états accessibles Ω1, 2 sont énormes ; d’autre part ils sont
en général des fonctions croissantes de l’énergie. 13 À cause de la propriété (3.60) ces variations
sont très violentes. Ω1 (E1 ) croı̂t (extrêmement vite) avec E1 alors que Ω2 (E − E1 ) décroı̂t vite
(figure 3.13). Le produit va donc atteindre un maximum pour une valeur de l’énergie E1max , qui
correspond à la valeur qui maximise p∗ (E1 ; E). Cette valeur maximise aussi l’entropie réduite :

∂ Se∗ max ∂S1∗ max ∂S2∗


(E ; E) = 0 ⇒ (E1 ) = (E − E1max ) . (3.70)
∂E1 1 ∂E1 ∂E2
13
On verra un contre exemple en TD, lorsque l’espace de Hilbert a une dimension finie.

61
IV Relâchement de contraintes Postulat fondamental – Ensemble microcanonique

Cette condition permet de trouver la valeur de E1max la plus probable, caractérisant un


équilibre macroscopique entre sous systèmes.
Attention toutefois, lorsque nous parlons ici d’équilibre, nous avons en tête une condition
fixant la valeur la plus probable de la variable interne (ici E1 ), cependant nous devons garder à
l’esprit que celle-ci présente des fluctuations que nous allons caractériser plus bas.

Définition de la température microcanonique.– La correspondance avec la thermody-


namique nous indique qu’après contact thermique, la condition d’équilibre est l’égalité des
températures : la température est définie par l’égalité fondamentale (1.1) : T = ∂E

∂S V,N La
.
correspondance entre la physique statistique et la thermodynamique (dans une limite qui reste à
préciser), nous conduit à introduire la définition générale pour la température microcanonique :

1 ∗
def ∂S (E)
= (3.71)
T ∗ (E) ∂E

Il s’agit de la température absolue (introduite par en 1848 par William Thomson, futur Lord
Kelvin), dont le zéro correspond à −273.15 o C. Notons une petite différence avec la notation de
∂S
la thermodynamique 1/T = ∂E V,N
: l’entropie microcanonique caractérise le système isolé,
i.e. est naturellement une fonction de E, V , N , donc il sera inutile de préciser que la dérivation
partielle de S ∗ se fait à V et N fixés.

Exemple : température du gaz parfait monoatomique.– Partant de l’entropie (3.63),


nous obtenons la température microcanonique du gaz parfait :

1 2E
T ∗ (E, V, N ) = = . (3.72)
∂S ∗ /∂E 3N kB

Elle est donc indépendante du volume ; par conséquent, étant intensive, T ∗ ne peut dépendre
que du rapport E/N des deux quantités extensives.

Condition d’équilibre thermique.– Revenons au problème du contact thermique : la condi-


tion  d’équilibre  (3.70) peut être re-écrite à l’aide des températures microcanoniques des deux
sous systèmes :

T1∗ (E1 ) = T2∗ (E − E1 ) (condition d’équilibre thermique) (3.73)

La solution de cette équation est la valeur la plus probable E1 = E1max .

Rq no 1 : fluctuations et stabilité de l’équilibre.– La stabilité de l’équilibre, i.e. l’existence


d’un maximum de l’entropie exige que celle-ci soit une fonction concave et par conséquent la
température est une fonction croissante de l’énergie :

∂2S∗ ∂T ∗
<0 ⇒ >0 (3.74)
∂E 2 ∂E

Le lecteur aura peut-être reconnu la chaleur spécifique à volume constant, définie dans le
def
cadre de la thermodynamique comme CV = ∂E

∂T V,N . Pour assurer la correspondance avec la
thermodynamique, nous proposons la définition suivante de la chaleur spécifique microcanonique

1 1
CV∗ =
def
=− . (3.75)
∂T ∗ /∂E (T ∗ )2 ∂ 2 S ∗ /∂E 2

62
Postulat fondamental – Ensemble microcanonique IV Relâchement de contraintes

La stabilité de l’équilibre implique donc la positivité de la chaleur spécifique. 14


On peut garder en tête que E1 est sujette à des fluctuations caractérisées par la variance
" #−1 −1
∂ 2 Se∗ max
 2 ∗
∂ S1 max ∂ 2 S2∗ max
Var(E1 ) = −kB (E ; E) = −kB (E )+ (E − E1 ) . (3.76)
∂E12 1 ∂E12 1 ∂E22

D’après (3.75), les fluctuations sont reliées aux chaleurs spécifiques des deux sous-systèmes

1 −1
 
2 ∗2 1
σE1 = Var(E1 ) = kB T + (3.77)
CV∗ 1 CV∗ 2
où CV∗ 1 et CV∗ 2 sont les chaleurs spécifiques des deux sous systèmes. Cette expression montre que
les fluctuations de l’énergie sont essentiellement contrôlées par le système ayant la plus petite
chaleur spécifique : si CV∗ 1  CV∗ 2 alors σE1 ' kB T ∗ CV∗ 1 /kB .
p

Considérons la limite où le nombre de particules est macroscopique : l’entropie et l’énergie


∗ ∝ N et E
sont des quantités extensives, S1,2 1,2 ∝ N ; l’expression précédente montre donc que
2

1/Var(E1 ) ∝ N/N i.e. σE1 ∝ N (plus simplement : les chaleurs spécifiques sont des quantités
extensives). Les fluctuations relatives tendent donc vers zéro
σE1 √
max ∝ 1/ N −→ 0 . (3.78)
E1 N →∞

La limite N → ∞, pour laquelle on peut négliger l’existence des fluctuations, est appelée
la limite thermodynamique.
1.2
W2 W1
1.0
pHE1;EL

0.8

0.6

0.4
E1m ~ΣE1
0.2

0.0
0.0 0.5 1.0 1.5 2.0

E1

Figure 3.13 : Contact thermique. Nombres de microétats accessibles des sous systèmes en
fonction de E1 et distribution de l’énergie.

Rq no 2 : entropie après contact thermique.– Nous calculons l’entropie du système une


fois que le contact thermique a été établi : notre point de départ est l’expression (3.67), dans
laquelle nous faisons apparaı̂tre l’entropie réduite :
Z   Z
1 1
S1∗ (E1 )+S2∗ (E−E1 ) 1 1 e∗
S (E1 ;E)
Ω1⊗2 (E) = dE1 e kB
= dE1 e kB . (3.79)
δE δE
La somme est dominée par le voisinage de E1max , la valeur qui maximise l’argument de l’expo-
nentielle. En faisant l’approximation gaussienne (méthode du col, cf. annexe A),
v
1 u 2πkB 1 e∗
S (E1max ;E) √ σE 1 e∗
S (E1max ;E)
Ω1⊗2 (E) ' e kB = 2π 1 e kB (3.80)
u
t 2 e∗
δE − ∂ S2 (E max ; E) δE
∂E1 1

14
Notons que ces propriétés reposent sur l’hypothèse d’interactions à courtes portées, centrale dans l’analyse du
contact thermique. Lorsque cette hypothèse n’est pas satisfaite, il est possible de trouver des situations où CV∗ < 0.

63
IV Relâchement de contraintes Postulat fondamental – Ensemble microcanonique

où nous avons utilisé (3.76) et (3.77). On déduit l’expression de l’entropie totale du système
∗ (E) = k ln Ω
S1⊗2 B 1⊗2 (E) :

entropie due aux fluctuations de E1 :


entropie à E1 fixée : O(ln N )
O(N ) z

}| !{

z }| { 2π σE1
S1⊗2 (E) = S1∗ (E1max ) + S2∗ (E − E1max ) + kB ln . (3.81)
δE

Le terme dû aux fluctuations de E1 traduit un manque d’information sur l’état macrosco-
pique. C’est seulement à la limite thermodynamique, N → ∞, que l’on peut négliger cette
dernière contribution à l’entropie, qui est alors donnée par la somme des entropies des deux
sous-systèmes :

S1⊗2 (E) ' S1∗ (E1max ) + S2∗ (E − E1max ) . (3.82)
- Exercice 3.2 : En utilisant la formule de Sackur-Tetrode obtenue plus haut, calculer ex-
2 ∂2S∗
plicitement − δE
kB ∂E 2 . Vérifier que le dernier terme de (3.81) est bien O(ln N ).

Figure 3.14 : Contact thermique. Le système ayant initialement la température la plus haute
(ici S2 ) cède de l’énergie (de la chaleur) à celui ayant intialement la température la plus basse.

Rq no 3 : sens des échanges d’énergie.– Les fonctions T1∗ (E1 ) et T2∗ (E − E1 ) sont donc
respectivement croissante et décroissante en fonction de E1 . Si le point d’intersection correspond
à l’équilibre, nous constatons donc que le système ayant initialement la température la plus haute
cède de l’énergie à celui ayant initialement la température la plus basse (figure 3.14). 15

Conclusion : En conclusion, nous pouvons formuler le  théorème  suivant :

Théorème : Lorsqu’une contrainte est relachée dans un système isolé, celui-ci évolue spon-
tanément vers un état d’équilibre macroscopique qui maximise son entropie réduite.

IV.C Échange de volume – Pression microcanonique


Considérons le problème de la détente de Joule (figure 3.15). Deux gaz occupent deux parties
d’un récipient séparées par une paroi isolante ( adiabatique ), bloquée par un taquet. Le
15
Nous rencontrerons des situations où la température absolue peut devenir négative (si la dimension de
l’espace des états est finie, l’entropie peut décroı̂tre en fonction de l’énergie pour les énergies les plus élevées : par
exemple pour un ensemble de spins). Dans ce cas nous verrons que les températures absolues négatives sont plus
 chaudes  que les températures absolues positives.

64
Postulat fondamental – Ensemble microcanonique IV Relâchement de contraintes

(i) (i)
volume total est V = V1 + V2 . À un instant on retire le taquet pour permettre à la paroi de
se déplacer librement. On permet également aux systèmes d’échanger de l’énergie, i.e. la paroi
devient  diatherme . Les énergies E1 et E2 ainsi que les volumes V1 et V2 deviennent alors
des variables internes, avec les contraintes E = E1 + E2 et V = V1 + V2 . L’analyse est analogue
à celle de l’échange thermique, à la différence que l’on doit maintenant introduire une entropie
réduite fonction de deux variables internes Se∗ (E1 , V1 ; E, V ) = S1∗ (E1 , V1 ) + S2∗ (E − E1 , V − V1 ).
La condition d’équilibre est
∂S1∗ max max ∂S2∗ ∂S1∗ max max ∂S2∗
(E1 , V1 ) = (E−E1max , V −V1max ) et(E1 , V1 ) = (E−E1max , V −V1max ).
∂E1 ∂E2 ∂V1 ∂V2
(3.83)
Nous savons par ailleurs que l’équilibre mécanique est un équilibre entre forces, i.e. entre pres-
sions. Nous définissons donc la pression microcanonique en accord avec la définition de la ther-
modynamique, éq. (1.1) :
p∗ def ∂S ∗
= . (3.84)
T∗ ∂V
Remarquons que, bien que nous ne l’ayons pas écrit, p∗ comme T ∗ sont donc des fonctions des
arguments de l’entropie microcanonique S ∗ (E, V, N, · · · ). La condition d’équilibre de la paroi
prend finalement la forme

T1∗ = T2∗ et p∗1 = p∗2 (condition d’équilibre) (3.85)

11111111
00000000
00
11 11111111
00000000
00
11 11111111
00000000
00
11
00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111
00
11
00000000
11111111
00
11 00
11
00000000
11111111
00
11 00
11
00000000
11111111
00
11
00000000
11111111
00
11 00000000
11111111
00
11 00000000
11111111
00
11
00000000
11111111
00
11 00000000
11111111
00
11 00000000
11111111
00
11
00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111
00
11
00000000
11111111
00
11 00
11
00000000
11111111
00
11 00
11
00000000
11111111
00
11
00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111 00000000
11111111
00
11
00000000
11111111
t=0 t=0+ t & tequil.

Figure 3.15 : Détente de Joule. À un instant initial, t = 0, on libère la paroi, puis on attend
jusqu’à ce que l’équilibre (macroscopique) s’établisse.

On pourra vérifier que le sens de l’échange de volume est le suivant : le système ayant la
pression la plus basse cède du volume à celui ayant la pression la plus haute (figure 3.15).
2 ∗
Notons que l’existence d’un équilibre est assurée par la propriété de convexité ∂∂VS2 < 0, que

nous pouvons encore interpréter ∂p∂V < 0.

Exemple : pression du gaz parfait – équation d’état.– Nous pouvons injecter la for-
mule de Sackur-Tetrode dans la définition de la pression. Remarquons toutefois que l’expression
complète de l’entropie n’est pas nécessaire. Il nous suffit de remarquer que, pour des particules
non corrélées (gaz parfait classique) le nombre de microétats dépend du volume comme

Ω∝VN (3.86)

et par conséquent S ∗ = N kB ln V + f (E, N ). Il s’ensuit immédiatement que p∗ = N kVB T ,
autrement dit nous avons retrouvé l’équation d’état du gaz parfait classique : la loi de Boyle-
Mariotte ou loi universelle des gaz parfaits (classiques)

p ∗ V = N kB T ∗ (3.87)

65
IV Relâchement de contraintes Postulat fondamental – Ensemble microcanonique

Le point remarquable est l’universalité de ce résultat, indépendant des détails microscopiques


(nature du gaz) et même des détails du modèle. Nous verrons qu’elle s’applique également à des
gaz parfaits polyatomiques. Ses limitations viendront de la présence des corrélations, soit sous
l’effet de la mécanique quantique (gaz parfait quantique) soit sous l’effet des interactions (gaz
réels). En utilisant l’expression de la température, nous pouvons finalement exprimer la pression
en termes des paramètres naturels de l’ensemble microcanonique : nous obtenons une expression
2E
p∗ (E, V, N ) = (3.88)
3V
indépendante du nombre de particules. Cette écriture de la pression est toutefois une forme non
universelle (le 2/3 dépend de la nature du gaz, ici monoatomique).

Remarque : Nous verrons que la relation (3.88) est plus générale qu’il n’y paraı̂t : dans le
problème (annexe 3.C page 77) nous montrons qu’elle est valable aussi bien dans le régime
classique que dans le régime quantique, pour des bosons ou des fermions.

Remarque 2 – détente de Joule avec une paroi adiabatique : La détente de Joule avec
une paroi adiabatique est plus délicate à discuter (cf. [6] ; exercice II.16 de [11]). Même si les
deux systèmes ne peuvent pas échanger de chaleur à travers la paroi, ils peuvent échanger du
travail, cependant les variations d’énergies et de volumes ne sont pas indépendantes. Montrons
que l’équilibre est encore caractérisé par la condition d’égalité des pressions. Pour cela nous
supposons que le système est dans son état d’équilibre et cherchons une propriété permettant
de définir cet équilibre. Si l’on écarte le piston de section A d’une distance infinitésimale dx, la
variation de l’énergie du gaz 1 est donnée par le travail des forces exercées sur le piston (par
le gaz 2) : 16 dE1 = d̄W1 = −F2→1 dx = −p∗2 dV1 où dV1 = Adx. De même dE2 = −p∗1 dV2 . Les
variations d’énergies et de volumes ne sont pas indépendantes. La variation d’entropie (réduite)
est donc complètement contrôlée par dV1 = −dV2 :
∗ ∗
 
∗ ∗ ∗ 1 p 1 p 1 1
1
dSe = dS1 + dS2 = ∗ dE1 + ∗ dV1 + ∗ dE2 + ∗ dV2 = 2
+ (p∗1 − p∗2 )dV1 . (3.89)
T1 T1 T2 T2 T1∗ T2∗

L’équilibre correspond au maximum de l’entropie (réduite), i.e. p∗1 = p∗2 . Qed.


Cependant, l’égalité des pressions ne suffit pas à déterminer complètement l’état d’équilibre.
En effet, puisque de l’énergie a pu s’échanger, on doit déterminer quatre inconnues, E1 , E2 ,
V1 et V2 , alors que nous ne disposons que de trois équations : E1 + E2 = E, V1 + V2 = V et
p∗1 (E1 , V1 ) = p∗2 (E2 , V2 ). L’état d’équilibre dépend des détails de la dynamique au cours de la
transformation.

IV.D Échange de particules – Potentiel chimique microcanonique


Enfin, sans le détailler puisque la logique est encore similaire, nous pouvons considérer une
situation où les deux systèmes échangent des particules. On relâche cette fois une contrainte sur
le nombre de particules de chaque sous-système, le nombre total N = N1 + N2 restant conservé.
En définissant le potentiel chimique microcanonique

µ∗ def ∂S ∗
=− (3.90)
T∗ ∂N
16
Rappelons que le travail reçu par un système est le travail des forces extérieures. Pour un gaz séparé
de l’extérieur par un piston, le travail infinitésimal est d̄W = −pext dV où pext est la pression extérieure. Si
la transformation est réversible, i.e. le système passe par une succession d’états d’équilibre, il y a égalité entre
pressions intérieure et extérieure p = pext et le travail infinitésimal prend la forme d̄W rev = −p dV .

66
Postulat fondamental – Ensemble microcanonique IV Relâchement de contraintes

puis en maximisant l’entropie réduite, on arrive à la condition d’équilibre


µ∗1 µ∗2
= . (3.91)
T1∗ T2∗
Remarquons que si l’on échange des particules, on échange également de l’énergie, et donc
l’équilibre est également caractérisé par l’égalité des températures [6]

T1∗ = T2∗ et µ∗1 = µ∗2 (condition d’équilibre) (3.92)

Ces relations nous permettent de comprendre le sens physique du potentiel chimique : le  pa-
ramètre conjugué de N  joue le même rôle qu’une  pression , mais pour les populations de
particules. On verifie cette fois que les particules se déplacent du système ayant initialement le
potentiel chimique le plus élevé, vers celui l’ayant le plus bas. Ceci se comprend bien en revenant
à l’égalité fondamentale (1.1) : lorsque S =cste et V =cste, on a dE = µdN , i.e. le potentiel
chimique est alors l’énergie gagnée par particule : N → N + 1 implique alors E → E + µ. Le flot
de particules vers la région de potentiel chimique le plus bas permet donc de minimiser l’énergie
totale.

Exemple : potentiel chimique du gaz parfait.– Nous calculons le potentiel chimique à


partir de la formule de Sackur-Tetrode :
3/2 !
3π~2 N

∗ ∗ N
µ (E/N, V /N ) = kB T ln . (3.93)
V mE

Grandeur Force conjuguée Équilibre thermo. Sens des échanges (∗)

∂S ∗ energie
Énergie E 1
T∗ = ∂E T1∗ = T2∗ si T1∗ (i) > T2∗ (i) S1 −→ S2
p∗ ∂S ∗ volume
Volume V T∗ = ∂V T1∗ = T2∗ & p∗1 = p∗2 si p∗1 (i) > p∗2 (i) S1 ←− S2
µ∗ ∗ particules
# de particules N T∗ = − ∂S
∂N T1∗ = T2∗ & µ∗1 = µ∗2 si µ∗1 (i) > µ∗2 (i) S1 −→ S2

Table 3.1 : (∗) : les sens d’échange de volume et de particules sont donnés en supposant égalité
des températures initiales T1∗ (i) = T2∗ (i) .

IV.E Cas général : distribution d’une variable interne quelconque


Nous généralisons et résumons la discussion précédente. Nous considérons une variable interne
X, i.e. une grandeur macroscopique extensive, susceptible de fluctuer (par exemple X → E1 , ou
X → Nv de la figure 3.1, etc). Nous introduisons
def 
ω(x; E) = # de microétats accessibles tels que X = x (3.94)
La distribution de la variable aléatoire est alors donnée, d’après le postulat fondamental, par :
ω(x; E) 1 h e∗ i
p∗ (x; E) = S (x; E) − S ∗ (E) où Se∗ (x; E) = kB ln ω(x; E) (3.95)
def
= exp
Ω(E) kB
∂ ∗
où est l’entropie réduite. Nous cherchons maintenant la valeur xmax la plus probable : ∂x p (x; E) =
0 implique
∂ Se∗ max
(x ; E) = 0 (3.96)
∂x

67
V Irréversibilité Postulat fondamental – Ensemble microcanonique

On peut répéter la conclusion tirée de l’étude du contact thermique : les propriétés d’extensi-
vité de l’entropie nous permettent
√ de montrer que les fluctuations relatives de la variable interne
sont négligeables, σX ∝ N , comparativement à sa valeur moyenne, xmax ∝ N . À la limite
thermodynamique N → ∞, les variables extensives prennent une valeur certaine (on dit qu’elles
sont  auto-moyennantes ). Ce point explique l’opposition entre l’aléatoire à l’échelle
microscopique et le déterminisme à l’échelle macroscopique (tableau 1.1).
Finalement l’entropie du système est S ∗ (E) ' Se∗ (xmax ; E), à une correction sous extensive
O(ln N ) près.
Ces propriétés sont résumées dans le tableau.

V Irréversibilité
Les différents exemples de relâchement de contraintes que nous avons analysés nous ont montré
que l’évolution spontanée du système isolé s’accompagne d’une augmentation de l’entropie. C’est
l’essence du second principe de la thermodynamique. Pour comprendre plus précisément l’origine
de l’irréversibilité, nous considérons un autre cas précis : un récipient est séparé en deux volumes
(i)
égaux par une paroi ammovible. Un volume contient initialement N1 = N molécules alors que
(i)
l’autre est vide N2 = 0. À un instant on retire la paroi, les molécules se répartissent rapidement
dans les deux volumes (figure 3.16). Puisqu’elles se déplacent dans tous les sens aléatoirement,
le nombre de molécules N1 est une variable interne (fluctuante), qui vaut en moyenne N/2. Une
molécule ayant une probabilité 1/2 de se trouver dans le volume de gauche, la distribution du
nombre de molécules dans le volume de gauche est donnée par
N!
p∗ (N1 ) = . (3.97)
2N N1 !(N − N1 )!

Figure 3.16 : Irréversibilité.


La configuration la plus probable (la valeur de N1 qui maximise la distribution) est N1max =
N/2. Cependant, rien n’interdit a priori que toutes les molécules ne se remettent toutes dans le
volume de gauche à un instant donné, et reviennent dans leur état initial. La probabilité d’un
tel évènement est p∗ (N ) = 2−N . Comparons cette probabilité avec la probabilité de la situation
la plus probable : en utilisant la formule de Stirling (A.12), nous obtenons :
 2 r
min[p∗ (N1 )] p∗ (N ) (N/2)! πN −N ln 2


= ∗ = ' 2 ∼ 2−N = 10−N ln 10 . (3.98)
max[p (N1 )] p (N/2) N! 2
L’application numérique pour v ∼ 1cm3 de gaz parfait dans les conditions normales de température
et de pression, N ∼ 3 1020 , donc
p∗ (N ) 20

∼ 10−10 = 0. 000
| · {z
· · 0001} (3.99)
p (N/2)
1020 chiffres

68
Postulat fondamental – Ensemble microcanonique VI Remarques sur le rôle de l’indiscernabilité

Encore une fois rien n’interdit que la situation où N1 = N ne se produise, cependant, sa proba-
bilité est si faible, relativement à la probabilité de l’état le plus probable, qu’on peut considérer
qu’elle ne se réalise jamais en pratique.

L’irréversibilité correspond à l’évolution d’un système d’un état très peu probable vers un
état beaucoup plus probable.

La flèche du temps : L’augmentation de l’entropie au cours de cette évolution est notre


manière d’orienter la flèche du temps, i.e. notre définition du futur.

Rq : Retour sur le  principe d’entropie maximale 

Nous avons évoqué à plusieurs reprises qu’un principe pouvant être pris comme le cœur de la
physique statistique des systèmes à l’équilibre est le  principe d’entropie maximale , permettant
de construire le macroétat, i.e. de spécifier les probabilités d’occupation des microétats. Remar-
quons que les considérations sur l’irréversibilité ont bien illustré pourquoi le système choisi l’état
correspondant à une entropie (réduite) maximale.

VI Quelques remarques sur le rôle de l’indiscernabilité


VI.A Validité du traitement semi-classique de l’indiscernabilité – cas du gaz
parfait monoatomique
Nous discutons la validité du traitement semi-classique de l’indiscernabilité des particules dans
l’étude du gaz parfait, i.e. de la formule de Sackur-Tetrode (3.63).
Nous avons obtenu la température du gaz en fonction de l’énergie. Cette relation peut être
inversée pour déduire l’énergie en fonction de la température microcanonique
3
E = N kB T ∗ , (3.100)
2
expression que nous retrouverons ultérieurement par un autre moyen. L’entropie (3.63) peut
ainsi être exprimée en fonction de la température :
  !
∗ 3/2
V mk B T
S ∗ = N kB ln e5/2 . (3.101)
N 2π~2

Cette expression fait mieux apparaı̂tre les limites de la formule de Sackur-Tétrode : elle diverge
aux basses températures S ∗ → −∞ lorsque T ∗ → 0, ce qui ne respecte pas le théorème de
Nernst, parfois appelé 3ème principe de la thermodynamique,

lim S ∗ (T ) = 0 . (3.102)
T →0

Nous verrons plus tard que (3.63) et (3.101) ne sont valables que dans une limite diluée ou de
relativement haute température, lorsque

mE 3/2 V mkB T ∗ 3/2


   
V
= 1, (3.103)
N 3π~2 N N 2π~2
ce qui assure en gros S ∗ & 0. Si cette condition n’est pas respectée, les effets du postulat de
symétrisation, que nous avons traités de façon approchée sans distinguer les cas bosonique et
fermionique, se font sentir fortement.

69
VI Remarques sur le rôle de l’indiscernabilité Postulat fondamental – Ensemble microcanonique

Pour mieux comprendre le sens de cette condition, nous écrivons (3.63) sous une autre forme
en introduisant  1/3 r
def V def E
∆x = et ∆p = 2m . (3.104)
N N
∆x3 = V /N représente le volume disponible par particule dans l’espace physique, et ∆x la
distance typique entre deux particules voisines. Le fait que le comptage des états des parti-
cules libres fasse intervenir le volume V /N , plutôt que le volume V qu’elles peuvent
explorer, est une manifestation de l’indiscernabilité, i.e. de l’invariance du microétat par
permutation entre particules. D’autre part ∆p représente l’impulsion typique d’une particule ;
puisque l’impulsion d’une particule fluctue, ∆p3 s’interprète comme le volume exploré par une
particule dans l’espace des impulsions. On vérifie facilement que la formule de Sackur-Tetrode
(3.63) devient


 
∗ ∆x∆p
S = 3N kB ln a avec a = 6πe5/6 = 9.9865... ' 10 . (3.105)
h

Ω = (a∆x∆p)3N /h3N est le nombre d’états quantiques accessibles (compte tenu de l’indiscerna-
bilité). Pour que la règle de comptage semi-classique soit valable, il faut que le nombre d’états
soit très grand Ω  1, ce qui exige que

a∆x∆p  h (3.106)

C’est est une autre écriture de la condition (3.103). Lorsque cette condition n’est pas respectée,
les effets du postulat de symétrisation deviennent importants. Examinons les conséquences pra-
tiques.

Cas des bosons.– Dans le cas des bosons (chapitre 10), la condition (3.103), ou (3.106), est
violée lorsqu’une fraction macroscopique des particules occupent l’état fondamental (conden-
sation de Bose), ce qui se produit à très basse température (typiquement T .qq µK dans les
gaz dilués ; en matière condensée, la superfluidité ou la supraconductivité s’apparentent à des
phénomènes de condensation qui apparaissent pour T .qq K). Les effets quantiques liés à l’in-
discernabilité des bosons se manifestent donc à très basse température.

Cas des fermions.– Dans le cas des fermions (chapitre 9), le principe de Pauli impose aux
particules de s’empiler dans des états individuels distincts, ce qui confère une énergie énorme au
système. Par exemple, si on considère les électrons d’un métal, la condition (3.103), ou (3.106),
est respectée pour T &qq10000K. Autrement dit les électrons d’un métal ne sont jamais dans
une limite diluée. C’est seulement lorsque le gaz de fermions est très dilué (gaz atomiques) qu’il
sera justifié de considérer que le régime classique est atteint.

VI.B Entropie de mélange et paradoxe de Gibbs


Position du problème
À la fin du XIXe siècle (période pré-quantique), la question de l’indiscernabilité des particules
identiques n’était pas clarifiée, ce qui posait des problèmes relatifs aux propriétés
h d’extensivitéi
∗ 3 V mE 3/2
    
de l’entropie du gaz parfait : la fonction Sdisc ' kB ln Φdisc = N kB 2 + ln N 3π~2
ne présente pas les bonnes propriétés d’extensivité. Gibbs avait proposé d’introduire un facteur
1/N ! dans le comptage des microétats, de manière ad hoc pensait-on
h à l’époque, ce qui conduit à

  1  5 V
 mE 3/2 i
une expression S ' kB ln Φindisc = kB ln N ! Φdisc = N kB 2 +ln N 3π~2 N qui possède
les bonnes propriétés d’extensivité.

70
Postulat fondamental – Ensemble microcanonique VI Remarques sur le rôle de l’indiscernabilité

Ces difficultés sont bien illustrées à travers le  paradoxe de Gibbs  que nous discutons
maintenant. Considérons l’expérience suivante : deux gaz parfaits de natures différentes, par
exemple un gaz d’hélium et un gaz d’argon, sont disposés dans deux volumes V1 et V2 ne
communiquant pas. Les deux gaz ont initialement mêmes températures et pressions : T1∗ = T2∗ ≡
T ∗ et p∗1 = p∗2 ≡ p∗ . À un instant on retire la paroi pour permettre aux deux gaz de se mélanger
(figure 3.17). La pression et la température du mélange est celle des gaz initialement séparés
puisque p∗ V1 = N1 kB T ∗ et p∗ V2 = N2 kB T ∗ implique p∗ (V1 + V2 ) = (N1 + N2 )kB T ∗ . Il est utile
pour la suite d’écrire
V1 V2 V1 + V2
= = . (3.107)
N1 N2 N1 + N2
def
L’entropie a néanmoins augmentée, ∆Smelange = S (final) − S (initial) > 0, du fait de l’incertitude
liée à la position des atomes des deux espèces dans l’état final, par rapport à l’état initial : il y a
(N1 +N2 )!
N1 !N2 ! manières de répartir aléatoirement les atomes des deux espèces dans les deux volumes,
ce qui correspond donc à une augmentation de l’entropie du système
 
(N1 + N2 )!
∆Smelange = kB ln ' kB [(N1 + N2 ) ln(N1 + N2 ) − N1 ln N1 − N2 ln N2 ] .
N1 !N2 !
(3.108)

Si l’on considère maintenant que les deux gaz sont de même nature, la présence de la paroi ne
change rien aux propriétés du système et l’entropie ne devrait pas varier. Or il n’est à première
vue pas évident de comprendre pourquoi le raisonnement qui a conduit à (3.108) ne s’applique
pas (paradoxe de Gibbs).
Plutôt que d’utiliser des arguments combinatoires (physique statistique), on peut comprendre
l’augmentation de l’entropie comme une conséquence du second principe de la thermodynamique.
Lorsque les gaz sont de natures différentes, la transformation est irréversible et donc ∆Smelange >
0 : si on remet la paroi, on ne revient pas dans l’état initial. En revanche si les gaz sont de même
nature, la transformation est réversible : re-introduire la paroi nous place à nouveau dans la
même situation qu’au départ de l’expérience. On attend alors ∆Smelange = 0.

Figure 3.17 : Entropie de mélange. Deux gaz de natures différentes occupent deux volumes.
À un certain instant on autorise les gaz à se mélanger (au centre). Si on réintroduit la paroi
(figure de droite), on obtient une situation différente de la configuration initiale.

Résolution du paradoxe : indiscernabilité


La résolution du  paradoxe  se trouve dans l’indiscernabilité quantique des atomes du gaz. Si
les atomes étaient discernables, alors il y aurait une perte d’information lorsque les volumes sont
mis en communication. Parce que les atomes sont identiques, donc indiscernables, on ne peut
pas plus les distinguer en présence ou en l’absence de la paroi, ce qui explique que l’entropie de
mélange est nulle lorsque les deux gaz sont de même nature.
Nous vérifions cette assertion à partir de la formule de Sackur-Tetrode obtenue plus haut, qui
intégre correctement l’effet de l’indiscernabilité. Puisque la température des gaz est inchangée
avant et après la transformation, il est plus commode de considérer (3.101). Allons plus loin dans

71
VI Remarques sur le rôle de l’indiscernabilité Postulat fondamental – Ensemble microcanonique

la simplification : puisque l’entropie de mélange est purement liée à la configuration spatiale des
gaz, il suffit de re-écrire la formule de Sackur-Tetrode comme :

S ∗ = N kB ln (c V /N ) . (3.109)

où c est une constante (fonction de T ∗ et de la masse m des atomes).

Gaz de différentes natures Lorsque les gaz sont de natures différentes, la variation d’entro-
pie est donc donnée en utilisant (3.109) (écrite pour chaque gaz) :
final : 2 gaz dans V1 +V2 initial
z   }|  { z   }|  {
V1 + V2 V1 + V2 V1 V1
∆Smelange = N1 kB ln c1 + N2 kB ln c2 − N1 kB ln c1 − N2 kB ln c2
N1 N2 N1 N2
(3.110)
   
N1 + N2 N1 + N2
= N1 kB ln + N2 kB ln (3.111)
N1 N2

où nous avons utilisé (3.107). Cette dernière expression correspond précisément à (3.108).

Gaz de même nature Lorsque les gaz sont de même nature, le calcul de l’entropie S (initial)
est le même que précédemment, en faisant c1 = c2 = c. En revanche S (final) n’est pas la somme
des entropies de deux gaz occupant le volume V1 + V2 comme précédemment, mais l’entropie
d’un gaz de N1 + N2 particules dans ce volume :
final : 1 gaz dans V1 +V2 initial
z }|  { z   }|  {
V1 + V2 V1 V1
∆Smelange = (N1 + N2 )kB ln c − N1 kB ln c − N2 kB ln c =0 (3.112)
N1 + N2 N1 N2

en vertu de (3.107), ce qui montre qu’il n’y a pas de paradoxe.

Conclusion
Le paradoxe de Gibbs (1875), i.e. la nécessité du facteur 1/N ! dans Ωindisc (E) dans la limite
diluée, permettant de restaurer les propriétés d’extensivité de l’entropie, est la manifestation
à l’échelle macroscopique de l’énorme réduction de la dimension de l’espace de Hilbert d’un
nombre macroscopique de particules indiscernables par rapport à des particules discernables, i.e
conséquence du postulat de symétrisation de la mécanique quantique.

72
Postulat fondamental – Ensemble microcanonique VI Remarques sur le rôle de l’indiscernabilité

, Les idées importantes


• Description classique et quantique des microétats et macroétats.
• Notion d’équilibre macroscopique.
• Évidemment le postulat fondamental, énoncé et distribution microcanonique (3.55).
• Entropie microcanonique (3.56).
• Notion de densité d’états. Important : calcul de densité d’états à l’approximation semi-
classique, équation (3.42).
• Indiscernabilité, règle (3.52).
• Calcul de l’entropie à l’aide de la densité d’états à l’approximation semi-classique ; on pourra
se rappeler que si le nombre de ∗
   particules est macroscopique, il est plus facile d’écrire : S =
kB ln ρ(E)δE ' kB ln Φ(E)
• Pour retrouver les définitions (température, pression,...) on se rappellera de la correspondance
à la thermodynamique dictée par la relation fondamentale dE = T dS − pdV + µdN ⇒ dS =
1 p µ
T dE + T dV − T dN .
• Les problèmes de relâchement de contraintes, le  théorème  sur l’augmentation de l’entropie.
• La notion de limite thermodynamique.
• Un exercice d’application important : le gaz parfait monoatomique.
Un autre exercice assez simple et instructif : le cristal de spin 1/2.

+ Pour en savoir plus


• Sur la présentation classique (début du chapitre) : le début de l’ouvrage [7].
• Sur la limite semi-classique, consulter le chapitre 2 du livre [3]
• Sur le postulat de symétrisation, chapitre 11 de [34].
• Sur l’introduction de la notion d’entropie dans le cadre de la thermodynamique, cf. [25].

• Sur l’origine de la  définition  de la pression microcanonique p∗ = T ∗ ∂S
∂V , on pourra consulter
le complément II.D de [11].
• Je recommande l’excellente discussion sur l’entropie du chapitre 5 de Sethna [32].

73
VI Remarques sur le rôle de l’indiscernabilité Postulat fondamental – Ensemble microcanonique

Annexe 3.A : La méthode des multiplicateurs de Lagrange


La question : Trouver les points stationnaires d’une fonction de N variables, notée F (x1 , · · · , xN ),
lorsque les variables ne sont pas indépendantes, mais liées par une contrainte
C(x1 , · · · , xN ) = 0 . (3.113)

Méthode no 1
En principe, (3.113) permet de trouver une des variables en fonctions des autres, par exemples
xN = ψ(x1 , · · · , xN −1 ). On cherche les  points stationnaires des N − 1 variables indépendantes
∂F ∂ψ ∂F
de F x1 , · · · , xN −1 , ψ(x1 , · · · , xN −1 ) , i.e. on obtient les N − 1 équations : ∂xn + ∂xn ∂xN
= 0.
Critique de cette approche : il peut être difficile de trouver la fonction ψ.

Méthode no 2 : multiplicateurs de Lagrange


La méthode procède en trois étapes :
1. On introduit la fonction
def
G(x1 , · · · , xN ) = F (x1 , · · · , xN ) + λ C(x1 , · · · , xN ) (3.114)
où λ est un  multiplicateur de Lagrange .
2. On cherche les points stationnaires de G, en considérant les N variables comme indépendantes.
La solution est une fonction du multiplicateur : x∗1 (λ), · · · , x∗N (λ).
3. On injecte la solution dans l’équation (3.113), C(x∗1 (λ), · · · , x∗N (λ)) = 0, ce qui nous donne
une équation pour λ dont nous notons la solution λs .
4. Conclusion : la solution du problème est x∗1 (λs ), · · · , x∗N (λs ).

Généralisation En présence de K contraintes Ck (x1 , · · · , xN ) = 0, avec k ∈ {1, · · · , K} on


doit introduire K multiplicateurs de Lagrange λk et appliquer la même logique à la fonction
K
X
def
G(x1 , · · · , xN ) = F (x1 , · · · , xN ) + λk Ck (x1 , · · · , xN ) . (3.115)
k=1

Illustration : démontrer le postulat fondamental


Comme illustration nous cherchons le macroétat qui rend l’entropie statistique S(P1 , · · · , PΩ ) =
− Ω
P
m=1 Pm ln Pm maximum, où PΩ
Ω est le nombre de microétats accessibles. La contrainte est ici
la contrainte de normalisation m=1 Pm = 1. Appliquons la méthode :
= S(P1 , · · · , PΩ ) + λ 1 − Ω
e 1 , · · · , PΩ ) def P 
1. On introduit la fonction auxiliaire S(P m=1 Pm .

∂S
2. l’extremum de Se est donné par ∂P = − ln Pm − 1 − λ = 0 pour 1 6 m 6 Ω, i.e. toutes les
e
m

probabilités sont égales − ln Pm = λ + 1 ∀ m.
∗ = ΩP ∗ = 1 i.e. on retouve que parmi
P
3. On injecte la solution dans la contrainte : m Pm m
toutes les macroétats, celui qui maximise l’entropie est celui correspondant à la distribution
uniforme :

Pm = 1/Ω (3.116)
(on obtient donc λs + 1 = ln Ω).
L’exemple montre que l’on retrouve la distribution microcanonique (i.e. le postulat fondamental
de la physique statistique) à partir d’un  principe d’entropie maximum .

74
Postulat fondamental – Ensemble microcanonique VI Remarques sur le rôle de l’indiscernabilité

Annexe 3.B : Rappel de mécanique quantique : postulat de symétrisation


Nous donnons une présentation succinte du postulat de symétrisation de la mécanique quantique,
qui joue un rôle assez important dans le cours de physique statistique.

États à une particule


Notons {| λ i} une base d’états individuels de l’espace de Hilbert à une particule H .

Principe d’indiscernabilité
Le formalisme quantique (la description en termes de fonctions d’ondes) implique l’indiscer-
nabilité des particules identiques (deux électrons par exemple). La conséquence est que les
vecteurs d’états de plusieurs particules identiques doivent être

• soit tous invariants sous les permutations, pour les particules appelées bosons (pho-
tons,...)

• soit tous antisymétriques, pour les particules appelées fermions (électron, proton, neu-
tron,...).

La nature bosonique/fermionique est déterminée par le spin de la particule : les particules de spin
entier (S = 0, 1, 2 · · · ) sont des bosons et les particules de spin demi-entier (S = 1/2, 3/2, · · · )
dont des fermions.
L’indiscernabilité induit en particulier une grande réduction de la dimension de l’espace des
états des N particules, par rapport au cas des particules discernables. Dans le cas des bosons,
on ne retient que la partie des vecteurs symétriques, HN bosons = H1 ⊗ H2 ⊗ · · · ⊗ HN sym , et


dans le cas des fermions, la partie antisymétrique, HN fermions = H1 ⊗ H2 ⊗ · · · ⊗ HN antisym .


 

Structure des états quantiques


États non symétrisés.– Nous pouvons construire des états non symétrisés par produits
tensoriels d’états individuels : | λ1 ipart. 1 ⊗ · · · ⊗ | λN ipart. N .

États bosoniques.– L’état symétrisé peut être construit à partir de l’état non symétrisé en
lui appliquant un opérateur de symétrisation. Par exemple, dans le cas N = 2, on aura
symétrisation
| λ1 ipart. 1 ⊗ | λ2 ipart. 2 −→
1
| λ1 , λ2 ibosons = √ [| λ1 ipart. 1 ⊗ | λ2 ipart. 2 + | λ2 ipart. 1 ⊗ | λ1 ipart. 2 ] (3.117)
2
qui est bien invariant lorsqu’on permute les particules. La procédure se généralise à N particules :
on obtient un état à N particules invariant sous l’échange de deux particules (ou la permutation
des nombres quantiques) | λ1 , · · · , λi , · · · , λj , · · · , λN i = | λ1 , · · · , λj , · · · , λi , · · · , λN i.

États fermioniques.– La logique est la même dans le cas des fermions, si ce n’est que les
états doivent être antisymétriques sous toute permutation entre deux particules. Par exemple
1
| λ1 , λ2 ifermions = √ [| λ1 ipart. 1 ⊗ | λ2 ipart. 2 − | λ2 ipart. 1 ⊗ | λ1 ipart. 2 ] (3.118)
2
L’état de N fermions est antisymétrique sous la permutation | λ1 , · · · , λi , · · · , λj , · · · , λN i =
−| λ1 , · · · , λj , · · · , λi , · · · , λN i.

75
VI Remarques sur le rôle de l’indiscernabilité Postulat fondamental – Ensemble microcanonique

Quelques conséquences
• Par rapport aux bosons qui peuvent occuper un état individuel en nombre illimité, l’an-
tisymétrisation pour les fermions conduit au principe de Pauli, interdisant à un état
individuel d’être occupé par plus d’un fermion.

• La symétrisation des états quantiques pour des particules identiques induit des corrélations
entre particules, même en l’absence d’interaction.

• Le point important à noter pour la physique statistique, où nous devons fréquemment
dénombrer les états quantiques, est le suivant : alors que l’état non symétrisé | λ1 ipart. 1 ⊗
· · · ⊗ | λN ipart. N est spécifié par une suite ordonnée de nombres quantiques (quel état
individuel est occupé par quelle particule), l’état symétrisé | λ1 , · · · , λN i est caractérisé
par une suite non ordonnée de nombres quantiques. Seul suffit de spécifier quels états
individuels sont occupés, chacun étant occupé par toutes les particules à la fois.
Autrement dit : seule importe l’occupation des états individuels.

+ Pour en savoir plus


• Le livre classique [8], ou [5]. Chapitre 11 de [34]

76
Chapitre 4

Système en contact avec un


thermostat – Ensemble canonique

Plan du chapitre
I Ensemble canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
I.A Distribution canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
I.B Propriétés de l’ensemble canonique . . . . . . . . . . . . . . . . . . . . . 82
II Relâchement d’une contrainte . . . . . . . . . . . . . . . . . . . . . . . 86
II.A Contexte physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
II.B Relâchement de la contrainte . . . . . . . . . . . . . . . . . . . . . . . . 86
II.C Énoncé du théorème de minimisation . . . . . . . . . . . . . . . . . . . . 87
II.D Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
III Ensembles microcanonique et canonique . . . . . . . . . . . . . . . . 88
III.A Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
III.B Analyse d’un exemple : le cristal paramagnétique . . . . . . . . . . . . . 89
III.C Analyse générale de l’équivalence entre ensembles . . . . . . . . . . . . . 90
IV Retrouver les  principes  de la thermodynamique . . . . . . . . . 92
V Formulation semi-classique . . . . . . . . . . . . . . . . . . . . . . . . . 94
V.A Distribution canonique classique et fonction de partition . . . . . . . . . 94
V.B Distribution de Maxwell des vitesses . . . . . . . . . . . . . . . . . . . . 95
V.C Théorème d’équipartition de l’énergie . . . . . . . . . . . . . . . . . . . 95
VI Indiscernabilité et approximation de Maxwell-Boltzmann . . . . . . 95
VI.A Indiscernabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
VI.B Approximation de Maxwell-Boltzmann . . . . . . . . . . . . . . . . . . . 96
VI.C Apparition des effets quantiques . . . . . . . . . . . . . . . . . . . . . . 98
Annexe 4.A :Transformations de Legendre et potentiels thermodynamiques100
Annexe 4.B : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

I Ensemble canonique
Dans le cadre de l’ensemble microcanonique, une partie des difficultés techniques des calculs a
pour origine la contrainte de conservation de l’énergie. On peut éviter ce problème en fixant,
plutôt que l’énergie, le paramètre conjugué de l’énergie : la température. Cette situation est de
plus assez physique puisque la plupart du temps le système S n’est pas isolé mais en contact

79
I Ensemble canonique Ensemble canonique

avec l’extérieur, i.e. un  grand  système T avec lequel il peut échanger de l’énergie (sous
forme de chaleur). La première question qui se pose alors est celle de la probabilité d’occupation
des microétats du système dans une telle situation.

Thermostat ,T

δE

Figure 4.1 : Système S en contact avec un thermostat T fixant la température.

I.A Distribution canonique


La première question est de déterminer la nouvelle règle d’occupation des microétats du système :
quelle est la probabilité pour que S soit dans un état `, indépendamment de l’état du thermostat
T , dont la dynamique ne nous intéresse pas ?
Notre point de départ est le postulat fondamental : les microétats ` ⊗ Λ du système isolé
S ⊗ T sont équiprobables, P`⊗Λ ∗ = 1/ΩS ⊗T où ΩS ⊗T est le nombre de microétats accessibles
de S ⊗ T . Supposons connus ΩS (E) et ΩT (ET ), caractérisant le système et le thermostat
(considérés isolément). En faisant une hypothèse de faibles interactions entre S et T , nous
pouvons écrire (cf. § IV du chapitre 3) :
X
ΩS ⊗T (Etot ) = ΩS (E) ΩT (Etot − E) . (4.1)
E

La probabilité d’occupation d’un microétat ` de S est donnée par le dénombrement des


microétats de S ⊗ T tels que S soit dans l’état `. Si l’état de S est fixé, la seule contrainte sur
T est que ET = Etot − E` , i.e. T peut occuper ΩT (Etot − E` ) microétats. Nous déduisons : 1

∗ ΩT (Etot − E` ) 1
S ∗ (E −E )
P`C = ΩT (Etot − E` ) × P`⊗Λ =P ∝ e kB T tot ` . (4.2)
E ΩS (E)ΩT (Etot − E)

Le thermostat est supposé suffisamment  grand  comparativement au système étudié afin que
les échanges d’énergie ne perturbent pas ses propriétés thermodynamiques (puisque son rôle est
d’imposer la température). On peut donc développer l’entropie du grand système comme

1/TT∗
z }| {
∗ ∗ ∂ST∗
ST (Etot − E` ) ' ST (Etot ) − E` (4.3)
∂ET
1 ∗
Plus formellement : P`C = Λ P`⊗Λ
P
δEΛ ,Etot −E` , où EΛ désigne l’énergie de microétat Λ du thermostat (c’est

l’analogue du passage d’une loi jointe à une loi marginale). Puisque P`⊗Λ = 1/ΩS ⊗T est une constante, il peut
être sorti de la somme, i.e.
X ∗ ∗
X
P`C = P`⊗Λ δEΛ ,Etot −E` = P`⊗Λ δEΛ ,Etot −E` = ΩT (Etot − E)/ΩS ⊗T (Etot ) .
Λ Λ

80
Ensemble canonique I Ensemble canonique

Nous prendrons comme définition de la température canonique, la température microcanonique


du thermostat :
T = TT∗ .
def
(4.4)

Nous obtenons donc que la probabilité d’occupation du microétat de S dépend exponen-


tiellement de l’énergie P`C ∝ exp −E` /kB T . Il est conventionnel d’introduire l’inverse de la
température
def 1
β= (4.5)
kB T

en termes de laquelle nous pouvons écrire la distribution canonique

1 −βE`
P`C = e (4.6)
Z

où la constante de normalisation


X
e−βE`
def
Z = (4.7)
`

est appelée la fonction de partition canonique. Bien que l’introduction de Z soit apparue pure-
ment technique (une constante de normalisation), nous allons voir qu’elle va jouer un rôle central
dans l’analyse dans le cadre de l’ensemble canonique. La raison est que cette fonction est une
fonction génératrice, dont nous pourrons extraire de nombreuses propriétés intéressantes.
Le point important du résultat (4.6) est que les probabilités (et la fonction de partition)
ne dépendent que des propriétés du système S . Le thermostat T n’intervient qu’à travers un
unique paramètre, sa température T .

Remarque importante : Attention, dans la définition de la fonction de partition, Éq. (4.7),


la somme porte sur les états quantiques (et non sur les niveaux d’énergie), i.e. elle inclut les
facteurs de dégénérescences. Si nous notons d` la dégénérescence du niveau E` , nous écrivons la
fonction de partition à l’aide d’une somme sur les niveaux d’énergie :
X
d` e−βE` .
def
Z = (4.8)
E`

La distribution canonique obtenue à partir du principe d’entropie maximale

Une autre approche permettant d’obtenir la distribution canonique est de suivre la logique in-
troduite dans l’annexe page 74 partant d’un  principe d’entropie maximale . Nous cherchons
la distribution des microétats {P` } qui maximise
P l’entropie statistique tout en satisfaisant deux
contraintes : d’une part la normalisation ` P` = 1, d’autre part nous P fixons la température via
une contrainte sur l’énergie moyenne que nous supposons donnée ` P` E` = E. Nous utilisons
l’approche des multiplicateurs de Lagrange (annexe page 74) et introduisons deux multiplica-
teurs, λ et β associés
P aux deux contraintes,
P  ce qui nous
P conduit à considérer la fonction auxiliaire
S({P` }) = − ` P` ln P` + λ 1 − ` P` + β E − ` P` E` .
e
∂S
Nous cherchons maintenant l’extremum : ∂P = − ln P` − 1 − λ − βE` = 0 ∀ `. Autrement dit
e
`
l’entropie est maximisée pour P` ∝ exp −βE` , ce qui correspond bien à la distribution canonique.
Le second multiplicateur de Lagrange s’interprète comme l’inverse de la température.

81
I Ensemble canonique Ensemble canonique

I.B Propriétés de l’ensemble canonique


Énergie libre
Le logarithme de la fonction de partition joue un rôle important, comme nous allons le voir. On
peut lui associer un  potentiel thermodynamique  : l’énergie libre, ou la fonction de Helmholtz,

def
F (T, V, N ) = −kB T ln Z(T, V, N ) (4.9)

Cette fonction des paramètres naturels de l’ensemble canonique (T , V , N ,...) joue un rôle central
dans l’ensemble canonique, similaire à celui de l’entropie dans le cadre de l’ensemble microca-
nonique : F s’interprète comme la fonction génératrice des propriétés thermodynamiques.

Interprétation thermodynamique de l’énergie libre.– Au delà de cette interprétation


technique, nous pouvons donner une autre interprétation, de nature thermodynamique [26].
L’énergie libre intervient dans la théorie des potentiels thermodynamiques où elle est définie
comme F = E − T S (voir l’équation (4.23) démontrée plus bas est réminiscente R de cette
définition). Rappelons l’énoncé du second principe de la thermodynamique ∆S > d̄Q/T où d̄Q
est une quantité infinitésimale de chaleur reçue par le système.
Si le système est isolé thermiquement (situation du précédent chapitre), on a d̄Q = 0 et on
déduit ∆S > 0.
Si le système a une température fixée par un thermostat (présent chapitre), le second principe
prend la forme ∆S > Q/T : il fournit une borne supérieure à la quantité totale de chaleur reçue,
Q 6 T ∆S, i.e. une borne inférieure à la chaleur cédée par le système. Nous pouvons alors relier
la variation d’énergie libre à la variation d’entropie ∆F = ∆(E −T S) = ∆E −T ∆S. En utilisant
le premier principe, ∆E = Q + W , nous obtenons

∆F = W + Q − T ∆S d’où ∆F 6 W (4.10)
| {z }
60

Du point de vue de la théorie des machines thermiques (Carnot), la question intéressante est de
quantifier le travail qu’une machine thermique (une locomotive, etc) peut fournir, Wdisponible =
−W . La variation de l’énergie libre fixe donc une borne supérieure sur la quantité de travail
disponible Wdisponible 6 −∆F .

Extensivité (N sous systèmes sans interaction)


Supposons le système constitué d’un ensemble de sous-systèmes non corrélés (ou plutôt, très
faiblement corrélés, afin d’assurer l’existence d’échanges énergétiques) : S = S1 ⊗ · · · ⊗ SN . Le
(i)
sous-système Si est caractérisé par un spectre de valeurs propres de l’énergie {ε` }. Puisque le
problème est séparable, on peut écrire l’énergie des états propres du système complet comme
N
(i)
X
E`1 ,··· ,`N = ε`i . (4.11)
i=1

La fonction de partition de S s’écrit donc


N X  N
(i)
X Y Y
−βE`1 ,··· ,`N
Z= e = exp −βε`i = zi , (4.12)
`1 ,··· ,`N i=1 `i i=1

est la fonction de partition de Si . L’énergie libre correspondante est additive F =


où zi P
−kB T N i=1 ln zi . Pour des sous-systèmes identiques et non corrélés (ni par les interactions ni

82
Ensemble canonique I Ensemble canonique

par le postulat de symétrisation), on a donc

Z = zN i.e. F = −N kB T ln z (4.13)

La fonction de partition croı̂t exponentiellement avec le nombre de sous-systèmes, alors que


l’énergie libre est extensive, i.e. croı̂t linéairement. 2 On verra plus bas que ces expressions sont
parfois modifées si on prend en compte l’effet de l’indiscernabilité.
Cette relation est tout à fait remarquable et illustre un des intérêts de l’ensemble canonique.
Alors que dans l’ensemble microcanonique, la contrainte sur l’énergie fait émerger des problèmes
combinatoires liés à la répartition de l’énergie disponible parmi les constituants du système, en
permettant à l’énergie de fluctuer, nous produisons une relation (4.13) qui met en relation
directe les propriétés d’un unique sous système, z, et les propriété d’un nombre potentiellement
macroscopique de ces mêmes sous-systèmes, Z.

Extensivité de F : Parmi les arguments de l’énergie libre, T est intensive alors que V et N
sont extensifs. Par conséquent, la propriété d’extensivité est

F (T, λV, λN ) = λ F (T, V, N ) , (4.14)

où λ est un facteur de dilatation sans dimension. Autrement dit cette propriété nous montre
que, bien qu’elle ait trois arguments (pour un fluide simple), l’énergie libre s’exprime à l’aide
d’une fonction de deux variables : F (T, V, N ) = N f (T, V /N ).

Exemple : Cristal paramagnétique.– Considérons un cristal paramagnétique, i.e. un en-


semble de N moments magnétiques µ ~ , placés aux nœuds d’un réseau cristallin. Les moments
sont identiques et supposés indépendants (on néglige les interactions mutuelles) mais discer-
nables (s’ils sont attachés aux nœuds d’un réseau).
Chaque moment plongé dans le champ magnétique dirigé selon l’axe Oz apporte une contribu-
tion H = −µz B à l’énergie, où µz désigne la composante du moment magnétique. Le moment
est relié au spin via un facteur gyromagnétique µ ~ Supposons pour simplifier qu’il s’agit
~ = γ S.
d’un spin 1/2. L’opérateur µz est quantifié et possède deux valeurs propres µz = ±µ. L’énergie
est donc quantifiée comme ε± = ∓µB. La fonction de partition d’un moment s’exprime comme
une somme sur les deux états propres du spin zmom = eβµB + e−βµB . En utilisant (4.13) nous
obtenons immédiatement la fonction de partition associée à l’énergie magnétique du cristal

Zcristal = [2 cosh(βµB)]N . (4.15)

Énergie et chaleur spécifique


Énergie moyenne.– Une première propriété intéressante est la relation entre l’énergie moyenne
et la fonction de partition (insistons : le système échange de l’énergie avec le thermostat, son
énergie fluctue) :


e−βE`
P
− ∂β `

1 X
X z }| {
C C −βE`
E = P` E` = E` e (4.16)
Z
` `

autrement dit
C ∂
E =− ln Z (4.17)
∂β
2
Rappelons que la propriété d’extensivité repose sur l’existence d’interactions à courte portée.

83
I Ensemble canonique Ensemble canonique

Exemple : Cristal paramagnétique (suite).– Reprenons l’exemple du cristal paramagnétique.


Par une simple opération de dérivation, nous déduisons de (4.15) l’expression de l’énergie
moyenne
C
E (T, B, N ) = −N µB tanh(βµB) . (4.18)

Fluctuations et chaleur spécifique.– Il n’aura pas échappé au lecteur du chapitre 1 que


si Z a la structure d’une fonction génératrice des moments de l’énergie, ln Z est la fonction
génératrice de ses cumulants. On peut en effet vérifier sans peine que les fluctuations de l’énergie
sont données par
∂ 2
  C
2 ∂E
σE ≡ Var(E) = − ln Z = − . (4.19)
∂β ∂β
Cette dernière expression rappelle une chaleur spécifique à volume constant. Si nous
 utilisons les
def
notations usuelles de la thermodynamique celle-ci est définie comme CV = ∂E ∂T V,N ; la dérivée
partielle est calculée à V et N constants. Puisque (T, V, N ) sont les variables  naturelles  de
l’ensemble canonique, la chaleur spécifique coı̈ncide bien avec la dérivée partielle de la moyenne
canonique :
def ∂ C
CV = E (T, V, N ) . (4.20)
∂T
Finalement nous trouvons une relation intéressante entre les fluctuations de l’énergie et un
coefficient calorimétrique :
1 2
CV = σ E , (4.21)
kB T 2
réminiscente de la définition (3.75). On appelle ce type d’équation une relation fluctuation-
dissipation, reliant un coefficient de réponse, la chaleur spécifique caractérisant comment l’énergie
 répond  à une augmentation de la température, à des fluctuations, ou plus généralement une

fonction de corrélation.

Entropie canonique
On calcule l’entropie statistique (2.43) associée à la distribution canonique :
X X
S C = −kB P`C ln P`C = kB P`C (ln Z + βE` ) , (4.22)
` `

autrement dit nous obtenons


C
E −F ∂F
S C (T, V, N ) = =− (4.23)
T ∂T

analogue à la relation déduite de l’égalité fondamentale de la thermodynamique, après transfor-


mation de Legendre (cf. annexe page 100).
- Exercice 4.1 : Vérifier la dernière égalité, S C = − ∂F
∂T , puis montrer que

∂S C ∂2F
CV = T = −T . (4.24)
∂T ∂T 2
On peut comparer cette définition à (3.75). On constate que les deux définitions expriment
la chaleur spécifique comme une dérivée seconde du potentiel fondamental (l’entropie dans le
cas de l’ensemble microcanonique et l’énergie libre dans le cas canonique). On vérifiera plus bas
sur l’exemple du gaz parfait que les deux définitions de la chaleur spécifique coı̈ncident dans la
limite thermodynamique.

84
Ensemble canonique I Ensemble canonique

Exemple : Cristal paramagnétique (suite).–  L’expression  de la fonction de partition du


cristal (4.15) donne énergie libre F = −N kB T ln 2 cosh βµB , qui combinée à l’expression de
l’énergie (4.18), conduit à
S C (T, B, N ) = N kB [ln (2 cosh βµB) − βµB tanh βµB] . (4.25)

Moyennes des grandeurs physiques – variables conjuguées


Nous considérons une grandeur physique générique, notée X, et introduisons le paramètre
conjugué φ, i.e. l’observable X peut être obtenue par dérivation de l’hamiltonien X = − ∂H
∂φ .
La différentielle de l’énergie contient un terme
dE = · · · − Xdφ . (4.26)
Par exemple X → M est l’aimantation et φ → B le champ magnétique ; la différentielle de
l’énergie magnétique est dEmagn = −M dB. Notons que l’extensivité de l’énergie impose que
parmi le couple de variables conjuguées (X, φ), l’une est extensive et l’autre intensive.
Dans un problème quantique, la moyenne quantique de la variable X peut être calculée à
def ∂
l’aide du théorème de Feynman-Hellmann X` = h ` |X| ` i = − ∂φ E` (en ayant supposé que ` est
un état propre de l’énergie). Si nous combinons moyenne
Pquantique et moyenne statistique, nous
C 1 P ∂ −βE`
obtenons l’expression de la moyenne canonique X = ` P`C X` = βZ ` ∂φ e , i.e.

C ∂F
X =− (4.27)
∂φ
Pour calculer la moyenne, il n’est donc pas nécessaire de faire appel à tous les détails microsco-
piques, énergies E` et valeurs moyennes X` , mais seulement de pouvoir identifier la dépendance
du potentiel thermodynamique dans le paramètre conjugué φ. Cette relation générale nous fait
mieux comprendre le rôle central de l’énergie libre et se révèlera très utile par la suite.

Exemple : pression canonique.– Nous considérons un volume V = xs clos par un piston,


où x est la position du piston et s sa section. Nous faisons subir la transformation réversible 3
suivante : le piston est déplacé très lentement pour que la force externe f ext soit à tout instant
équilibrée avec la force interne due aux chocs moléculaires f . Le travail de la force externe
apporté au système est donc d̄W rev = f ext dx = −f dx. Cet argument montre que la différentielle
de l’énergie interne contient un terme dE = · · · − f dx, ce qui nous permet d’exprimer la force
C
moyenne canonique f = − ∂F ∂x . Si on divise les deux membres par la section du piston, nous
obtenons l’expression de la pression canonique
∂F
pC = − (4.28)
∂V
Remarquons l’analogie avec (4.27).

Potentiel chimique canonique.– Notons finalement que la définition du potentiel chimique


est réminiscente de la relation (4.27) :

def ∂F
µC = (4.29)
∂N
On pourra retrouver rapidement ces définitions à l’aide de l’égalité fondamentale de la ther-
modynamique (1.1) à laquelle on aura fait subir une  transformation de Legendre  (cf. annexe
4.A page 100) : F = E − T S.
3
Une transformation réversible est telle que le système passe par une succession d’états d’équilibre.

85
II Relâchement d’une contrainte Ensemble canonique

Figure 4.2 : Pression. Un piston coulisse sans frottement.

II Distribution d’une variable interne – Relâchement d’une contrainte


II.A Contexte physique
Nous discutons le problème du relâchement d’une contrainte entre deux sous systèmes S1 et S2
dans le cadre de l’ensemble canonique. Considérons que les deux sous systèmes (avec interactions
à courte portée) sont dans deux microétats (`1 ) et (`2 ). Nous notons (`1 ⊗ `2 ) le microétat de
l’ensemble. Si les deux sous-systèmes sont très faiblement corrélés, la probabilité de cet état est

P`C1 ⊗`2 = P`C1 P`C2 ∝ e−β(E`1 +E`2 ) (4.30)

Considérons une variable interne échangée lors du relâchement d’une contrainte entre S1 et S2 .
Par exemple

• La détente de Joule : V1 et V2 fluctuent avec V = V1 + V2 fixé.

• L’échange de particules : N1 et N2 fluctuent avec N = N1 + N2 fixé.

II.B Relâchement de la contrainte


Considérons un cas générique où nous notons X1 et X2 deux variables extensives associées aux
deux sous systèmes isolés (par exemple les volumes dans la détente de Joule). Après relâchement
de la contrainte, seule la somme de ces deux variables est fixée Xtot = X1 + X2 alors que X1 et
X2 deviennent des variables internes. Nous pouvons écrire la fonction de partition de S1 ⊗ S2
sous la forme
X X X X
Z1⊗2 (T, Xtot ) = e−β(E`1 +E`2 ) = e−βE`1 e−βE`2 (4.31)
`1 ⊗`2 X1
`1 tq. `2 tq.
X`1 = X1 X`2 = Xtot − X1
X
= Z1 (T, X1 ) Z2 (T, Xtot − X1 ) (4.32)
X1

où X`1 est la valeur prise par la grandeur physique X dans le microétat `1 . Le calcul de la
distribution de X1 suit la même logique. p(X1 ; T ) est donné par la somme des probabilités
canoniques P`C1 ⊗`2 sur tous les microétats qui réalisent la valeur X1 . Si nous notons X`1 la valeur
prise par la grandeur dans le microétat (`1 ), nous pouvons écrire
X
p(X1 ; T ) = P`C1 ⊗`2 δX1 ,X`1 δXtot −X1 ,X`2 . (4.33)
`1 ⊗`2

Nous obtenons

Z1 (T, X1 ) Z2 (T, Xtot − X1 ) e−β(F1 +F2 ) e−β F (X1 ;T,Xtot )


e
p(X1 ; T ) = = = , (4.34)
Z1⊗2 (T, Xtot ) Z1⊗2 (T, Xtot ) Z1⊗2 (T, Xtot )

86
Ensemble canonique II Relâchement d’une contrainte

où nous avons introduit l’énergie libre réduite


def
Fe(X1 ; T, Xtot ) = F1 (T, X1 ) + F2 (T, Xtot − X1 ) , (4.35)

qui représente l’énergie libre du système lorsque X1 est fixé. La probabilité p(X1 ; T ) est maximale
lorsque l’énergie réduite est mimimum

∂ Fe(X1max ; T, Xtot ) ∂F1 ∂F2


=0 ⇒ (X1max ) = (Xtot − X1max ) . (4.36)
∂X1 ∂X1 ∂X2
Comme dans le chapitre précédent, nous pouvons donner un sens plus clair à cette condition
d’équilibre, à condition d’introduire le paramètre conjugué (intensif) de la variable (extensive) :
def ∂F def ∂F
φC = − ∂X (par exemple si X → V est le volume alors φ → pC = − ∂V est la pression canonique).
La condition d’équilibre s’interprète alors comme une égalité entre les paramètres conjugués
intensifs :
φC1 = φC2 (condition d’équilibre) (4.37)
(par exemple l’égalité des pressions canoniques pC1 = pC2 lors d’un échange de volume, ou l’égalité
des potentiels chimiques lors d’un échange de particules µC1 = µC2 ).

II.C Énoncé du théorème de minimisation


Nous en tirons donc le principe général sur les transformations irréversibles :

Théorème : Lorsqu’une contrainte est relachée dans un système en contact avec un ther-
mostat, celui-ci évolue spontanément vers un état d’équilibre macroscopique qui minimise
son énergie libre réduite.

II.D Discussion
Nous pouvons poursuivre l’analyse du problème de relâchement de contrainte en suivant les
lignes du cas microcanonique. Terminons par quelques observations :

Structure de la distribution.– Remarquons que la distribution de la variable interne obte-


nue plus haut
p(X1 ; T ) ∝ e−β(F1 +F2 ) (4.38)
fait écho à celle obtenue dans l’analyse du problème de relâchement de contrainte dans le cadre
1
(S1∗ +S2∗ )
microcanonique, équation (3.68) : p∗ (X1 ; E) ∝ e kB .

Stabilité.– La stabilité de l’équilibre impose que l’énergie libre soit une fonction convexe (à
dérivée seconde positive)
∂2F
>0 (4.39)
∂X 2
∂2F ∂pC ∂p 
(par exemple ∂V 2 > 0 et donc ∂V ≡ ∂V T,N < 0, ce qui assure la positivité de la compressibilité
def
κT = − V1 ∂V

∂p T ).

Forme de la distribution.– Les propriétés d’extensivité de F1 et F2 impliquent que la dis-


max ∝ N alors que
√ p(X1 ; T ) est une gaussienne extrêmement étroite : si X1 ' X1
tribution
σX1 ∝ N .

87
III Ensembles microcanonique et canonique Ensemble canonique

Énergie libre.– L’énergie libre après relâchement de contrainte

F (T, Xtot ) = F1 (T, X1max ) + F2 (T, Xtot − X1max ) + O(ln N ) (4.40)

coı̈ncide avec l’énergie libre réduite à des termes venant des fluctuations de X1 près, négligeables
dans la limite thermodynamique.

Une autre démonstration du théorème.– Calculons l’entropie microcanonique du système


global (isolé) T ⊗ S : 1 S ∗ (E
T tot −E` )
e kB T 'Ω (Etot ) e−βE`
hX z }| { i
ST∗ ⊗S (Etot ) = kB ln [ΩT ⊗S (Etot )] = kB ln ΩT (Etot − E` ) ΩS (E` ) (4.41)
E`
hX i
' kB ln ΩT (Etot ) + kB ln ΩS (E` ) e−βE` = ST∗ (Etot ) + kB ln Z (4.42)
E`
| P
{z }
`

(le calcul corrige une petite erreur de raisonnement dans la démonstration du chapitre III, § II.D,
de [11]). Finalement on aboutit à

F
ST∗ ⊗S (Etot ) ' ST∗ (Etot ) − . (4.43)
T
Le principe de maximisation de l’entropie du système (global) isolé (section IV), conduit donc
au principe de la minimisation de l’énergie libre du système thermostaté.

III Correspondance entre les descriptions microcanonique et ca-


nonique
III.A Introduction
Nous avons rencontré les mêmes notions (pression, température, entropie, etc) dans deux cadres
assez différents : l’ensemble microcanonique et l’ensemble canonique. L’existence de deux  boı̂tes
à outils  permettant d’analyser un système macroscopique soulève donc la question de la com-
paraison entre les prédictions obtenues dans les deux cadres. Cette comparaison est d’autant
plus nécessaire que les deux distributions sont très différentes : la distribution microcanonique,
P`∗ ∝ δ̄(E` − E), est concentrée sur la couche d’énergie E, alors que la distribution canonique,
P`C ∝ e−βE` , est non nulle pour toute énergie.

δ ( E −E)
1
δE

E
E

Figure 4.3 : Fonction δ̄(E` − E).

Afin de comparer en détail les propriétés des deux ensembles, nous introduisons la fonction
(
1 si E − δE/2 6 E` 6 E + δE/2
δ̄(E` − E) = (4.44)
0 sinon

88
Ensemble canonique III Ensembles microcanonique et canonique

que nous représentons sur la figure 4.3. L’introduction de cette fonction nous permet d’insister
sur l’analogie entre le nombre de microétats accessibles Ω(E) et la fonction de partition Z(T ) :
tous deux sont des fonctions de comptage des microétats. Alors que Ω(E) attribue un poids 1
aux microétats d’énergie E` = E et 0 aux autres, la fonction de partition canonique attribue un
poids exponentiel à tous les microétats.

Ensemble microcanonique Ensemble canonique


Système isolé système thermostaté

Thermostat ,T

δE

Énergie E fixée à δE près Température T fixée


Z(T ) = ` e−βE`
P P
Ω(E) = ` δ̄(E` − E) = ρ(E)δE

Pl * Pl C
P`∗ = 1
Ω(E) δ̄(E` − E) P`C = 1 −βE`
Ze
El El
E k BT
S ∗ (E) = kB ln Ω(E) F (T ) = −kB T ln Z(T )

Dans chacun des ensembles, une fois obtenu le potentiel thermodynamique approprié (la
fonction fondamentale), S ∗ ou F , on déduit les propriétés thermodynamiques par dérivation
par rapport aux arguments de S ∗ et F . Le point que nous voulons maintenant examiner est
lié à l’observation que si les ensembles de la physique statistiques sont multiples, la
thermodynamique est unique.

III.B Analyse d’un exemple : le cristal paramagnétique


Étudions l’équivalence entre les ensembles sur un exemple précis, celui du cristal paramagnétique
de spins 1/2, que nous avons analysé à l’aide du formalisme canonique plus haut. Rappelons que
l’énergie du cristal sous champ magnétique est de la forme
N
X
E = −B µz(i) (4.45)
i=1

(i)
où µz est la composante du moment i. Aux deux états du spin 1/2 correspondent deux valeurs
(i)
du moment quantifié µz = ±µ.

a) Traitement microcanonique
L’énergie est fixée, ce qui détermine la fraction des moments dirigés vers le haut. Le nombre
de moments tels que µz = ±µ est n± = 12 (N ∓ E/µB). Le nombre de microétats accessibles
correspond donc au nombre de manières de choisir n+ moments + parmi N , i.e Ω(E, B, N ) =
N !/(n+ !n− !). Nous déduisons l’expression de l’entropie microcanonique

S ∗ (E, B, N ) = kB ln Ω(E, B, N ) ' kB N ln N − n+ ln n+ − n− ln n−


 
(4.46)
 
(1 − ξ) ln (1 − ξ) + (1 + ξ) ln (1 + ξ) def E
= N kB ln 2 − où ξ =
2 N µB

89
III Ensembles microcanonique et canonique Ensemble canonique

En utilisant dE = ∓2µBdn± , on obtient très facilement la température microcanonique à partir


de (4.46) :
µB 1 1−ξ 2µB/kB
T ∗ (E, B, N ) =
def
β̃ = ∗
= ln i.e. explicitement N µB−E 
(4.47)
kB T 2 1+ξ ln N µB+E

L’existence de températures (absolues) négatives 4 traduit le comportement non monotone de


l’entropie microcanonique, ce qui a pour origine la dimension finie de l’espace de Hilbert du
cristal qui présente un spectre d’états dégénérés entre un état fondamental E = Emin = −N µB
non dégénéré et un état d’énergie maximale E = Emax = N µB également non dégénéré.

b) Comparaison avec le traitement canonique


Montrons que les résultats obtenus plus haut dans le cadre de l’ensemble canonique coı̈ncident.
(4.18) prend la forme ξ = − tanh β̃. Si nous inversons cette fonction nous obtenons β̃ = 12 ln 1−ξ
1+ξ ,
C
éq. (4.47). Autrement dit, E comme fonction de T est la fonction inverse de T ∗ comme fonction
de E, à condition d’identifier températures microcanonique et canonique et l’énergie fixée de
l’ensemble microcanonique avec l’énergie moyenne de l’ensemble canonique.
Considérons maintenant le cas de l’entropie : partons de (4.25) : S C /(N kB ) = ln(2 cosh β̃) −
β̃ tanh β̃ = β̃ + ln(1 + e−2β̃ ) − β̃ tanh β̃. Nous exprimons β̃ en fonction de ξ pour arriver à
S C /(N kB ) = 21 ln( 1−ξ 2 ξ 1−ξ 1
1+ξ ) + ln( 1−ξ ) − 2 ln( 1+ξ ). Finalement S /(N kB ) = ln 2 − 2 (1 − ξ) ln(1 − ξ) −
C

1
2 (1 + ξ) ln(1 + ξ), qui coı̈ncide avec (4.46).

III.C Analyse générale de l’équivalence entre ensembles


Nous cherchons maintenant à donner une preuve générale de l’identité des résultats obtenus
dans le cadre des deux ensembles.

La compétition entropie-énergie – Distribution de l’énergie du système dans l’en-


semble canonique
La distribution de l’énergie dans l’ensemble canonique est donnée par
ΩT (Etot − E) −βE+ k1 S ∗ (E)
p(E; T ) = ΩS (E) ∝ ρ(E) e−βE ∝ e B , (4.48)
ΩS ⊗T (Etot )
| {z }
P`C pour E=E`

où nous avons introduit l’expression de l’entropie microcanonique S ∗ (E) = kB ln Ω(E) = kB ln[ρ(E)δE].
def
Il est intéressant de définir une  énergie libre  5 F(E; T ) = E − T S ∗ (E) afin de re-écrire la
probabilité comme
p(E; T ) ∝ e−βF (E;T ) . (4.49)
Si nous cherchons la valeur de l’énergie qui maximise cette distribution, nous obtenons la condi-
tion  
∂F(E; T ) ∂ 1 ∗
β = βE − S (E) = 0 ⇒ T ∗ (Em ) = T . (4.50)
∂E ∂E kB
Le point Em est le point où les croissances des deux fonctions s’équilibrent (figure 3.13) : la
fonction très rapidement croissante ρ(E) et la fonction très rapidement décroissante e−βE . La
4
Les températures négatives sont plus  chaudes  que les températures positives : un cristal de température
(absolue) négative mis en contact avec un autre cristal de température positive cède de l’énergie à ce dernier.
5
Stricto sensu F(E; T ) n’est pas l’énergie libre microcanonique. Celle-ci serait plutôt F ∗ (E) = F(E; T ∗ (E)) =
E − T ∗ (E) S ∗ (E).

90
Ensemble canonique III Ensembles microcanonique et canonique

valeur la plus probable Em est obtenue en écrivant l’égalité de la température canonique avec
la température microcanonique. Nous pourrions aller plus loin et analyser en détail la distribu-
tion p(E; T ), répétant ainsi l’exercice de la section IV.B dans laquelle nous avons obtenu une
distribution gaussienne très étroite
(E − Em )2
p(E; T ) ∝ exp − 2 , (4.51)
2σE

avec Em ∝ N et σE ∝ N . La distribution est représentée sur la figure 3.13 (il faut faire
Ω2 → ΩT (Etot − E) ∝ e−βE ).
Dans le cadre de l’ensemble canonique, l’énergie est autorisée à fluctuer. Mais puisque les
fluctuations sont négligeables devant les valeurs moyennes dans la limite thermodynamique,
N → ∞, on est presque dans la situation où l’énergie est fixée (distribution de l’énergie dans
l’ensemble microcanonique) : 6

p(E; T ) −→ p∗ (E; Em ) = δ(E − Em ) (4.52)


| {z } N →∞ | {z }
canonique microcanonique

La compétition énergie–entropie
Le principe de minimisation de l’énergie libre et l’analyse de la distribution de l’énergie illus-
trent un point intéressant que nous pouvons appeler la  compétition énergie–entropie . Puisque
l’énergie libre s’exprime en fonction de l’énergie et de l’entropie comme F = E − T S, sa mi-
nimisation procède d’un compromis entre énergie et entropie : le principe de maximisation de
l’entropie, à combiner avec la minimisation usuelle de l’énergie. Ceci est particulièrement ex-
plicite sur l’expression de la distribution (4.48) de l’énergie : p(E; T ) est le produit d’un terme
rapidement croissant avec E, le terme de densité d’états dont la présence traduit un  effet en-
tropique  ρ(E) ∝ exp k1B S ∗ (E), et d’un terme décroissant rapidement avec l’énergie, exp −βE.
La recherche de la valeur la plus probable procède du compromis énergie-entropie.

Limite thermodynamique
Puisqu’elle joue un rôle central, examinons la fonction de partition canonique :
Z Z
X 1 −βE+ k1 S ∗ (E)
Z= e−βE` = dE ρ(E) e−βE = dE e B . (4.53)
δE
`

Dans la limite thermodynamique l’intégrale est dominée par le voisinage de Em . On obtient


(méthode du col, cf. annexe A) :
s
1 2π kB −βEm + k1 S ∗ (Em ) √ σE −βEm + 1 S ∗ (Em )
Z' 2 ∗ e B = 2π e kB
, (4.54)
δE − ∂ S2 (Em ) δE
∂E

d’où l’expression de l’énergie libre


√ σ 
E
F (T ) = Em − T S ∗ (Em ) − kB T ln 2π ' Em − T S ∗ (Em ) (4.55)
| {z δE }
O(ln N )

6

Remarquons que (4.52) est uniquement schématique : si la largeur de p(E; T ) croı̂t moins vite (∝ N )
que l’énergie sur laquelle elle est centrée (∝ N ), la largeur croı̂t et la distribution ne tend pas vers un Dirac.
def
En revanche, une écriture mathématiquement correcte est de considérer la variable aléatoire ε = E/N dont
la moyenne tend vers une limite finie εm = limN →∞ Em /N , tandis que ses fluctuations s’annulent à la limite
N → ∞ ; on a bien p(ε) −→ δ(ε − εm ).
N →∞

91
IV Retrouver les  principes  de la thermodynamique Ensemble canonique

où Em est une fonction de la température canonique définie par T = T ∗ (Em ). En utilisant (4.23)
nous écrivons l’entropie canonique

'0
z }| {
C C
E E − Em
S C (T ) = + kB ln Z = +S ∗ (Em ) + O(ln N ) . (4.56)
T T

Autrement dit
S C (T ) ' S ∗ (Em ) où T ∗ (Em ) = T (4.57)

Nous définissons la limite thermodynamique comme  N → ∞  (plus exactement N est


macroscopique, i.e. N ∼ 1023 ) : les grandeurs macroscopiques (énergie totale, entropie,...) de-
viennent extensives (i.e. on peut négliger les termes sous-extensifs comme O(ln N )) : il de-
vient alors légitime de négliger les fluctuations, qui correspondent à des contributions sous-
extensives O(N 1/2 ).
Il est alors possible d’inverser les différentes relations : par exemple, en confondant l’énergie
C
à sa valeur moyenne E et sa valeur la plus probable Em , la relation obtenue précédemment
T = T ∗ (Em ) peut être inversée pour donner l’énergie en fonction de la température. Puisque l’en-
tropie micronanonique est la fonction fondamentale de l’ensemble microcanonique, cette relation
assure l’équivalence de toutes les propriétés thermodynamiques, à la limite thermodynamique.
Notamment on aura

à la limite thermodynamique : p∗ = pC , µ∗ = µC , S∗ = SC , etc. (4.58)

À la limite thermodynamique où les fluctuations des grandeurs physiques sont


négligeables devant leurs valeurs moyennes, les résultats obtenus dans le cadre des ensembles
microcanonique et canonique coı̈ncident.

IV Retrouver les  principes  de la thermodynamique

Dans la section précédente nous avons montré que les potentiels thermodynamiques associés
aux différents ensembles coı̈ncident à la limite thermodynamique. Autrement dit nous avons
proposé plusieurs méthodes équivalentes pour construire les fonctions fondamentales au cœur
de l’analyse proposée par la thermodynamique. Nous discutons maintenant la relation avec
les principes de la thermodynamique. Afin de pouvoir considérer des transformations au cours
desquelles de l’énergie est apportée au système, il est naturel de se placer dans le cadre de
l’ensemble canonique.

Premier principe

Nous pouvons identifier l’énergie interne du système E (en général plutôt notée U ) avec l’énergie
moyenne de l’ensemble canonique (il est entendu que P nous nous plaçons dans la limite thermody-
namique où les fluctuations sont négligées) : E = ` P` E` . Nous considérons une transformation
réversible, i.e. passant par une succession d’états d’équilibre : nous pouvons ainsi supposer

92
Ensemble canonique IV Retrouver les  principes  de la thermodynamique

que les occupations des états P` et les énergies E` sont modifiées de manière  adiabatique  : 7

X
dE = (E` dP` + P` dE` ) . (4.59)
`

Nous identifions maintenant la signification des deux termes.

Travail.– La notion de travail 8 est purement mécanique et traduit la modification de l’énergie


du système, via le changement d’un (ou plusieurs) paramètre(s). Si le système est dans le mi-
croétat (`) avec probabilité P` = 1, le travail correspond à une modification du niveau d’énergie
(d̄W )` = dE` . Dans le cas où plusieurs microétats sont occupés on aura donc
X
d̄W rev = P` dE` . (4.60)
`

Soulignons que la notation  d̄  signale que l’expression (4.60) n’est pas une différentielle exacte.

Chaleur.– Nous déduisons que le second terme de la variation d’énergie interne, occasionnée
par la variation des probabilités d’occupation, s’interprète comme la chaleur apportée au système
au cours de la transformation réversible :
X
d̄Qrev = E` dP` . (4.61)
`

L’identification du premier principe de la thermodynamique a donc consisté à clarifier le sens


des deux termes de l’énergie (4.59). Réciproquement, cette identification a permis de donner un
sens statistique à la chaleur.

Second principe
P
Calculons la différentielle de l’entropie statistique S = −kB ` P` ln P` , correspondant à la
variation d’entropie lors d’une transformation infinitésimale,
X
dS = −kB (ln P` + 1) dP` (4.62)
`

En utilisant maintenant la distribution canonique nous obtenons


X 1X
dS = kB (−1 + ln Z + βE` ) dP` = E` dP` (4.63)
T
` `
P
où nous avons utilisé ` dP` = 0. Nous reconnaissons l’expression de la chaleur obtenue précé-
demment, i.e. nous avons retrouvé l’égalité de Clausius :
d̄Qrev
dS = . (4.64)
T

7
C’est seulement lorsque la transformation est réversible que nous pouvons utiliser le “langage” de la physique
statistique d’équilibre tout au long de la transformation : autrement dit, si les paramètres du problème dépendent
du temps  très lentement  on peut simplement négliger l’effet de leur dépendance temporelle sur la dynamique
du système. À l’inverse, si les paramètres dépendent  rapidement  du temps, il faudrait alors développer une
physique statistique hors de l’équilibre (cf. [20] par exemple, ou [4, 25, 28] ou mes notes de cours de Master 2
[33]).
8
Travail (petit rappel du cours de mécanique) : le travail d’une force F ~ le long d’un chemin (une transforma-
~ def R
tion) A → B est WA→B F
= ~ . Dans le cas où la force est conservative, F
d~r · F ~ = −∇E
~ p , le travail correspond
A→B
F ~
à l’opposé de la variation d’énergie potentielle WA→B = Ep (A) − Ep (B).

93
V Formulation semi-classique Ensemble canonique

Troisième principe
On évoque parfois un  troisième principe  pour désigner le théorème de Nernst sur l’annulation
de l’entropie à température nulle. Aussi bien l’expression de l’entropie microcanonique que
celle de l’entropie canonique montrent que l’entropie tend vers une limite finie à température
nulle S(0) = limT →0 S(T ) = kB ln D0 où D0 désigne la dégénérescence de l’état fondamental.
Génériquement, 9 la dégénérescence du fondamental est une quantité non extensive ce qui conduit
à limN →∞ S(0)/N = 0 (écriture précise du théorème de Nernst).

Remarque : violation du théorème de Nernst.– Certains systèmes possèdent toutefois


une entropie résiduelle importante à T = 0. C’est le cas des verres, des matériaux amorphes.

V Formulation semi-classique
V.A Distribution canonique classique et fonction de partition
La distribution canonique est exponentielle dans l’énergie du microétat, ce qui correspond à la
mesure dans l’espace des phases

ρC ({~ri , p~i }) ∝ e−βH({~ri ,~pi }) (4.65)

où H({~ri , p~i }) est l’hamiltonien de N particules dans l’espace tridimensionnel. Si les parti-
cules possèdent d’autres degrés de liberté (rotation, vibration,...) on devra en tenir compte. La
constante de normalisation est proportionnelle à la fonction de partition

N
Z Y
1 d~ri d~
pi −βH({~ri ,~pi })
Z= e (4.66)
N! h3
i=1

où nous avons introduit le facteur 1/N ! pour tenir compte de l’indiscernabilité des particules
identiques.
Supposons l’hamiltonien de la forme
N
X p~i 2
H({~ri , p~i }) = + U ({~ri }) (4.67)
2m
i=1

où le potentiel U ({~ri }) décrit les interactions mutuelles entre les particules (il pourrait également
inclure l’effet d’un potentiel extérieur). Dans le cas classique, nous profitons de l’absence de
corrélation entre positions et impulsions pour calculer explicitement les intégrales (gaussiennes)
sur les impulsions. Nous obtenons :
 N
N Z Y
1 V d~ri −βU ({~ri })
Z= e (4.68)
N! Λ3T V
i=1

où la longueur thermique à été introduite plus haut. La factorisation de la fonction de partition
en une partie cinétique (ou translation) et une partie potentielle reflète l’absence de corrélation
entre positions et impulsions (ce qui n’est pas le cas dans le cas quantique où [x̂, p̂] = i~).
9
Notons toutefois que certains problèmes de physique statistique font apparaı̂tre des problèmes avec fondamen-
tal hautement dégénéré pour lesquels le théorème de Nernst est violé (par exemple dans les antiferromagnétiques
frustrés et les systèmes vitreux).

94
Ensemble canonique VI Indiscernabilité et approximation de Maxwell-Boltzmann

Remarquons que l’expression de la fonction de partition (4.68) peut être re-écrite sous la forme
suggestive
1 D E V
Z= (ztrans )N e−βU , où ztrans = 3 (4.69)
N! ΛT

est la fonction de partition d’une particule, associée aux degrés de liberté de translation. h· · ·i
désigne ici la moyenne uniforme sur les positions.

V.B Distribution de Maxwell des vitesses


Nous pouvons passer de la distribution jointe (4.65) à la loi marginale pour une des impulsions,
i.e. pour la vitesse d’une des particules : nous obtenons une distribution gaussienne
 3/2  
m m
f (~v ) = exp − ~v 2 (4.70)
2πkB T 2kB T

valable pour des gaz classiques (parfaits ou non).

V.C Théorème d’équipartition de l’énergie


La forme de la mesure canonique ρC ∝ e−βH nous permet d’obtenir facilement un résultat
intéressant sur la moyenne de l’énergie.
Si nous supposons que l’hamiltonien contient un terme quadratique

H = · · · + b ξ2 + · · · . (4.71)

où la variable ξ est une des variables dynamiques (un des qi ou des pi ), n’apparaissant nulle par
ailleurs dans l’hamiltonien. La factorisation classique nous permet de calculer la contribution à
la fonction de partition de ce degré de liberté :
Z
2 1
Z = (· · · dξ · · · ) · · · e−βb ξ · · · ∝ · · · × √ × · · · (4.72)
β
∂ C
et donc sa contribution à l’énergie moyenne E = − ∂β ln Z = · · · + 12 kB T + · · · :

1
hb ξ 2 i = kB T (4.73)
2

Ce résultat porte le nom de  théorème d’équipartition de l’énergie . Il se révèlera très utile


par la suite. Nous pouvons le formuler comme suit : chaque terme quadratique de l’énergie
vaut en moyenne 12 kB T (dans le régime classique).
- Exercice 4.2 : Retrouver l’énergie moyenne du gaz parfait monoatomique en utillisant le
théorème d’équipartition. Et pour des molécules diatomiques (assimilées à de petits segments en
rotation) ? Et des molécules polyatomiques (considérées comme des objets complexes rigides) ?

VI Indiscernabilité et approximation de Maxwell-Boltzmann


Nous reprenons la discussion du traitement de l’indiscernabilité, abordée au § II.D page 53 dans
le cadre microcanonique, dans le cadre canonique (cf. annexe p. 75), afin d’analyser la limite de
validité du traitement semi-classique que nous venons de présenter.

95
VI Indiscernabilité et approximation de Maxwell-Boltzmann Ensemble canonique

VI.A Indiscernabilité
Considérons un problème de particules identiques (donc indiscernables). Étant donnée une base
des états individuels {| λ i}, nous pouvons construire une base {| λ1 i ⊗ · · · ⊗ | λN i} de l’espace
produit tensoriel H1 ⊗ · · · ⊗ HN . L’espace physique est la partie complètement symétrique
(ou
 antisymétrique)  sous l’échange de particules de l’espace produit tensoriel Hbosons/fermions =
H1 ⊗ · · · ⊗ HN sym/antisym [34]. Les vecteurs de l’espace de Hilbert à N particules sont donc
repérés uniquement par la donnée de l’ensemble des nombres quantiques, sans leur attribuer une
particule particulière : seule compte l’occupation des états individuels. Nous notons ces états
| λ1 , · · · , λN i (cf. annexe 2.B page 75).
Nous considérons un problème de particules sans interaction. L’hamiltonien prend une forme
séparable : les états construits à partir d’états individuels stationnaires sont états propres de
l’Hamiltonien à N particules. Nous notons Eλ1 ,··· ,λN = ελ1 + · · · + ελN le spectre de valeurs
propres de ce dernier. La fonction de partition prend la forme
X nλ1 ! · · · nλN ! −βEλ ,··· ,λ 1 X
Zbosons = e 1 N et Zfermions = e−βEλ1 ,··· ,λN
N! N!
λ1 ,··· ,λN λ1 , · · · , λN
tous différents
(4.74)
où nλ ∈ N (pour des bosons) désigne le nombre de particules occupant l’état individuel | λ i. La
difficulté du calcul de ces fonctions de partition tient aux contraintes introduites par le postulat
de symétrisation sur la sommation sur les nombres quantiques individuels. Nous expliquerons
dans un chapitre ultérieur comment résoudre ce problème. Contentons-nous pour l’instant de
discuter une approximation de ces fonctions de partition.

VI.B Approximation de Maxwell-Boltzmann


Supposons que les termes dominants ces sommations soient tels que les contraintes soient peu
importantes : cela arrive s’il est peu probable qu’un état individuel soit occupé par plus d’une
particule, i.e. dans une limite dilué où la probabilité d’occupation des états individuels est très
faible. Nous écrivons :
1 X −β(ελ +···+ελ ) 1  X −βελ N
Zbosons ' Zfermions ' e 1 N = e (4.75)
N! N!
λ1 ,··· ,λN λ

En oubliant les contraintes, nous avons pu relier la fonction de partition à une particule à la
fonction de partition des N particules (en principe corrélées par le postulat de symétrisation)

1 N X
Z M−B = z où z= e−βελ (4.76)
N!
λ

Cette approximation porte le nom de l’approximation de Maxwell-Boltzmann. Elle est simi-


laire à l’approximation discutée au niveau de la densité d’états (3.52) dans le chapitre précédent,
ce qui n’a rien de surprenant puisqueRla fonction de partition est génériquement la transformée
de Laplace de la densité d’états Z = dE ρ(E) e−βE .
Remarquons que la fonction de partition (4.76) prend en compte l’effet du postulat de
symétrisation à un niveau très grossier sur le volume de l’espace des phases : le facteur N !
est une estimation du facteur de réduction de dimHindisc par rapport à dimHdisc . Toutefois, il
ne prend pas en compte l’effet fin des corrélations quantiques (ce qui est clair puisque bosons et
fermions ne sont pas distingués à ce niveau).

96
Ensemble canonique VI Indiscernabilité et approximation de Maxwell-Boltzmann

Validité de l’approximation de Maxwell-Boltzmann : cas du gaz parfait monoato-


mique
Nous reformulons dans le cadre canonique quelques idées introduites dans le paragraphe VI.A
page 69 dans le cadre microcanonique. Dans le cas du gaz monoatomique nous obtenons facile-
ment la fonction de partition à une particule :

d~k −β ~2~k 2
Z
X k
−β ~2m
2~ 2 V
z= e 'V e 2m = (4.77)
(2π)3 Λ3T
~k

où
s
def 2π~2
ΛT = (4.78)
mkB T

est appelée la longueur thermique (de de Broglie). ΛT est l’échelle de longueur quantique associée
à l’échelle d’énergie caractérisant les fluctuations thermiques.
L’approximation de Maxwell-Boltzmann nous donne immédiatement la fonction de partition
du gaz à N particules :
N N
eN
 
1 V V
Z' '√ , (4.79)
N! Λ3T 2πN N Λ3T

en ayant utilisé la formule de Stirling. Cette règle approchée s’applique lorsque les effets de la
quantification s’estompent, or nous devons nous rappeler qu’au même titre que Ω(E), la fonction
de partition est une fonction qui compte les états accessibles, avec une pondération e−βE . Si les
énergies sont positives, E` > 0, on doit au moins avoir Z > 1. La validité de l’approximation
semi-classique est donc Ω  1 et Z  1, i.e.
 N
V
1 (4.80)
N Λ3T

Cette condition est exactement celle obtenue au chapitre précédent lorsque nous avons discuté la
validité de la formule de Sackur-Tetrode (3.103). Si nous re-écrivons la condition (4.80) comme

 1/3
V
 ΛT ∝ T −1/2 (4.81)
N

nous constatons qu’il s’agit en effet d’une approximation faible densité/haute température, i.e.
de gaz dilué : la distance typique entre particules voisines (V /N )1/3 doit être plus grande que la
longueur thermique. Inversement, si la température est abaissée, toutes choses égales par ailleurs,
les effets des corrélations quantiques liés au postulat de symétrisation se font sentir lorsque la
distance entre particules approche la longueur thermique (chapitres 9 et 10).

Sens physique de la longueur thermique : un argument populaire... mais vaseux.–


La distribution de Maxwell montre que l’incertitude dans l’espace des impulsions est ∆px ∼

mkB T . Nous déduisons que l’incertitude dans l’espace est (inégalité de Heisenberg) ∆x ∼
h/∆px ∼ ΛT . Autrement dit, il semble que la longueur thermique s’interprète comme la largeur
du paquet d’onde décrivant un atome.
- Exercice 4.3 : Pourquoi l’argument manque-t-il de rigueur ?

97
VI Indiscernabilité et approximation de Maxwell-Boltzmann Ensemble canonique

ΛT n −1/3

régime classique régime quantique


(dilué) (corrélé)

Figure 4.4 : Chaque atome peut être considéré comme un paquet d’onde de largeur ΛT . Dans la
limite diluée (classique) les paquets d’onde ne se recouvrent pas, il n’y a pas d’effet du postulat
de symétrisation. Dans la limite opposée (quantique) le recouvrement des paquets d’onde conduit
à l’apparition de corrélations quantiques liées au postulat de symétrisation.

Ordres de grandeur : Examinons dans la pratique la condition (4.81). Considérons un gaz


d’Hélium (le cas a priori le moins favorable, puisque les atomes les plus légers, susceptibles de
produire la plus grande longueur thermique) dans les conditions normales de température et de
pression. Nous obtenons (V /N )1/3 ' 34 Å et ΛT ' 0.5 Å. La condition est parfaitement satisfaite.
Elle ne sera violée qu’en allant vers les hautes densités (liquide) à basse température (qq K),
des conditions dans lesquelles on observe le phénomène de superfluidité de l’Hélium.

VI.C Apparition des effets quantiques


Nous pouvons d’ores et déjà déterminer l’échelle de température en deçà de laquelle se manifes-
teront les effets des corrélations quantiques, i.e. l’effet de l’indiscernabilité des particules. L’étude
du gaz parfait fait intervenir deux paramètres : la masse des particules m, une échelle de longueur
donnée par la densité du gaz (V /N )1/3 = n−1/3 . Avec ~, ces deux grandeurs nous permettent de
2
construire une échelle d’énergie ~m n2/3 , et donc une échelle (quantique) de température

def ~2 2/3
T∗ = n (4.82)
kB m

qui sépare les régimes classique et quantique

T & T∗ ⇒ Maxwell-Boltzmann valable (régime classique) (4.83)


T . T∗ ⇒ effet des corrélations quantiques dominant (4.84)

On vérifie sans peine que la première équation est une simple reécriture de la condition (4.81).

98
Ensemble canonique VI Indiscernabilité et approximation de Maxwell-Boltzmann

, Les idées importantes


• Distribution canonique (se souvenir de la démonstration simple conduisant à P`C ). La définition
de la fonction de partition.
• Retrouver quelques relations en termes de la fonction de partition (l’énergie moyenne, retrouver
l’entropie, etc). On pourra être guidé par la correspondance à la thermodynamique. Partant de
la relation fondamentale dE = T dS − pdV + µdN , la transformation de Legendre F = E − T S
(permettant de passer des variables E, V , N aux variables T , V , N ) conduit à dF = −SdT −
pdV + µdN .
• Le  théorème  sur la minimisation de l’énergie libre.
• L’idée d’équivalence entre les ensembles à la limite thermodynamique.
• Calcul semi-classique de la fonction de partition à l’approximation de Maxwell-Boltzmann,
Z MB = N1 ! z N pour des particules identiques indépendantes (on se rappellera de la condition de
validité (V /N )1/3  ΛT ).
• Le théorème d’équipartition est assez utile, même s’il est de portée limitée (régime classique).

+ Pour en savoir plus


• Une présentation plus détaillée de la relation avec la thermodynamique : compléments II.D &
III.L de [11].
• Sur la construction de la distribution à partir du principe d’entropie maximale, consulter le
§4.2 du livre [3]
• Sur les ensembles de Gibbs et la théorie des potentiels thermodynamiques, consulter les cha-
pitres 4 et 5 du livre [3]

99
VI Indiscernabilité et approximation de Maxwell-Boltzmann Ensemble canonique

Annexe 4.A : Transformations de Legendre et potentiels thermo-


dynamiques
Nous considérons un fluide simple caractérisé, lorsqu’il est isolé, par E, V, N (si d’autre pa-
ramètres entrent en jeu, un champ magnétique, un champ électrique, etc, on aura davantage de
liberté pour construire des potentiels thermodynamiques).

Ensemble Paramètres Fct génératrice Potentiel Relation


extérieurs fixés (phys. stat.) thermodynamique thermodynamique
micro- E, V, N # de microétats Ω E(S, V, N ) dE = T dS − p dV + µ dN
canonique entropie S(E, V, N ) ou dS = T1 dE + Tp dV − Tµ dN
isobare E, p, N Enthalpie H(E, p, N ) dH = T dS + V dp + µdN
canonique T, V, N fct de partition Z énergie libre F (T, V, N ) dF = −SdT − pdV + µdN
(fct de Helmholtz)
isobare- T, p, N enthalpie libre G(T, p, N ) dG = −SdT + V dp + µdN
isotherme (fct de Gibbs)
grand- T, V, µ fct de grand potentiel J(T, V, µ) dJ = −SdT − pdV − N dµ
canonique grand-partition Ξ
Les différents potentiels thermodynamiques jouent le rôle de fonctions fondamentales : la
connaissance de la fonction d’état S(E, V, N ), ou E(S, V, N ), (fonction de ces trois arguments
précisément), encode toutes les propriétés thermodynamiques. De même pour la fonction F (T, V, N )
etc.
À titre d’illustration : on a bien vu que la fonction F (T, V, N ), donnée par la physique
statistique, permet de déduire l’ensemble des propriétés thermodynamiques du gaz parfait. En
revanche E(T, V, N ) = 23 N kB T (l’énergie moyenne canonique) ne donne aucune information
sur l’équation d’état par exemple. En revanche E(S, V, N ), obtenue par inversion de l’entropie
microcanonique (formule de Sackur-Tétrode), encode bien l’ensemble des propriétés thermody-
namiques.

Limite thermodynamique – Transformations de Legendre


Rappelons les relations entre les potentiels et comment on peut retrouver les expressions des
différentielles. Partons de l’égalité fondamentale de la thermodynamique

dE = T dS − p dV + µ dN (4.85)

Les transformations de Legendre nous donnent les différentielles de l’enthalpie H, l’énergie


libre F , l’enthalpie libre G, le grand potentiel J

H = E + pV ⇒ dH = T dS + V dp + µdN (4.86)
F = E − TS ⇒ dF = −SdT − pdV + µdN (4.87)
G = F + pV = E − T S + pV ⇒ dG = −SdT + V dp + µdN (4.88)
J = F − µN = E − T S − µN ⇒ dJ = −SdT − pdV − N dµ (4.89)

Toutes ces relations coı̈ncident avec celles du tableau (à la limite thermodynamique où S ∗ =
S C = S G =etc).
Remarquons que l’extensivité de G(T, p, N ) fonction d’une grandeur extensive et deux gran-
deurs intensives (T et p) implique que
G = µN , (4.90)

100
Ensemble canonique VI Indiscernabilité et approximation de Maxwell-Boltzmann

de même
J = −pV . (4.91)
D’où

F = −pV + µN (4.92)
H = T S + µN (4.93)
E = T S − pV + µN (4.94)

Notons finalement que le contenu informatif de ces relations n’est pas si extraordinaire puisque
tous les paramètres ne sont pas indépendants ; par exemple, en terme des variables naturelles
pour un système isolé, E(S, V, N ) = T (S, V, N ) S − p(S, V, N ) V + µ(S, V, N ) N . De même
F (T, V, N ) = −p(T, V, N ) V + µ(T, V, N ) N .

Relation de Gibbs-Duhem
Les considérations précédentes sur l’extensivité impliquent une relation assez importante et utile
en thermodynamique, liant les variations des différentes quantités intensives : µ, T et p dans
un fluide simple. Elle peut être obtenue en considérant un potentiel thermodynamique qui n’est
fonction que d’une unique grandeur extensive, G ou J. En différentiant G − µN = 0 on obtient
la relation de Gibbs-Duhem
S V
dµ = − dT + dp , (4.95)
N N
qui contraint les variations des trois paramètres intensifs.

Relations de Maxwell
Finalement, remarquons que l’écriture des différentielles des potentiels thermodynamiques per-
met d’obtenir un ensemble de relations non triviales entre dérivées partielles. Par exemple, le
fait que dF = −SdT − pdV + µdN soit une différentielle exacte montre que (égalité des dérivées
croisées)
   
∂S ∂p
= (4.96)
∂V T,N ∂T V,N
   
∂S ∂µ
− = (4.97)
∂N T,V ∂T V,N
   
∂p ∂µ
− = (4.98)
∂N T,V ∂V T,N

etc.

101
Chapitre 5

Application 1 : Description
semi-classique des gaz

Plan du chapitre
I Gaz parfait monoatomique . . . . . . . . . . . . . . . . . . . . . . . . . 105
I.A Propriétés thermodynamiques . . . . . . . . . . . . . . . . . . . . . . . . 105
I.B Ordres de grandeur dans un gaz d’Argon . . . . . . . . . . . . . . . . . 107
II Gaz parfaits moléculaires . . . . . . . . . . . . . . . . . . . . . . . . . . 107
II.A Aspects microscopiques : cas des molécules diatomiques . . . . . . . . . 108
II.B Thermodynamique des gaz de molécules diatomiques hétéronucléaires . 109
II.C Molécules diatomiques homonucléaires : cas de H2 . . . . . . . . . . . . 113
II.D Molécules polyatomiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
III Gaz réels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

Premier chapitre d’application du formalisme canonique, dans lequel nous donnons une
présentation succinte (semi-classique) des gaz.

I Gaz parfait monoatomique


Nous commençons par rappeler les propriétés du gaz parfait monoatomique, propriétés déjà
démontrées dans les deux chapitres précédents, mais éparpillées. Nous utilisons le formalisme
canonique et soulignons son efficacité qui va nous permettre d’obtenir l’ensemble des propriétés
thermodynamiques du gaz parfait monoatomique en quelques lignes de calculs élémentaires.

I.A Propriétés thermodynamiques


Nous considérons un gaz parfait monoatomique dans le régime classique où l’approximation de
Maxwell-Boltzmann s’applique. Nous appliquons directement (4.69) :
1 V
Z= (ztrans )N où ztrans = (5.1)
N! Λ3T
où la longueur thermique ΛT a été définie plus haut. En utilisant la formule de Stirling, nous
déduisons l’expression de l’énergie libre
  
V /N
F (T, V, N ) = −N kB T [1 + ln(ztrans /N )] = −N kB T 1 + ln , (5.2)
Λ3T

105
I Gaz parfait monoatomique Description semi-classique des gaz

dont nous tirons les propriétés thermodynamiques. Tout d’abord nous calculons l’énergie moyenne
du gaz : revenons plutôt à la fonction de partition, dont nous identifions la dépendance en
température

− ∂β ln C 3
Z ∝ β −3N/2 =⇒ E = N kB T . (5.3)
2
Nous aurions pu directement déduire cette expression du théorème d’équipartition de l’énergie :
C
l’hamiltonien des N atomes libres contient 3N termes quadratiques, d’où E = 3N × 21 kB T .
L’expression nous permet d’obtenir la chaleur spécifique du gaz monoatomique

3
C V = N kB . (5.4)
2
En utilisant la relation de Mayer Cp − CV = N kB , nous déduisons le paramètre contrôlant les
def
transformations isentropiques γ = Cp /CV = 53 (l’équation de l’isentrope est pV γ = cste ; cf.
annexe 2.C page 77). Au passage nous en profitons pour caractériser les fluctuations de l’énergie
à l’aide de la relation fluctuation-dissipation (4.21) :
r
p 3N C
σ E = k B T 2 CV = kB T ⇒ σE  E , (5.5)
2

qui sont en effet d’ordre N , beaucoup plus petites que l’énergie moyenne.
Le calcul de la pression peut être mené très simplement en identifiant la dépendance dans le
volume de la fonction de partition
Z ∝VN (5.6)
caractéristique de particules indépendantes. L’énergie libre est donc F = −N kB T ln V + · · · ,
d’où, en utilisant la définition de la pression canonique,

N kB T
pC = . (5.7)
V
Nous avons retrouvé l’équation d’état des gaz parfaits.
Nous calculons le potentiel chimique :
 
C V /N
µ = −kB T ln(ztrans /N ) = −kB T ln (5.8)
Λ3T

qui présente le comportement


µC ∼ −T ln T (5.9)
T →∞

à haute température. Il est d’ores et déjà intéressant de noter que la condition de validité (4.81)
montre que cette expression du potentiel chimique cesse d’être valable lorsque µC ∼ 0. Autrement
dit, le régime classique est celui pour lequel µC . 0 alors que l’effet des corrélations quantiques
(postulat de symétrisation) devient dominant pour µC & 0 (ou simplement µC = 0 pour le cas
des bosons). Nous re-discuterons ce point à la fin du cours.
Terminons par l’analyse de l’entropie canonique. Nous obtenons
  
5 V /N
S C (T, V, N ) = N kB + ln (5.10)
2 Λ3T

qui est une re-écriture de la formule de Sackur-Tetrode (3.101). C’est une nouvelle illustration
de l’équivalence entre les ensembles (S ∗ = S C ).

106
Description semi-classique des gaz II Gaz parfaits moléculaires

I.B Ordres de grandeur dans un gaz d’Argon


Considérons une mole, N ' 6 × 1023 , de gaz parfait monoatomique (par exemple de l’argon
40 Ar) dans les conditions normales de température et de pression (T = 300 K et p = 1 atm).
18
def
Volumes.– Le gaz occupe un volume V = 24 `, i.e. chaque atome occupe un volume ∆x3 =
V /N ' 40 000 Å3 (la distance typique entre atomes est ∆x ' 34 Å).
Énergie et vitesse.– L’énergie moyenne d’un atome est E/N = 3
2 kB T ∗ ' 40 meV, ce qui
1 1
correspond à une vitesse v = m ∆p ' 430 m/s (où 2m ∆p2 = E/N )
Nombre d’états accessibles et entropie (gaz isolé).– Il est intéressant de calculer ∆x∆p/h
intervenant dans le dénombrement des états quantiques occupés ; on obtient ∆x∆p/h ' 160.
Finalement en utilisant (3.105), nous obtenons l’entropie par particule et estimons le nombre de
microétats accessibles :
S∗ 23
' 3 ln(1600) ' 22 et Ω ' 108×10 . (5.11)
N kB

Collisions (gaz réel).– Finalement nous discutons le rôle des collisions. √ Un atome parcourt
une distance typique entre deux collisions (libre parcours moyen) ` = 1/ 2σn où σ ' 5 Å2 est
la section efficace de collision (qui mesure en gros la probabilité de collision dans une expérience
de collision à deux atomes) et n = N/V la densité moyenne. On obtient ici ` ' 0.6 µm. Le temps
typique séparant deux collisions successives d’un atome est τ = `/v ' 1.3 ns.
Interaction (gaz réel).– Les collisions sont extrêmement fréquentes, sur des échelles macro-
scopiques. Cependant la contribution des collisions (i.e. de l’interaction entre atomes) à l’énergie
N r3
du gaz est très faible : on peut l’estimer comme suit (cf. TD) Eint /Ec ∼ V 0 kuB0T , où r0 est la
portée de l’interaction et u0 la  force  de l’interaction. Typiquement r0 ∼ 5 Å et u0 ∼ 1 meV,
ce qui conduit à une contribution Eint /Ec ∼ 10−4 extrêmement faible, et justifie l’hypothèse de
gaz parfait (dans les conditions normales de température et de pression).
Diffusion.– L’existence des collisions affecte fortement la nature du mouvement des particules.
Un atome effectuant un mouvement balistique parcourt une distance d = vt, i.e. d ' 430 m
pendant t = 1 s. Les atomes du gaz subissent des collisions incessantes. Pendant une seconde,
un atome subit typiquement Ncoll ∼ (t/τ ) ∼ 109 collisions. Son mouvement est donc de nature
diffusive. Si nous supposons que l’atome se déplace de ±` entre deux collisions (vers la droite,
+`, ou vers√la gauche, −`,√avec probabilité 1/2), l’atome aura typiquement parcouru une dis-
tance d ∼ Ncoll ` = vt/ Ncoll ∼ 1 cm après t = 1 s. Autrement dit, comparativement à la
distance parcourue par une particule √ balistique, la distance couverte par la particule diffusive
est typiquement réduite d’un facteur Ncoll ∼ 104 .

II Gaz parfaits moléculaires


Dans le paragraphe précédent, nous avons analysé les propriétés thermodynamiques de gaz
parfaits monoatomiques en traitant les atomes comme des particules entièrement décrites par
des degrés de liberté de translation. En réalité les atomes sont des  particules  composites
constituées d’un noyau et d’un cortège électronique : l’état d’un atome est donc également
caractérisé par l’état quantique des électrons, i.e. par des degrés de liberté internes. L’étude des
gaz moléculaires va nous offrir l’occasion d’analyser le rôle des degrés de liberté internes sur les
propriétés thermodynamiques du gaz. Comparativement aux atomes, les molécules possèdent
des dégrés de liberté supplémentaires (rotation, vibration) qui sont activités dans les conditions
normales de température et de pression, alors qu’on peut légitimement oublier les degrés de
liberté internes des atomes dans ces conditions.

107
II Gaz parfaits moléculaires Description semi-classique des gaz

II.A Aspects microscopiques : cas des molécules diatomiques


Formons-nous une idée sur la nature d’une molécule dans le cas le plus simple des molécules
diatomiques. Deux atomes forment une molécule si leurs configurations électroniques leur per-
mettent de former une liaison chimique (ex : H2 , O2 , CO, NaCl, etc). La nature microscopique
de la liaison chimique correspond à la mise en commun de certains électrons des atomes, qui
trouvent plus favorable énergétiquement de se délocaliser autour de plusieurs noyaux (il y a
une compétition entre la délocalisation des électrons sur les deux noyaux, qui minimise l’énergie
cinétique des électrons, et leur localisation autour des noyaux, qui minimise l’énergie poten-
tielle). Les électrons étant beaucoup plus légers que les noyaux, me ∼ mp /2000, leur dynamique
est extrêmement rapide comparativement à celle des noyaux atomiques. Par exemple si nous
considérons une énergie ECoul ∼ 10 eV (l’échelle d’énergie typique pour l’énergie coulombienne
dans un atome ou une molécule) nous obtenons une vitesse électronique ve ∼ 1300 km/s, à
comparer à la vitesse du noyau 2 km/s . vnoyau . 30 km/s. Nous pouvons donc supposer que les
dynamiques des électrons et des noyaux sont (approximativement) découplées. La présence du
nuage d’électrons rapides autour des noyaux est ressentie par ces derniers via un potentiel effec-
tif, caractérisé par un minimum associé à l’état lié entre atomes (la molécule). Ce découplage est
l’essence de l’approximation de Born-Oppenheimer [4, 8]. L’hamiltonien effectif entre les deux
noyaux est de la forme
énergie cinétique des noyaux
z }| {
p~1 2 p~2 2
Hmolecule = + + Veff (||~r1 − ~r2 ||) (5.12)
2m1 2m2 | {z }
Coulomb + énergie des e−

Veff (r) possède un minimum absolu en r = r∗ . Reécrit dans les coordonnées du centre de masse,
P~ et R,
~ et relatives, p~ et ~r :

P~ 2 p~ 2
Hmolecule = + + Veff (||~r||) (5.13)
2M 2mr
où M = m1 + m2 et 1/mr = 1/m1 + 1/m2 . On obtient un nouveau découplage (exact) entre
variables du centre de masse (mouvement de translation) et variables relatives.
~2
p
L’énergie cinétique 2m r
peut être décomposée en énergie cinétique de rotation et radiale
~2
p ~
`2 p2r
2mr = 2mr r2 + 2mr où ~` est le moment cinétique orbital et pr l’impulsion radiale. Si nous
supposons que le potentiel est très piqué autour de r∗ (la liaison est très rigide), V (r) ' −V0 +
1 2 2
2 mr ω (r − r∗ ) avec
 ω grand , nous pouvons découpler (approximativement) rotation et

vibration. Finalement, ces différentes étapes ont conduit au découplage des degrés de liberté de
translation, de rotation et de vibration :
P~ 2 ~` 2 p2 1
Hmolecule = + + r + mr ω 2 (r − r∗ )2 −V0 (5.14)
2M 2I 2m 2
|{z} |{z} | r {z }
translation rotation vibration
où I = mr r∗2 est le moment d’inertie de la molécule. L’énergie de liaison est Eliaison = V0 − ~ω/2
(énergie minimum à fournir pour dissocier
p la molécule). La validité du découplage rotation-
vibration est ~2 /I  ~ω, i.e. r∗  ~/mr ω. Le quantum d’énergie de vibration est beaucoup
plus grand que le quantum d’énergie de rotation. Les échelles de temps caractéristiques sont en
rapport inverse, i.e. la vibration est très rapide et la rotation lente.

Spectre quantique des molécules hétéronucléaires


Le problème est séparable, nous pouvons préciser les spectres quantiques des trois hamiltoniens :

108
Description semi-classique des gaz II Gaz parfaits moléculaires

Figure 5.1 : Représentation schématique des spectres de rotation et de vibration.

Hamiltonien Valeurs propres nb. quantique(s) dégén. suppl.


~2
P (trans) ~ 2
~2 K ~
Htrans = 2M ε~ = 2M K = 2π
L (n x , ny , nz )
K | {z }
∈Z3
~
`2 (rot) ~2 `(`+1)
Hrot = 2I ε` = 2I `∈N 2` + 1
p2r (vib)
+ 12 mr ω 2 (r − r∗ )2 1

Hvib = 2mr εn = ~ω n + 2 n∈N

II.B Thermodynamique des gaz de molécules diatomiques hétéronucléaires


Factorisation de la fonction de partition pour les problèmes séparables
(trans) (rot) (vib)
Les niveaux d’énergie de la molécule sont donc donnés par εK,`,n
~ = ε~ + ε` + εn − V0
K
(avec dégénérescence 2` + 1). La fonction de partition d’une molécule est
X n o
zmolecule = (2` + 1) exp −βεK,`,n
~ . (5.15)
~ `, n
K,

À la séparabilité du problème quantique correspond la factorisation de la fonction de partition


d’une molécule :
zmolecule = ztrans zrot zvib eβV0 (5.16)
où
V
ztrans = (5.17)
Λ3T

2 `(`+1)/2I
X
zrot = (2` + 1) e−β~ (5.18)
`=0

X 1
zvib = e−β~ω(n+ 2 ) (5.19)
n=0

109
II Gaz parfaits moléculaires Description semi-classique des gaz

La fonction de partition du gaz peut être immédiatement déduite (à l’approximation de Maxwell-
Bolztmann)
1 N
Zgaz = z (5.20)
N ! molecule

Régime classique (haute température)


Le régime classique correspond à la situation où les effets de quantification du spectre sont
 gommés . Lorsque la température devient grande, les exponentielles dans (5.18) et (5.19)

varient lentement et l’on peut remplacer les sommes par des intégrales : nous obtenons
Z ∞
2 2I
zrot ' d` (2` + 1) e−β~ `(`+1)/2I = 2 (5.21)
0 ~ β
Z ∞
1
zvib ' dn e−β~ωn = (5.22)
0 β~ω

Dont nous déduisons l’énergie moyenne par molécule


3
εmolecule = kB T + kB T + kB T − V0 (5.23)
|2 {z }
|{z} |{z} |{z}
rotation vibration liaison
translation

ce que nous aurions pu obtenir assez directement à l’aide du théorème d’équipartition de l’énergie.
La chaleur spécifique du gaz contient donc trois contributions correspondantes :
 (trans) 3
CV
 = 2 N kB
(trans) (rot) (vib) (rot)
CV = CV + CV + CV avec CV = N kB (5.24)
 (vib)

CV = N kB

La prédiction classique est donc une chaleur spécifique CV = 72 N kB pour les gaz parfaits diato-
miques.

Gel des degrés de liberté à basse température


Sur la partie gauche figure 5.2 est représentée la chaleur spécifique du dihydrogène deutéré. On
(trans) (trans) (rot)
voit bien apparaı̂tre des plateaux correspondant à CV = 23 N kB et CV + CV = 52 N kB ,
cependant la chaleur spécifique en fonction de la température présente une structure plus riche.
Sur d’autres gaz (O2 , N2 , CO, Cl2 ), on observe également la transition entre un plateau à
(trans) (rot) (trans) (rot) (vib)
CV + CV = 25 N kB et un autre à CV + CV + CV = 27 N kB (partie droite de
la figure). Nous allons maintenant expliquer, quantitativement, l’origine de ces transitions, que
nous attribuons au gel de certains degrés de liberté (vibration, pour toutes les molécules, et en
sus gel de la rotation dans le cas du dihydrogène), une manifestation de la quantification du
spectre des énergies de la molécule.

Vibration.– Commençons par discuter la question du gel de la vibration. Nous revenons sur
l’expression de la fonction de partition (5.19) ; elle-ci se calcule très facilement (il s’agit d’une
série géométrique)
1
zvib = (5.25)
2 sinh( 2k~ω
BT
)

ce qui conduit à l’énergie moyenne εvib = ~ω ~ω


2 coth( 2kB T ), qui interpole entre le résultat clas-
sique εvib ' kB T , à haute température kB T  ~ω, et l’énergie fondamentale de l’oscillateur

110
Description semi-classique des gaz II Gaz parfaits moléculaires

C V /NkB
experiment

theory
3

1 T vib
T rot

0
5 10 500 1000 5000
50 100 T (K)

Figure 5.2 : Chaleur spécifique du dihydrogène deutéré (HD ≡ 11 H–21 H). Partant
des hautes températures, la décroissance de la chaleur spécifique correspond aux gels succes-
sifs des degrés de liberté de vibration puis de rotation. Les petits schémas représentent l’état
des molécules : rotation et vibration excitées pour T > Tvib ; rotation seule excitée pour
Trot < T < Tvib (la molécule se comporte comme un bâtonnet rigide en rotation) ; rotation
et vibration gelées pour T < Trot (la molécule est un objet invariant par rotation). Données
tirées du livre de R. Balian [3].

harmonique εvib ' ~ω


2 = ε0 , à basse température kB T  ~ω. Nous obtenons aisément la chaleur
spécifique :

(vib) ∂εvib

Tvib /2T
2 1 si T  Tvib
CV (T ) = = N kB ' N kB ×  T 2 −T /T
∂T sinh (Tvib /2T )  vib e vib
T si T  Tvib
(5.26)
où nous avons introduit
~ω def
.
Tvib = (5.27)
kB
Afin de comprendre le comportement de basse température, rappelons que la chaleur spécifique
caractérise la capacité du système à augmenter son énergie lorsque la température est augmentée.
Or le spectre de vibration présente un gap ε1 −ε0 = ~ω à la base du spectre. Pour les températures
T  Tvib , l’énergie disponible via des fluctuations thermiques est très inférieure au gap : l’os-
cillateur reste bloqué dans son état fondamental. L’oscillateur est excité avec une très faible
probabilité ∼ exp − k~ω BT
, comportement qui se reflète dans la chaleur spécifique. L’oscillateur
harmonique reste dans son état fondamental, i.e. le degré de liberté de vibration (mouvement
radial) est gelé. Autrement dit, pour T  Tvib on peut considérer que la molécule se comporte
comme un rotateur rigide. Dans les conditions de pression et de température normales, la plupart
des gaz diatomiques sont dans ce régime car les températures vibrationnelles excèdent quelques
centaines de Kelvins (et les températures rotationnelles sont plutôt inférieures à la centaine de
Kelvins ; cf. tableau 5.1).
On compare le comportement (5.26) aux données expérimentales sur la figure 5.3. Cette
comparaison est faite pour des gaz diatomiques de différentes natures. Chacun étant caractérisé
(vib)
par une température caractéristique propre (cf. tableau 5.1) on trace CV (T ) en fonction de
T /Tvib : on constate que tous les points tombent parfaitement sur la même courbe. Il est tout à
fait remarquable que ces calculs simples aient permis de comprendre quantitativement la courbe
de chaleur spécifique de cet ensemble de gaz diatomiques, avec un unique paramètre libre Tvib
(qui dépend des détails microscopiques).

111
II Gaz parfaits moléculaires Description semi-classique des gaz

Figure 5.3 : Contribution vibrationnelle à la chaleur spécifique. de divers gaz (O2 , N2 ,


CO, Cl2 ), en fonction de T /Tvib . Figure tirée du livre de R. Balian [3].
def def
Molécule Trot = ~2 /(2kB I) Tvib = ~ω/kB
H2 85.3 K 6215 K
HD 64.0 K 5382 K
O2 2.1 K 2256 K
N2 2.9 K 3374 K
CO 2.8 K 3103 K
Cl2 0.35 K 808 K

Table 5.1 : Températures rotationnelles et vibrationnelles de divers gaz diatomiques (données


tirées de [11]).

Rotation.– Le même phénomène se produit pour les degrés de liberté de rotation. Le spectre
de rotation fait intervenir une échelle d’énergie caractéristique, convertie en température,

def ~2
Trot = . (5.28)
2kB I
Lorsque la température du gaz est T  Trot , la fonction de partition rotationnelle (5.18) est
dominée par le premier terme zrot ' 1. Les degrés de liberté de rotation ne sont pas excités, i.e.
la molécule reste dans son état fondamental ` = 0 et ne tourne plus : elle se comporte comme
un objet invariant par rotation (comme un atome). Pour la plupart des gaz ce phénomène se
produit à trop basse température pour être facilement observé (le gaz se liquéfie), sauf pour
le dihydrogène qui est très léger (i.e. petit mr et grande température Trot ) pour lequel on voit
nettement sur la courbe figure 5.2 le gel de la rotation pour des températures T . 20 K.

Du macroscopique au microscopique.– Il est tout à fait remarquable de souligner que des


mesures de quantités thermodynamiques, comme une chaleur spécifique, permettent de remon-
ter à des propriétés microscopiques. La rotation en donne une belle illustration. Les données
expérimentales peuvent être fitées par une courbe à un paramètre, la température de rotation
Trot . Par exemple, on trouve (expérimentalement) Trot = 64 K pour les molécules HD. Or, on
def 2
a vu que celle-ci s’exprime en termes du moment d’inertie de la molécule comme Trot = 2k~B I ;
I = µ R2 est le moment d’inertie de la molécule, fonction de la masse relative, donnée par
1/µ = m1p + mp +m1
n
, i.e. µ ' 32 mp , et la distance R entre les deux noyaux, seule inconnue du
problème. Finalement, nous obtenons I ' 5.7 × 10−48 kg.m2 d’où R ' 0.7 Å (sur wikipedia,
on trouve R = 0.7414 Å). En conclusion, grâce à notre modèle microscopique, nous avons pu
remonter de la chaleur spécifique CV (T ) à une propriété microscopique des molécules.

112
Description semi-classique des gaz II Gaz parfaits moléculaires

On peut même aller plus loin : le comportement de la chaleur spécifique nous donne des
informations sur la dynamique microscopique des molécules comme on l’a illustré sur les petits
schémas de la figure 5.2 : par exemple, lorque rotation et vibration sont gelées, les mocules HD
se comportent exactement comme des atomes, i.e. des objets invariants par rotation sans degrés
de liberté internes.

Comparaison entre isotopes.– Pour enfoncer le clou, il est intéressant de comparer les deux
molécules isotopiques H2 et HD, qui possèdent des propriétés similaires, si ce n’est la masse des
noyaux. En particulier on peut vérifier que le découplage rotation/vibration est une très bonne
−1/2
approximation. Le modèle que nous avons présenté montre que Trot ∝ m−1 r et Tvib ∝ mr . On
(H2 ) (HD) (H2 ) (HD)
vérifiera
√ que les valeurs données dans le tableau satisfont Trot /Trot = 4/3 et Tvib /Tvib =
2/ 3 avec une très bonne précision.

Remarque : degrés de liberté électroniques.– Maintenant que nous avons analysé en


détail le rôle des degrés de liberté interne sur ces deux exemples, nous pouvons revenir sur la
question des degrés de liberté électroniques, qui avaient été laissés de côté. Les électrons liés à
l’atome ou à la molécule sont caractérisés par un spectre de niveaux d’énergie. Si la température
est suffisante, ces degrés de liberté peuvent être excités grâce aux fluctuations thermiques. Dans
la pratique les énergies (i.e. les températures) sont toutefois très élevées : les échelles typiques
pour l’interaction coulombienne dans un atome ou une molécule sont 1 à 10eV, or 1eV correspond
à 11600 K. C’est probablement ce qui explique l’écart entre les courbes de chaleur spécifique
théorique et expérimentale pour HD (figure 5.2), puisqu’on attendrait l’excitation des degrés
de vibration pour des températures T & Tvib ' 5400 K devenant comparables aux énergies
électroniques.

II.C Molécules diatomiques homonucléaires : cas de H2


Dans le paragraphe précédent, nous avons considéré le cas des molécules diatomiques hétéro-
nucléaires (comme HD, CO,...). Le cas des molécules diatomiques homonucléaires (comme H2 ,
O2 ,...) introduit une complication liée au postulat de symétrisation. Considérons par exemple le
cas du dihydrogène H2 pour simplifier. Les deux noyaux étant identiques (donc indiscernables),
leur fonction d’onde doit satisfaire le postulat de symétrisation, ce qui affecte la construction des
états stationnaires. En effet, les états de moment orbital ` pairs sont spatialement invariants par
échange des noyaux (en termes des coordonnées sphériques (θ, ϕ), cela correspond à une rotation
θ → π − θ et ϕ → π + ϕ). Ils doivent donc être combinés avec un état singulet (S = 0) pour
les spins nucléaires, afin de respecter l’antisymétrisation globale de la fonction d’onde (chapitre
8 & chapitre 11 de [34]). On parle de para-hydrogène pour désigner l’état singulet de spin de
H2 . De même les états de ` impair, spatialement antisymétrique par permutation des noyaux,
doivent être combinés avec un des trois état triplet (S = 1) de spin. On parle dans ce cas
d’ortho-hydrogène. Finalement la fonction de partition rotationnelle est :
(rot) (rot)
(H )
X X
zrot2 = (2` + 1) e−βε` + 3 (2` + 1) e−βε` . (5.29)
` pair ` impair
| {z } | {z }
zpara zortho

(rot) ∂ ∂
La chaleur spécifique correspondante est CV = N kB ∂T (−) ∂β ln zrot , i.e.

(H2 , rot) ∂ 2 ∂
CV (T ) = N kB
T ln (zpara + zortho ) (5.30)
∂T ∂T
Cette discussion peut être généralisée pour des molécules avec noyaux ayant des spins arbitraires
(cf. chapitre 6 de [28] ou complément III.B de [11]). Notons toutefois que puisque les températures

113
III Gaz réels Description semi-classique des gaz

de rotation sont en général très basses (cf. tableau 5.1), on peut se limiter en pratique au régime
classique, pour lequel zrot = 2TTrot (au lieu de TTrot pour les molécules hétéronucléaires). La chaleur
spécifique n’est bien entendu pas affectée par ces effets dans le régime classique.
Revenons sur le cas du di-hydrogène pour lequel la température Trot est telle qu’il est possible
d’observer la transition vers le gel de la rotation. On constate que le modèle théorique discuté
ci-dessus, équation (5.30), est en désaccord avec les données expérimentales. La raison est liée au
manque de relaxation entre para- et ortho- hydrogène (la probabilité de transition d’un état vers
l’autre est très faible car elle met en jeu des états des spins nucléaires très faiblement couplés).
Le gaz de dihydrogène se comporte en pratique comme un mélange de deux gaz indépendants
de para- et ortho- hydrogène dans des proportions correspondant aux dégénérescences de spin
1/4 et 3/4, caractérisé par une chaleur spécifique
 
(H2 , rot) ∂ 2 ∂ 1 3
CV (T ) = N kB T ln zpara + ln zortho , (5.31)
∂T ∂T 4 4

au lieu de (5.30). Cette subtilité est discutée dans le § 6.5.B de [28] et dans le chapitre 8 de [3].
Elle illustre bien l’importance des interactions microscopiques, même faibles, afin d’atteindre un
équilibre thermodynamique.

II.D Molécules polyatomiques


Sans rentrer dans les détails nous pouvons faire deux observations sur le cas des molécules
polyatomiques. La logique est la même et l’on s’attend à un découplage rotation/vibration.

Rotation.– Les molécules linéaires sont caractérisées par deux degrés de liberté de rotation
(deux angles sont nécessaires pour définir l’orientation de la molécule). Dans le régime classique
(rot)
on aura donc CV = N kB .
En revanche il faut trois angles pour spécifier l’orientation d’un objet tridimensionnel (une
(rot)
molécule non linéaire comme H2 O, CH4 ,...) et on aura CV = 23 N kB .

Vibration.– Les molécules polyatomiques sont caractérisées par un nombre plus grand de
degrés de liberté de vibration, associés aux déformations de la molécule. Un comptage du nombre
de degrés de liberté permet d’identifier le nombre de modes de vibration. Considérons une
molécule formée à partir de n atomes ; elle est caractérisée par 3n degrés de liberté, dont 3 de
translation, 3 de rotation (molécules non linéaire) et donc 3(n − 2) de vibration. Dans le régime
(vib)
classique on aura dans ce cas CV = 3(n − 2)N kB si tous les modes de vibrations sont activés.

III Gaz réels


Si l’approximation du gaz parfait est une excellente approximation dans de nombreuses situations
(cf. § sur les ordres de grandeurs), dans certains cas on peut observer des écarts à la théorie semi-
classique des gaz parfaits présentée ci-dessus. Rappelons que le gaz parfait est une approximation
de particules indépendantes, non corrélées. Ceci est mis en défaut pour deux raisons :

• d’une part dans certaines conditions les corrélations quantiques liées au postulat de
symétrisation de la mécanique quantique se manifestent : nous discuterons les propriétés
des gaz parfaits quantiques dans les chapitres 9 et 10.

• D’autre part les particules présentent toujours des interactions mutuelles (sauf dans le
cas notable des photons que nous analyserons). Nous avons noté que ces interactions sont
nécessaires à l’établissement d’un équilibre thermodynamique (i.e. le gaz parfait correspond

114
Description semi-classique des gaz III Gaz réels

à une approximation d’interactions négligeables plutôt qu’inexistantes). Si elles affectent


peu les propriétés thermodynamiques dans la limite diluée, il en est autrement lorsque l’on
considère des régimes où la matière est plus condensée (liquides ou solides).
Plusieurs techniques systématiques intéressantes ont été développées permettant d’étudier
les corrections au gaz parfait apportées par les interactions : le développement en clusters
et le développement du viriel, dont on trouvera une présentation dans des ouvrages plus
avancés (chapitre 9 de [3], chapitre 10 de [13], chapitre 10 de [28], etc).
Dans le § II chapitre 7, par une méthode de champ moyen, nous montrerons que les inter-
actions sont à l’origine de phénomènes collectifs remarquables : des transitions de phase.
Les interactions agissant à l’échelle microscopique sont donc responsables de phénomènes
coopératifs à l’échelle macroscopique.

, Les idées importantes


• On doit pouvoir retrouver très rapidement les résultats pour le gaz monoatomique.
• La factorisation de la fonction de partition pour des problèmes séparables.
• La notion du gel des degrés de liberté (phénomène quantique lié à la quantification de l’énergie).

+ Pour en savoir plus


• Sur les gaz diatomiques et polyatomiques : chapitre 6 de [28], chapitre 8 de [3] ou complément
III.B de [11] (avec l’exercice III.22).

115
III Gaz réels Description semi-classique des gaz

116
Chapitre 6

Application 2 : Thermodynamique
des oscillateurs harmoniques

Plan du chapitre
I Molécule diatomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
I.A Analyse classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
I.B Traitement quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
II Vibrations d’un corps solide . . . . . . . . . . . . . . . . . . . . . . . . 120
II.A Aspects microscopiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
II.B Thermodynamique des vibrations . . . . . . . . . . . . . . . . . . . . . . 123
III Thermodynamique du rayonnement . . . . . . . . . . . . . . . . . . . 128
III.A Description du problème du corps noir . . . . . . . . . . . . . . . . . . . 128
III.B Modes propres du champ électromagnétique dans une cavité . . . . . . . 128
III.C Thermodynamique du rayonnement . . . . . . . . . . . . . . . . . . . . 130
Annexe 6.A : Modes propres d’une chaı̂ne de ressorts . . . . . . . . . . . . 136
Annexe 6.B : Corde vibrante : quantification  classique  versus  quan-
tique  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Annexe 6.C : Cristal – Approximation harmonique et indiscernabilité . . 140

L’étude de l’oscillateur harmonique est un problème extrêmement transversal en physique,


décrivant toute situation où l’énergie peut être écrite sous la forme
2
Énergie ∝ + écart à l’équilibre (6.1)

Citons quelques exemples de telles situations :


• Un oscillateur mécanique.
• Vibration des molécules (chapitre précédent).
• Énergie de vibration d’un corps solide (ci-dessous).
• Oscillateur(s) électrique(s) : un circuit L-C (ou plusieurs couples inductance-capacité). Une
inductance stocke une énergie  cinétique  EL = 21 LI 2 alors qu’une capacité stocke une
1
énergie  potentielle  EC = 2C Q2 .
• Le champ électromagnétique (ci-dessous).
etc.

117
I Molécule diatomique Thermodynamique des oscillateurs harmoniques

I Molécule diatomique : un oscillateur harmonique thermalisé


Dans ce paragraphe, nous analysons les propriétés thermodynamiques d’un unique oscillateur
harmonique, supposé en équilibre avec un thermostat. On peut penser à l’exemple concret du
degré de vibration d’une molécule diatomique, comme nous l’avons discuté au chapitre précédent.
Ces résultats seront utiles dans les sections suivantes où nous aurons à considérer des problèmes
d’oscillateurs harmoniques indépendants.
L’oscillateur est décrit par l’hamiltonien

p2 1
H(q, p) = + mω 2 q 2 . (6.2)
2m 2
Pour la molécule, q serait l’écart à la position correspondant au minimum de l’énergie potentielle.

I.A Analyse classique


Commençons par un petit exercice simple consistant dans l’analyse dans le cadre de la mécanique
classique. La fonction de partition est donnée par une intégrale double gaussienne
Z +∞ Z +∞
1 1 T ~ω
dp e−βH(q,p) =
def
z (class) = dq = où Tvib = (6.3)
h −∞ −∞ β~ω Tvib kB

Nous déduisons l’énergie moyenne

1 1
ε(class) = kB T + kB T = kB T , (6.4)
|2 {z } |2 {z }
εcin εpot

kB T
l’énergie libre f (class) (T ) = kB T ln k~ω (class) (T ) = k
  
B T ou encore l’entropie s B 1 + ln ~ω .
Rappelons que la validité du traitement classique est celle des grands nombres quantiques, i.e.
z (class)  1. Autrement dit c’est une approximation de haute température T  Tvib .

I.B Traitement quantique


Aux plus basses températures, on observe des phénomènes de saturation quantique : l’oscillateur
se trouve dans son état fondamental, l’énergie est bloquée à ε ' ε0 = 21 ~ω.

Fonction de partition
Rappelons le spectre quantique de l’hamiltonien
 
1
εn = ~ω n + où n ∈ N . (6.5)
2

La fonction de partition

X
z= e−β~ω(n+1/2) (6.6)
n=0

est une série géométrique que nous calculons aisément :

1
z= β~ω 
(6.7)
2 sinh 2

118
Thermodynamique des oscillateurs harmoniques I Molécule diatomique

Énergie moyenne, distribution de Bose-Einstein et chaleur spécifique


L’énergie moyenne de l’oscillateur se déduit de la fonction de partition
 
~ω ~ω ~ω ~ω
ε= coth = + ~ω/k T . (6.8)
{z − 1}
2 2kB T 2
|{z} |e
B

ε0 excitation

On retrouve le comportement classique, linéaire en température pour T  Tvib , équation (6.4).


À basse température, l’énergie sature pour la valeur de l’énergie fondamentale de l’oscillateur,
ε ' ε0 . Autrement dit, nous retrouvons le phénomène quantique de  gel de la vibration  pour
T  Tvib . À ce stade il est intéressant de reinterpréter l’expression de l’énergie moyenne en
caractérisant l’excitation moyenne de l’oscillateur. Si nous écrivons ε = ~ω(nω +1/2), la quantité

1
nω = (6.9)
e~ω/kB T −1
mesure le nombre moyen de quanta d’énergie dans l’oscillateur. Cette fonction porte le nom de
distribution de Bose-Einstein et jouera un rôle important par la suite.
Finalement nous pouvons caractériser la capacité de l’oscillateur à stocker l’énergie en considérant
sa chaleur spécifique
 2 
∂ε

2kB T
1 if kB T  ~ω
c(T ) = = kB     ' kB ×  ~ω 2 −~ω/k T (6.10)
∂T sinh ~ω  e
kB T
B if kB T  ~ω
2kB T

Le résultat de haute température est le résultat classique. Le comportement (quantique) de basse


température est caractéristique de l’existence d’un gap dans le spectre :
 

c(T ) ∼ exp − ⇔ gap ~ω (6.11)
kB T

Pour T  Tvib , l’oscillateur est essentiellement bloqué dans son état fondamental. Les fluc-
tuations thermiques, fournissant une énergie typique ∼ kB T , sont très insuffisantes pour le
promouvoir dans ses états excités.
Rappelons que l’expression (6.10) décrit très bien les données expérimentales d’un oscillateur
simple comme une molécule diatomique (figure 5.3) : la contribution à la capacité calorifique
de ces gaz diatomiques très divers (O2 , N2 , etc) est parfaitement décrite par cette fonction,
qui ne dépend que d’un unique paramètre microscopique, la pulsation ω caractérisant la liaison
chimique.

Énergie libre et entropie


 
L’expression de l’énergie libre sera utile par la suite. Nous obtenons f (T ) = kB T ln 2 sinh 2k~ω
BT
,
que nous préférons écrire  
~ω − k~ωT
f (T ) = + kB T ln 1 − e B (6.12)
2
pour faire apparaı̂tre l’énergie fondamentale, à laquelle s’ajoute la contribution des états excités
de l’oscillateur. Cette expression met bien en évidence la saturation de l’énergie libre à basse
température f (T → 0) ' ε0 .
L’entropie peut être mise sous une forme
  
~ω − ~ω
s(T ) = kB nω − ln 1 − e kB T , (6.13)
kB T

119
II Vibrations d’un corps solide Thermodynamique des oscillateurs harmoniques

f HTLÑΩ
-1

-2

-3
0.0 0.5 1.0 1.5 2.0 2.5 3.0

kBTÑΩ

Figure 6.1 : Énergie libre d’un oscillateur harmonique On identifie la saturation à basse
température f (T ) −→ ε0 = 12 ~ω et le comportement classique de haute température f (T ) '
T →0
−kB T ln T (ligne en tirets).

mettant bien en évidence son comportement de basse température s(T ) ' ~ω T exp − kB T →

0. On retrouve également


 aisément le comportement classique de haute température s(T ) '
kB ln(kB T /~ω) + 1 .

2.0

1.5
gel quantique
sHTLkB

1.0
ré gime classique

0.5

0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0

kBTÑΩ

Figure 6.2 : Entropie d’un oscillateur harmonique.

II Vibrations d’un corps solide


Nous étudions un ensemble macroscopique d’atomes dans la limite extrême inverse de celle du
gaz parfait : le corps solide correspond à la limite où les atomes ont de très fortes interactions
mutuelles. Dans cette limite, les atomes ne sont plus indépendants, cependant nous allons pouvoir
identifier des degrés de liberté se découplant, afin d’écrire encore une fois l’énergie sous la forme
d’une somme de contributions associées à des degrés de liberté indépendants, les modes propres.

II.A Aspects microscopiques


Énergie du solide

Un solide peut être considéré comme une  grosse molécule , constituée d’un nombre ma-
croscopique d’atomes. Deux contributions importantes à l’énergie sont d’une part l’énergie des
électrons formant la liaison chimique entre atomes, que nous étudierons plus tard, et l’énergie
des ions :
Esolide = Eions + Eelectrons . (6.14)

Les ions se meuvent autour de leur positions d’équilibre, lentement à l’échelle de la dynamique des
électrons (cf. § II.A). Nous pouvons nous représenter l’énergie des atomes comme une énergie

120
Thermodynamique des oscillateurs harmoniques II Vibrations d’un corps solide

de vibration autour de positions d’équilibre (figure 6.3) : 1

N
X p~a 2 1 X
Hvibration ' + mω02 (~ra − ~rb )2 (6.15)
2m 2
a=1 ha,bi

où la somme porte sur les atomes voisins : ce deuxième terme décrit des énergies de liaison
(harmoniques) entre atomes plus proches voisins dans le cristal. Comme dans la discussion sur
la liaison chimique dans les molécules, les forces harmoniques résultent de la liaison chimique.
Cette forme de l’énergie est bien entendu une approximation au voisinage de l’état d’équilibre
du solide, loin de son point de fusion.

Figure 6.3 : Un modèle simple de solide : des atomes plus proches voisins en interactions
harmoniques, décrit par (6.15).

Modes propres de vibration


Le fait que l’énergie de vibration soit une forme quadratique des coordonnées des atomes, assure
l’existence d’une transformation linéaire de l’ensemble des coordonnées qui diagonalise l’énergie :
1 X
Epot = mω02 (~ra − ~rb )2 .. (6.16)
 
2 
. .
 .
ha,bi .. .. 
1   xa   1 X 3N
. . . . . .  
= m · · · xa ya za · · ·  . . .  y a
= m ωi2 qi2 (6.17)
2   za 
 2
.. .. i=1
. . .
| {z } ..
Ω2 : matrice 3N ×3N

où les ωi2 sont les 3N valeurs propres de la matrice Ω2 et les qi des combinaisons linéaires des
coordonnées atomiques (· · · , xa , ya , za , · · · ). Finalement, l’énergie mécanique s’écrit sous la forme
3N  2 
X pi 1 2 2
Hvibration = + mωi qi (6.18)
2m 2
i=1

où les 3N coordonnées {qi }, combinaisons linéaires des {~ra }, sont appelées les coordonnées
normales (cf. annexe 6.A page 136 pour l’analyse d’un exemple explicite). Autrement dit, la
diagonalisation de la forme quadratique donnant l’énergie potentielle nous a permis de reécrire
l’énergie de vibration comme la somme de l’énergie de 3N oscillateurs harmoniques unidimen-
sionnels indépendants (le nombre vient d’un argument de comptage des degrés de liberté associés
aux N atomes).
1
L’hamiltonien décrit l’énergie des ions et des électrons, mais pas l’excitation du gaz électronique, qui sera
analysée dans un chapitre ultérieur.

121
the origin notably straight for some distance before
falling oG. Karman model. A simple sketch will verify that it is
The frequency distributions for phonons in alumi- easy to interpolate graphically between symmetry
II Vibrations d’un corps solide
num and lead at 80'K are shown in Figs. 1 and 2. The
Thermodynamique
directions in aluminum with des at oscillateurs
least the accuracy harmoniquesof
integral for the total curve in each case is 1. The con- the complicated computer program involved in the
I.
tributions from the , T~, and T2 STEDMAN,
branches are shown ALMQVIS 1', AND NlLSSON
separately. In rounding oG the curves, phonon widths
have been taken into account, which means that each similar to ours in Table I, though with an interval of —,'6
phonon frequency is replaced by a distribution of in each q component, followed by a linear Taylor
frequencies about the same mean and with a small but ezpansion of frequencies locally in this network. Their
appreciable width: The only eGect worth mentioning resalts2 diEer from ours mainly in the relative intensities
is a broadening 4 and lowering of the high longitudinal of the peaks near 2.6 and 3.6, but in other details as
peak in both metals. well. (In comparing the two distributions it should be
'0 noted that theirs is not normalized as ours is. ) The
0s 3
2.3 Comments
O
on the Frequency Distribution source of the differences between the two distributions
for Aluminum must be in the frequencies for points oG the main
3 directions, since they have attained a
symmetry
The three3 peaks of the aluminum distribution are
02 Cb

CO remarkably close 6t for frequencies in the symmetry


easily referred to stationary points on dispersion curves. directions. Dr. Gilat kindly sent us the data which are
The maxima at (0.5,0.5,0.5) T, (1,0,0) T, and (0.6,0.6,0) their equivalent of our tables for aluminum, and we
L, , for which the respective frequencies are 2.64, 3.66,
have compared the two sets. The differences are ap-
and 5.45, turn out to be saddle points when examined parent in the two frequencies for q= (1,0.5,0): They
in three dimensions, and correspond3 closely 4 to the peaks have 004.45(Ts) .and
in the frequency distribution. 4) (lQ" t'ad s-') 4 .65.18(L,
S , Tt),
10 while1.2 the measured
14
values are 4.06 and ~ (10" red
5.00.a') The deviations from the
Gilat and Nicklow' have calculated a frequency
FIG. 1. correct values
FIG. 2. The aGect the shapes of the saddle points
distribution atThe
80'K
phonon-frequency
from our dispersion of aluminum.
distribution curves for phonon-frequency distribution of lead.
— previously mentioned; in the frequency distribution the
aluminum,
Figure 6.4 :using
DensitéBorn de vonmodesKarmande formulas
l’aluminium with (à gauche) et du plomb (à droite). Les courbes en
the rest of 'Formost markedC. e6ect is a displacement
B. Walker, Phys. Rev. 103, of 547 (1956)from
intensity
suitable(mu'+bee"),
parameters and determine u, b, and
to interpolate overtt to
a fit
network example:
traits fins représentent
the computed les contributions
distribution, utilizing the integraldes modes thelongitudinal
(aluminum);
of B. Woods,
D. the
A. in
peak T2(L) et transverses
contribution
136,
r'b@~
3.6 towards
781at(1964) (ta. (T1 et T2).
ntalum);higher
Cowley, A. D. B. Woods, and G. Dolling, ib@. 150, 487
R. A.frequencies.
Figures4 G.g(cu)
Gilat and to
out
tirées dethe
R. limit
M.: Nicklow,
R. Stedman,
chosen, together
Phys. Rev. L.
143,Almqvist
487 the value
with(1966). & G. of Nilsson,
(1966)  Phonon-frequency distributions and
(potassium).
g(~) and the slope of g(~) at the limit chosen. A good The discrepancy between the calculated frequencies
heat capacities of aluminium and lead , Phys.
approxiniate description of the first part of the distri-
Rev.of 162,
Gilat et549–557
al. and the(1967).
measured values is of interest;
bution in aluminium is (0.0151aP+0.000106~") and in outside the particular case of aluminum, since it
lead (1.33oP+39.6aP). For units, see Figs. 1 and 2. The illustrates the fallibility of the method which they and
Densité powerde7 in modes
the small: termpropriétés
is in good qualitative agree- several others' have used to derive phonon frequency
ment with the observed shapes of dispersion curves near distributions for metals, via an analysis of dispersion
Les fréquences
the origin de — modes
notably propres,
straight for somel’ensemble
distance before des 3N for symmetry {ω
curvesfréquences i } dépend
directions in terms a Born —von
du ofcristal. Nous
falling oG. Karman model. A simple sketch will verify that it is
n’aurons toutefois pas besoin d’informations précises sur ces fréquences, mais seulement de
easy to interpolate graphically between symmetry
The frequency distributions for phonons in alumi- 2
quelques propriétés
num and lead at très
80'K générales. Nous introduisons
are shown in Figs. 1 and 2. The la
directions densité de modes
in aluminum with at least the accuracy of
integral for the total curve in each case is 1. The X con- the complicated computer program involved in the
def
tributions from the I., T~, and T2 branches
ρ(ω)are=shown δ(ω − ωi ) (6.19)
separately. In rounding oG the curves, phonon widths i
have been taken into account, which means that each
caractérisant la distribution
phonon frequency is replaced by afréquences
de ces distribution : of
ρ(ω)dω indique le nombre de fréquences ωi dans
frequencies about the same mean and with a small but
l’intervalle [ω, ω + dω]. Les propriétés générales dont nous aurons besoin sont au nombre de
appreciable width: The only eGect worth mentioning 2
trois : is a broadening and lowering of the high longitudinal
peak in both metals.
1. Les fréquences se distribuent dans un intervalle fini ωi ∈ [0, ωmax ], le support de la distribu-
tion 2.ρ(ω).
3 Comments on the Frequency
L’existence Distributionmaximale ω
d’une fréquence max est un effet de réseau puisque celui-ci
for Aluminum
ne peut supporter des ondes de longueur d’onde inférieure 3 à λmin ∼ 1 Å correspondant au
The three peaks of the aluminum distribution are Cb

pas du réseau cristallin.


easily referred to stationary points on dispersion curves.
The maxima at (0.5,0.5,0.5) T, (1,0,0) T, and (0.6,0.6,0)
2. Règle de somme
L, , for which (sur lefrequencies
the respective nombre arede 2.degrés
64, 3.66,de liberté) :
and 5.45, turn out to be saddle points whenZ examined
ωmax
in three dimensions, and correspond closely to the peaks
in the frequency distribution.
dωρ(ω) = 3N 0 .
0 .4 .6 S 10 1.2 14 (6.20)
0 ~ (10" red a')
Gilat and Nicklow' have calculated a frequency
distribution at 80'K from our dispersion curves for FIG. 2. The phonon-frequency distribution of lead.
3. Ilaluminum,
existe des modes
using Born —acoustiques
von Karman de basseswith
formulas fréquences (les solides peuvent progager du son).
Dans
suitable laparameters
limite desto grandes
interpolate longueurs 'Forrelation
d’onde(aluminum);
over a network la example: C. deB.dispersion
Walker, Phys. prendRev. 103,la547 (1956) 3
forme
A. D. B. Woods, 136, 781 (1964) (ta. ntalum);
r'b@~

ω~k4 G. ~
' Gilat
||k||c s où cs est la vitesse du son. R. A. Cowley, A. D. B. Woods, and G. Dolling, ib@. 150, 487
and R. M. Nicklow, Phys. Rev. 143, 487 (1966). (1966) (potassium).

La troisième remarque nous permet de déduire le comportement générique de basse fréquence


de la densité de modes :
d~k
X Z
ρ(ω) = 3 δ(ω − ω~k ) ' 3 V δ(ω − ||~k||cs ) (6.21)
ωωmax (2π)3
~k
2
bien qu’il y ait une analogie avec la notion de densité d’états introduite pour décrire les propriétés spectrales
des problèmes quantiques, notons que ρ(ω) est une notion parfaitement classique.
3
Les modes peuvent être repérés par un vecteur d’onde ~k appartenant à la zone de Brillouni [17] (cf. annexe).

122
Thermodynamique des oscillateurs harmoniques II Vibrations d’un corps solide

où le facteur 3 provient du fait que pour chaque vecteur d’onde, existent trois modes de vibration
(un mode longitudinal et deux modes transverses). Finalement 4

3V
ρ(ω) ' ω2 (6.22)
ωωmax 2π 2 c3s

Il est donc remarquable que du point de vue des propriétés de basse énergie, toute la complexité
du cristal (nature des atomes, structure cristalline, etc) est encodée dans un unique paramètre cs .
Sur la figure 6.4 sont représentées les densités de modes de deux métaux, obtenues par
diffusion de neutrons. On observe bien le comportement quadratique à l’origine.

Quantification des modes propres : phonons

Les modes propres de vibration sont des combinaisons linéaires des variables de position ato-
miques. Il est donc naturel de quantifier ces oscillateurs. Les niveaux d’énergieP de vibration sont
donc caractérisés par 3N nombres quantiques (un par oscillateur) : E{ni } = i ~ωi (ni + 1/2).
Lorsque le mode de fréquence ωi est dans son ni ème niveau excité, on dira que le mode est occupé
par ni phonons. Un phonon représente un quantum d’excitation du mode. Si nous revenons au
labelling des modes à l’aide d’un vecteur d’onde, i → ~k, nous dirons que ~ω~k représente l’énergie
du phonon et ~~k son impulsion. 5 Nous interprétons la relation de dispersion linéaire ω~k ' ||~k||cs
comme caractérisant des particules de masse nulle.
Les phonons sont des particules émergentes apparaissant dans la théorie de basse énergie
décrivant les vibrations du cristal (notons que les phonons n’ont d’existence que dans le cris-
tal). Toutefois ces particules ne sont libres qu’à basse énergie, dans la limite où l’énergie peut
être considérée quadratique. À plus haute énergie, la physique des vibrations est sensibles aux
déviations à la forme quadratique (6.15), qui se manifestent sous forme de termes quartiques,
etc. Ces anharmonicités seront interprétées comme décrivant des interactions entre les phonons.
À la limite où la température est très élevée, il peut y avoir fusion du cristal.

II.B Thermodynamique des vibrations


L’étude de la thermodynamique des vibrations peut maintenant être menée très simplement :
nous devons considérer un problème de 3N oscillateurs harmoniques quantiques, décrits par
(6.18), dont les fréquences sont distribuées selon la densité de modes ρ(ω). Puisque le problème
est séparable, nous pouvons donc reprendre les résultats obtenus pour un oscillateur harmo-
nique et déduire les résultats analogues pour les oscillateurs indépendants.

Fonction de partition

L’indépendance des oscillateurs nous permet d’écrire que la fonction de partition du cristal est

3N
Y 1
Zvibration = zi où zi = β~ωi 
(6.23)
i=1 2 sinh 2
4
En principe les modes transverses (cisaillement) et longitudinal (compression) ne sont pas caractérisés par la
même vitesse de propagation. Dans ce cas on posera simplement 3/c2s = 1/c2L + 2/c2T où cL et cT sont les vitesses
du son associées aux différents types de modes.
5
Stricto sensu l’interpétation de ~~k comme une impulsion n’est valable que pour les petits vecteurs d’onde
(1/k  1 Å). Pour les plus grands vecteurs d’onde les effets liés au réseau perturbent cette image simple (cf. [17]).

123
II Vibrations d’un corps solide Thermodynamique des oscillateurs harmoniques

Énergie moyenne
Nous déduisons immédiatement l’énergie moyenne, qui prend la forme d’une somme de contri-
butions de termes (6.8) associées aux différents modes
3N   Z ωmax  
C
X ~ωi ~ωi ~ω ~ω
E vibration = + β~ω = dωρ(ω) + β~ω (6.24)
2 e i −1 0 2 e −1
i=1

Le premier terme correspond à l’énergie fondamentale du cristal (énergie à T = 0), que nous
notons : Z ωmax

Evide = dω ρ(ω) (6.25)
0 2
(l’énergie du  vide de phonon ). Le second terme s’interpète comme l’énergie des excitations,
i.e. du gaz de phonons : Z ωmax
C
E phonons = dω ρ(ω) ~ω nω (6.26)
0
où ~ω représente l’énergie d’un phonon, nω = eβ~ω1 −1 le nombre moyen de phonons occupant le
mode et dω ρ(ω) le nombre de modes dans l’intervalle.

Chaleur spécifique
La chaleur spécifique s’obtient de même en pondérant la chaleur spécifique de chaque mode par
la densité de modes :
C Z ωmax
∂E vibration ∂nω
CV (T ) = = dω ρ(ω) ~ω (6.27)
∂T 0 ∂T
d’où  2
Z ωmax ~ω
2kB T
CV (T ) = kB dω ρ(ω)    (6.28)

0 sinh 2kB T

Elle met en jeu l’intégrale d’un produit de deux fonctions : une fonction de largeur ωmax , la
densité de modes, et une fonction de largeur kB T /~, la chaleur spécifique d’un mode.

ρ(ω) kBT/h
1 1 ρ(ω)

kBT/h
ω
0 ω Max ω 0 ω Max

Figure 6.5 : Les deux fonctions intervenant dans le calcul de la chaleur spécifique (6.28).

Limite de haute température (T  ~ωmax /kB ).– Dans la limite classique, la seconde
fonction est très large à l’échelle de la densité de modes. On peut donc écrire (x/ sinh 2 ' 1 dans
R ωx)
max
l’intégrale, qui fait alors intervenir l’intégrale de la densité de modes CV (T ) ' kB 0 dω ρ(ω).
En utilisant la règle de somme (6.20), nous obtenons la loi de Dulong et Petit (1819) :

CV (T ) ' 3N kB (6.29)

Autrement dit la chaleur spécifique (classique) des solides est une loi universelle, indépendante
de la nature du cristal, de la structure cristalline etc.

124
Thermodynamique des oscillateurs harmoniques II Vibrations d’un corps solide

Limite de basse température (T  ~ωmax /kB ).– Dans la limite quantique, de basse
température, une partie des modes de vibration sont gelés et ne participent plus à la cha-
leur spécifique. Dans ce cas la fonction (x/ sinh x)2 sélectionne le comportement à l’origine de la
chaleur spécifique. On peut simplement injecter le comportement (6.22) dans (6.28) :
 2
Z Λ ~ω
3V 2kB T
CV (T ) ' kB dω ω 2   , (6.30)
2π 2 c3s


0 sinh 2kB T

où la borne supérieure Λ est une coupure qui correspond à la limite de validité du comportement
quadratique ρ(ω) ∝ ω 2 . Un changement de variable nous donne
3 Z ~Λ/(2kB T ) 3 Z ∞
dx x4 dx x4
 
3V 2kB T 12V kB T
CV (T ) ' kB 2 3 2 ' kB 2 . (6.31)
2π cs ~ 0 sinh x π ~cs sinh2 x
|0 {z }
π 4 /30

Comme il se doit, le comportement de basse température est indépendant de la coupure Λ. En


conclusion nous obtenons le comportement de la chaleur spécifique
3
2π 2

kB T
CV (T ) ' kB V pour kB T  ~ωmax . (6.32)
5 ~cs

Ce comportement universel CV (T ) ∼ T 3 est dans la pratique très bien vérifié (cf. figure 6.6).
Remarquons qu’il ne dépend
A1872de la nature du cristal
W.queH.viaLI
laEN
vitesse
AN du
0 son s . PH ILL I PS
N. cE.

r
0.5 1 I
1.0
I
IS TmLE IV. The heat capacity of rubidium; measurem
I
the liquid-helium temperature cryostat. The units of
~ I I I ~
1 I I

Potassium pacity are mJ mole ' deg '. Temperatures are based on
He4 scale. '
cu 5
'Cl
4
I 3,0
1.1991 24.07 4.0713 1009. 3.6579
1.3249 32.22 1.1952 23.83 4.0081
E 2 1.4630 43.46 1.3076 30.99 1.5881
1.6163 59.22 1.4365 41.12 1.7361
o 25 1.7867 81.31 1.5882 56.00 1.9055
1.9718 111.4 1.7523 76.35 2.0910
2. 1610 149.7 1.9314 104.3 2.2887
2.3660 200.3 2.1287 142.6 2.5015
2.0 2.0 2.5961 269.1 2.3342 191.4 2.7254
O.I 0.2 03 2.8521 361.7 2.5471 251.8 2.9798
T PK)
3.1428 486.5 2.7886 336.9 3.2642
Pro. 1. C/T versus T' for potassium. Q: liquid-helium cryostat;
3.4535 644.5 3.0530 445. 1 3.5784
o: adiabatic demagnetization cryostat. 3.7762 827.6 3.3361 581.4 3.9231

a See Ref. 10.


III. EXPERIMENTAL RESULTS
Figure 6.6 : Capacité calorifique du potassium. Figure tirée de W.H. Lien et N.E. Phillips,
The heatCcapacity
Phys. Rev. 133, A1370 (1964)). points obtained in the2 six experi-
V (T )/T en fonction de T est linéaire,tassium i.e. Cand
V (Tcesium
) = A taken
T + in the adiabatic dem
ments are presented in Tables I to VI.
3
B T . Le terme linéaire deIfCthe
V (Texperimental
) est la contribution du gaz d’électrons (masse effective m∗those
zation cryostat and = taken in the liquid-
heat capacity points were all cryostat do not join smoothly in the region of
1.25 me ) que nous étudierons au accuracy
of equal chapitrethe
9. best method of analysis of the In each case the
points obtained in the adiaba
data would be to plot C/T versus T' and to find y and magnetization cryostat are high. The discrepa
Nous pouvons retrouver A of ceEq.comportement
(4) from the intercept and limitingparslope
caractéristique at heat
le petit argument at 1.2'K, after the heat capacity
capacityheuristique
T'=0. In this work the measurements above 1'K are empty calorimeter is subtracted, is 1.3/0 for po
suivant : à une échelle de température T , seuls les modes de basse énergie t.q. ω . kB T /~ sont
expected to be appreciably more accurate than those and 3% for cesium, as will be seen in Figs. 1
excités et donc contribuent below à 1'K,
l’énergie.
and itLes modes de
is therefore plus hautes
appropriate fréquences
to give R Tsont toushasgelés
This discrepancy not been observed in ot
dans leur état fondamental. some La variation
weight to the d’énergie 1'K even
est donc
points above E(Tin) −theE(0) ∼ 0 dω
periments in ρ(ω) ~ω ∼
this apparatus, and is apparently
RT determination of y. This3 can be done through the re- ated with the fact that in these experiments
3 ∼ T 4 , d’où nous
dω ω déduisons C V ∼ T . Qed.
0 quirement that Eq. (5) represents the data at tem- introduced to the surface of the calorimeter
Au contraire du comportement CV ∼
peratures at which e−∆/kBfrom
deviations
T que nous avons obtenu dans to
Eq. (4) first became of directly l’étude d’un
the sample. This produces a superh
système possédant un spectre
important. This requirement
d’excitations avec uncan gap an le
have ∆, comportement
appreciable of the de basse énergie
calorimeter during the heating periods, w
aAect on the assignment of values of y and A. consequence that the heat loss from the calorim
There is a further complication in, the analysis of the surroundings during the heating period is
125
these experiments. The experimental points for po- than that estimated from the drift rates befo
after the heating period. This effect is not impor
TABLE III. The heat capacity of rubidium: measurements in
the adiabatic demagnetization cryostat. The units of heat ca-
II Vibrations d’un corps solide Thermodynamique des oscillateurs harmoniques

en loi de puissance CV (T ) ∼ T 3 caractérise une absence d’échelle caractéristique. Quelle


que soit l’échelle d’énergie à laquelle le système est sondé (kB T ), il existe des degrés de liberté
(des oscillateurs) pouvant être excités, i.e. recevoir/céder de l’énergie avec le thermostat. C’est
une simple conséquence de l’existence d’une densité de modes continue ρ(ω) ∼ ω 2 . L’échelle
ωmax n’apparaı̂t que comme une échelle de coupure (un  cutoff ), liée à l’échelle atomique,
signalant les limitations de la description continue de basse énergie.

Ordres de grandeur
Examinons la condition de  basse température  dans la pratique. Par exemple dans le cas de
l’aluminium (figure 6.4) la fréquence maximale est ωmax ' 6 × 1013 s−1 , ce qui correspond à une
échelle de température ~ωmax /kB ' 430 K. Le régime de basse température est donc facilement
atteint pour un échantillon d’aluminum. Dans le cas du plomb la fréquence maximale est plus
petite ωmax ' 1.4 × 1013 s−1 , i.e. ~ωmax /kB ' 100 K. Celui-ci est donc plutôt dans le régime
classique à température ambiante.

Énergie libre et potentiel chimique


L’analyse de l’énergie libre, la fonction fondamentale de l’ensemble canonique, recèle d’autres
informations intéressantes. Nous pouvons écrire l’énergie libre associée à la vibration comme
Z ωmax  
− ~ω
F (T, V ) = Evide + kB T dω ρ(ω) ln 1 − e kB T (6.33)
0
| {z }
Fphonons (T,V )

où le deuxième terme représente l’énergie libre du gaz de phonons (la dépendance dans le volume
est via la densité de modes ∝ V ). Cette forme permet d’insister sur l’absence d’unePloi de
conservation sur le nombre de phonons, dont le nombre moyen est N phonons = 3 ~k nω~k .
Les phonons ne représentent que de l’énergie, ce qui est associé ici au fait que ce sont des
particules de masse nulle, ou plutôt que le spectre des phonons ω~k ' ||~k||cs est sans gap (une
discussion plus précise de ce point sera proposée en entrée du chapitre 10).
Par conséquent l’énergie libre est indépendante du nombre de phonons et donc le potentiel
∂F
chimique des phonons est nul (µ = ∂N )

µphonon = 0 (6.34)

1.0

0.8
~ã -ÑΩDkB T
CV HTLH3NkBL

0.6
µT 3
0 0.05 0.1
0.06

0.4
0.04

0.2 0.02

0.0 0
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4

kBTÑΩD

Figure 6.7 : Chaleur spécifique du modèle de Debye. Comparaison entre la chaleur


(Einstein)
spécifique (6.37) (Debye) et la chaleur spécifique CV = 3N c(T ) du modèle d’Einstein
(3N oscillateurs identiques de même fréquence ωD ), où c(T ) est donnée par (6.10).

126
Thermodynamique des oscillateurs harmoniques II Vibrations d’un corps solide

Modèle de Debye
Le modèle que nous avons introduit est une variante du modèle proposé par Debye en 1912. Celui-
ci avait fait la simplification suivante : afin de manipuler une forme explicite de densité de modes,
on suppose que celle-ci est donnée exactement par la formule de basse énergie, équation (6.22),
sur l’intervalle
R ω [0, ωD ] où la fréquence de Debye ωD est choisie pour que la règle de somme soit
satisfaite : 0 D dω 2π3V2 c3 ω 2 = 3N ce qui conduit à
s

ωD = cs (6π 2 n)1/3 , (6.35)

où n = N/V ; on a retrouvé que la fréquence de coupure est associée à une longueur d’onde de
l’ordre de la distance interatomique. La fréquence de Debye est du même ordre que la fréquence
maximale ωD ∼ ωmax . Le modèle de Debye consiste donc à considérer une densité d’états (fi-
gure 6.8) (
3V 2
2 3ω si ω ∈ [0, ωD ]
ρ(ω) = 2π cs (6.36)
0 sinon

ρ(ω)
ρ(ω)

ω ω
0 ω Max 0 ωD

Figure 6.8 : Densité de modes du modèle de Debye. Le modèle de Debye consiste à


remplacer la densité de modes par une densité strictement parabolique sur un intervalle fini, de
telle sorte que les comportement quadratiques soient identiques et les aires sous les deux courbes
soient égales.

Le modèle fournit une expression de la chaleur spécifique

2T 3 TD /2T 3x4
  Z
def ~ωD
CV (T ) = 3N kB × dx où TD = (6.37)
TD 0 sinh2 x kB
qui permet de retrouver les comportements limites donnés plus haut, mais aussi d’analyser le
régime intermédiaire (figure 6.7). Par exemple nous pouvons re-écrire le comportement de basse
énergie (6.32) en fonction de la température de Debye

12π 4 T 3
 
CV (T ) ' N kB . (6.38)
T TD 5 TD
Les solides sont communément caractérisés par leurs températures de Debye dans les ouvrages.

Z solide TD ~ωmax /kB


6 Diamant (C) 1860 K
13 Aluminium (Al) 394 K 430 K
29 Cuivre (Cu) 315 K
46 Plomb (Pd) 88 K 100 K
47 Argent (Ag) 215 K
79 Or (Au) 170 K

Table 6.1 : Températures de Debye de quelques solides. Source : chapitre 23 de [2].

127
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

III Thermodynamique du rayonnement


III.A Description du problème du corps noir
Nous étudions un état du champ électromagnétique où celui-ci est à l’équilibre thermody-
namique. Autrement dit un gaz de photons à l’équilibre. Le champ électromagnétique est à
l’équilibre thermodynamique s’il interagit avec de la matière elle-même à l’équilibre thermody-
namique, via des processus d’absorption-émission. 6 Par exemple si nous considérons une cavité
dans laquelle se trouvent des photons interagissant avec les parois thermalisées. On parle de
corps noir pour désigner le rayonnement stocké dans la cavité ( noir  car la cavité n’émet pas
de rayonnement).
Une étoile fournit un exemple d’application du concept de  corps noir  : les photons
produits lors des réactions de fusion au cœur de l’étoile, se déplacent vers les couches externes
et subissent de nombreux processus d’absorption/émission. On peut considérer qu’avant d’être
émis par l’étoile, les photons étaient à l’équilibre thermodynamique avec la matière de la couche
externe. De plus l’émission de photons est suffisamment faible pour ne pas perturber l’équilibre.
Un autre exemple important qui réalise un corps noir est le fond diffus cosmologique : après le
big bang, la matière ionisée était à l’équilibre avec la lumière. Lors de l’expansion l’ensemble s’est
refroidi. Après ∼380 000 ans la température de l’univers était suffisamment basse pour permettre
la formation des atomes, ce qui a conduit à un découplage lumière-matière. Le rayonnement était
alors dans un état d’équilibre thermodynamique et l’est resté au cours de l’expansion, tout en
se refroidissant.

III.B Modes propres du champ électromagnétique dans une cavité


Modes propres
Nous considérons une cavité (une boı̂te supposée cubique) stockant de l’énergie électromagnétique.
~ r, t). Dans le vide, en l’absence de termes de source,
Le champ est décrit par le potentiel vecteur A(~
les équations de Maxwell conduisent à l’équation différentielle pour le potentiel vecteur :

1 ∂2 ~
 
∆ − 2 2 A(~r, t) = 0 . (6.39)
c ∂t
Les solutions dans le vide sont donc des ondes planes
~
~~k,± eik·~r−iω~k t où ω~k = ||~k||c (6.40)

Le vecteur ~~k,± peut prendre deux valeurs indépendantes correspondant aux états de polarisation
de l’onde plane (dans la jauge de radiation, 7 ~k ·~~ = 0). Dans la cavité les vecteurs d’onde sont
k,±
quantifiés pour satisfaire certaines conditions aux limites dépendant de la nature des parois. Un
6
Rappelons que l’équilibre thermodynamique ne peut être atteint que si des interactions permettent de redis-
tribuer l’énergie entre les différents degrés de liberté. Les photons sont des particules strictement sans interaction.
Le gaz de photons ne peut atteindre un équilibre thermodynamique que grâce aux interactions avec la matière. Le
problème du corps noir correspond donc à l’étude du rayonnement dans le problème de l’équilibre lumière/matière.
Ce problème ne se posait pas pour les phonons, pour lesquels l’absence d’interaction n’est qu’une approximation.
L’énergie de vibration d’un solide n’est qu’approximativement quadratique et l’on peut interpréter les anharmo-
nicités de l’énergie comme des termes d’interaction entre phonons. En outre les phonons interagissent avec les
électrons.
7
Rappelons que les deux équations de Maxwell divB ~ = 0 et −→
rotE~ = − ∂t
∂ ~
B (induction) contraignent les deux
−→
~ = rotA
~ et B −−→
~ = gradφ − A
∂ ~ où φ et A
~ sont les potentiels scalaire et vecteur.
champs vectoriels à être de la forme B ∂t
Étant donnée une distribution de charges, il reste cependant une liberté pour déterminer ces potentiels (choix
de jauge). Dans le vide, il est pratique d’imposer φ = 0 et divA~ = 0 (jauge de radiation), ce qui fixe alors les
potentiels de manière univoque.

128
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

mode propre du champ dans la cavité est donc décrit par le couple (~k, σ) où σ = ± indice les
deux états de polarisation. 8
La densité de modes est facilement calculée
d~k
X Z
ρ(ω) = δ(ω − ω~k,σ ) = 2 V δ(ω − ||~k||c) (6.41)
(2π)3
~k,σ

où le facteur 2 représente les deux états de polarisation. On obtient


V
ρ(ω) = ω2 pour ω ∈ R . (6.42)
π 2 c3
Cette expression est tout à fait similaire à la densité de modes de vibration du solide, si ce n’est
qu’elle n’est pas limitée aux hautes fréquences.

Énergie du champ électromagnétique


L’hamiltonien électromagnétique
" #
1
Z 
1

1
Z ~ 2
 ∂A 1  2
He−m = d~r 0 E~ 2 + ~2 =
B d~r 0 + ~ A
rot ~ (6.43)
2 V µ0 2 V ∂t µ0

~ r, t) = i~k·~
P ~
peut être écrit en termes du champ dans l’espace de Fourier A(~ √1 ~k A~k (t)e
r . Le
V
terme  cinétique  prend la forme 9

0
Z ~~ 2
0 X ~ 2 0 X ∂ A
d~r E~ 2 = E
~k = k
2 V 2 2 ∂t
~k ~k

et le terme  potentiel 
Z
1 ~2 = 1 X ~ 2 1 X~ 2 2
~
d~r B B~k = k A~k ,
2µ0 V 2µ0 2µ0
~k ~k

~~ = ~k × A
où l’on a utilisé B ~~ avec ~k ⊥ A ~~ dans la jauge de radiation. Finalement :
k k k
 ~
0 X ∂ A

~k 2 2 ~ 2

He−m = + ω~k A~k (6.45)
2 ∂t

~k

Cette dernière expression montre que la composante de Fourier A ~~ et sa dérivée temporelle


k
jouent le même rôle que les deux variables canoniquement conjuguées d’un oscillateur harmo-
nique. L’énergie électromagnétique est donc l’énergie d’une collection d’oscillateurs harmoniques
indépendants (un oscillateur pour chaque mode de la cavité)
8
L’existence de deux états de polarisation est reliée à la nature vectorielle du champ électromagnétique (le
potentiel vecteur). Un vecteur est un objet de  spin  S = 1, cependant le champ ne peut être que dans deux
états de polarisation indépendants, associés aux deux hélicités permises pour le photon (ceci est lié au fait que le
photon a une masse nulle et une vitesse c).
9
Pour transformer l’intégrale spatiale sur les champs en somme sur les modes, nous utilisons l’égalité de
def RL
Parseval-Plancherel. Soit f (x) une fonction définie sur [0, L] et fk = √1L 0 dx f (x) e−ikx sa transformée de
Fourier, i.e. f (x) = √1L k fk eikx . Rappelons que les vecteurs d’onde sont quantifiés en volume fini : k = 2nπ
P
L
avec
P
n ∈ Z pour des conditionsP aux limites périodiques. La notation  k g(k)  désigne précisément la sommation
sur les vecteurs quantifiés n∈Z g(kn ).
RL
En utilisant 0 dx eiqx = L δq,0 on obtient facilement que
Z L X
dx |f (x)|2 = |fk |2 . (6.44)
0 k

129
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

Quantification – photons
Comme dans le cas de l’énergie de vibration des solides, les oscillateurs harmoniques associés
aux modes propres du champ électromagnétique doivent être quantifiés. Un état quantique du
champ est donc caractérisé par l’état quantique de chacun des oscillateurs harmoniques. Les états
propres de l’énergie sont caractérisés par des nombres quantiques entiers n~k,± ∈ N indiquant
l’état d’excitation du mode. L’énergie de l’état stationnaire est
 
X 1
E{n~k,σ } = ~ω~k n~k,σ + (6.46)
2
~k,σ

On dira que le mode (~k, σ) est occupé par n~k,σ photons, ceux-ci représentant les quanta d’énergie
des modes du champ électromagnétique.
Tout comme pour l’analyse des vibrations d’un corps solide, il y a donc deux interprétations
physiques complètement équivalentes de l’énergie :

• Soit l’énergie d’un ensemble d’oscillateurs harmoniques (quantiques) indépendants, de pul-


sations {ω~k }.

• Soit l’énergie d’un gaz de particules sans interaction (les quanta des modes propres), de
nature bosonique (ce qui sera plus clair au chapitre 10), décrit par la relation de dispersion
p||c (avec p~ = ~~k et εp~ = ~ω~k ).
εp~ = ||~

Le rayonnement est donc décrit via un gaz de particules libres (sans interaction) : les photons.

III.C Thermodynamique du rayonnement


Fonction de partition et énergie libre
L’énergie electromagnétique est une énergie d’oscillateurs harmoniques indépendants. Nous déduisons
immédiatement que la fonction de partition est le produit de fonctions de partition pour chacun
des modes
Y 1
Ze−m = (6.47)
2 sinh(β~ω~k /2)
~k,σ

où le produit porte sur tous les modes propres de la cavité. L’énergie libre correspondante est :
X   X ~ω~
Fe−m (T, V ) = Evide + kB T ln 1 − e−~ω~k /kB T où Evide = k
(6.48)
2
~k,σ ~k,σ
| {z }
Frayon : contrib. du rayonnement

représente l’énergie fondamentale du champ électromagnétique (i.e. l’énergie du  vide de pho-


ton ). Par la suite nous remplacerons la somme sur les modes par une intégrale sur les fréquences
X Z ∞
−→ dω ρ(ω) . (6.49)
~k,σ 0

À ce niveau nous pouvons faire la même observation que pour les phonons : les photons ne
représentent que de l’énergie et leur nombre n’est pas contraint par une quelconque loi de
conservation. Cela se traduit par
µphoton = 0 (6.50)

130
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

Énergie moyenne
De même nous pouvons écrire l’énergie moyenne électromagnétique comme la somme de deux
termes :
E e−m (T, V ) = Evide + E rayon (T, V ) (6.51)
où le second terme représente l’énergie d’excitation, i.e. l’énergie du gaz de photons :
énergie d’un photon
Z ∞ z}|{ Z ∞
E rayon = dω ρ(ω) × ~ω × nω =V dω u(ω, T ) (6.52)
0 | {z } |{z} 0
# de modes # de photons
dans le mode

Afin d’identifier les contributions à l’énergie des différentes fréquences, nous introduisons la
densité spectrale d’énergie u(ω, T ) = V1 ρ(ω) ~ω nω par unité de volume.

Loi de Planck.– La densité spectrale d’énergie est donnée par la loi de Planck

~ ω3
u(ω, T ) = (6.53)
π 2 c3 e~ω/kB T − 1
C’est donc une loi universelle contrôlée uniquement par la température. Nous obtenons une
courbe avec un comportement quadratique aux petites fréquences (résultat classique, loi de
Rayleigh-Jeans) uRJ (ω, T ) = πkB2 cT3 ω 2 , présentant un maximum pour ωm ' 2.82 kB T /~, puis
décroissant exponentiellement aux plus hautes fréquences (gel des oscillateurs de haute fréquence).
La loi de Planck décrit assez bien la distribution spectrale du rayonnement solaire et extrêmement
bien celle du fond S174
diffus cosmologiqueL. Page
pourand une température
D. Wilkinson: T background
Cosmic microwave = 2.725 ± 0.002 K (figures).
radiation

portant to reject radiation from the ground, the galactic


plane, moon, etc., so usually beam sizes of a few degrees
are used with careful attention to shielding. Ideally, the
cold load can be connected to the horn antenna aperture
without disturbing the radiometer. It establishes an out-
put reading at a known temperature, a zero-point cali-
bration. Most experimenters use a good microwave ab-
sorber connected to a bath of boiling liquid helium, a
temperature conveniently close to TCMBR . The gain
(output units per Kelvin), is usually measured by making
a known change in the cold-load temperature. Gain fluc-
tuations are removed by periodically switching between
the antenna signal and a known, stable, source (Dicke,
1946). The more troublesome noise sources are gener-
ated skyward of the Dicke switch. These include atmo-
spheric emission, Galactic radiation, or emission from FIG. 2. The initial sky spectrum from the FIRAS instrument
within the instrument, for example, radiation from the aboard the COBE satellite. The solid line is a 2.735 K black-
inner walls of the horn antenna. As in any experiment body and the squares are the FIRAS results. There can be no
measuring an absolute number, all these must be accu- question that the universe is filled with thermal radiation as
rately measured and subtracted from the total measured required by the hot-big-bang model. This preliminary spec-
radiation temperature. In early experiments these extra- trum was based on nine minutes of data. The horizontal axis is
wave number (cm�1); the vertical axis is sky brightness. (Fig-
neous sources were as large as several K. In a well-
ure courtesy Edward S. Cheng, NASA/GSFC.)
designed modern experiment they are the order of a few
tens of mK.
Many measurements of the CMBR temperature have of the instrument, and to the blackness and broad fre-
Figure 6.9 : Densité
been made spectrale
from the ground,duballoons,
corpshigh-flying
noir. air-Comparaison
quency range ofde thelacolddistribution
load. du rayon-
craft,laand One version of the COBE/FIRAS spectrum is shown
nement solaire avec loia satellite.
de Planck (For comprehensive
du corps reviews see
noir (gauche) et du fond cosmologique
in Fig. 2. This is the first spectrum seen by the (droite).
COBE
Weiss, 1980, and Partridge, 1995.). From the ground one
Figure de droite tirée de : L. Page & D. Wilkinson,
needs to measure and subtract emission from atmo- Rev. team
Mod.only a month
Phys. after
71, COBE’s
S173 launch
(1999).in November,
spheric oxygen and water vapor. This can be hundreds 1989. When John Mather (COBE Project Scientist and
FIRAS Principle Investigator) showed it to a packed
of Kelvin near emission lines or a few Kelvin in the
session of the American Astronomical Society’s January
atmosphere’s microwave windows. Long-wavelength
1990 meeting, the audience stood and applauded. Sub-
measurements (�� 20 cm) are still made from the
Loi de Stefan-Boltzmann.– Nous pouvons déduire sequent
ground because appropriate antennas are large and
la densité volumique
careful analysis d’énergie
of the FIRAS totale
data has greatly
(énergie du rayonnement
cumbersome. par unité de
At centimeter volume)
wavelengths, : offer improved
balloons
the accuracy of the results. The FIRAS team
has shown that the sky spectrum fits a 2.728�0.004 K
a good way of reducing atmospheric emission to an ef-
Z ∞ instru- blackbody
fective temperature of a few mK. Balloon-based
spectrum to an accuracy of 0.01% at wave-
lengthsπbetween 5 mm
ments have achieved �1% E rayon
accuracies at wavelengths
2 (k T )4 and 0.5ofmm
Bmeasurement
(Fixsen et al., 1996).
between e1tot
cm(T and) 3=cm. = dω u(ω, T A) temperature
= 3
this accuracy is not par-
(6.54)
V ticularly
15useful in cosmology,
(~c) but the spectral fit is very
However, the field was changed forever
0 by a CMBR important. Only the hot-big-bang model predicts, or ac-
spectrum measurement from the Cosmic Background
counts for, such an accurate fit to a Planck spectrum.
Explorer (COBE) satellite. The Far-Infrared Absolute
Within two weeks of the announcement by the
Spectrophotometer (FIRAS) compared the spectrum 131 of COBE/FIRAS team, a very similar result was reported
the sky with that of a very black cold load (emissivity
by Gush, Halpern, and Wishnow (1990), who used a
�0.99997) whose temperature was accurately measured
rocket-borne spectrometer. Their result would have pre-
(Mather et al., 1990). The instrument was a scanning
dated the COBE/FIRAS result except that an erroneous
Fourier-transform spectrometer with one input coupled
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques
S175
L. Page and D. Wilkinson: Cosmic microwave background radiation

FIG. 3. (Color) The final four-year sky map (in galactic coordinates) produced by the DMR experiment aboard COBE. Some of
the stronger features seen off the galactic plane are due to real CMBR anisotropy. The 2.73 K CMBR level, the 3.3 mK dipole, and
most of the galactic emission have been subtracted to obtain this map. The temperature range is �150 �K. (Figure courtesy COBE
Science Working Group, NASA/GSFC.)

Figure 6.10 : Anisotropie du fond cosmologique. Figure tirée de : Lyman Page & David
�100 � K, so extraordinary detector sensitivity and sta- The COBE/DMR result was quickly confirmed using
Wilkinson,  Cosmic microwave background radiation , Rev. Mod. Phys. 71, S173 (1999).
bility are needed. Also, care must be taken to avoid data from an earlier MIT balloon experiment, the Far
changes in the signal from antenna side-lobes when Infrared Survey (FIRS). The measurement was made
moving the antenna beams, and the effects of atmo- using bolometric detectors at 170 GHz and higher. On
spheric
que emission
nous and galactic
associons radiation spécifique
à une chaleur must be mini- their own, the FIRS data were too noisy and contami-
mized. Early experimenters spent many years develop- nated by spurious effects to permit an unambiguous iso-
ing receivers and techniques for observations from the lation of the
 CMBR 3 anisotropy signal. However, cross
CV (Tsuccessfully
) ∂etot (T 4π 2
) correlation kBthe
of T FIRS
ground, balloons, and aircraft. They = de- = kB . map with the COBE/DMR(6.55) map
tected the dipole effect, a Doppler shift V due to the∂T sun’s showed
15 a strong ~c common signal. The much higher fre-
velocity with respect to the CMBR frame. The dipole quency of the FIRS data provided a measurement of the
amplitude is 3.3 mK, �10�3 TCMBR . However, the early spectrum of the common signal; it matched that ex-
experimentslibre
Énergie failedet to pression
separate thede important
radiationintrinsic pected from a 2.73 K blackbody (Ganga et al., 1993).
CMBR anisotropy from spurious effects. After COBE, interest in the CMBR anisotropy turned
NousBy the late 1970s,
revenons the lessonsde
à l’analyse learned from the
l’énergie early
libre to measurements
(contribution at smaller angular
du rayonnement) : scales. Again, ex-
experiments led to the design of the COBE satellite’s perimenters have used ground- and balloon-based in-
differential microwave radiometers (DMR) which 1 con-∞ struments with  coherent receivers, bolometric detectors,
Z
clusively detected the CMBR anisotropy V ) =a year of dωand
Frayon (T,after ρ(ω) ln 1 − e−β~ω
interferometers (see Page, 1997, for a review).(6.56)
Since
orbital data had been analyzed (Smoot et al., 1992). β The0 the COBE/DMR measured anisotropy only at angles
COBE/DMR experiment used differential radiometers �7°, it was natural for the experiments to move to
at 31,
En 53, and 90que
utilisant GHzlatodensité
map the spectrale
sky with beams
est ofune7° loi smaller angular scales.
de puissance simple,Also, theorists
nous had found
pouvons faire that,
une
full width. The three frequencies were needed to sepa-
d 1 during. On
the decoupling process of the standard model,

intégration par partie en écrivant ρ(ω) = ωρ(ω) obtient
rate the CMBR anisotropy from Galactic radio emis- dω 3 certain angular scales are enhanced, embedding measur-
sion. These sources have different, but known, Z ∞ fre- able features in the angular power spectrum of the
quency dependence. The rms amplitude of1 the CMBR 1 (e.g., Bond and Efstathiou, 1987).
dω ρ(ω) CMBR
~ω anisotropy
Frayon (T, V ) = − = − E rayon (T, V ) (6.57)
on angular scales �7° was found to be 30�5 3 0� K. One These e β~ω −were
1 predicted
3 to appear at scales from about 1°
sees why terrestrially based experiments had so much to 0.1°. Experimental progress at these intermediate an-
trouble separating the CMBR anisotropy
d’où, en utilisant la loi de Stefan-Boltzmann from the ef- gular scales has been rapid, with all three detection tech-
fects of the 300 K background of the Earth’s environ- niques contributing to the current picture. Figure 4
ment. After four years of data the signal-to-noise ratio shows a plot of4 the average of many measurements of
in regions of the COBE/DMR map away from the ga- π 2 (k
CMBR BT )
anisotropy amplitude vs angular scale. (Angles
Frayon (T, V ) = −are V (6.58)
lactic plane was about 2, so the CMBR anisotropy was (~c)3 by the spherical-harmonic index l ,
45 represented
clearly detected (Bennett et al., 1996). Figure 3 shows a angle �180°/ l .) The solid line shows the prediction of a

has been subtracted using data


(T, V ) = −prayon (T ) representative
four-year COBE/DMR map in which the galactic signal
L’extensivité implique Frayon from all three COBE/
theoretical model. One is impressed that
V . Nous déduisons la pression du gaz de pho-
the measurements indicate increased fluctuations at
tons
DMR(pression
frequencies.de Theradiation)
subtraction is not complete near about the angular scales predicted by the models. How-
the galactic plane. 2ever, even
π (kB T ) 4 after averaging over all measurements avail-
prayon = (6.59)
Rev. Mod. Phys., Vol. 71, No. 2, Centenary 1999
45 (~c)3

Cette expression correspond à l’équation d’état du gaz de photons.


Une petite application numérique donne une pression (au voisinage du soleil) prayon ' 0.33Pa
pour T = 5800 K.

132
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

Comparaison avec le gaz classique.– On peut comparer l’équation d’état des photons
(6.59) avec l’équation d’état classique p = nkB T en exprimant la pression en terme de la densité
moyenne de photons :
1 ∞ 2ζ(3) kB T 3
Z  
n= dω ρ(ω) nω = (6.60)
V 0 π2 ~c
(l’intégrale est donnée dans le formulaire, annexe A). Nous re-écrivons l’équation d’état comme

ζ(4)
prayon = n kB T . (6.61)
ζ(3)

Le facteur est peu différent de l’unité : ζ(4)/ζ(3) = 0.900 393...

Voile solaire.– Notons que la pression exercée par les photons (loin du soleil) a permis à la
voile solaire Nanosail, lancée avec le satellite Ikaros en mai 2010 et déployée en janvier 2011, de
se déplacer autour de la terre pendant quelques mois (figure).

Figure 6.11 : Vue d’artiste de la voile solaire déployée en janvier 2011.

Pression Casimir (hors programme)


Revenons sur la présence de l’énergie du vide dans les différentes quantités rencontrées précédemment.
Cette contribution a le mauvais goût d’être infinie :
X ~ω~
k
Evide = =∞ (6.62)
2
~k,σ

Sa présence peut toutefois se manifester, à condition de pouvoir faire svarier un paramètre dont
elle dépend. Si par exemple on considère deux plaques métalliques séparées par une distance
a, celles-ci imposent des conditions aux limites qui affectent la distribution des fréquences. En
faisant l’hypothèse simplifiée que la présence des plaques impose des conditions de Dirichlet, les
fréquences des modes propres entre les plaques sont caractérisées par une densité de modes

d2~kk
Z  
Sa
X q
ρ(avec plaques)
(ω) = 2 S 2 ~
δ ω − c (nπ/a) + kk 2 = 2 3 ω 2 +δρ(ω) (6.63)
(2π) 2
n=1 |π c{z }
Weyl

où S est la section des plaques. La composante ~kk parallèle aux plaques n’est pas quantifiée,
seule la composante perpendiculaire k⊥ = nπ/a est quantifiée, conséquence de l’introduction
des conditions aux limites. Le premier terme est le terme de Weyl, obtenu à la limite a → ∞
où le spectre des fréquences propres peut être considéré continu. Le second terme δρ(ω), i.e. la

133
canning electron micro- 350 nm) the Casimir force is the dominant characteristic
d cantilever with sphere far exceeding all the systematic errors (the electrostatic
III Thermodynamique
he sphere diameter was duof rayonnement
force is less than 3% the Casimir force in this region). Thermodynamique des oscillateurs harmoniques
196 mm. The average Region 3 is the flexing of the cantilever resulting from VOLUME 81, NUMBER 21 PHYSICAL REVIEW LETTERS
lized surfaces was mea- the continued extension of the piezo after contact of
the two surfaces. Given the distance moved by the flat a flat plate using an AFM. The m
ntilever is measured by plate (x axis), the difference signal of the photodiodes consistent with the corrections f
can be calibrated to a cantilever deflection in nanometers and roughness of the metal surf
beam is reflected off the
fabrication of cantilevers with a
ection. A force on the using the slope of the curve in region 3. The deflection interferometric detection of canti
er deflection leading to of the cantilever leads to a decrease in the sphere-plate of lower temperatures to reduce
odiodes A and B (shown over 1000, improvement in the
sible in the future using this tech
implications of the Casimir force
ments should allow for careful c
properties of vacuum.

*Author to whom corresponde


Email address: umar.mohideen
[1] H. B. G. Casimir, Proc. K. N
FIG. 4. The measured average Casimir force as a function (1948).
of plate-sphere separation for 26 scans is shown as square [2] E. Elizalde and A. Romeo, Am
dots. The error bars show the range of experimental data [3] G. Plunien, B. Muller, and W
at representative points. The theoretical Casimir force from 87 – 193 (1986); V. M. Mostep
Eq. (4) with all corrections is shown as a solid line. The The Casimir Effect and Its
rms deviation between the experiment and theory is 1.6 pN. London, 1997).
The dash-dotted line is the Casimir force without the finite [4] S. K. Blau, M. Visser, and A.
conductivity, roughness, or temperature correction [Eq. (1)] 163 – 180 (1988); X. Li, H. C
xperimental setup. Appli- which results in a rms deviation of 6.3 pN. The dashed line Phys. Rev. D 56, 2155 (1997).
s in the movement of the includes only the finite conductivity correction [Eq. (2)] which [5] R. Golestanian and M. Kardar
ments were done at a pres- FIG. 2. Scanning electron microscope image of the metallized results in a rms deviation of 5.5 pN. The dotted line includes
only the roughness correction leading to a rms deviation of (1997); L. H. Ford, Phys. Rev
rature. sphere mounted on a AFM cantilever. 48 pN. Cole and H. E. Puthoff, Phys
R. L. Forward, Phys. Rev. B 30
[6] E. M. Lifshitz, Sov. Phys. JETP
[7] H. B. G. Casimir and D. Polder
Figure 6.12 : Effet Casimir. Mesure de la force Casimir entre
height of the solid une
square bouleto et
corresponds une surface
the average de-
[8] E. S. Sabiski and C. H. Ander
viation observed in the 26 scans. The theoretical Casimir
métallisées. Figures tirées de U. Mohideen & A. Roy,force
”Precision measurement of the Casimir (1973); D. Tabor and R. H. S. W
from Eq. (4), with no adjustable parameters, is 219, 1120 (1968).
Force from 0.1 to 0.9 µm”, Phys. Rev. Lett. 81(21) 4549shown as a solid line. The plasma frequency vp corre-
(1998). [9] C. I. Sukenik, M. G. Boshier, D
sponding to a wavelength of 100 nm was used in the theo- E. A. Hinds, Phys. Rev. Lett. 7
reticalqcurve [19]. The root mean square (rms) deviation [10] T. H. Boyer, Phys. Rev. 174, 1
s � �Fexpt 2 Fth �2 �N � 1.6 pN, where Fexpt and Fth [11] M. J. Sparnaay, Physica (Utrec
in the Making, edited by A. Sa
différence entre la somme et l’intégrale, traduit l’effet des plaques
are the experimentalmétalliques sur laforce
and theoretical Casimir distribution
values,
(North-Holland, Amsterdam, 1
respectively, and N � 256 is the number of data points.
des fréquences, c’est à dire l’effet de la quantification. Ce This deviation s which is 1% at the smallest surfacevariation
terme permet de quantifier la sepa-
[12] S. K. Lamoreaux, Phys. Rev. L
[13] V. B. Bezerra, G. L. Klimchitsk
ration can be taken
d’énergie induite par l’introduction des deux plaques métalliques : as a statistical measure of the experi- Phys. Lett. A 12, 2613 – 2622 (
mental precision. The dash-dotted line in Fig. 4 is the [14] A. A. Maradudin and P. Mazu
Casimir
Z ∞ force without the finite conductivity, roughness, (1980); 23, 695 (1981); M. Y.
(avec plaques) (sans plaques) or temperature corrections~ω [Eq. (1)] which results in a s V. Y. Chernyak, Teor. Mat. Fiz
Evide − Evide = of 6.3 pNdω(5% δρ(ω)
deviation at the smallest surface separa- (6.64) [15] M. Bordag, G. T. Gillies, and
tion)
0 between experiment 2 and theory. The dashed line Rev. D 56, 1 (1997).
includes only the finite conductivity correction [Eq. (2)] [16] J. Blocki, J. Randrup, W. J. S
which results in a s of 5.5 deux
pN (5% deviation Ann. Phys. (N.Y.) 105, 427 (1
Le calcul précis nécessite quelques régularisations afin de manipuler ces infinis.at Enthe small-
est separation). The dotted line includes only the rough-
prenant [17] J. Schwinger, L. L. DeRaad, J
Phys. (N.Y.) 115, 1 (1978).
compte plus rigoureusement l’effet des conditions auxness limites
correction(qui imposent
leading to a s of 48des conditions
pN (40% deviation de [18] J. Mehra, Physica (Utrecht) 37
at the closest separation). The ~k theoretical finite conduc-
Dirichlet seulement pour la composante parallèle du champ électrique, E = 0 sur les plaques)
tivity correction and roughness correction are observed to
[19] Handbook of Optical Constant
Palik (Academic Press, New Y
on obtient finalement be consistent with the measurement. The experiment has [20] P. B. Johnson and R. W. Chri
been repeated for different cantilevers, spheres, and plates. (1972).
(sansInplaques)
conclusion,
" (avec plaques) #we have performed a precision measure- [21] William R. Smythe, Electrost
∂ E vide − E ment of the Casimir force between
vide π 2 ~ca metallized sphere and (McGraw-Hill, New York, 195
pCasimir = − =− (6.65)
∂a S 4552 240 a4

Cette pression négative décrit une petite force attractive entre les plaques métalliques.
Elle a pu être mesurée à la fin des années 1990 grâce à un microscope électronique, en
mesurant la force entre une boule et une surface métallisées (figure 6.12).

134
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

, Les idées importantes


• Retrouver les propriétés thermodynamiques pour un oscillateur harmonique.
• La distribution de Bose-Einstein (l’occupation moyenne de l’oscillateur thermalisé) nω =
1
eβ~ω −1
.
• La notion de densité de modes ρ(ω).
• Loi de Planck, loi de Stefan-Boltzmann (savoir retrouver la dépendance en température utot ∝
T 4 ).
• Le potentiel chimique des phonons et des photons est nul.

+ Pour en savoir plus


• Sur la thermodynamique de l’univers : chapitre 10 de [28].
• Sur la quantification du champ électromagnétique : [9].
• Sur l’effet Casimir : l’article de B. Duplantier,  Introduction à l’effet Casimir , Séminaire
Poincaré 1, pp. 41–54 (2002).

135
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

Annexe 6.A : Modes propres d’une chaı̂ne de ressorts


Afin de clarifier la notion de modes propres, on discute les modes mécaniques d’une chaı̂ne de
ressorts, i.e. un modèle de  cristal unidimensionnel . 10 Considérons N masses sur une ligne,
reliées entre elles par des ressorts identiques, de longueur à vide a. L’hamiltonien est :
N  2 
X p n1
H= + mω02 (xn − xn−1 )2 (6.66)
2m 2
n=1

(eq)
où xn = Xn − na mesure l’écart à la position d’équilibre Xn = na de la masse numéro n.
Pour simplifier nous supposons x0 = xN (i.e. des c.a.l. périodiques). L’identification des modes
propres correspond à la diagonalisation de la forme Pquadratique, i.e. au changement
P 2 2 de variables
1 2 2 1
{xn } → {χk } permettant d’écrire Ep = 2 mω0 n (xn − xn−1 ) = 2 m k ωk χk . Autrement
dit, en introduisant le vecteur X regroupant toutes les coordonnées, l’identification des modes
propres correspond à la diagonalisation de la matrice Ω2 intervenant dans Ep = 12 mX T Ω2 X ;
les ωk2 sont les valeurs propres de la matrice Ω2 .
Dans Ple cas présent cet exercice est très facile : nous introduisons les variables normales
χk = N n xn e−ikn , où le paramètre appartient à la  première zone de Brillouin  k ∈]−π, +π]
√1

(périodicité du problème). De plus les conditions aux limites périodiques, x0 = xn , imposent la


quantification du vecteur d’onde k = 2πm N P avec m ∈ {−N/2 + 1, · · · , N/2} (si N est pair). On
vérifie sans difficulté 11 que Ep = 21 mω02 k |1 − e−ik |2 χk χ−k . Finalement, en introduisant la
variable conjuguée πk = ∂∂L χ̇k = mχ̇−k de χk , nous obtenons

X  |πk |2 1

H= + mωk2 |χk |2 où ωk = 2ω0 | sin(k/2)| (6.67)
2m 2
k

est la relation de dispersion des ondes de compression de la chaı̂ne de ressorts. Remarquons


qu’elle présente bien le mode acoustique ωk ∝ |k| pour les petits vecteurs d’ondes. Dans la limite
thermodynamique, N → ∞, le spectre de la chaı̂ne est donc continu et borné, ωk ∈ [0, 2ω0 ].
- Exercice 6.1 : On considère la chaı̂ne de ressorts. En remarquant que la matrice des
fréquences est tridiagonale
.
.. ...

. 
 ..
2 −1

Ω2 = ω02 
 
.. 

 −1 2 .
.. ..
. .
retrouver le spectre des fréquences propres et clarifier le lien entre les coordonnées normales et
les vecteurs propres de la matrice.
- Exercice 6.2 : Pour analyser P le cas des dimensions supérieures, considérons le modèle
1 2 2
élastique suivant : Ep = 2 mω0 hR, ~ R ~ − hR
~ 0 i (hR ~ 0 ) où hR
~ est le déplacement (scalaire) du site
~
R au nœud d’un réseau hypercubique de dimension d. La somme porte sur les sites voisins du
réseau (i.e. sur les liens) ; dans le réseau hypercubique, chaque nœud R ~ possède 2d voisins en
~
R ± ~ui avec i ∈ {1, · · · , d} où les ~ui forment une base orthornormée. Le terme d’énergie cinétique
10
L’emploi des guillemets est motivé par un théorème général et très important dans l’étude des transitions de
phases, le théorème de Mermin-Wagner, qui interdit en particulier la formation d’un cristal en dimension d = 1
et d = 2. Dans le cas présent : l’ordre à longue portée (le cristal) est détruit par les fluctuations thermiques (cf.
chapitre 4 de [33]), mais aussi par les fluctutations quantiques à température nulle (cf. exercice 7.8 de [34]).
11
On utilisera N ikn
= N δk,0 où il est entendu que k est quantifié comme k = 2πm
P
n=1 e N
.

136
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

est Ec = 12 m R~ ḣ2~ . Déduire les équations du mouvement. Montrer que la relation de dispersion
P
R
des modes propres est donnée par
v
u d
uX
ω~k = 2ω0 t sin2 (ki /2) (6.68)
i=1

où ki ∈] − π, +π]. Analyser la limite ~k → 0. Ce modèle simplifié s’applique-t-il au mode de


compression (longitudinal) ou aux modes de cisaillement (transverses) ?

137
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

Annexe 6.B : Corde vibrante : quantification  classique  versus


 quantique 

L’étude des vibrations d’une corde vibrante rend assez claire la distinction entre le phénomène
classique de quantification des modes propres d’une équation d’onde, induite par des conditions
aux limites, et la quantification de la mécanique quantique.
Nous étudions la thermodynamique d’une corde vibrante fixée à ses deux extrémités (fi-
gure 6.13). Commençons par exprimer l’énergie de la corde caractérisée par une déformation
y(x). L’énergie élastique d’un segment est proportionnelle à son élongation : la contribution du
∂y 2
δx + δy − δx ' f 2δx ∂x
p 
segment de longueur initiale δx est δEp = f 2 2 , où f est la tension
µδx ∂y 2
de la corde. L’énergie cinétique du segment est δEc = 2 ∂t où µ est la masse linéique. En
sommant ces contributions, on obtient l’énergie :
"   #
1 L ∂y(x, t) 2 ∂y(x, t) 2
Z  
E[y(x, t)] = dx µ +f . (6.69)
2 0 ∂t ∂x

2 δ y2
δx +
δy
y(x)
δx
x
0 L

Figure 6.13 : Corde vibrante fixée entre deux points.

Quantification classique – Modes propres.– La situation où la corde est fixée à ses
deux extrémités correspond à un choix de conditions aux limites de Dirichlet pour le champ
de déplacement y(x, t). Nous pouvons décomposer le déplacement en série de Fourier
r ∞  
2X kπx
y(x, t) = yk (t) sin , (6.70)
L L
k=1
p
où le facteur 2/L est introduit par commodité afin de décomposer le champ de déplacement
p RL
sur une base de fonctions, uk (x) = 2/L sin(kπx/L), orthonormées : 0 dx uk (x) uk0 (x) = δk,k0 .
On vérifiera que l’énergie se reécrit dans les composantes des modes comme

"  2 #
X 1 2 1 kπ 2
E[{yk (t)}] = µ ẏk (t) + f yk (t) . (6.71)
2 2 L
k=1

y1HxL y2HxL y3HxL


1.0 1.0 1.0

0.5 0.5 0.5

xL xL xL

···
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0
-0.5 -0.5 -0.5

-1.0 -1.0 -1.0

Figure 6.14 : Les trois premiers modes propres de vibration de la corde.

Le Hamiltonien est fonction des coordonnées canoniquement conjuguées (yk , pk = µ ẏk ) :


∞  
X 1 2 1 2 2
H[{yk , pk }] = p + µ ωk yk . (6.72)
2µ k 2
k=1

138
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

Nous avons introduit les fréquences propres de vibration


πc
ωk = k avec k ∈ N∗ . (6.73)
L
p
c = f /µ est la vitesse de propagation d’une onde dans la corde. Jusqu’ici le problème est
parfaitement classique.

Quantification de la mécanique quantique.– L’énergie de chaque mode a la forme de celle


d’un oscillateur harmonique unidimensionnel :
1 2 1
Hmode k = p + µ ωk2 yk2 . (6.74)
2µ k 2
Si la corde est une corde de piano, une description quantique du problème semble inutile. Si
l’on s’intéresse à un microrésonateur, comme une corde de nanotubes de carbone (figure 6.15),
il peut être raisonnable de le décrire dans un cadre quantique.

Antenne RF
Corde de nanotubes
de carbone hω
1111111
0000000 1111111
0000000
0000000
1111111 0000000
1111111
1111111
0000000
0000000
1111111
1111111
0000000
0000000
1111111
Au
Re
0000000
1111111 L =1.7 µ m 0000000
1111111
0000000
1111111
Si 3 N 4 0000000
1111111
0000000
1111111 0000000
1111111
Si

Figure 6.15 : Spectre de vibration d’une corde de nanotubes de carbone. Schéma


de l’expérience : une corde suspendue de (≈ 200) nanotubes de carbone est traversée par un
courant I = 2 µA. Les modes de vibration de la corde (dans un état supraconducteur à T =
120 mK) sont excités par un champ électromagnétique radio-fréquence. Expérience : B. Reulet,
A. Yu. Kasumov, M. Kociak, R. Deblock, I. I. Gorbatov, V. T. Volkov, C. Journet & H. Bouchiat,
Phys. Rev. Lett. 85, 2829 (2000). Figure tirée de [34].

L’énergie de chaque mode est alors quantifiée comme


 
(mode k) 1
En = ~ωk n + où n ∈ N . (6.75)
2

La quantification de l’énergie de vibration s’accompagne de la quantification des autres obser-


vables, comme l’amplitude des oscillations, ou de la
q
vitesse. Par exemple, l’état excité | ϕn i du
2

mode k correspond à des oscillations d’amplitude yk avec
 

2 ~ 1
yk | ϕ n i = n+ (6.76)
µωk 2

(la moyenne est purement quantique).


En conclusion : la  quantification classique  correspond à la quantification des longueurs
d’onde pour le champ de déplacement le long de la corde (reliée à l’existence de nœuds et ventres
de vibration, figure 6.14) alors que la  quantification quantique  correspond à la quantification
de l’amplitude des oscillations.
- Exercice 6.3 : Comment la valeur quadratique moyenne yk2 dépend-t-elle de la température

si la corde est à l’équilibre thermodynamique ?

139
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

Annexe 6.C : Cristal – Approximation harmonique et indiscer-


nabilité
Position du problème
Si l’on considère N atomes en interaction
N
X p~i 2
H({~ri , p~i }) = +U (~r1 , · · · , ~rN ) , (6.77)
2m
i=1
| {z }
Hcin

les atomes sont des particules identiques qui doivent être traitées comme des particules indis-
cernables, dont la fonction de partition est, dans l’approximation semiclassique,
N
Z Y
1 d~ri d~pi −βH({~ri ,~pi })
Z= 3
e . (6.78)
N! h
i=1

Le préfacteur 1/N ! est l’expression de l’indiscernabilité des atomes au niveau semiclassique.


D’autre part, le développement de l’énergie potentielle au voisinage du minimum (approxi-
mation harmonique), équation (6.15), a conduit à un problème d’oscillateurs harmoniques dis-
cernables :
Z Y3N
dqi dpi −β Pi 1 p2i + 1 mωi2 qi2

Zvib = e 2m 2 . (6.79)
h
i=1
Nous souhaitons ici clarifier comment on passe des atomes indiscernables aux oscillateurs dis-
cernables.

Approximation harmonique
Si la température est abaissée suffisamment, le système pourra éventuellement atteindre une
phase cristalline (selon la nature de l’interaction). Si tel est le cas, le potentiel possède des
minima correspondant à l’état stable de la  molécule macroscopique  (le solide). Une particule
verra typiquement un profil d’énergie comme celui de la figure 6.16 (pour simplifier la discussion
nous nous plaçons dans la situation unidimensionnelle).

U
0 ρ1 0 ρ2 0 ρ3 0 ρN

...
R1 R2 R3 RN

Figure 6.16 : Représentation (très) schématique du potentiel  vu  par un atome, dans la


phase cristalline.

Lorsque la température est suffisamment basse (devant la hauteur des puits de potentiel), on
peut faire une approximation harmonique, i.e. développer le potentiel autour de ses N minima.
Si on introduit ρi , mesurant le déplacement autour d’une position d’équilibre, on écrit
1 X ∂2U
U (R1 + ρ1 , · · · , RN + ρN ) ' (R1 , · · · , RN ) ρi ρj . (6.80)
2 ∂xi ∂xj
i, j

Avant d’introduire le développement dans la fonction de partition, nous devons toutefois remar-
quer que puisque le potentiel est invariant sous les permutations, il y a N ! manières différentes

140
Thermodynamique des oscillateurs harmoniques III Thermodynamique du rayonnement

d’attribuer un atome à chacun des puits avant d’effectuer le développement, ce qui traduit que
dxi est dominée par N ! minima équivalents dans RN . Précisément, nous
RQ
l’intégrale multiple
devons écrire
Z Y N 2U

1 dρi dpi X −βHcin −β 12 i, j ∂x∂i ∂x
P ρσ(i) ρσ(j)
Z' e j eq
(6.81)
N! h σ
i=1
P
où σ est une somme sur les N ! permutations des indices et σ(i) désigne le résultat de la
permutation sur l’indice i. Puisque les variables d’intégration sont muettes, on peut simplement
remplacer la somme sur les permutations par un facteur N ! qui vient corriger le facteur 1/N ! :
N
Z Y ∂2U

dρi dpi −βHcin −β 12 i, j
P
∂xi ∂xj eq
ρi ρj
Z' e . (6.82)
h
i=1

Les oscillateurs, attachés aux sites du réseau cristallin, sont bien discernables. Après diagonali-
sation de la forme quadratique, on obtiendrait une expression du type (6.79).

141
III Thermodynamique du rayonnement Thermodynamique des oscillateurs harmoniques

142
Chapitre 7

Application 3 : Transitions de phase


– Approximation de champ moyen

Plan du chapitre
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
II Liquide-gaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
II.A Description du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
II.B Approximation de champ moyen . . . . . . . . . . . . . . . . . . . . . . 144
II.C Analyse des isothermes de van der Waals – transition liquide-gaz . . . . 147
III Para-Ferro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
III.A Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
III.B Traitement de champ moyen du modèle d’Ising Ferro . . . . . . . . . . . 153
III.C Brisure spontanée de symétrie et paramètre d’ordre . . . . . . . . . . . 161
III.D Comparaison avec la transition liquide-gaz . . . . . . . . . . . . . . . . . 162
Annexe 7.A : Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

I Introduction
Dans ce nouveau chapitre d’application du formalisme canonique, nous allons aborder un sujet
plus difficile : l’étude (simplifiée) de deux transitions de phase par une approximation de champ
moyen. Les interactions à l’échelle microscopique sont à l’origine des effets coopératifs à l’échelle
macroscopique se manifestant par différents types d’organisation de la matière. Le cœur de
la question consiste donc à comprendre l’effet de la compétition entre les interactions et les
fluctuations thermiques.

II La transition liquide-gaz
Pour l’instant nous avons étudié deux situations extrêmes :
• Au chapitre 5, nous avons étudié les gaz dans la limite du gaz parfait, i.e. le cas d’atomes
en très faible interaction : les interactions n’étaient pas présentes explicitement dans le
modèle (i.e. dans l’hamiltonien), mais cependant nécessaires à l’équilibration.
• Au chapitre 6, l’étude des vibrations des atomes d’un solide correspond à la situation
extrême inverse d’atomes en très fortes interactions, de manière à former une  molécule  ma-
croscopique (un corps solide).

143
II Liquide-gaz Transitions de phase – Approximation de champ moyen

Nous allons aborder dans ce paragraphe la situation la plus délicate à décrire : le cas intermédiaire
où l’interaction n’est ni dominante ni négligeable.

II.A Description du problème

Interaction entre deux atomes

L’interaction entre deux atomes est très répulsive à courte portée, à cause des effets
électrostatiques et du principe de Pauli qui s’opposent à l’interpénétration des nuages électroniques.
À longue portée, un atome (neutre) est polarisable : soumis à un champ électrique extérieur
~ le barycentre du nuage électronique se décale de la position du noyau et l’atome acquiert
E,
un moment dipolaire d~ = α E~ (où α est la polarisabilité). Lorsque deux atomes se trouvent en
présence, une fluctuation du moment dipolaire de l’un des atomes crée un champ électrique
polarisant le second atome. Cet effet des fluctuations est responsable de l’apparition d’une in-
teraction attractive ∝ −r−6 .
En résumé, un modèle de potentiel effectif incorporant les deux effets est le potentiel de
Lennard-Jones
   r 6 
r0 12 0
uLJ (r) = u0 −2 (7.1)
r r

où les deux paramètres u0 et r0 sont très dépendants des atomes. Typiquement u0 ∼ 10 meV
(i.e. 100 K) et r0 ∼ 4 Å (des ordres de grandeurs sont donnés dans le tableau 7.1 où u0 ∼ kB Tc ).
Pour l’Hélium, l’interaction est plus faible u0 ' 1 meV et r0 ' 3 Å [13].

Modèle de gaz réel

Le potentiel d’interaction de Lennard-Jones est une interaction effective, qui a pour origine des
mécanismes microscopiques complexes (par opposition avec une interaction fondamentale comme
l’interaction de coulomb). Lorsque l’on considère plus de deux particules, l’énergie potentielle
fait donc très certainement intervenir des effets à plusieurs corps. Autrement dit l’énergie de
trois atomes est différente de la somme des énergies à deux corps avec potentiel effectif de type
de Lennard-Jones. Nous devrions en principe écrire P l’énergie d’interaction
P comme une somme
d’interaction à deux corps, trois corps, etc : U = i<j u(~ri − ~rj ) + i<j<k u(~ri , ~rj , ~rk ) + · · ·
Nous ne prendrons cependant pas en compte ces effets à plusieurs corps et considèrerons le
modèle suivant :

U=
N
p~i 2
X z X }| {
def
H= + uLJ (rij ) où rij = ||~ri − ~rj || . (7.2)
2m
i=1 16i<j6N

L’interaction à deux corps est décrite par deux paramètres : la force de l’interaction attractive
u0 et sa portée r0 .

II.B Approximation de champ moyen

Notre point de départ sera la discussion du paragraphe V du chapitre 4, précisément la formule


(4.69). Nous procédons en deux temps afin d’évaluer la partie potentielle de la fonction de
partition he−βU i.

144
Transitions de phase – Approximation de champ moyen II Liquide-gaz

Effet de volume exclu


Nous analysons l’effet de l’interaction répulsive en remplaçant le potentiel de Lennard-Jones par
une interaction u(r) = 0 pour r > r0 et u(r) = ∞ pour r < r0 . Autrement dit
(
−βu(r) 0 si r < r0
e = (7.3)
1 si r > r0

Imaginons une configuration microscopique des atomes {~r1 , · · · , ~rN }. L’intégration sur ~r1 nous
donne Z
def 4π 3
PN
d~r1 e−β i=2 u(r1i ) = V − (N − 1)v où v = r (7.4)
V 3 0
est le volume exclu autour de chaque atome (Fig. 7.1).

r0
rs

Figure 7.1 : Volume exclu.


P
Posant U = i<j u(rij ), l’intégration successive sur les positions des atomes conduit à
Z Z N
Y
d~r1 · · · d~rN e−βU ≈ (V − (n − 1)v) . (7.5)
V V n=1

1 V
Lorsque N v  V , nous pouvons écrire N
P R
n=1 ln (V − (n − 1)v) ' v V −N v dy ln(y) ' N ln(V −
N v/2), d’où
N
Nv N
Y  
(V − (n − 1)v) ' V − . (7.6)
2
n=1
Nous concluons que la partie fortement répulsive de l’interaction contribue à la fonction de
partition comme
def v 2π 3
he−βU irepul ' (V − N b)N où b = = r . (7.7)
2 3 0
Ce traitement de l’interaction répulsive n’est qu’approximatif : il est facile de voir qu’il ne décrit
pas correctement la phase très dense au voisinage du  full packing  (le cas V ∼ N b). C’est
pour cette raison que le traitement de champ moyen que nous décrivons dans ce chapitre rend
compte de la transition liquide-gaz, mais pas des transitions vers la phase solide.

Effet de l’interaction attractive


Nous pouvons estimer l’effet de l’interaction attractive en calculant la moyenne de l’énergie
d’interaction (idée du champ moyen)

N (N − 1) N2
Z
d~r
hU iattract ' uLJ (||~r||) ∼ − u0 r03 . (7.8)
2 r||>r0 V
||~ V

Finalement nous écrivons


N2
hU iattract ' − a (7.9)
V
où a ∼ u0 r03 .

145
II Liquide-gaz Transitions de phase – Approximation de champ moyen

Conclusion : fonction de partition


Nous combinons les deux effets
Z
d~r1 · · · d~rN e−βU ≈ (V − N b)N e−βhU iattract . (7.10)
V

Autrement dit la fonction de partition complète est, dans cette approximation,

1 (V − N b)N β N 2 a
Z= e V (7.11)
N! Λ3N
T

Bien que cette approximation paraisse assez grossière, nous allons déduire de ce calcul de fonction
de partition des résultats remarquables (l’apparition d’une transition de phase).

Énergie et entropie
Nous déduisons l’énergie libre

N 2a
 
V − Nb
F = −N kB T 1 + ln − (7.12)
N Λ3T V

L’énergie moyenne
C 3 N2
E = N kB T − a (7.13)
2 V
est la somme de l’énergie cinétique moyenne (extensive) et de l’énergie d’interaction moyenne
(non extensive). Remarquons que la chaleur spécifique CV = 32 N kB est la même que celle du
(G.P.)
gaz parfait, cependant Cp diffère de Cp = 52 N kB .
L’entropie s’obtient facilement
 
5 V − Nb
S = N kB + ln . (7.14)
2 N Λ3T

Équation d’état de van der Waals (1873)


La dérivation de l’énergie libre par rapport à V nous donne la pression

N kB T N2
p= − 2a pour V > N b . (7.15)
V − Nb V
2
Nous avons retrouvé l’équation d’état de van der Waals. Écrite sous la forme (p+ N V2
a)(V −N b) =
N kB T , elle a la forme de l’équation d’état des gaz parfaits pour un volume réduit V − N b et une
2
pression effective peff = p + N V2
a (cette dernière expression traduit une réduction de la pression
sous l’effet de l’interaction attractive, par rapport à un gaz parfait). Les isothermes sont tracées
sur la figure 7.5.

Coefficient du viriel de l’équation de van der Waals.– Pour caractériser l’écart à


l’équation d’état du gaz parfait, on peut écrire la pression sous la forme d’un développement en
puissances de la densité :

!
X
p = nkB T 1 + Bk (T ) nk−1 (7.16)
k=1

146
Transitions de phase – Approximation de champ moyen II Liquide-gaz

Les coefficients Bk , appelés les coefficients du viriel, admettent une interprétation intéressante
en termes du problème à k particules et peuvent être calculés systématiquement (chapitre 10
de [13]). Par exemple, dans un gaz classique,le second coefficient du viriel est donné par B2 =
(0)
−23/2 Λ3T δZβ , où δZβ = Zβ − Zβ caractérise le problème à deux corps. Zβ est la fonction
de partition de l’hamiltonien décrivant la particule relative dans le problème à deux corps :
1 2 (0)
Hr = m p~ +u(r) et Zβ la fonction de partition pour u(r) = 0. Par exemple, l’introduction d’une
interaction répulsive u(r) > 0 repousse le spectre vers les énergies positives, ce qui correspond à
une diminution de la densité d’états du problème à deux corps et donc à δZβ < 0, par conséquent
B2 > 0 (l’introduction d’une interaction répulsive augmente la pression, toutes choses égales par
ailleurs).
Pour l’équation de van der Waals, on obtient une expression systématique des coefficients
du viriel
a
Bk (T ) = bk−1 − δk,2 . (7.17)
kB T
La partie répulsive du potentiel génère bien une contribution positive à B2 alors que le coefficient
a caractérisant la partie attractive apporte une contribution négative. Remarquons finalement
que B2 est dominé par l’effet de l’interaction répulsive aux hautes températures.

II.C Analyse des isothermes de van der Waals – transition liquide-gaz


Le problème de la compressibilité négative
Nous avons remarqué au chapitre 4 (§ II) que la stabilité du système requiert une compressibilité
positive :  
def 1 ∂V 1 1
κT = − = >0. (7.18)
V ∂p T V ∂ 2 F2
∂V
Or la dérivation de la pression conduit à
r
∂p kB T 3/2
<0 si V > V − Nb . (7.19)
∂V 2N a
Une analyse graphique (Fig. 7.2 ou Fig. 7.5) montre qu’il existe une température critique Tc
sous laquelle la condition n’est pas satisfaite pour toute valeur du volume : nous obtenons une
zone [V1 , V2 ] sur laquelle κT < 0. Nous concluons que l’équation de van der Waals ne donne pas
directement la pression dans le domaine [V1 , V2 ]. Nous allons voir plus bas comment interpréter
cette équation.
p
T>Tc T<Tc T>Tc
C
T=Tc

V T<Tc V
0 V1
V1 V2 0 V2
Nb
Nb p p
>0 >0
V V

Figure 7.2 : Gauche : Résolution graphique de (7.19). Droite : allure des isothermes de van der
Waals (pour T < Tc , la partie rayée est non physique car elle correspondrait à une compressibilité
κT < 0).

Notons que la pression elle-même peut devenir négative (Fig. 7.5).

147
II Liquide-gaz Transitions de phase – Approximation de champ moyen

Point critique
Nous déterminons la position du point critique (Vc , pc , Tc ) en écrivant l’équation d’état, l’annu-
∂p ∂2p
lation de la dérivée ∂V |c = 0 et de la dérivée seconde ∂V 2 |c = 0, puisque le point critique est un
point d’inflexion de l’isotherme (Fig. 7.2). Nous obtenons les trois équations :

N kB Tc N2
pc = −a 2 (7.20)
Vc − N b Vc
N kB Tc N2
0= − 2a (7.21)
(Vc − N b)2 Vc3
N kB Tc N2
0= − 3a (7.22)
(Vc − N b)3 Vc4
Le rapport des deux dernières équations conduit à Vc = 3N b. La deuxième équation nous donne
8
alors la température critique kB Tc = 27 a/b. Puisque a ∼ u0 r03 et b ∼ r03 , nous obtenons que la
température critique est simplement de l’ordre de l’énergie d’interaction

kB Tc ∼ u0 . (7.23)

Finalement nous obtenons la pression à l’aide de la première équation. En conclusion, le point


critique a pour position :
a 8a
Vc = 3N b , pc = et kB Tc = . (7.24)
27b2 27b
Remarquons que la théorie de van der Waals prédit que le rapport
pc Vc 3
= (7.25)
N kB Tc 8
est universel. Propriété qui est assez bien vérifiée dans la pratique (cf. tableau 7.1).
pc Vc
Tc (K) Vc (cm3 ) pc (atm) N kB Tc
He 5.2 57.8 2.26 0.30
H2 33.1 65.0 12.8 0.31
N2 126.1 90.1 33.5 0.29
O2 154.4 74.4 49.7 0.29
CO2 304.2 94.0 72.9 0.27
H2 O 647.4 56.3 218.3 0.23

Table 7.1 : Positions du point critique pour divers gaz. Données tirées de [11] citant N. Lange,
 Lange’s handbook of chemistry , McGraw-Hill (1967).

Transition liquide-gaz pour T < Tc


Les pathologies mathématiques dans la fonction de partition (singularités, discontinuités, etc),
conduisant ici à une compressibilité négative, signale un phénomène physique intéressant : l’exis-
tence d’une transition de phase.
∂p
Nous avons vu plus haut que l’isotherme présente une zone non physique, lorsque ∂V > 0,
2
∂ F
disons entre le minimum D1 et le maximum local D2 . Sur cet intervalle on a ∂V 2 < 0. La présence
de cette zone de concavité négative (non physique) dans le potentiel thermodynamique implique
l’existence d’un chemin (représenté par la ligne allant de A à B sur la figure 7.3) caractérisé par
une énergie libre plus basse, à condition que le fluide se sépare en un mélange de l’état A

148
Transitions de phase – Approximation de champ moyen II Liquide-gaz

et de l’état B. Autrement dit, nous remettons en question l’hypothèse de fluide homogène. Il


y a alors coexistence de deux phases : une phase de haute densité, A, que nous identifions
avec une phase liquide, et une phase de basse densité, B, la phase gazeuse. L’énergie libre prend
la forme d’une combinaison linéaire des énergies libres associées aux deux phases
VB − V V − VA
F (T, V ) = F (T, VA ) + F (T, VB ) pour VA 6 V 6 VB . (7.26)
VB − VA VB − VA
Puisque l’énergie libre est linéaire, la pression du mélange est constante : on parle de plateau de
liquéfaction.

~−ln(V−Nb)
p F 2
F
~1/(V−Nb) <0
V2

D2 D1
~1/ V A D2
B
V V
D1
VA VB
Nb Nb ~−lnV

Figure 7.3 : Isotherme de van der Waals et énergie libre pour T < Tc . L’énergie libre
du mélange des phases A et B (ligne en tirets) est plus basse que celle de la courbe présentant
l’inversion de concavité.

Une question intéressante est celle de la détermination des caractéristiques des phases A et
B, à partir de l’équation de van der Waals. Pour cela il est utile d’introduire l’enthalpie libre (la
fonction de Gibbs)
def
G = F + pV . (7.27)
La relation entre les deux potentiels thermodynamiques est une transformation de Legendre,
dF = −SdT − pdV + µdN −→ dG = −SdT + V dp + µdN , ce qui montre que l’enthalpie libre
est une fonction des trois variables T , p et N : G(T, p, N ). L’analyse des propriétés d’extensivité
montre qu’elle est proportionnelle au potentiel chimique.
G(T, p, N ) = N µ(T, p) . (7.28)
La dépendance en p de ce potentiel thermodynamique peut R p être déduite de l’intégration de
l’équation d’état, tournée de 90 : G(T, p, N ) = f (T ) + p0 dp V (p0 ). En partant des grandes
o 0

pressions, la courbe V (p) rebrousse chemin entre D2 et D1 , ce qui implique que G(·, p, ·) repasse
par un même point,
G(T, pA , N ) = G(T, pB , N ) , (7.29)
qui s’interprète comme le point d’équilibre entre les deux phases où est réalisée l’égalité des
potentiels chimiques :
µA = µ B . (7.30)
Puisque dG = −SdT + V dp + µdN , nous déduisons
Z
V (p) dp = 0 (7.31)
B→A

Autrement dit, en revenant au diagramme de Clapeyron, la position des points A et B est


déterminée par la condition
I
p dV = 0 (7.32)

149
II Liquide-gaz Transitions de phase – Approximation de champ moyen

p
D2 vapeur
sur−saturée

plateau de B
A liquéfaction
liquide
sur−chauffé
Nb aires égales V
D1

Figure 7.4 : Construction de Maxwell. La ligne bleue épaisse est la ligne d’équilibre thermo-
dynamique. Les deux branches (lignes vertes fines) AD1 et D2 B sont deux lignes de métastabilité.

où l’intégrale correspond à l’intégration sur le circuit fermé enclosant les deux aires hachurées
de la figure 7.4. Nous venons de décrire la  construction de Maxwell .
Partant des hautes densités (petit V ), le fluide suit l’isotherme jusqu’au point A. Lorsque le
volume est augmenté, il suit alors le plateau de liquéfaction (pression constante) correspondant
à la conversion progressive du liquide en gaz. Arrivé en B, tout le fluide a été converti en gaz.
Une augmentation supplémentaire du volume conduit à un abaissement de la pression.
Notons que les deux branches AC et DB ne sont pas interdites. Dans certaines conditions,
le liquide peut exister à des densités plus basse que celle du point A ( liquide sur-chauffé ),
cependant il s’agit d’un état métastable que le système peut quitter à l’aide une fluctuation.

Chaleur latente de vaporisation


La transition entre la phase liquide (A) et la phase gazeuse (B) s’accompagne d’une discontinuité
def
de l’entropie. Cette discontinuité ∆Svap = S(T, VB , N )−S(T, VA , N ) est reliée à l’existence d’une
 chaleur latente . En utilisant (7.14) nous obtenons l’expression :

def VB − N b
Lvap = T ∆Svap = N kB T ln (7.33)
VA − N b

Elle mesure le coût énergétique nécessaire pour convertir tout le liquide en gaz (à p et T fixées).
L’existence d’une chaleur latente s’interprète comme une discontinuité, SA 6= SB , d’une dérivée
première de l’énergie libre S = − ∂F ∂T , de part et d’autre de l’équilibre entre phases. La dis-
continuité de la densité, i.e. VA 6= VB , correspond à une discontinuité d’un autre potentiel
thermodynamique, puisque V = + ∂G ∂p . Pour cette raison on dira que la transition liquide-gaz est
une transition de phase du premier ordre.

Voisinage du point critique


Nous avons remarqué au début de la discussion qu’au delà de la température Tc , l’isotherme
de van der Waals est parfaitement monotone (Fig. 7.19). Autrement dit, au point critique on a
annulation de la chaleur latente Lvap = 0 et continuité des dérivées premières des potentiels.
Pour étudier plus précisément les propriétés au voisinage du point critique, il est utile d’in-
troduire des variables adimensionnées
def V def p T
v= −1, π= − 1 et t = −1, (7.34)
Vc pc Tc
mesurant les écarts au point critique. On vérifie que l’équation d’état prend la forme
 
3
1+π+ (2 + 3v) = 8(1 + t) (7.35)
(1 + v)2

150
Transitions de phase – Approximation de champ moyen II Liquide-gaz

ou encore
3v 3 + 8v 2 (π − t) + (7π − 16t)v + 2(π − 4t) = 0 . (7.36)
On trace sur la figure 7.5 les isothermes dans ces variables adimensionnées.
1.0

T=Tc

Π =Hp-pcLpc
0.5

0.0

-0.5

-1.0
0 1 2 3 4 5

v=HV-VcLVc

Figure 7.5 : Isothermes de van der Waals (en termes des variables adimensionnées). La
pression p = 0 correspond à π = −1 et le volume V = N b à v = −2/3.

p
C

Liq.
T=Tc
Liq.+Gaz
Gaz T<Tc
V

Figure 7.6 : Propriétés du point critique. La zone intermédiaire sous le point critique est
la région du plan (V, p) où coexistent les deux phases liquide et gazeuse.

L’étude du voisinage est un petit peu délicate et peut être trouvée dans le chapitre 12 de
[28]. Les conclusions sont :

• Sur la ligne de coexistence des phases (dans le plan (T, p)), la pression est proportionnelle
à l’écart à la température critique π ' 4t. Combinée à (7.36), nous obtenons que les deux
densités dépendent de la température comme

v ' ±2 −t pour t < 0 , (7.37)

qui est l’expression de la parabole en tirets (Fig. 7.6).

• À la température critique (t = 0), nous déduisons de (7.36) que


 1/3
3 2
π ' − v3 i.e. v' π . (7.38)
2 3

(comportement de l’isotherme T = Tc dans le diagramme (V, p), cf. Fig. 7.6).

• Nous déduisons facilement la compressibilité isotherme en dérivant la pression (7.36) :


∂π 2
∂v = −6t + O(tv) + O(v ), d’où une divergence de la compressibilité au point critique
 
1def ∂v 1
κ̃T = − ' pour t > 0 . (7.39)
v ∂π T 6t

151
III Para-Ferro Transitions de phase – Approximation de champ moyen

• La chaleur spécifique présente une discontinuité au point critique (Uhlenbeck, 1966 et


Thomson, 1988) :
9
CV (Tc+ ) − CV (Tc− ) = N kB . (7.40)
2
Toutes ces remarques montrent que le point critique est caractérisé par des comportements
singuliers des dérivées secondes des potentiels thermodynamiques (chaleur spécifique discontinue,
divergence de la compressibilité,..). Pour cette raison, on dira que le point critique est le lieu
d’une transition de phase du second ordre.

III La transition paramagnétique-ferromagnétique


III.A Introduction
Nous étudions les propriétés magnétiques de certains matériaux présentant une aimantation
spontanée (en l’absence d’un champ magnétique extérieur) comme le fer.

Description du phénomène
Certains matériaux possèdent une aimantation spontanée à température ambiante, comme les
composés à base de fer, cobalt ou nickel. Si le matériau est chauffé au delà d’une certaine
température appelée température critique Tc , aussi appelée la température de Curie, cette ai-
mantation disparaı̂t.

Fe : Tc = 1043 K
Co : Tc = 1388 K
Ni : Tc = 627 K

Table 7.2 : Quelques valeurs de températures critiques.

L’existence d’une aimantation spontanée s’interprète comme un effet d’alignement des mo-
ments magnétiques locaux, dans le matériau, sous l’effet des interactions microscopiques générant
un effet coopératif à l’échelle macroscopique. Lorsque le système est chauffé, il y a compétition
entre ces interactions et les fluctuations thermiques. Celles-ci peuvent finalement dominer les
interactions et détruire l’ordre ferromagnétique.

Origine microscopique
Nous allons baser notre discussion sur un modèle de magnétisme localisé porté par des moments
magnétiques locaux, supposés aux nœuds d’un réseau cristallin. 1 Rappelons que le moment
magnétique des électrons domine le moment nucléaire puisque les rapports gyromagnétiques
sont dans un rapport de l’ordre de 1000. L’aimantation du matériau vient donc du spin des
électrons (et éventuellement de leur moment orbital).
La première question est de comprendre l’origine de l’interaction microscopique entre mo-
ments magnétiques. L’hypothèse venant spontanément à l’esprit serait celle d’une interaction
µ0 |~
µi ·~
µj |
dipolaire magnétique EDM ∼ 4π r3
. Celle-ci a cependant une intensité très nettement insuf-
ij
fisante pour expliquer l’existence d’un alignement des moments à température ambiante. Pour
des échelles atomiques, on trouve EDM ∼ 10−5 eV (soit 0.1 K, très loin de Tc ∼ 1000 K).
Un second candidat expliquant l’existence d’une interaction entre moments magnétiques est
le mécanisme d’échange. Je renvoie aux problèmes du chapitre 13 de [34] où l’on montre que
1
Par opposition à un magnétisme itinérant porté par le spin des électrons de conduction.

152
Transitions de phase – Approximation de champ moyen III Para-Ferro

l’interaction coulombienne et le principe de Pauli (ou plutôt le postulat de symétrisation) sont


responsables de l’apparition d’une interaction effective entre les spins de deux électrons
4J ~ ~
Heff = −Si · Sj . (7.41)
~2
En un mot : l’existence de cette interaction vient de ce que dans l’état singulet du spin total, S =
0, les deux électrons sont plus proches (fonction d’onde antisymétrique en spin et symétrique dans
l’espace) que dans l’état triplet, S = 1 (fonction d’onde symétrique en spin et antisymétrique
dans l’espace). L’énergie coulombienne est donc plus basse dans l’état triplet et on attend une
interaction ferromagnétique, J > 0, qui favorise l’alignement des deux spins.
Puisque l’interaction effective trouve son origine dans l’interaction coulombienne, son ordre
de grandeur est J ∼ 1 eV (1000 K), i.e. 10000 fois plus grande que l’interaction dipolaire
magnétique, maintenant comparable aux valeurs typiques de températures de Curie mesurées
expérimentalement, Tc ∼ 1000 K.

Modèles : de Heisenberg à Ising


Les remarques précédentes conduisent naturellement à proposer le modèle de cristal ferro-
magnétique suivant
4 X ~j − 2 B
~i · S ~·
X
~i ,
HHeisenberg = − 2 Jij S S (7.42)
~ ~
i<j i
où Jij est l’interaction entre le couple de spins ; d’après la discussion précédente, cette interaction
dépend du recouvrement des orbitales atomiques et décroit rapidement avec la distance entre les
deux spins. 2 Ce modèle est toutefois encore beaucoup trop compliqué pour permettre des calculs
explicites (même lorsque les spins sont traités comme des vecteurs classiques). Pour cette raison
nous allons drastiquement simplifier le modèle : nous cherchons à étudier la compétition entre
interactions et fluctuations thermiques (éventuellement en présence d’un champ magnétique).
Les moments sont soit tous alignés dans une direction, soit fluctuent fortement. Nous pouvons
décrire cette physique en considérant des  spins  σi ∈ {−1, +1} :
X X
HIsing = − Jij σi σj − B σi (7.43)
i<j i

où B est un champ magnétique extérieur. Nous avons choisi un système d’unité telles que
[J] = [B] = [énergie]. Ce modèle est appelé le modèle d’Ising. Il est d’une très grande importance
en physique statistique, ce que nous comprenons facilement en remarquant qu’il sera pertinent
pour décrire toute situation où les variables microscopiques prennent deux valeurs :
• Gaz sur réseau (cases vide ou pleine).
• Alliage binaire (atomes de type A ou B).
• etc.

III.B Traitement de champ moyen du modèle d’Ising Ferro


Nous allons étudier dans cette section le modèle d’Ising pour des interactions entre spins plus
proches voisins X X
HIsing = −J σi σj − B σi (7.44)
hi , ji i

2
Son signe pourrait également devenir positif pour certains choix d’orbitales atomiques, pouvant conduire à
une interaction anti-ferromagnétique (J < 0) favorisant l’anti-alignement des spins. Il peut également y avoir des
effets d’anisotropie dans le cristal : interaction plus forte dans une direction que dans une autre.

153
III Para-Ferro Transitions de phase – Approximation de champ moyen

P
pour J > 0, où hi , ji désigne la somme sur les sites du réseaux plus proches voisins, i.e. sur les
liens du réseau.

Préliminaire : le cristal paramagnétique (J = 0)


Commençons par un petit exercice préliminaire très simple. Nous calculons la fonction de par-
tition en l’absence d’interaction
!N
X P X
ZPara = eβB i σi = eβBσ = (2 cosh βB)N , (7.45)
{σi } σ

où la somme sur les 2N microétats est explicitement


X XX X
≡ ··· , (7.46)
{σi } σ1 σ2 σN

chaque spin pouvant prendre deux valeurs σi ∈ {−1, +1}. Nous déduisons l’aimantation moyenne
par spin
C
def M 1 ∂F
m(T, B) = =− (7.47)
N N ∂B
i.e., pour le paramagnétisme,
m(T, B) = tanh(B/T ) . (7.48)
def ∂m

La susceptibilité correspondante présente le comportement χ = ∂B B=0 = 1/T .

Approximation de Bragg-Williams
Nous commençons par quelques petites manipulations sur l’hamiltonien d’Ising. Supposons
l’existence d’une solution caractérisée par une aimantation moyenne
def
m = σi . (7.49)

Nous écrivons
σi = m + δσi (7.50)
où δσi représente une fluctuation autour de la moyenne. Faisons quelques manipulations sur le
terme d’interaction
X X X
σi σj = (m2 + 2m δσi + δσi δσj ) = (−m2 + 2m σi + δσi δσj ) (7.51)
hi , ji hi , ji hi , ji

Nous pouvons calculer certaines sommes en convertissant la somme sur les liens en somme sur
les sites :
N
X 1X X
= (7.52)
2
hi , ji i=1 j∈v(i)

où v(i) désigne l’ensemble des sites voisins du site i. Nous notons q = Card(v(i)) le nombre de
voisins, i.e. la coordinence du réseau. Par exemple sur un réseau hypercubique en dimension d
on a q = 2d. Nous déduisons finalement
N X X
HIsing = Jqm2 − (Jqm + B) σi −J δσi δσj (7.53)
2
i
| {z } | hi , ji
{z }
Hcm (m) fluctuations

154
Transitions de phase – Approximation de champ moyen III Para-Ferro

Le second terme admet une interprétation en termes de champ local moyen. En effet, puisque l’in-
teraction tend à aligner les spins, on peut dire que les spins de v(i) créent un champ magnétique
local au site i sur lequel σi trouve favorable de s’aligner. L’expression de ce champ local est
obtenue par dérivation de l’hamiltonien (le champ est la variable conjuguée du spin) :

(loc) def δHIsing X


Bi =− =B+J σj (7.54)
δσi
j∈v(i)

(loc)
où l’on a encore utilisé (7.52). La valeur moyenne du champ local est donc Bi = Jqm + B,
soit précisément l’expression que nous avons fait apparaı̂tre dans l’hamiltonien.
L’étape suivante consiste à faire l’approximation de champ moyen consistant à négliger le
terme de fluctuation de l’hamiltonien d’Ising. On suppose ainsi que la dynamique d’un spin est
(loc)
contrôlée par un ordre moyen, le champ local moyen Bi = Jqm + B, davantage que par les
fluctuations (idée du champ moléculaire de Weiss, 1907). L’hamiltonien approché
N X
Hcm (m) = Jqm2 − (Jqm + B) σi (7.55)
2
i

prend exactement la forme de l’hamiltonien décrivant le problème du paramagnétisme. Grâce


à l’approximation de champ moyen, nous nous sommes donc ramenés à un problème séparable
(donc facile). Remarquons toutefois que la méthode que nous proposons se  mord la queue  puisque
l’hamiltonien contient comme paramètre la solution m que l’on cherche à déterminer. C’est ce
que l’on appelle une méthode auto-cohérente.
Nous obtenons facilement la fonction de partition
N 2
Zcm (m) = e−β 2 Jqm (2 cosh β(Jqm + B))N . (7.56)

Nous introduisons  l’énergie libre  par spin fcm = F/N :


1 1
fcm (m) = Jqm2 − ln [2 cosh β(Jqm + B)] . (7.57)
2 β

Équation auto-cohérente pour le paramètre d’ordre


La dérivation de l’énergie libre par rapport au champ ne nous fournit pas directement la valeur
de l’aimantation mais une équation pour la déterminer ; c’est en cela que la méthode est auto-
cohérente :
∂fcm (m)
m=− ⇒ m = tanh β(Jqm + B) . (7.58)
∂B
Nous notons m∗ (T, B) la solution de cette équation.
Il est utile de remarquer que cette équation peut également être obtenue par minimisation
de  l’énergie libre  fcm (m) par rapport au paramètre m :
∂fcm (m)
=0 ⇒ Eq. (7.58). (7.59)
∂m

Existence d’une transition de phase (cas B = 0)


La résolution de l’équation (7.58) peut être effectuée graphiquement : nous cherchons l’intersec-
tion de la fonction tanh(βJqm) de m avec la droite.
Si βJq < 1, la pente à l’origine de tanh est inférieure à 1 et les deux courbes ne possèdent
qu’une intersection à l’origine, i.e. m∗ = 0 (figure 7.7).

155
III Para-Ferro Transitions de phase – Approximation de champ moyen

1.0 1.0

TTc=1.25 TTc=0.75
0.5 0.5

-m*
0.0 0.0
+m*

-0.5 -0.5

-1.0 -1.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0

m m

Figure 7.7 : Résolution graphique de l’équation auto-cohérente (7.58) pour B = 0.

Si en revanche βJq > 1, la fonction tanh intersecte trois fois la droite (figure 7.7). Nous mon-
trerons que la solution m = 0 est instable. L’équation (7.58) admet deux solutions symétriques
m = ±m∗ , avec m∗ > 0.
En résumé, la résolution graphique de l’équation auto-cohérente met en évidence deux types
de solutions, suivant la valeur de la température T = 1/β

T > Tc : m∗ (T, 0) = 0 phase PARAmagnétique


T < Tc : m∗ (T, 0) > 0 phase FERROmagnétique

où Tc = qJ s’interprète comme la température critique (température de Curie). Comme attendu,


elle est de l’ordre de l’interaction entre spins voisins.
-0.51

-0.75 TTc=1.25 -0.52 TTc=0.75


-0.53
fcmHmL

fcmHmL

-0.80 -0.54

-0.55

-0.85
-0.56

-0.57
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0

m m

Figure 7.8 : Fonction fcm (m) pour B = 0. En deçà de la température critique (figure de
droite), le système choisit une des deux solutions (ici +m∗ ). La solution brise la symétrie du
problème.

Stabilité des solutions

L’étude de  l’énergie libre  conduit aux comportements limites (pour B = 0) :


 
1 2 β
fcm (m) ' Tc m − |m| pour |m|  1 (7.60)
2 βc
T4
 
1 Tc β
' −T ln 2 + Tc 1 − m2 + c 3 m4 + · · · pour |m|  1 (7.61)
2 T 12T βc

La seconde expression montre que fcm (m) développe un double puits pour T < Tc alors que
m = 0 correspond à un maximum local de  l’énergie libre , i.e. à une solution instable.

156
Transitions de phase – Approximation de champ moyen III Para-Ferro

Analyse du paramètre d’ordre


Cas T  Tc .– La solution de (7.58) est m∗ ' 1, ce qui permet d’utiliser le développement
tanh x ' 1 − 2e−2x pour x  1 :
2
m ' 1 − 2 e− T (Tc m+B) . (7.62)

m ' 1 à une correction exponentiellement petite dans le paramètre Tc /T  1, on peut donc


remplacer m par 1 dans l’exponentielle. On déduit que
Tc +B
m∗ (T, B) ' 1 − 2 e−2 T (7.63)

Cette expression est intéressante : elle souligne l’existence d’un gap dans le spectre des
excitations. Nous verrons plus bas que la chaleur spécifique présente le même comportement
de basse température.

−J +J
−J +J
−J +J
−J +J

E=−qJ E=+qJ

Figure 7.9 : Retournement d’un spin dans la phase ferromagnétique.


340 FRANCIS BETTER
∆E = 2B est le coût énergétique pour retourner un spin aligné sur le champ.
where in the statistics of atomic interactions. At low temperatures none of the observed points
∆E = 2Tc = 2qJ est le coût énergétique
lie on the pour retourner
theoretical un
curve. In Fig. spin
4 the resultsdans unreplotted
have been environnement
on a larger scale où
in which
the square of the reduced temperature is used to bring out the linear relationship between T'
and I„at
tous les spins sont alignés (une interaction entre spins alignés
low temperatures. Curve 1compte
represents the−J alors
classical que indeux
equation spins
which the Langevin
L, (x) appears, and curve 2 represents Eq. (1). gneiss and Forrer, whose data are
antialignés ont une énergie +J) : figurefunction
7.9.
plotted in Fig. 4, emphasized the linear relationship here indicated. In addition it should be
noticed that when plotted in this way the results for the cubic lattices fall together into one
IO ~u x 0+x

1.2

1.0 3 HTc - TL  Tc
lw
0.8 ~ - NIC
m* HT,0L

o -NIC
0.6
h- CO
X- IR
+- IR
0- MA
0.4
~ 2
I- PY
0.2 I

X
FERRO PARA +
0.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 0 -I .2 .3 .4
T
5,
.
~ ~

6 .7 .8 .8
I

I0

TTc ep
Fig. 3. The reduced saturation intensity is plotted as a function of the reduced temperature.
The experimental results are taken from the papers referred to in Figs. 1 and 2, and from F.
Figure 7.10 : Paramètre d’ordre àHegg,
B Thesis,
= 0Ziirich,
en 1910;
fonction dedeTChim.
P. Curie, Ann. . À et degauche : (1895),
Phys. 5, 289 Résolution
P. gneiss, Jour.
de Physique 6, 661 (1907); and Zeigler, Thesis, Zurich, 1915.
numérique de l’équation auto-cohérente. À droite : figure tirée de F. Bitter,'  On the Interpre-
= IRoN x= NlcKEL:+ =MAONETITE ~ h"-F&2 Q j 0= cEMENTITE
tation of Some Ferromagnetic Phenomena , Phys. l. 00
Rev. 39, 337 (1932).

,96

Voisinage de la transition : T . Tc à B = 0.– On attend une solution m  1 ce qui


suggère un développement tanh x = x − 31 x3 + · · · :

Tc m .188 Tc m 3
 
m' − (7.64)
T 3 T
+84
.05 ~I .I5 ~ 2 .25 .3
e
157
Fig. 4. The reduced saturation intensity is plotted as a function of the square of the re-
duced temperature. The experimental points are taken from P. gneiss and R. Forrer, Ann. de
Physique 12, 279 (1929).

group, and those for the non-cubic orthorhombic lattices into another. As for cobalt and pyrrho-
III Para-Ferro Transitions de phase – Approximation de champ moyen

Après simplification d’un m nous déduisons


s
3(Tc − T )
m∗ (T, 0) ' . (7.65)
T →Tc− Tc

Le paramètre d’ordre à B = 0 est tracée sur la figure 7.10. Les données expérimentales sont
assez bien décrites par cette théorie très simple.
1.0

T=Tc
0.5

m* HTc,BL
H3BTc L13
0.0

-0.5

-1.0
-1.0 -0.5 0.0 0.5 1.0

Figure 7.11 : Paramètre d’ordre à T = Tc en fonction de B.

À la transition : T = Tc à B 6= 0.– Le développement de (7.58) prend cette fois la forme


 3
B 1 B
m'm+ − m+ (7.66)
Tc 3 Tc

Le paramètre d’ordre présente le comportement


 1/3
3B
m∗ (Tc , B) ' (7.67)
B→0 Tc

Au delà de la transition : T & Tc à B 6= 0.– Finalement nous étudions la réponse


du système à un champ magnétique extérieur dans la phase paramagnétique (T > Tc ), au
voisinage de la transition. L’analyse de la réponse du système annonce la transition de phase.
Un développement de tanh à l’ordre le plus bas est cette fois suffisant :

Tc m B B
m' + d’où m∗ (T, B) ' . (7.68)
T T B→0 T − Tc
∂ f def 2
Nous obtenons une susceptibilité magnétique, χ = ∂m 1
∂B |B=0 = − ∂B 2 |B=0 = T −Tc , divergente à
la transition (on montre plus bas que la relation est exacte). Le comportement χ = 1/(T − Tc )
porte le nom de loi de Curie-Weiss. Il rappelle celui de la susceptibilité paramagnétique.

Énergie libre, énergie, entropie, chaleur spécifique


L’énergie libre du système est donnée par

f (T, B) = fcm (m∗ (T, B)) , (7.69)

où m∗ est solution de (7.58). Toutes les propriétés thermodynamiques peuvent alors être déduites
explicitement de f (T, B). La dérivation par rapport aux deux paramètres requiert de connaitre

158
Transitions de phase – Approximation de champ moyen III Para-Ferro

Χ HTL
3

2 FERRO PARA
1

0
0.0 0.5 1.0 1.5 2.0

TTc

Figure 7.12 : Susceptibilité magnétique.

les dérivées ∂m ∗ ∂m∗


∂β et ∂B . Ces deux dérivées peuvent être exprimées en fonction de m∗ par
différenciation de l’équation (7.58). Par exemple, la dérivation par rapport à B donne
 
∂m∗ ∂m∗ 
1 − tanh2 β (Tc m∗ + B)

=β 1 + Tc (7.70)
∂B ∂B

En utilisant que m∗ = tanh β (Tc m∗ + B), un réarrangement conduit à une première relation
utile
∂m∗ 1 − m2∗
= . (7.71)
∂B T − Tc (1 − m2∗ )

Susceptibilité de part et d’autre de la transition.– Pour illustrer l’utilité de (7.71),


remarquons que dans la phase paramagnétique, elle fournit l’expression de la susceptibilité de
Curie-Weiss :
∂m∗ 1
χ(T ) = = (pour T > Tc ) , (7.72)
∂B B=0 T − Tc

qui est bien valable au delà du voisinage de la transition, comme annoncé précédemment. En
outre, en utilisant (7.65), nous pouvons obtenir une expression de la susceptibilité dans la phase
ferromagnétique :
1
χ(T ) ' (pour T . Tc ) . (7.73)
2(Tc − T )

La divergence de la susceptibilité, Éqs. (7.72) et (7.73), admet une interprétation intéressante


basée sur la relation entre susceptibilité et fluctuations d’aimantation :

∂ 2 f
Var(m) = T χ(T ) = −T . (7.74)
∂B 2 B=0

Le développement de l’énergie libre au voisinage de la transition, Éq. (7.61), prend la forme

1 Tc
fcm (m) ' −Tc ln 2 + a(T )m2 + m4 où a(T ) = T − Tc (7.75)
2 12

On associe un poids e−βfcm (m) ' e−fcm (m)/Tc à l’aimantation m. Au dessus de la température
critique, T → Tc+ , on peut identifier la courbure de l’énergie libre avec la susceptibilité, d’où
χ = Var(m)/Tc ' 1/a(T ), Qed. Au dessous de la température critique, T → Tc− , l’énergie libre
présente une structure en double puits (figure 7.8) : fcm (m) ' cste + T12c (m2 − m2∗ )2 . La concavité
2f
d’un des puits est donnée par ∂∂m 2

2 m ' 3 Tc m∗ ' 2(Tc − T ).
cm

159
III Para-Ferro Transitions de phase – Approximation de champ moyen

Énergie moyenne.– En dérivant (7.58) par rapport à β nous obtenons une seconde relation
utile :
∂m∗ (Tc m∗ + B)(1 − m2∗ )
= , (7.76)
∂β 1 − TTc (1 − m2∗ )
qui nous permet de calculer l’énergie moyenne par spin. Après quelques simplifications, on obtient

C ∂ 1
E = (βf (T, B)) = − Tc m2∗ − B m∗ (7.77)
∂β 2

Les deux termes s’interprètent respectivement comme l’énergie d’interaction et l’énergie po-
tentielle magnétique. Remarquons que cette expression correspond simplement à la moyenne
de (7.55).
1.5

1.0
CV HTL

0.5

0.0
FERRO PARA
0.0 0.2 0.4 0.6 0.8 1.0 1.2

TTc

Figure 7.13 : Chaleur spécifique pour B = 0.

Chaleur spécifique.– La chaleur spécifique par spin (à B = 0) est obtenue en dérivant
l’énergie par rapport à la température, i.e. en utilisant à nouveau (7.76) :
Tc2 m2∗ (1 − m2∗ )
CV (T ) = . (7.78)
T [T − Tc (1 − m2∗ )]
Le comportement de basse température est obtenu à partir de celui de m∗ :
2Tc 2 −2Tc /T
 
CV (T ) ' e . (7.79)
T Tc T
Lorsque la température tend vers Tc par valeurs inférieures, on obtient une limite finie CV (Tc− ) =
3/2 ; remarquons que cette valeur peut être obtenue en combinant l’expression de l’énergie,
C C
E = − 21 Tc m2∗ , avec le comportement (7.65) : E ' 32 (T − Tc ) pour T . Tc . Au delà de la
température critique, m∗ (T, 0) = 0 et donc la chaleur spécifique est nulle CV (Tc+ ) = 0. La
discontinuité de chaleur spécifique est donc
3
CV (Tc− ) − CV (Tc+ ) = kB , (7.80)
2
où nous avons rétabli kB .

Entropie.– Quelques manipulations montrent que, lorsqu’elle est exprimée en fonction de


l’aimantation seulement, l’entropie prend précisément la forme de celle obtenue pour la phase
paramagnétique :
   
1 − m∗ 1 − m∗ 1 + m∗ 1 + m∗
S(T, B) = − ln − ln . (7.81)
2 2 2 2
L’étude détaillée de m∗ (T, B) permet d’analyser les comportements de l’entropie.

160
Transitions de phase – Approximation de champ moyen III Para-Ferro

0.6

SHT,0L
0.4

0.2

0.0
FERRO PARA
0.0 0.5 1.0 1.5 2.0

TTc

Figure 7.14 : Entropie pour B = 0.

Remarque

La méthode de champ moyen de Bragg-Williams que nous avons présentée pourrait être améliorée
pour prendre en compte les corrélations locales entre spins. L’idée consiste à appliquer la méthode
de champ moyen, non pas à un spin isolé, mais à un petit  cluster  de spins plus proches voisins
(un spin et ses q voisins) soumis à un champ moyen dû à l’environnement. Cf. § 14.5 de [13] ou
[28].

III.C Brisure spontanée de symétrie et paramètre d’ordre


Clôturons l’analyse détaillée du modèle d’Ising par quelques remarques de portée générale.

Brisure spontanée de symétrie.– À B = 0, l’hamiltonien d’Ising est une fonction paire


des spins, HIsing ({−σi }) = HIsing ({σi }). Cette symétrie se reflète également dans la distribu-
tion canonique P C ({σi }) ∝ e−βHIsing ({σi }) ; à ce P
titre il est étonnant de trouver une solution
caractérisée par une aimantation moyenne m = {σi } σi P C ({σi }) non nulle. 3 Autrement dit,
si la transformation −σi ↔ σi est une symétrie de la théorie à B = 0 (i.e. de l’hamiltonien),
elle n’est pas une symétrie de la phase ferromagnétique, i.e. de l’état du système, m = σi 6= 0.
On dira que la symétrie est  spontanément brisée  lorsque le système se trouve dans la phase
ferromagnétique.

Paramètre d’ordre.– La notion de brisure de symétrie est tout à fait centrale dans la théorie
des transitions de phase. C’est même ainsi que l’on définit le changement de phase (par une
réduction des symétries de l’état du système). La grandeur physique signalant cette brisure de
symétrie (ici l’aimantation moyenne et dans la transition liquide-gaz la densité) est appelée le
paramètre d’ordre.

Non analyticité des fonctions thermodynamiques.– Un autre aspect intéressant lié à


la brisure spontanée de la symétrie est l’apparition de comportements singuliers, non analy-
tiques, des fonctions thermodynamiques. Rappelons que la logique qui a prévalu dans les cha-
def
pitre précédent était de calculer une énergie libre f (T, B) = limN →∞ N1 F (T, B, N ) dont on
∂f
déduit l’aimantation moyenne par site m(T, B) = − ∂B . La symétrie du problème implique que
l’énergie libre est une fonction symétrique du champ magnétique f (T, −B) = f (T, B). Dans la
phase paramagnétique, l’annulation de l’aimantation à champ nul est lié à un comportement
3
σi P C ({σi }) σi P C ({−σi })
P P
Naı̈vement, en utilisant la symétrie : m = {σi } = {σi } =
P C
{σi } (−σi ) P ({σi }) = −m donc m = 0.

161
III Para-Ferro Transitions de phase – Approximation de champ moyen

régulier de l’énergie libre :


1
f (T, B) ' f (T, 0) − χ(T ) B 2 pour T > Tc (7.82)
B→0 2
Dans la phase ferromagnétique, l’existence d’une aimantation spontanée est lié à une disconti-
nuité de la dérivée de l’énergie libre : limB→0± ∂f ∂B
(T,B)
= ±m∗ où m∗ > 0, i.e.
f (T, B) ' f (T, 0) − m∗ |B| pour T < Tc . (7.83)
B→0

L’existence de tels comportements singuliers trouve son origine mathématique dans la limite
thermodynamique (en effet, pour une nombre N fini de spins, la fonction de partition et l’énergie
libre sont par définition des fonctions parfaitement régulières de T et B). Il y a donc une question
de limites qui ne commutent pas
1 ∂F (T, B, N ) 1 ∂F (T, B, N )
lim lim = 0 6= lim lim <0 pour T < Tc . (7.84)
N →∞ B→0+ N ∂B B→0+ N →∞ N ∂B

III.D Comparaison avec la transition liquide-gaz


L’étude de la dépendance de l’aimantation pour différentes températures peut être menée en
étudiant la solution de (7.58) graphiquement. Pour T > Tc on obtient une courbe assez similaire
à celle du cas du paramagnétisme. Pour T = Tc on a vu plus haut que la réponse à B → 0
est non linéaire, m∗ ∝ B 1/3 . Pour T < Tc la courbe d’aimantation présente une discontinuité à
B = 0.
1.0 1.0 1.0

TTc=1.25 TTc=1 TTc=0.85


0.5 0.5 0.5
m* HT,BL

m* HT,BL

m* HT,BL
0.0 0.0 0.0

-0.5 -0.5 -0.5

-1.0 -1.0 -1.0


-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0

B B B

Figure 7.15 : Paramètre d’ordre en fonction de B.

Remarquons que si ces figures sont tournées de 90o , elles ont une allure tout à fait similaire
aux isothermes de van der Waals au voisinage du point critique, i.e. la correspondance entre les
deux problèmes est établie en faisant substituant l’aimantation à la densité du fluide (mesurée
par rapport à la densité critique) m∗ → ρ − ρc et B → p − pc .
La ligne verticale à B = 0 sur la figure de droite de Fig. 7.15 décrit donc un équilibre
thermodynamique avec coexistence de deux phases : une phase d’aimantation m = +m∗ (T, 0)
et une phase d’aimantation m = −m∗ (T, 0). Le système est inhomogène et présente des zones
d’aimantation +m∗ (T, 0) et d’autres d’aimantation −m∗ (T, 0).
La relation est plus profonde qu’il n’y paraı̂t comme on peut s’en convaincre en examinant
les exposants critiques caractérisant le voisinage du point critique obtenu dans le cadre de
l’approximation de champ moyen (tableau 7.3). Pour cela on introduit la variable
def T
t= −1 (7.85)
Tc
mesurant la distance au point critique.
Nous pouvons pousser plus loin la comparaison et questionner l’égalité entre exposants cri-
tiques des deux problèmes physiques expérimentalement. Pour cela il convient d’abord de re-
marquer que l’approximation de champ moyen ne donne pas des valeurs exactes des exposants
critiques. Ceux-ci ont été obtenus numériquement (cf. tableau 7.4).

162
Transitions de phase – Approximation de champ moyen III Para-Ferro

Liq.-Gaz Para-Ferro
CV (T ) ∼ |t|−α α=0 CV (T ) ∼ |t|−α α=0
δρ(T ) ∼ (−t)β ∼ β = 1/2 m(T, 0) ∼ (−t)β β = 1/2
δρ(Tc ) ∼ (δp)1/δ δ=3 m(Tc , B) ∼ B 1/δ δ=3
κ(T ) ∼ |t|−γ γ=1 χ(T ) ∼ |t|−γ γ=1

Table 7.3 : Exposants critiques de champ moyen. Le paramètre d’ordre de la transition


liquide-gaz est la densité δρ = ρ − ρc . Celui de la transition para-ferromagnétique est l’aimanta-
tion m.
Quantité exposant
C(T ) ∼ |t|−α α = 0.110(1)
m(T, 0) ∼ (−t)β β = 0.3265(3)
χ(T ) ∼ |t|−γ γ = 1.2372(5)
m(Tc , B) ∼ B 1/δ δ = 4.789(5)
def
Table 7.4 : Exposants critiques du modèle d’Ising 3D (théorie). t = (T − Tc )/Tc .
Résultats théoriques obtenus pour le modèle d’Ising 3D, tirées de la revue : Andrea Pelissetto
& Ettore Vicari,  Critical phenomena and renormalization-group theory , Phys. Rep. 368,
549–727 (2002).

Si ces exposants sont comparés aux résultats expérimentaux, on constate en effet un remar-
quable accord entre théorie et expérience d’une part, mais surtout entre exposants associés aux
deux transitions.

Transition liquide-gaz para-ferro


Chaleur CO2 FeF2
spécifique C(T ) ∼ |t|−α α = 0.111(1) C(T ) ∼ |t|−α α = 0.11(3)
Paramètre densité CO2 aimantation FeF2
d’ordre ρ(T ) − ρc ∼ (−t)β β = 0.324(2) m(T, 0) ∼ (−t)β β = 0.325(2)
Suscep- Compressibilité Xe Susceptibilité FeF2
tibilité κT (T ) ∼ |t|−γ γ = 1.246(10) χ(T ) ∼ |t|−γ γ = 1.25(1)

Table 7.5 : Exposants critiques des transitions liquide-gaz et para-ferromagnétique.


def
(Transitions de phase de la classe d’universalité d’Ising 3D). t = (T − Tc )/Tc mesure l’écart au
point critique. Données expérimentales tirées de H. W. Blöte, E. Luijten & J. R. Heringa, J.
Phys. A 28, 6289 (1995).

La convergence de deux problèmes a priori aussi différents est un aspect particulièrement


remarquable et se comprend par le fait qu’ils appartiennent tous les deux à la même classe
d’universalité (même dimensionnalité et paramètre d’ordre de même nature, i.e. symétrie brisée
Z2 ).

163
III Para-Ferro Transitions de phase – Approximation de champ moyen

, Les idées importantes


• Les transitions de phase sont la manifestation, à l’échelle macroscopique, d’effets coopératifs
médiés par les interactions à l’échelle microscopique. Les mêmes détails microscopiques conduisent
à des organisations de la matière différentes à l’échelle macroscopique.
• Notion de paramètre d’ordre : une grandeur physique permettant de discriminer la nature de
la phase. Ex : la densité du fluide pour la transition liquide/gaz. Ex2 : l’aimantation pour la
transition Para/Ferro.
• Transition de phase du premier ordre : discontinuité du paramètre d’ordre (ex : différentes
densités dans les phases liquide et gazeuse). Existence d’une chaleur latente, plus généralement
discontinuité des dérivées premières du potentiel thermodynamique.
• Transition de phase du second ordre : paramètre d’ordre continu (ex √ : en champ nul, l’aiman-
tation d’un ferromagnétique est m(T ) = 0 pour T > Tc et m(T ) ∝ Tc − T pour T < Tc , dans
l’approximation de champ moyen). Comportements singuliers des dérivées secondes du potentiel
thermodynamique (ex : divergence de la susceptibilité magnétique à la transition Para/Ferro).
• Le modèle d’Ising est un modèle très important en physique statistique (magnétisme, gaz sur
réseau, alliages désordonnés, etc).
X X
HIsing = −J σi σj − B σi (7.86)
hi , ji i

pour des  spins  σi = ±1. La somme porte sur les spins voisins en interaction. L’interaction
J > 0 favorise l’ordre ferromagnétique (et J < 0 l’ordre antiferromagnétique).
• Le traitement en champ moyen du modèle d’Ising (méthode auto-cohérente) fait émerger la
plupart des propriétés physiques intéressantes (au moins qualitativement).
• Concrètement : être capable de retrouver l’équation auto-cohérente et maı̂triser le principe
de la résolution graphique.

164
Transitions de phase – Approximation de champ moyen III Para-Ferro

Annexe 7.A : Exercices


- Exercice 7.1 Le modèle d’Ising anti-ferromagnétique sur réseau hypercubique :
Nous considérons le cas X X
H = +J σi σj − B σi (7.87)
hi,ji i

où J > 0, i.e. une interaction favorisant l’anti-alignement des spins. On admet que la phase
ordonnée à T = B = 0 correspond à l’ordre de Néel : les spins prennent des valeurs alternées +1
et −1. Autrement dit, si nous divisons le réseau hypercubique en deux sous réseaux imbriqués,
notés Ra et Rb , l’aimantation prend une valeur constante sur chacun des sous-réseaux, ma = +1
et mb = −1 (ou l’inverse). L’aimantation moyenne m = 21 (ma + mb ) est nulle mais il existe un
ordre caractérisé par la valeur de l’aimantation alternée mstag = 12 (ma − mb ) = 1 (ou −1). Cette
dernière joue donc le rôle de paramètre d’ordre dans la phase anti-ferromagnétique.
P P P
a/ En décomposant la somme sur les sites sur les deux sous réseaux i = i∈Ra + i∈Rb ,
donner l’expression de l’hamiltonien de champ moyen Hcm analogue à (7.55). Il sera commode
pour la suite d’introduire deux champs magnétiques distincts Ba et Bb sur les deux sous réseaux.
b/ Calculer l’énergie libre associée à l’hamiltonien de champ moyen Hcm . Déduire deux équations
auto-cohérentes permettant de déterminer ma et mb .
c/ On admet que ma = −mb . Déduire une équation pour mstag . Comparer au cas ferro-
magnétique. Résoudre cette équation graphiquement lorsque B = 0. Identifier la température
critique Tc . Analyser mstag dans les limites T . Tc et T  Tc .
- Exercice 7.2 Du bon usage du champ moyen – La méthode variationnelle : On
veut fonder l’approche de champ moyen sur un principe variationnel, i.e. construire une énergie
libre approchée, que nous noterons fvar (m), à partir d’un critère de minimisation clair.
On souhaite étudier les propriétés d’un système décrit par le Hamiltonien H, que l’on ne
sait pas traiter exactement. L’idée de la méthode variationnelle est de proposer un ansatz H0 ,
dépendant d’un(des) paramètre(s) variationnel(s), dont on sait étudier les propriétés. On cher-
chera alors quelle(s) valeur(s) du(des) paramètre(s) minimise(nt) un critère que nous définissons
maintenant.
1/ Inégalité de Bogoliubov.– Soit x une variable aléatoire ; on donne l’inégalité de convexité
hex i > ehxi . Montrer que l’énergie libre pour H est bornée supérieurement par :

F 6 F0 + hH − H0 i0 (7.88)

où h· · ·i0 est la moyenne canonique par rapport à l’hamiltonien H0 .


Cette inégalité, appelée inégalité de Bogoliubov, nous permet de définir un critère pour ap-
procher les propriétés de H : on cherche les paramètres variationnels qui minimisent le membre
de droite F0 + hH − H0 i0 .
2/ Hamiltonien d’Ising.– Nous considérons l’Hamilonien
P d’Ising ferromagnétique (l’hamilto-
nien H). Proposons l’hamiltonien d’essai H0 = −Beff i σi .
a/ Quelle est la valeur de l’aimantation moyenne m par site associée à H0 ?
b/ Calculer hHi0 puis déduire une équation pour la valeur du paramètre variationnel Beff qui
def
minimise Fvar = F0 + hH − H0 i0 .
c/ Dans l’équation obtenue à la question précédente, éliminer Beff au profit de m pour obtenir une
équation auto-cohérente pour cette dernière. Calculer l’énergie variationnel par site fvar (m) =
Fvar /N en fonction de m. Comparer à la fonction fcm (m) obtenue dans l’exercice précédent.

165
III Para-Ferro Transitions de phase – Approximation de champ moyen

Commentaire (sur la méthode de champ moyen) : Si on applique la méthode variationnelle au


modèle d’Ising anti-ferromagnétique (AF) on peut vérifier que les deux énergies libres approchées
fcm (ma , mb ) (exercice 7.1) et fvar (ma , mb ) (exercice 7.2) ne coı̈ncident pas ! Le problème posé par
“l’approche champ moyen” (dans la version présentée dans l’exercice 7.1) est de ne pas reposer
sur un principe variationnel, i.e. sur un critère de minimisation bien défini. En particulier, elle
fournit une “énergie libre de champ moyen” fcm (ma , mb ) qui n’est pas minimale pour la phase
AF (i.e. correspond à un point col). Autrement dit, bien que les équations auto-cohérentes que
nous avons obtenues pour déterminer ma et mb soient correctes, fcm (ma , mb ) n’a pas de sens
hors de la ligne ma = −mb . En revanche l’approche variationnelle fournit une énergie libre
variationnelle fvar (ma , mb ) minimale dans la phase AF.
Cette observation est inspirée de l’article : Raphaël Agra, Frédéric van Wijland & Emmanuel
Trizac, On the free energy within the mean-field approximation, European Journal of Physics
77, 407 (2006), arXiv:cond-mat/06 01 125.

166
Chapitre 8

Système en contact avec un


thermostat réservoir de particules –
Ensemble grand canonique

Plan du chapitre
I Ensemble grand canonique . . . . . . . . . . . . . . . . . . . . . . . . . 167
I.A Introduction : Position du problème . . . . . . . . . . . . . . . . . . . . 167
I.B Ensemble grand canonique . . . . . . . . . . . . . . . . . . . . . . . . . 168
I.C Propriétés de l’ensemble grand canonique . . . . . . . . . . . . . . . . . 170
II Particules identiques sans interaction . . . . . . . . . . . . . . . . . . 170
II.A Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
II.B Description microscopique : facteurs d’occupation . . . . . . . . . . . . . 174
II.C Décomposition de la grande fonction de partition . . . . . . . . . . . . . 174
II.D Occupation des états individuels . . . . . . . . . . . . . . . . . . . . . . 175

I Ensemble grand canonique


I.A Introduction : Position du problème
Dans ce chapitre nous nous intéressons à la situation où le système se trouve en contact avec un
grand système avec qui il peut échanger de l’énergie (comme dans la situation canonique) mais
aussi des particules. Autrement dit, nous fixons les variables thermodynamiques conjuguées de
l’énergie et du nombre de particules, respectivement la température et le potentiel chimique du
système.

Motivations physiques.– Cette situation peut avoir un intérêt pour décrire certaines situa-
tions physiques. Deux exemples :
• L’étude de l’adsorption des atomes d’un gaz à la surface d’un solide. Les surfaces des solides
sont extrêmement rugueuses à l’échelle atomique, et d’autre part inhomogènes chimique-
ment, ce qui se traduit par l’existence de pièges sur lesquels les atomes du gaz peuvent venir
s’accrocher. Cet effet est particulièrement désagréable si l’on souhaite faire une expérience
sous vide : des atomes piégés à la surface de la chambre à vide pourraient être relâchés et
polluer l’expérience, d’où l’intérêt de bien comprendre le phénomène d’adsorption afin de
contrôler la quantité d’atomes de surface.

167
I Ensemble grand canonique Ensemble grand canonique

Si nous considérons l’ensemble des atomes piégés à la surface du solide ( le système ),
leur nombre varie constamment à cause des processus de piégeage/dépiégeage. Il y a donc
des échanges constant avec le gaz qui joue le rôle d’un  réservoir  d’atomes. Puisque le
nombre d’atomes de surface est nécessairement beaucoup plus petit que les atomes du gaz,
l’état de la surface n’affecte pas l’état thermodynamique du gaz.
• Une deuxième illustration physique est fournie par un conducteur mis en contact avec
une batterie. Les lois de l’électrocinétique nous disent que la charge est contrôlée par la
tension, Q = C V , où C est la capacité du conducteur. Cette description ignore toutefois
l’effet des fluctuations thermiques, qui peuvent générer des fluctuations δq de la charge :
on doit plutôt écrire Q = C V . La batterie joue le rôle de réservoir pour les charges du
conducteur.

δq
Q
V

Figure 8.1 : Un conducteur relié à une batterie. Les fluctuations thermiques sont respon-
sables de fluctuations de la charge dans le conducteur.

Motivation  technique  : les statistiques quantiques.– L’autre intérêt de l’ensemble


grand canonique est de nature plus technique, mais aura des conséquences physiques d’im-
portance fondamentale. Relâcher une contrainte supplémentaire sur le nombre de particules
(en passant de l’ensemble canonique à grand canonique) va permettre de lever les difficultés
techniques liées au postulat de symétrisation de la mécanique quantique. Le formalisme grand
canonique va ainsi nous permettre de traiter exactement les effets du postulat de symétrisation
et les corrélations quantiques. Une bonne partie de la fin du cours concernera l’étude des gaz
parfaits quantiques.

I.B Ensemble grand canonique


Distribution grand canonique
La logique et les calculs sont très similaires à ceux de l’ensemble canonique. Aussi serons-nous
plus brefs. Nous reprenons essentiellement l’argument présenté de manière détaillée au § I.A
du chapitre 4. Nous notons R le réservoir-thermostat et S le système. L’énergie totale et le
nombre de particules total du système isolé (R ⊗S ) sont notés respectivement Etot et Ntot . Nous
cherchons la probabilité d’occupation du microétat ` du système S , caractérisé (notamment)
par une énergie E` et un nombre de particules N` . Nous appliquons le postulat fondamental au
système isolé R ⊗ S , ce qui conduit à la probabilité d’occupation
ΩR (Etot − E` , Ntot − N` ) 1
S ∗ (E −E ,N −N )
P`G = P ∝ e kB R tot ` tot ` (8.1)
E, N ΩS (E, N ) ΩR (Etot − E, Ntot − N )

Nous utilisons l’hypothèse que le réservoir est beaucoup plus grand que le système pour développer
son entropie microcanonique :

∂SR ∗
∂SR
∗ ∗
SR (Etot − E` , Ntot − N` ) ' SR (Etot , Ntot ) − E` (Etot , Ntot ) −N` (Etot , Ntot ) (8.2)
∂E ∂N
| R {z } | R {z }
1/TR∗ −µ∗R /TR∗

168
Ensemble grand canonique I Ensemble grand canonique

Nous définissons la température et le potentiel chimique grand canoniques comme les valeurs
fixées par le réservoir :

T = TR∗
def
(8.3)
µ = µ∗R .
def
(8.4)

Nous avons obtenu la dépendance de la probabilité d’occupation du microétat dans les variables
définissant celui-ci :  
G 1 1 µ
P` ∝ exp − E` + N` . (8.5)
kB T T
Il nous reste à normaliser cette distribution. Finalement, la distribution grand-canonique est

1 −β(E` −µN` )
P`G = e (8.6)
Ξ

où la constante de normalisation Ξ est appelée la  grande fonction de partition  :


X
e−β(E` −µN` )
def
Ξ= (8.7)
`

La grande fonction de partition est la fonction génératrice de l’ensemble grand canonique.


P
Remarque : espace de Hilbert versus espace de Fock.– Notons que la sommation `
est réalisée sur les microétats correspondant à des nombres de particules pouvant varier, i.e. dans
L de Fock F défini comme la réunion des espaces de Hilbert à 0, 1, 2, 3, etc particules :
l’espace
F = ∞ N =0 HN où HN est l’espace de Hilbert à N particules.

Relation entre les fonctions de partitions canonique et grand canonique


En remarquant que nous pouvons séparer la somme sur les microétats en une somme sur le
nombre de particules N et une somme sur les microétats ayant un nombre de particules N ,

X X
Ξ(β, µ) = eβµN e−βE` , (8.8)
N =0 ` tq. N` =N

nous obtenons la relation entre grande fonction de partition et fonction de partition canonique

X def
Ξ(β, µ) = ϕN Z(T, N ) , où ϕ = eβµ (8.9)
N =0

est appelée la fugacité. Par convention Z(β, 0) = 1. Autrement dit, on peut utiliser la fonction de
partition grand canonique comme fonction génératrice de la fonction de partition canonique : 1

1 ∂N
Z(β, N ) = Ξ(β, µ) . (8.11)

N ! ∂ϕN
ϕ=0
1
Remarque : On a vu une relation analogue entre la fonction de partition canonique et le nombre de
microétats accessibles. Si on identifie le nombre de microétats accessibles à énergie E avec la dégénérescence (i.e.
on identifie δE avec l’écart entre niveaux successifs, dans les notations du chapitre 3) :
X
Z(β, N ) = Ω(E` ) e−βE` (8.10)
E`

où la somme porte ici sur les niveaux d’énergie (pas les états).

169
II Particules identiques sans interaction Ensemble grand canonique

I.C Propriétés de l’ensemble grand canonique


Grand potentiel
On introduit un potentiel thermodynamique, le grand potentiel :
def
J(T, µ, · · · ) = −kB T ln Ξ(T, µ, · · · ) (8.12)
où “· · · ” signale la possible dépendance dans d’autres paramètres (volume, champ magnétique,
etc). Comme pour les autres ensembles, la connaissance de ce potentiel donne accès à toutes les
propriétés thermodynamiques du système.

Nombre moyen de particules et énergie moyenne


G P
Il est facile de voir que le nombre moyen de particules, N = ` P`G N` , est obtenu par dérivation
de la grande fonction de partition par rapport au paramètre conjugué :
G 1 ∂ ∂J
N = ln Ξ = − . (8.13)
β ∂µ ∂µ
G
Connaissant N , l’énergie moyenne est alors donnée par
G G ∂
E − µN = − ln Ξ . (8.14)
∂β

Entropie grand canonique


Nous appliquons la formule de l’entropie statistique à la distribution grand canonique :
X X X
S G = −kB P`G ln P`G = kB β P`G E` − kB βµ P`G N` + kB ln Ξ (8.15)
` ` `
i.e. G G
G E − µN − J ∂J
S = =− (8.16)
T ∂T
- ∂J
Exercice 8.1 : Vérifier la dernière égalité S G = − ∂T .

Pression grand canonique


La pression grand canonique est définie comme la dérivée du potentiel thermodynamique par
rapport au volume :
def ∂J
pG = − (8.17)
∂V
Remarquons que pour un fluide simple, si le grand potentiel n’est fonction que de T , µ et du
volume V , ce dernier étant la seule grandeur extensive, le grand potentiel lui est forcément
proportionnel et donc
1
pG (T, µ) = − J(T, µ, V ) . (8.18)
V
La  densité volumique de grand potentiel  est donc la pression (au signe près).

II Particules identiques sans interaction


II.A Motivation
Un des intérêts du traitement grand canonique est de rendre possible un traitement exact des
effets du postulat de symétrisation de la mécanique quantique. Nous pourrons ainsi analyser en
détail les propriétés des gaz parfaits quantiques.

170
Ensemble grand canonique II Particules identiques sans interaction

Les limites du traitement semi-classique


Les limitations du traitement semi-classique du gaz parfait monoatomique ont déjà été soulignées
plus haut (chapitre 4) aussi nous ne reviendrons pas dessus en détail. Rappelons néanmoins que
l’analyse a fait émerger un échelle de température caractéristique en deçà de laquelle l’approxi-
mation de Maxwell-Boltzmann cesse d’être valable. Cette observation était basée sur l’examen
de la fonction de partition
(M.B.) eN 1
Z ' √ (8.19)
2πN (n Λ3T )N
p
où n = N/V est la densité moyenne et ΛT = 2π~2 /(mkB T ) la longueur thermique. La
condition de validité de (8.19) est
n Λ3T . 1 . (8.20)
Il s’agit donc d’une condition de basse densité et/ou de haute température, ce que nous désignons
comme le régime diluée.

Transition vers le régime quantique


À l’inverse, nous appellerons le régime où n Λ3T & 1, le régime corrélé, en référence aux corrélations
quantiques induites par le postulat de symétrisation [34, chapitre 11].
La transition entre les deux régimes se produit pour une densité n ∼ n∗ = 1/Λ3T (si T est
fixée), ou à une température
def ~2 2/3
T ∼ T∗ = n (8.21)
mkB
si la densité est fixée.
0 T* T
quantique classique
n n = Λ−3
* T

À quels effets pouvons-nous d’ores et déjà nous attendre ? Considérons par exemple l’équation
d’état d’un gaz parfait quantique. Si les atomes sont des bosons, les corrélations quantiques fa-
vorisent leur regroupement spatialement ou énergétiquement. Elles auront donc pour effet de
diminuer la pression, par rapport au gaz classique (figure 8.2). En revanche, si les atomes sont des
fermions, le postulat de symétrisation induit des anti-corrélations produisant une répulsion ef-
fective entre les atomes (principe de Pauli), ce qui augmente la pression du gaz comparativement
au gaz parfait classique (figure 8.2).

?
ue

P
siq
as

fermions
cl

?
bosons

n
n*

Figure 8.2 : Allure attendue pour les équations d’états des gaz parfaits quantiques. La déviation
à la loi p = nkB T est due aux corrélations quantiques (postulat de symétrisation).

171
II Particules identiques sans interaction Ensemble grand canonique

Exemple du problème à deux particules sans interaction


Afin d’illustrer plus précisément ce point, nous étudions le problème à deux particules. Nous
notons {| n i, εn } le spectre des états à une particule, où l’indice nPregroupe l’ensemble des
nombres quantiques. La fonction de partition à un corps est Z1 (β) = n e−βεn .

Deux bosons.– Les états à deux bosons sont des états symétrisés
(
| n i1 ⊗ | n i2 si n = m
| n, m iB = (8.22)
√1 | n i1 ⊗ | m i2 + | m i1 ⊗ | n i2
 
2
6 m
si n =

Le spectre des énergies à deux bosons est simplement

En,m = εn + εm où n > m (8.23)

afin de ne pas compter deux fois le même état | n, m iB = | m, n iB . Autrement dit la fonction
de partition à deux bosons est

sommation sur les microétats


zX
}| { X
Z2B (β) = e−βEn,m = e−β(εn +εm ) . (8.24)
| n,m iB n>m
|{z}
sommation sur les nombres quantiques

La somme sur les états quantiques s’écrit donc en termes d’une double somme sur des nombres
quantiques avec une contrainte, expression du postulat de symétrisation.
Nous pouvons expliciter la somme afin de relier la fonction de partition à deux bosons à la
fonction de partition à une particule :

1 X −β(εn +εm ) 1 X −2βεn 1


Z2B (β) = Z1 (β)2 + Z1 (2β) .

e + e = (8.25)
2 n, m 2 n 2

Deux fermions.– Les états fermioniques sont antisymétriques :

1  
| n, m iF = √ | n i1 ⊗ | m i2 − | m i1 ⊗ | n i2 pour n > n . (8.26)
2

La fonction de partition s’écrit donc


X X
Z2F (β) = e−βEn,m = e−β(εn +εm ) . (8.27)
| n,m iF n>m

Nous pouvons simplifier la somme de manière analogue au cas des bosons.

Conclusion.– En conclusion, la fonction de partition du problème à deux bosons/fermions


est
B/F 1 1
Z2 (β) = Z1 (β)2 ± Z1 (2β) . (8.28)
| {z } 2
2
M.B.

Nous reconnaissons le premier terme qui correspond à l’approximation de Maxwell-Boltzmann.


Le second terme est donc une correction quantique due au postulat de symétrisation.

172
Ensemble grand canonique II Particules identiques sans interaction

Forme approchée de l’équation d’état des gaz parfaits quantiques – Second coeffi-
cient du viriel
Quelle(s) conséquence(s) physique(s) peut-on déduire de ce résultat ? Pour des particules libres,
nous utilisons Z1 = V /Λ3T , d’où
" #
V 2 1 V 2 Λ3T
    
B/F 1 V
Z2 (β) = ± 3/2 3 = 1 ± 3/2 , (8.29)
2 Λ3T 2 ΛT 2 Λ3T 2 V

où nous avons utilisé que ΛT → 2ΛT si β → 2β. En traitant le terme ±Λ3T /(23/2 V ) comme
une  petite  correction, ce qui est le cas dans la limite de haute température, nous obtenons
l’énergie libre
Λ3T kB T Λ3
 
F (T, V, 2) = Fclass (T, V, 2) − kB T ln 1 ± 3/2 ' Fclass (T, V, 2) ∓ 3/2 T (8.30)
2 V | 2{z V }
∆Fpaire
 
où Fclass (T, V, N ) = −N kB T ln(Z1 /N ) + 1 est l’énergie libre du gaz parfait classique étudiée
au chapitre 4. ∆Fpaire est la correction due aux corrélations quantiques, pour une paire de
particules.
Nous extrapolons maintenant au cas d’un gaz de N particules en écrivant
N (N − 1)
F (T, V, N ) ' Fclass (T, V, N ) + ∆Fpaire (8.31)
2
où nous avons multiplié ∆Fpaire par le nombre de paires du gaz, N (N − 1)/2 ' N 2 /2. Nous
obtenons finalement
kB T Λ3T
F (T, V, N ) ' Fclass (T, V, N ) ∓ N 2 . (8.32)
25/2 V
Cette expression n’est valable que dans un régime de relativement haute température car elle
ignore les corrélations à N > 2 particules.
Nous déduisons le comportement de la pression :
∂F  
p=− ' nkB T 1 ∓ 2−5/2 n Λ3T . (8.33)
∂V
La correction quadratique dans la densité a donc un signe opposé dans les cas bosonique et
fermionique. L’expression est en accord avec le comportement attendu (figure 8.2).

Second coefficient du viriel.– Une manière pratique d’analyser les gaz réels consiste à
présenter l’équation d’état sous la forme d’un développement en puissance de la densité :

!
X
p = n kB T 1 + Bk (T ) nk−1 . (8.34)
k=2
Le coefficient Bk est appelé le kème coefficient du viriel, et encode l’effet des corrélations à k
particules. Si ce développement a été introduit au chapitre 7 pour traiter l’effet des corrélations
induites par l’interaction entre atomes (conduisant à une transition de phase), nous venons
d’obtenir l’expression du second coefficient du viriel du gaz parfait quantique :
(
−5/2 3 − bosons
B2 (T ) = ∓2 ΛT (8.35)
+ fermions
caractérisant l’effet des corrélations quantiques à 2 particules (dans un gaz réel, effets de l’in-
teraction et des corrélations quantiques se conjuguent). L’équation d’état du gaz parfait quan-
tique pourrait s’écrire sous la forme d’un développement en puissance du paramètre adimen-
sionné nΛ3T .

173
II Particules identiques sans interaction Ensemble grand canonique

Objectif des prochains chapitres : l’objet de la fin du chapitre et des deux chapitres
suivants sera d’analyser en détail les propriétés des gaz parfaits quantiques (fermions, puis
bosons). Cependant, la stratégie sera très différente de celle suivie dans ce paragraphe introductif,
qui a consisté à étudier, à partir des hautes températures, comment l’équation d’état du gaz
parfait classique p = nkB T était affectée par les corrélations quantiques. Dans les prochains
chapitres nous aborderons le problème à partir de la température nulle et nous procéderons à
des développements de basse température.

II.B Description microscopique : facteurs d’occupation


Lorsque les particules n’interagissent pas le problème est séparable et il est pertinent de construire
les bases d’états à N corps, {| ` i}, en termes des états individuels (à 1 corps), notés {| λ i}. I.e.
| ` i =Symétrisation | λ1 i ⊗ · · · ⊗ | λN i représente un état symétrisé à N particules occupant N
états individuels (par exemple des ondes planes pour des particules libres) ; | ` i est soit invariant
(bosons) soit antisymétrique (fermions) sous l’échange d’une paire de particules. On a discuté
dans le chapitre 3 que les états à N corps satisfaisant le postulat de symétrisation peuvent être
caractérisés par la donnée de l’ensemble des facteurs d’occupation des états individuels (cf.
annexe 3.B page 75) :
| ` i ≡ | {nλ } i (8.36)
où nλ est le nombre de particules dans l’état individuel | λ i. On a
X X
N` = nλ et E` = n λ ελ (8.37)
λ λ
P
où la somme λ porte sur l’ensemble des états individuels. ελ est la valeur propre de l’énergie
de l’état stationnaire | λ i de l’hamiltonien pour une particule.

II.C Décomposition de la grande fonction de partition


L’introduction des facteurs d’occupation fournit le  bon langage  pour exprimer la grande
fonction de partition en termes des états individuels. Pour clarifier ce point, nous remplaçons
dans (8.7) le label ` par la donnée de l’ensemble des facteurs d’occupation ` → {nλ }
P P
nλ nλ ···
1 2
z}|{
X −β
P
nλ ελ −µ
P

 YX 
−βnλ (ελ −µ)
Ξ= e λ λ = e . (8.38)
{nλ } λ nλ

Autrement dit nous pouvons factoriser la grande fonction de partition en produit de grandes
fonctions de partition associées à chacun des états individuels :
Y X
Ξ= ξλ où ξλ = e−βnλ (ελ −µ) . (8.39)
λ nλ

La fonction de grand partition ξλ permet donc de caractériser les propriétés statistiques des
particules dans l’état individuel | λ i.

Ce résultat est très important : il montre que l’écriture en terme des facteurs d’occupation
et le formalisme grand canonique fournissent le  bon langage  pour passer très directement
des propriétés à une particule (le spectre des états individuels | λ i) aux propriétés à plusieurs
particules (la physique statistique d’un système macroscopique).

Cette  factorisation  des propriétés à un corps est d’autant plus remarquable que les particules
sont corrélées (effets du postulat de symétrisation).

174
Ensemble grand canonique II Particules identiques sans interaction

II.D Occupation des états individuels


Analyse générale
L’occupation moyenne de l’état individuel | λ i est aisément obtenue à partir de ξλ . Pour nous en
convaincre, nous pouvons repartir de l’expression de la probabilité d’occupation grand canonique
G
P{n ν}
du microétat {nν } :
1 −β E{nν } −µN{nν }
X X 
G G
nλ = nλ P{nν } = nλ e (8.40)
Ξ
{nν } {nν }
X e−βnλ (ελ −µ) X e−βnν1 (εν1 −µ) X e−βnν2 (εν2 −µ) X e−βnλ (ελ −µ)
= nλ ··· = nλ (8.41)

ξλ nν1
ξν1 nν2
ξν2 nλ
ξλ
| {z }
états individuels 6=λ−→ contribution=1
Comme on s’y attendait, par analogie avec (8.13) puisqu’il y a  découplage  entre états
individuels dans le formalisme grand canonique :
1 ∂
nλ G = ln ξλ (8.42)
β ∂µ
De même nous pouvons caractériser les fluctutations du nombre d’occupation
1 ∂ 2
 
Var(nλ ) = ln ξλ (8.43)
β ∂µ
cumulant ∂ m
et plus généralement les cumulants nm = β1 ∂µ

λ ln ξλ . Ces petits calculs illustrent une
idée forte : les différentes quantités thermodynamiques pourront ainsi être directement exprimées
en termes des propriétés à une particule.

Distribution du nombre d’occupation


Le calcul précédent a fait apparaı̂tre la distribution du nombre d’occupation (i.e. la probabilité
d’occupation de l’état individuel | λ i par nλ particules) :
1 −βnλ (ελ −µ)
πλG (nλ ) = e (8.44)
ξλ
P
(normalisée comme nλ πλG (nλ ) = 1).

Statistique de Bose-Einstein
Nous appliquons les formules précédentes au cas des bosons. Dans ce cas l’occupation des états
individuels n’est pas limitée :
bosons : nλ ∈ N
Nous obtenons explicitement la grande fonction de partition d’un état individuel et l’occupation
moyenne de l’état :
1 1
ξλB = ⇒ nλ B = pour µ < ε0 (8.45)
1− e−β(ελ −µ) eβ(ελ −µ) −1
qui est appelée la distribution de Bose-Einstein. On doit P∞imposer une contrainte sur le po-
tentiel chimique afin que la série géométrique ξλ = nλ =0 e−nλ β(ελ −µ) soit convergente : µ
B

doit donc être inférieur à l’énergie fondamentale ε0 . Nous verrons dans deux chapitres que cette
contrainte joue un rôle extrêmement important : elle est responsable du phénomène de conden-
sation de Bose-Einstein, lorsqu’il existe une loi de conservation sur le nombre de particules.

175
II Particules identiques sans interaction Ensemble grand canonique

Statistique de Fermi-Dirac
Pour des fermions, le principe de Pauli interdit l’occupation d’un état individuel par plus d’une
particule, i.e.
fermions : nλ ∈ {0, 1}
La sommation, dans la grande fonction de partition, est encore plus élémentaire :

1
ξλF = 1 + e−β(ελ −µ) ⇒ nλ F = (8.46)
eβ(ελ −µ) +1

où nλ F est la distribution de Fermi-Dirac.

Résumé : Bosons/Fermions
Nous pouvons écrire sur le même plan les propriétés obtenues ci-dessus :
(
B/F ∓1 − pour des bosons
ξλ = 1 ∓ e−β(ελ −µ)
 
(8.47)
+ pour des fermions

donc nous déduisons


1
nλ B/F = . (8.48)
∓1 eβ(ελ −µ)
Nous obtenons une expression générale du grand potentiel en terme des propriétés des états
individuels :
1X
J B/F = ± ln(1 ∓ e−β(ελ −µ) ) (8.49)
β
λ

L’idée maı̂tresse formulée dans l’encadré plus haut est particulièrement explicite si l’on
considère le grand potentiel. Ce dernier contient toutes les propriétés thermodynamiques du
système à N particules (non fixé), or, bien que les particules ne soient pas indépendantes mais
corrélées, J s’exprime comme une somme de propriétés du problème à une particule (propriétés
des états individuels).
3.0

2.5 MB

2.0

1.5
principe de Pauli

1.0
FD

0.5 Μ BE

0.0
-6 -4 -2 0 2

Figure 8.3 : Distributions de Bose-Einstein (noire) et de Fermi-Dirac (bleue) ; limite classique :


distribution de Maxwell-Boltzmann (marron en pointillés).

176
Ensemble grand canonique II Particules identiques sans interaction

Fonction de partition canonique


Nous pouvons insérer dans Ξ le développement de la fonction de grand partition en puissances
de la fugacité
(
B/F 1 + ϕ e−βελ + ϕ2 e−2βελ + O(ϕ3 ) bosons
ξλ = (8.50)
1 + ϕ e−βελ fermions

Par exemple, pour les bosons


Y 
ΞB = 1 + ϕ e−βελ + ϕ2 e−2βελ + · · · (8.51)
λ
!
X X X
=1+ϕ e−βελ + ϕ2 e−2βελ + e−β(ελ +εν ) + O(ϕ3 ) (8.52)
λ λ λ>ν

le terme quadratique en ϕ est construit d’une part par les termes quadratiques ϕ2 e−2βελ de ξλ ,
et d’autre part par les produits ϕ e−βελ ϕ e−βεν de termes linéaires (chaque couple apparaı̂t une
fois dans le développement). Si nous comparons ce développement avec (8.9), nous retrouvons
X
Z(β, 1) = e−βελ (8.53)
λ
1
B
Z (β, 2) = Z(β, 1)2 + Z(2β, 1) .

(8.54)
2

- Exercice 8.2 : Facile : vérifier que le cas des fermions redonne le résultat obtenu en
introduction de la section.
Plus difficile : pousser le développement jusqu’aux termes ϕ3 afin de déduire Z(3, N ).

Remarque sur les fluctuations


Nous analysons plus en détail les fluctuations à partir de l’expression (8.43) :
2
1 ∂nλ B/F eβ(ελ −µ)

B/F 1 ∂ B/F
Var(nλ ) = ln ξλ = = β(ε −µ) (8.55)
β ∂µ β ∂µ (e λ ∓ 1)2

Des manipulations élémentaires conduisent à l’expression intéressante


 
Var(nλ )B/F = nλ B/F 1 ± nλ B/F (8.56)

Dans la limite classique (Maxwell-Boltzmann), la variance est égale à la valeur moyenne

Var(nλ )MB = nλ MB (8.57)

ce qui caractérise une distribution poissonienne, pour des particules indépendantes. Le résultat
(8.56) montre donc l’effet du postulat de symétrisation sur les fluctuations : pour des bosons se
regroupant plus favorablement dans un même état quantique, les fluctuations sont augmentées
BE BE BE

par rapport au cas classique, Var(nλ ) = nλ 1 + nλ . En revanche, pour des fermions, les
fluctuations sont réduites par le principe de Pauli par rapport au cas poissonien, Var(nλ )FD =
nλ FD 1 − nλ FD ; dans le cas extrême de température nulle, la distribution de Fermi-Dirac est
nλ FD = θH (µ − ε) et les fluctuations sont nulles : Var(nλ )FD = 0 à T = 0.

177
II Particules identiques sans interaction Ensemble grand canonique

Limite diluée (classique)


Si le potentiel chimique est très en deçà de l’énergie fondamentale ε0 , de telle sorte que

e−β(ελ −µ)  1 ∀λ , (8.58)

les facteurs d’occupation sont très faibles nλ BE ' nλ FD ' e−β(ελ −µ) . Dans ce cas il n’y a pas de
différence entre les deux types de statistiques. Si la probabilité d’occupation d’un état individuel
est très faible, les bosons ne  sentent  pas qu’ils doivent s’encourager à s’empiler dans un
même état, et les fermions à s’interdire de s’y mettre à plusieurs (Pauli). Dans ce régime, le
système est insensible aux effets du postulat de symétrisation : c’est la limite classique (diluée),
dans laquelle l’approximation de Maxwell-Boltzmann est valable. On notera

nλ MB = e−β(ελ −µ) (8.59)

Validité de M-B : nλ  1

Dans ce cas l’expression du grand potentiel est obtenue en écrivant ln(1 ∓ e−β(ελ −µ) ) '
∓e−β(ελ −µ): X
e−βελ
def
J MB = −kB T eβµ z où z= (8.60)
λ

est la fonction de partition à une particule. Cette formule illustre de façon extrême avec quelle
facilité le formalisme grand canonique permet de passer des propriétés à un corps, la fonction
de partition z, aux propriétés à plusieurs particules, le grand potentiel.
Nous pouvons également examiner la structure de la grande fonction de partition Ξ =
exp(−βJ) : h i
ΞMB = exp eβµ z = eϕ z . (8.61)

Nous déduisons la fonction de partition canonique en utilisant (8.11) :

1 ∂ N MB 1 N
Z MB = N
Ξ = z (8.62)
N ! ∂ϕ ϕ=0 N!

On a redémontré le résultat du chapitre 4 (paragraphe VI.B).

Exemple d’application : retrouvons les propriétés du gaz parfait classique Pour illus-
trer l’efficacité du formalisme grand canonique, analysons (encore une fois !) le cas du gaz parfait
classique. Rappelons nous p que la fonction de partition pour une particule libre dans une boı̂te
3
est z = V /ΛT où ΛT = 2π~2 /mkB T est la longueur thermique. On obtient immédiatement

V
J MB = −kB T eβµ (8.63)
Λ3T

dont nous tirons les propriétés thermodynamiques du gaz. On déduit le nombre moyen de par-
ticules
G ∂ V
N = − J MB = eβµ 3 (8.64)
∂µ ΛT
puis la pression
∂J MB J MB 1
pG = − =− = kB T eβµ 3 . (8.65)
∂V V ΛT
G
En combinant ces deux équations nous retrouvons la loi des gaz parfaits pG = N kB T /V .

178
Ensemble grand canonique II Particules identiques sans interaction

La frontière classique-quantique (cas du gaz parfait monoatomique)


Nous pouvons reprendre la discussion du paragraphe VI.C : le nouveau langage introduit (les
facteurs d’occupation) nous donne un éclairage plus simple. L’équation (8.64) montre que le
G
potentiel chimique peut s’exprimer en fonction de la densité moyenne n = N /V

eβµ = n Λ3T = (2πT∗ /T )3/2 (8.66)

(relation déjà introduite au chapitre 4), où nous avons refait apparaı̂tre l’échelle de température

def ~2 2/3
T∗ = n . (8.67)
kB m
La limite diluée correspond à

n Λ3T  1 (i.e. T  T∗ ) ⇒ e−βελ |{z}


eβµ  1 ⇒ nλ BE ' nλ FD ' nλ MB (8.68)
1

On a retrouvé que l’échelle de température T∗ dresse la frontière entre les régimes classique
(T & T∗ ) et quantique (T . T∗ ).

, Les idées importantes


• Retrouver (rapidement) la distribution grand canonique P`G = Ξ1 e−β(E` −µN` ) .
def P def
Définition de la grande fonction de partition Ξ = ` e−β(E` −µN` ) et du grand potentiel J(T, µ, · · · ) =
−kB T ln Ξ (la fonction génératice des propriétés thermodynamiques).
G G
• Retrouver les formules pour N , E , pG , S G etc.
Encore une fois on pourra être guidé en utilisant la relation à la thermodynamique et l’égalité
fondamentale de la thermodynamique :
J=E−T S−µN
dE = T dS − pdV + µdN + · · · −→ dJ = −SdT − pdV − N dµ + · · ·
• Très importantQ: la formulation en termesP des propriétés individuelles des particules.
→ La relation Ξ = λ ξλ et la définition ξλ = nλ e−βnλ (ελ −µ) .
→ Le calcul de nλ P
→ L’écriture du grand potentiel en termes des propriétés des états individuels J = −kB T λ ln ξλ .
1
• Les distributions de Bose-Einstein nλ BE = eβ(ελ −µ) −1
(avec la condition µ < ε0 ) et de Fermi-
1
Dirac nλ FD = eβ(ελ −µ) +1
.
• La limite classique est telle que les facteurs d’occupation sont très faibles nλ BE ' nλ FD  1.
Dans ce cas il coı̈ncident tous deux avec nλ MB = e−β(ελ −µ) .

179
II Particules identiques sans interaction Ensemble grand canonique

180
Chapitre 9

Statistique de Fermi-Dirac

Plan du chapitre
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
I.A Contexte physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
I.B Les électrons d’un métal . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
II Gaz parfait de fermions libres complètement dégénéré (T = 0) . . . 185
II.A Formules grand canoniques . . . . . . . . . . . . . . . . . . . . . . . . . 185
II.B Interprétation canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
III Développements de basse température . . . . . . . . . . . . . . . . . 187
III.A Rappel des formules grand canoniques . . . . . . . . . . . . . . . . . . . 187
III.B Stratégie de l’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
III.C Développements de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . 188
III.D Potentiel chimique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
III.E Énergie et chaleur spécifique . . . . . . . . . . . . . . . . . . . . . . . . 190
III.F Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
III.G Équation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

I Introduction
I.A Contexte physique
Nous étudions dans ce chapitre les effets du postulat de symétrisation (i.e. du principe de Pauli)
sur la thermodynamique d’un ensemble de fermions libres. Une question est de comprendre
comment les corrélations quantiques liées à l’indiscernabilité modifient la théorie semi-classique
du gaz parfait étudiée au chapitre 5. L’étude du gaz de fermions dégénéré (i.e. dans un régime
dominé par le principe de Pauli) trouve des applications dans des domaines assez divers :

• La thermodynamique des électrons d’un métal. Problème évidemment extrêmement im-


portant : il suffit de penser au rôle central des métaux dans la vie quotidienne (même si
ce sont plutôt leurs propriétés de conduction que leur propriétés thermodynamiques qui
importent pour les applications qui nous entourent). Nous placerons essentiellement notre
analyse dans ce contexte.

• La physique des semiconducteurs, étudiée dans un exercice de TD. Nous étudierons en


particulier la dépendance du nombre de porteurs de charges en fonction de la température.

181
I Introduction Statistique de Fermi-Dirac

• La physique de l’Hélium-3. Un problème fondamental ayant suscité un nombre considérable


de travaux (expérimentalement et théoriquement), qui a aussi des applications pratiques
importantes : par exemple, une particularité du diagramme de phases de l’Hélium 3 (la
remontée de la ligne d’équilibre liquide-solide en allant vers les basses températures, appelée
effet Pomeranchuk) est utilisée dans les techniques de refroidissement dans les cryostats et
permet d’atteindre de très basses températures (∼ 10 mK).

• Pour changer d’échelle : la stabilité de certains types d’étoiles (naines blanches et étoiles
à neutrons) est assurée par la pression résiduelle du gaz de fermions dégénéré.

I.B Les électrons d’un métal


Nous concentrerons notre analyse sur le cas des métaux. Rappelons quelques éléments introduits
au paragraphe II.A du chapitre 6 : un cristal métallique est une  molécule macroscopique ,
i.e. un ensemble d’atomes formant une liaison chimique en mettant leur électrons en commun.
Les ions ayant une masse beaucoup plus importante que les électrons impliqués dans la liai-
son chimique, il y a un découplage entre les dynamiques des ions ( lents ) et des électrons
( rapides ) :
Ecristal = Eions + Eelectrons . (9.1)
Au chapitre 6, nous avons analysé la thermodynamique des vibrations du cristal, i.e. la contri-
bution à l’énergie du cristal du mouvement des ions. Dans le présent chapitre, nous allons nous
concentrer sur les propriétés thermodynamiques du gaz d’électrons, les ions étant supposés im-
mobiles. Ce problème physique sera étudié dans le cadre d’un modèle extrêmement simplifié : le
modèle des électrons libres sans interaction (un gaz parfait d’électrons dans une boı̂te), l’occu-
pation des états individuels étant caractérisée par la distribution de Fermi-Dirac (figure 9.1)

1
nλ F = . (9.2)
eβ(ελ −µ) +1

2.0

T=0
nΛ F = f HΕ - Μ;TL

1.5

1.0

0<T`̐kB Μ
0.5

0.0
0 1 2 3 4 5 6

ΕΛ

Figure 9.1 : Distribution de Fermi-Dirac (occupation moyenne des états individuels) à


basse température kB T  µ.

Justifions la pertinence de ce modèle, qui néglige deux aspects du problème physique : l’exis-
tence du potentiel cristallin et les interactions coulombiennes.

États individuels dans un potentiel périodique


Un ingrédient important pour l’analyse grand canonique est la densité des états individuels, que
nous notons ρ(ε). Dans un cristal, il convient donc d’étudier les valeurs propres de l’énergie
pour une particule soumise à un potentiel périodique. Nous devrions en principe déterminer le
~2
spectre des énergies d’un hamiltonien H = − 2m e
∆ + Vions (~r) où le potentiel a la périodicité

182
Statistique de Fermi-Dirac I Introduction

de la structure cristalline, i.e. Vions (~r + R) ~ = Vions (~r) pour tout vecteur R ~ = n ~a + m ~b +
~ 3
p ~c, où ~a, b et ~c sont les vecteurs de la maille élémentaire et (n, m, p) ∈ Z . Le problème est
extrêmement riche (manière polie de dire  compliqué ) et pourrait donner matière à des
discussions avancées dans le cadre d’un cours de cristallographie [2, 17]. Fort heureusement, tous
les détails microscopiques seront  gommés , dans le sens où ils n’affectent que marginalement
les propriétés thermodynamiques du gaz d’électrons, pour des raisons que nous allons maintenant
exposer et qui reposent sur la structure de la fonction de Fermi-Dirac (figure 9.1).
À ce stade il est inutile de connaı̂tre tous les détails des propriétés spectrales pour un potentiel
périodique, mais il nous suffit de retenir deux propriétés importantes, déduites de l’observation
suivante. Puisque le cristal est invariant sous les translations de réseau, i.e. les translations de
R~ = n ~a + m ~b + p ~c, ∀ (n, m, p) ∈ Z3 , l’hamiltonien et les opérateurs de translations T̂ (R) ~ sont
diagonalisables simultanément. Par conséquent (théorème de Bloch, cf. chapitre 6 de [34]) :

1. Les états stationnaires sont étendus (délocalisés) à l’échelle du cristal, comme les ondes
planes du problème libre. 1

2. Corrélativement à la délocalisation des états stationnaires, le spectre des énergies est


continu.

La densité d’états est typiquement composée de bandes (théorie des bandes de Bloch), i.e.
est continue par morceaux. La détermination de la structure de bandes précise est un problème
compliqué ; pour donner une idée de la complexité du problème, on montre sur la figure 9.2 la
densité d’états associée à la bande de conduction du cuivre.

Figure 9.2 : Densité d’états pour la bande de conduction du cuivre.

Fort heureusement, la structure de la distribution de Fermi-Dirac (figure 9.1) est à l’origine


d’une simplification drastique : elle montre que tant que kB T  µ, seuls les états dans un
voisinage du potentiel chimique µ (à distance au plus ∼ kB T ) participent à l’excitation thermique
du système. Les autres électrons, à des énergies plus éloignées, ε . µ − kB T , sont gelés à cause
du principe de Pauli et ne participent pas aux propriétés thermodynamiques. Par conséquent,
seules importent des propriétés locales du spectre à une particule, dans le voisinage de ε ∼ µ
(figure 9.3). Cette observation importante nous autorise à remplacer le problème (compliqué)
d’un électron dans une potentiel périodique par le problème (simple), d’un électron libre, qui
possède les deux propriétés essentielles : états délocalisés et spectre continu.
1
L’opérateur de translation est unitaire : il possède des valeurs propres complexes, de module égale à l’unité.
~ ψ i = eiα | ψ i, i.e. ψ(~r − R)
Un état propre de l’opérateur de translation satisfait donc T̂ (R)| ~ = eiα ψ(~r), ce qui
traduit bien la délocalisation de la fonction d’onde.

183
I Introduction Statistique de Fermi-Dirac

ρ(ε ) kBT ρ(ε ) kBT


simplification

ε ε
électrons gelés µ électrons électrons gelés µ
excités
Cristal Problème libre

Figure 9.3 : Blocage de Pauli. Le principe de Pauli nous permet de simplifier l’information
spectrale injectée : seuls les électrons occupant des états d’énergies voisines de µ sont excités. La
majeure partie des électrons ne participe pas à l’excitation thermique.

Le rôle des interactions éléctroniques

La deuxième question que nous soulevons est celle du rôle des interactions électroniques. Les
électrons sont des particules chargées électriquement. Dans le vide ils interagissent via l’inter-
def qe2
action coulombienne, de portée infinie : VCoul (r) = e2 /r où e2 = 4π 0
. Il pourrait sembler a
priori que les interactions jouent un rôle dominant dans l’étude des électrons d’un métal, ce
qui anéantirait nos espoirs d’un traitement simple dans le cadre d’un modèle de particules non
interagissantes. Fort heureusement, l’électro-neutralité dans un métal (assurée par la présence
des ions) induit des phénomènes d’écrantage qui rendent l’interaction effective entre charges à
très courte portée. Si une charge Q est introduite dans un métal, des charges de signe opposé
vont immédiatement se mouvoir et se distribuer autour afin d’assurer la neutralité électrique (un
métal est précisément un milieu au sein duquel les charges se meuvent aisément). Par conséquent,
à grande distance la charge globale est nulle et le potentiel électrostatique créé par cette distribu-
tion de charge décroı̂t extrêmement rapidement, exponentiellement : Veff (r) = (e2 /r)e−r/`ecr où
la longueur d’écrantage `ecr est une échelle microscopique (dans l’argent, `ecr . 1 Å). Autrement
dit, l’interaction effective entre charges est à très courte portée, microscopique, ce qui explique
que les interactions sont effectivement faibles et peuvent légitimement être négligées.

− −

− − +Q −
− −−
− − −

Figure 9.4 : Écrantage. Lorsque qu’une charge +Q est introduite dans un métal, des électrons
se déplacent de manière à écranter la charge extérieure. Ils se répartissent typiquement sur une
distance `ecr (la taille de la sphère). À grande échelle de `ec , l’électroneutralité est restaurée.

Conclusion : le modèle des électrons libres (aspects microscopiques du problème)

En résumé : nous avons justifié qu’il est possible de négliger la présence du potentiel périodique
cristallin et les interactions électroniques. Autrement dit, nous modélisons les électrons d’un
métal comme un gaz parfait d’électrons libres dans une boı̂te (le volume du métal).
Rappelons que le spectre des énergies pour une particule libre, les ondes planes | ~k i ⊗ | ± ispin

184
Statistique de Fermi-Dirac II Gaz parfait de fermions libres complètement dégénéré (T = 0)

~2~k 2
d’énergie ε~k = 2m , est caractérisé par la densité d’états :
3/2


X 2spin 2m
ρ(ε) = 2spin δ(ε − ε~k ) = V A ε avec A = (9.3)
4π 2 ~2
~k

(pour les détails du calcul, on pourra se référer au § II.C page 49). La densité d’états encodera
toutes les propriétés microscopiques du problème nécessaires à notre étude.

II Gaz parfait de fermions libres complètement dégénéré (T = 0)


II.A Formules grand canoniques
À température nulle, la distribution de Fermi est une fonction de Heaviside (figure 9.1) :

n~k F = θH (µ − ε~k ) . (9.4)

Cette forme rend les calculs particulièrement simples. Le nombre moyen des fermions et l’énergie
moyenne sont donnés par
Z µ
G
X 2
N (0, µ, V ) = 2spin n~k F = dε ρ(ε) = V A µ3/2 (9.5)
0 3
~k

et Z µ
G
X
F 2 3 G
E (0, µ, V ) = 2spin n~k ε~k = dε ρ(ε) ε = V A µ5/2 = N (0, µ, V ) µ . (9.6)
0 5 5
~k

II.B Interprétation canonique


Énergie de Fermi
Nous avons remarqué qu’à température nulle, les fluctuations disparaissent (le système est dans
son état fondamental) puisque Var(nλ ) = nλ F (1 − nλ F ) = 0 si nλ F = θH (µ − ελ ). Il n’y a donc
G
pas de distinction entre N ou N , etc. Nous pouvons inverser les formules grand canoniques afin
d’obtenir des informations canoniques, i.e. exprimer les grandeurs en fonction de V et N (plutôt
que V et µ). Nous déduisons de (9.5) une expression du potentiel chimique (canonique, donc)

def ~2
µC (0, n) = εF , où εF = (3π 2 n)2/3 (9.7)
2m
est une échelle d’énergie caractéristique du problème à N et V fixés, appelée l’énergie de
Fermi ; elle est uniquement fonction de la densité moyenne n = N/V , et de constantes mi-
croscopiques. Du point de vue des propriétés thermodynamiques, εF est donc la limite de
température nulle du potentiel chimique canonique (ou de manière équivalente la valeur de µ
G
pour laquelle N (0, εF , V ) = N ). Il est utile pour la suite de définir une échelle de température
associée, la température de Fermi, qui jouera un rôle dans les développements ultérieurs :

def ~2
kB TF = εF = (3π 2 n)2/3 (9.8)
2m

Nous avons ainsi obtenu une échelle caractéristique à laquelle comparer la température pour
définir des régimes de basse et haute température. En effet, la température de Fermi coı̈ncide

185
II Gaz parfait de fermions libres complètement dégénéré (T = 0) Statistique de Fermi-Dirac

précisément, à un facteur numérique sans importance près, avec l’échelle de température intro-
duite au paragraphe VI.C séparant les régimes classique et quantique :
1
TF = (3π 2 )2/3 T∗ (frontière classique/quantique). (9.9)
2
Notons finalement que la saturation du potentiel chimique à température nulle reflète l’effet
du principe de Pauli : à T = 0 les fermions s’empilent dans les états quantiques jusqu’au niveau
d’énergie égal à εF . Le spectre libre est extrêmement dense, cependant s’il est rempli par un
nombre macroscopique de fermions, l’énergie εF est  grande  (typiquement quelques eV dans
les métaux, i.e. quelques 10000 K). Les anticorrélations quantiques (en énergie) imposées par le
postulat de symétrisation forcent les électrons à occuper des états individuels de grande énergie,
à température nulle.
De même, l’énergie peut être exprimée en fonction de N et V (on utilise l’équivalence des
G C
ensembles à la limite thermodynamique E (0, εF , V ) = E (0, N, V ) = E0 ) :

3
E0 = N εF (9.10)
5

désigne l’énergie fondamentale du gaz de N fermions. À température nulle, l’énergie fonda-


mentale du gaz de fermions sature à une valeur  importante  du fait du principe de Pauli
(figure 9.6). Nous donnons plus bas deux illustrations (avec ordres de grandeur) afin d’insister
sur ce point.

Pression quantique à T = 0
Nous pouvons relier l’énergie au grand potentiel grâce à (9.20) (pour α = 3/2) : J(0, µ, V ) =
G
− 32 E (0, µ, V ). En utilisant de plus que J = −pG V , nous obtenons la pression pG (0, µ) =
2 G 2 G
3V E (0, µ, V ) = 5V N (0, µ, V ) µ, que nous pouvons reécrire comme une fonction de la densité

2 1 ~2
p0 = nεF = (3π 2 )2/3 n5/3 (9.11)
5 5 m

Afin de bien apprécier ce que la saturation de la pression à température nulle a de remar-


quable, il convient de rappeler la situation classique : dans un gaz  classique , en abaissant
la température les particules voient leurs énergies cinétiques, et leurs impulsions, diminuer. Les
transferts d’impulsion du gaz vers les parois du récipient deviennent de plus en plus faibles,
la pression diminue. Si T → 0 la pression s’annule proportionnellement p ∝ T → 0. Pour le
gaz de fermions, le principe de Pauli interdit l’occupation multiple des états de basse énergie.
Les fermions sont forcés d’occuper des états individuels de grande énergie, typiquement εF , ca-
ractérisés par une grande impulsion. Ils exercent donc collectivement une force sur les parois du
système. Bien que l’agitation thermique disparaisse lorsque T → 0, la pression sature au lieu de
s’annuler.

Applications et ordres de grandeur


Métaux.– Dans un bon métal (Cu, Ag, etc) la densité typique d’électrons de conduction est
ne ' 6 1028 m−3 (pour Ag), ce qui conduit à une énergie de Fermi importante, εF ' 4.8 eV. Par
exemple si nous calculons la vitesse de Fermi associée à cette énergie, donnée par εF = 12 me vF2 ,
nous obtenons vF ' 1.2 106 m/s (la vitesse des électrons de conduction dans l’argent). Enfin
nous constatons que la température de Fermi est énorme comparativement à la température
ambiante : TF ' 56 000 K ! On trouve une pression p0 ' 1.8 × 1010 Pa = 180 kbar.

186
Statistique de Fermi-Dirac III Développements de basse température

Naines blanches.– La pression quantique du gaz dégénéré est très importante. En particulier
c’est la pression du gaz d’électrons qui fournit le mécanisme de stabilisation des étoiles de type
 naines blanches  pour s’opposer à l’effondrement gravitationnel.

Les ordres de grandeurs typiques sont : 2 une masse typique M ∼ 1030 kg∼ M = 2×1030 kg
et un rayon typique R ∼ 10 000km∼ R♁ = 6400km. On peut associer à l’énergie gravitationnelle
def
Egrav ∼ −GM 2 /R une pression pgrav = Egrav /R3 ∼ −GM 2 /R4 (négative pour caractériser
l’effondrement). L’application numérique donne pgrav ∼ −1022 Pa = −1017 atm.
La masse est essentiellement celle de la matière hadronique ; puisque l’étoile est neutre, le
nombre d’électrons est Ne ∼ Np ∼ M/mproton ∼ 1057 , ce qui donne une densité d’électrons
ne ∼ 1036 m−3 = 106 Å−3 . Nous obtenons εF ∼ 105 eV (< me c2 = 511 keV) et TF ∼ 109 K,
bien supérieure à la température de cœur, estimée à Tcœur ∼ 107 K (température de fusion de
l’hydrogène) ; le gaz d’électrons peut donc être considéré quasiment comme un gaz à température
nulle ! La pression quantique du gaz d’électrons est p0 ∼ 1022 Pa= 1017 atm, exactement du même
ordre que pgrav (puisqu’elle compense l’effondrement).

III Développements de basse température


III.A Rappel des formules grand canoniques
Il sera commode pour la suite d’introduire la notation

def 1
nλ F = f (ελ − µ; T ) où f (ε; T ) = (9.12)
eβε+1
est la fonction de Fermi, centrée sur l’énergie nulle. Nous pouvons écrire les diverses quantités
importantes :
Z ∞
G
N (T, µ, V ) = dε ρ(ε) f (ε − µ; T ) (9.13)
0
Z ∞
G
E (T, µ, V ) = dε ρ(ε) ε f (ε − µ; T ) (9.14)
0
Z ∞
1  
J(T, µ, V ) = − dε ρ(ε) ln 1 + e−β(ε−µ) , (9.15)
β 0
etc.

G
Une relation utile entre J et E – Équation d’état
Discutons une relation qui sera très utile entre le grand potentiel et l’énergie moyenne. Comme
celle-ci est indépendante de la nature bosonique ou fermionique, et puisqu’on y fera appel dans
le prochain chapitre, nous considérons ici le cas général. Notre point de départ est l’expression
du grand potentiel Z
1
J B/F
=± dε ρ(ε) ln(1 ∓ e−β(ε−µ) ) , (9.16)
β
P
où le spectre des énergies du problème à une particule est supposé continu, i.e. ρ(ε) = λ δ(ε−ελ )
est une fonction continue. Effectuons une intégration par parties dans (9.16), nous obtenons
Z ∞
B/F ε
J =− dε Φ(ε) β(ε−µ) , (9.17)
0 e ∓1
2
Sur l’article wikipedia, on trouve que les naines blanches observées sont dans les bornes : 0.17 M < M <
1.33 M où M = 2 1030 kg et 0.008 R < R < 0.02 R où R = 700 000 km.

187
III Développements de basse température Statistique de Fermi-Dirac

Rε 0
où Φ(ε) = dε ρ(ε0 ) est la densité d’états intégrée (le nombre d’états individuels d’énergie
6 ε). Cette équation est intéressante : dans un fluide simple (si J n’est fonction que de T, V, µ),
elle correspond à l’équation d’état :
Z ∞
G Φ(ε) ε
p (T, µ) = dε β(ε−µ)
(9.18)
0 V e ∓1

(rappelons que ρ et Φ sont proportionnelles au volume V dans un problème invariant par trans-
lation).
Nous pouvons maintenant établir la relation entre le grand potentiel et l’énergie moyenne,
à condition de faire une hypothèse supplémentaire sur la densité d’états : nous supposons que
celle-ci est une loi de puissance
ρ(ε) ∝ εα−1 . (9.19)

En écrivant Φ(ε) = α1 ε ρ(ε), l’équation (9.17) prend la forme d’une relation entre J et l’énergie :

1 G
J B/F = − E pour ρ(ε) ∝ εα−1 (9.20)
α

III.B Stratégie de l’analyse


Motivation

Bien souvent (mais pas toujours) on s’intéresse à des quantités physiques exprimées en fonction
de N plutôt que µ (situation canonique). Par exemple si l’on considère le cas important de la
chaleur spécifique, définie par
  C G  
def ∂E ∂E (T, N, V ) ∂E (T, µ, V ) ∂E
CV = = 6= = (9.21)
∂T V,N ∂T ∂T ∂T V,µ

Méthode

Illustrons le principe de la méthode sur l’étude de l’énergie du gaz.


G G
1. Nous développons les formules grand canoniques N (T, µ, V ) et E (T, µ, V ) dans la limite
kB T  µ.

2. Les fluctuations relatives sont négligeables à la limite thermodynamique. On peut considérer


G
la formule grand canonique N = N (T, µ, V ) comme une relation entre n = N/V , T et µ.
Nous pouvons ainsi inverser cette relation afin d’obtenir l’expression du potentiel chimique
(canonique) en fonction de T et N/V : µC (T, N/V ).

3. À la limite thermodynamique, l’équivalence entre les ensembles permet d’obtenir l’énergie


C G
comme fonction de T , V et N , i.e. l’énergie moyenne canonique E (T, N, V ) = E (T, µC (T, N/V ), V ).

III.C Développements de Sommerfeld


Les différentes grandeurs physiques exprimées dans le formalisme grand canonique sont de la
forme Z ∞
Φ(T, µ) = dε ϕ(ε) f (ε − µ; T ) (9.22)
0

188
Statistique de Fermi-Dirac III Développements de basse température

où ϕ(ε) est une fonction régulière de l’énergie. Les développements de basse température sont
effectués à l’aide de la formule 3
Z ∞ Z µ
π2 7π 4 000
dε ϕ(ε) f (ε − µ; T ) = dε ϕ(ε) + ϕ0 (µ) (kB T )2 + ϕ (µ) (kB T )4 + O(T 6 ) (9.24)
6 360

Démonstration : On considère
Z ∞
def
δΦ(T, µ) = Φ(T, µ) − Φ(0, µ) = dε ϕ(ε) δf (ε − µ; T ) (9.25)
0
def
où δf (ε; T ) = f (ε; T ) − θH (−ε) est une fonction concentrée autour de ε = 0 et décroissant
exponentiellement vite sur une échelle kB T . On utilise le découplage entre échelles, i.e. que
δf (ε; T ) décroı̂t  rapidement  (sur l’échelle kB T ) alors que ϕ(ε) varie  lentement , ce qui
permet de remplacer cette dernière par son développement de Taylor au voisinage de ε = µ :
Z ∞
ε2 00
 
0
δΦ(T, µ) = dε ϕ(µ) + ε ϕ (µ) + ϕ (µ) + · · · δf (ε; T ) . (9.26)
−µ 2!

En remplaçant la borne inférieure par −∞ (i.e. en négligeant des corrections d’ordre e−βµ ) et
en utilisant la symétrie δf (−ε; T ) = −δf (ε; T ), on fait apparaı̂tre les intégrales
Z ∞
def xn
In = dx x (9.27)
0 e +1
qui sont tabulées (cf. le formulaire de l’annexe A) : par exemple I1 = π 2 /12, I3 = 7π 4 /120, etc.
Qed.

III.D Potentiel chimique canonique


Nous appliquons (9.24) à l’expression du nombre de particules :
" #
π 2 kB T 2
 
G 2 3/2 4
N (T, µ, V ) = V A µ 1+ + O(T ) (9.28)
3 8 µ

À µ fixé, le nombre moyen de fermions est une fonction croissante de la température, ce qui est
lié au fait que ρ(ε) est une fonction croissante. Autrement dit, les états vidés sous µ sont moins
nombreux que ceux occupés au dessus de µ.
Nous souhaitons interpréter ce résultat à la limite thermodynamique comme une relation
entre N/V , T et µ. Nous déduisons que le potentiel chimique décroı̂t lorsque T croı̂t, à N fixé.
Explicitement, nous pouvons caractériser cet effet en inversantla relation entre N/V et  µ. Pour
cela nous proposons la forme du développement µC (T, n) = εF 1 + a(T /TF )2 + O(T 4 ) , où a est
un nombre sans dimension, que nous obtenons en injectant ce développement dans l’expression
G
de N (T, µ, V ) :
"  2 #3/2 "  2 #
N 2 T π 2 T
G 3/2
N = N (T, µC (T, ), V ) = V A εF 1 + a + ··· 1+ + · · · (9.29)
V 3
| {z } TF 8 TF
=N
| {z }
2
2
1+( 23 a+ π8 ) T
TF
+···=1

3
Cette formule correspond au développement de la fonction de Fermi-Dirac, en puissance de sa largeur kB T .
Un tel développement s’exprime à l’aide de distributions :
1 π2 7π 4
= θH (ε − µ) − (kB T )2 δ 0 (ε − µ) − (kB T )4 δ 000 (ε − µ) + O(T 6 ) . (9.23)
eβ(ε−µ)+1 6 360
La relation entre les deux formules est assurée par dx δ (n) (x) f (x) = (−1)n f (n) (0).
R

189
III Développements de basse température Statistique de Fermi-Dirac

d’où a = −π 2 /12. Finalement

" 2 #
π2

T
µC (T, n) = εF 1− + O(T 4 ) pour T  TF . (9.30)
12 TF

On peut rappeler la forme obtenue à haute température au chapitre 4 dans l’approximation de


Maxwell-Boltzmann

3
µC (T, n) ' kB T ln(Λ3T n/2spin ) = kB T ln (c TF /T ) pour T  TF , (9.31)
2

où c = 4π/(6π 2 )2/3 .

Figure 9.5 : Potentiel chimique du gaz parfait de fermions libres.

III.E Énergie et chaleur spécifique

Nous développons (9.14) à l’aide de (9.24)

" 2 #
2

G 2 5π kB T
E (T, µ, V ) = V A µ5/2 1 + + O(T 4 ) (9.32)
5 8 µ

Nous injectons (9.30) dans cette expression afin d’obtenir le développement de l’énergie cano-
C G
nique E (T, N, V ) = E (T, µC (T, N/V ), V ) :

" #
5π 2 T 2
 
C 3
E (T, N, V ) = N εF 1 + + O(T 4 ) pour T  TF . (9.33)
5 12 TF

C
Cette expression peut être comparée avec le résultat (classique) de haute température E '
3
2 N kB T pour T  TF . On peut maintenant simplement dériver l’énergie moyenne canonique

190
Statistique de Fermi-Dirac III Développements de basse température

par rapport à la température pour obtenir la chaleur spécifique : 4

π2 T
CV = N kB + O(T 3 ) (9.36)
2 TF

Par rapport à la chaleur spécifique d’un gaz parfait classique, CVclass ∼ N kB , la chaleur spécifique
du gaz dégénéré de fermions est réduite d’un facteur TTF , qui peut être très petit en pratique (par
300
exemple, ∼ 60000 = 1/200 dans l’argent à température ambiante). Ce comportement linéaire est
très caractéristique des métaux et trouve son origine dans le blocage de Pauli : à cause du
principe de Pauli, seuls les fermions d’énergies voisines de εF , à kB T près, peuvent être excités,
i.e. une très petite fraction des particules. Ces fermions gagnent individuellement typiquement
kB T par rapport à la situation de température nulle. Le nombre de fermions excités étant
typiquement Nexcites ∼ ρ(εF )kB T , l’énergie du gaz dépend de la température comme E(T ) −
E(0) ∼ Nexcites kB T ∼ ρ(εF )(kB T )2 . En se rappelant que N ∼ ρ(εF ) εF nous retrouvons bien
CV ∼ N kB TTF .
Ce résultat est important : il établit une connection directe entre blocage de Pauli et compor-
tement linéaire de la chaleur spécifique. Nous pouvons garder en mémoire que le comportement
CV ∝ T est caractéristique de l’énergie électronique d’un métal : un gaz de fermions libres ca-
ractérisé par un spectre d’excitation sans gap, i.e. une densité d’états finie au niveau de Fermi.

Figure 9.6 : Énergie moyenne et chaleur spécifique d’un gaz de fermions.

III.F Entropie
On peut très facilement obtenir l’entropie canonique en utilisant la formule vue dans la chapitre
C
4 : CV = T ∂S
∂T . Puisque CV ∝ T on a donc CV ' S (seuls les termes linéaires en T des deux
C

4 G
∂E
Pour bien apprécier le calcul précédent, on peut comparer la chaleur spécifique à ∂T
. Nous dérivons (9.32)
par rapport à la température
G
∂E 2 5π 2 kB2
T
= V A µ5/2 +O(T 3 ) . (9.34)
∂T |5 {z } 4 µ2
| {z }
3 N ε +O(T 2 )
5 F k2 T
B +O(T 3 )
ε2
F

Nous écrivons ce résultat en fonction de N et TF :


G
∂E 3π 2 T π2 T
= N kB + O(T 3 ) 6= CV = N kB + O(T 3 ) . (9.35)
∂T 4 TF 2 TF

191
III Développements de basse température Statistique de Fermi-Dirac

quantités coı̈ncident) :
π2 T
S C (T, N, V ) = N kB + O(T 3 ) (9.37)
2 TF
ce qui respecte le théorème de Nernst, S(T → 0) = 0, (contrairement à la formule de Sackur-
Tétrode pour l’entropie du gaz classique).

III.G Équation d’état


On souhaite analyser l’équation d’état du gaz dégénéré, et en particulier comment elle s’éloigne
du résultat classique p ' nkB T , que l’on doit retrouver dans la limite diluée (haute température/basse
densité) T  TF .
L’équation (9.20) nous permet d’établir directement un lien entre l’énergie et la pression :
G
pG = − V1 J = 3V 2
E . On obtient finalement le développement de basse température de la pres-
sion : " #
2 5π 2 T 2
 
1 2 2/3 ~ 5/3 4
p = (3π ) n 1+ + O(T ) (9.38)
|5 {z m } 12 TF
p0

Pour T  TF , la pression sature à une valeur finie p → p0 (alors qu’elle s’annule avec T pour le
gaz parfait classique).
Puisque TF ∝ n2/3 , le développement (9.38) est aussi un développement valable dans la
limite de haute densité p = (· · · )n5/3 1 + (· · · )T 2 n−4/3 + · · · , ce qui montre que l’isotherme


présente une divergence à haute densité, p ∝ n5/3 , plus forte que dans le cas classique p ∝ n,
nouvelle manifestation du principe de Pauli.

p p n 5/3
uli
Pa
ue
siq
as
Cl
ue
n 5/3

siq

T’<T
as

T
Pauli

Cl
p0

T n=N/V
−3 −3
TF Λ T’ Λ T

Figure 9.7 : Pression d’un gaz de fermions.– À gauche en fonction de la température (à
n fixée). À droite : deux isothermes.

, Les idées importantes


• Savoir retrouver les propriétés du gaz de fermions à T = 0 (énergie de Fermi εF , énergie du
gaz, pression, etc)
• Connaı̂tre le principe des développements de basse température :
(1) écrire les formules grand canoniques et les développer à T → 0 ;
(2) inverser la relation entre N et µ pour obtenir le potentiel chimique canonique µC (T, N/V ) ;
(3) l’équivalence entre ensembles, à la limite thermodynamique, permet d’obtenir un résultat
C G
canonique, par exemple E (T, N, V ) = E (T, µC (T, N/V ), V ).

192
Statistique de Fermi-Dirac III Développements de basse température

+ Pour en savoir plus


• Chapitre VI de [11].

193
III Développements de basse température Statistique de Fermi-Dirac

194
Chapitre 10

Statistique de Bose-Einstein

Plan du chapitre
I Phonons et photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
I.A Rappel : description canonique . . . . . . . . . . . . . . . . . . . . . . . 195
I.B Description grand canonique . . . . . . . . . . . . . . . . . . . . . . . . 196
I.C Remarque sur le cas où µ = 0 : Gap ou masse ? . . . . . . . . . . . . . . 196
II Gaz parfait de bosons libres . . . . . . . . . . . . . . . . . . . . . . . . 197
II.A Gaz de bosons libres – Information microscopique . . . . . . . . . . . . 197
II.B Analyse du potentiel chimique . . . . . . . . . . . . . . . . . . . . . . . 197
II.C Énergie et chaleur spécifique pour T < TBE . . . . . . . . . . . . . . . . 202
II.D Équation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
II.E Entropie et chaleur latente . . . . . . . . . . . . . . . . . . . . . . . . . 204
III Réalisations expérimentales . . . . . . . . . . . . . . . . . . . . . . . . 204
III.A Diverses réalisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
III.B Condensation dans un piège harmonique . . . . . . . . . . . . . . . . . . 205

I Phonons et photons
I.A Rappel : description canonique
Il est intéressant de reprendre à ce niveau la discussion du chapitre 6 sous un nouvel éclairage.
Nous y avions analysé l’énergie d’oscillateurs harmoniques dans le cadre canonique. La quan-
tification de ces oscillateurs harmoniques nous a conduit à interpréter les excitations de ces
oscillateurs en termes de  particules  émergentes (les phonons et les photons).
Par exemple, dans le cas de l’énergie de vibration des corps solides, le calcul canonique avait
montré que l’énergie moyenne et l’énergie libre sont données par

énergie du vide Evide énergie des phonons


z }| { zZ }| {
Z ωMax ωMax
C ~ω ~ω
E vibration = dω ρ(ω) + dω ρ(ω) β~ω (10.1)
0 2 0 e −1
Z ωMax
1  
F (T, V ) = Evide + dω ρ(ω) ln 1 − e−β~ω . (10.2)
β 0
| {z }
contributions des phonons

195
I Phonons et photons Statistique de Bose-Einstein

Nous avions interprété ces expressions en introduisant le nombre moyen d’excitations dans le
mode de fréquence ω :
1
nBω = ~ω/kB T . (10.3)
e −1
La comparaison entre la distribution de Bose-Einstein (8.45)
P et cette expression, et le fait que
F (T, V ) soit indépendant du nombre de quanta N = ω nω , démontrent que le potentiel
chimique de ces quanta (interprétés comme des  particules ) est nul : µphonon = 0 (de même
µphoton = 0).

I.B Description grand canonique


Dans la description canonique rappelée précédemment, nous avons pris le point de vue des
oscillateurs. Dans le cadre grand canonique, nous analysons le même problème en termes des
excitations, interprétées comme des particules : l’énergie de vibration du solide est l’énergie d’un
gaz de particules libres, les phonons, décrites par une relation de dispersion linéaire aux petits
vecteurs d’onde, ω~k ' ||~k||cs . Le nombre moyen de particules dans un état (onde plane) d’énergie
ε~k = ~ω~k est donné par la distribution de Bose-Einstein (8.45) pour un potentiel chimique nul,
µphonon = 0 (cette information est cette fois injectée  à la main ). L’énergie moyenne du gaz
de particules est Z ωMax
G ~ω
E phonons = dω ρ(ω) β~ω . (10.4)
0 e −1
Comme il se doit, nous avons retrouvé le même résultat que dans la description canonique (en
masquant l’existence de l’énergie du vide).

Remarque : l’identité entre descriptions canonique et grand canonique est évidente pour
µ = 0 puisqu’elle implique l’égalité entre potentiels thermodynamiques : J = F .

I.C Remarque sur le cas où µ = 0 : Gap ou masse ?


La nullité du potentiel chimique caractérisant un gaz de particules est associée au fait qu’il
n’existe pas d’énergie de seuil (gap) nécessaire à leur création.
p Si nous considérons une particule décrite par la relation de dispersion relativiste εp~ =
p~ 2 c2 + mc2 , il existe un coût énergétique minimal mc2 pour créer cette particule. Dans ce
cas, l’énergie de seuil, que nous appelons le  gap  ∆ = mc2 , est reliée à la masse. Par exemple,
les photons sont des particules non massives, décrites par la relation de dispersion εp~ = ||~ p||c.
Aussi petite soit l’énergie disponible, il est possible de la convertir en photon(s) (énergie lumi-
neuse).
Remarquons qu’en matière condensée où les particules sont émergentes, il n’y en général
pas de relation évidente entre la masse et le gap des excitations. Par exemple, il est courant
d’associer à la courbure de la relation de dispersion une masse effective m∗ , cependant celle-ci
n’a pas de relation avec le gap. Un exemple est celui des magnons, des particules décrivant
les excitations collectives de basse énergie du type  ondes d’aimantation  dans les matériaux
ferromagnétiques. On peut montrer que la relation de dispersion de basse énergie des magnons
est du type :
1 2
εp~ ' ∆ + p~ (10.5)
2m∗
où m∗ est la masse effective. Lorsque le matériau est isotrope, le gap est nul ∆ = 0, et les
magnons, des particules de masse effective m∗ , sont caractérisés par un potentiel chimique nul,
µmagnon = 0. En revanche, le gap est non nul dans les matériaux anisotropes, ∆ 6= 0, ce qui
conduit à l’existence d’un potentiel chimique fini µ 6= 0.

196
Statistique de Bose-Einstein II Gaz parfait de bosons libres

La différence est de taille car dans le second cas il est possible d’observer le phénomène de
condensation de Bose-Einstein, 1 mais pas pour des particules de gap nul ∆ = 0 dont le nombre
n’est pas fixé. 2

Conclusion :
particule de gap nul ∆ = 0 ⇒ µ=0

Figure 10.1 : Gap ou masse ? La courbure de la relation de dispersion (reliée à la masse)


n’est pas toujours reliée au gap.

II Gaz parfait de bosons libres


Nous avons étudié la thermodynamique de deux gaz de bosons, les phonons et les photons, tout
deux de masse nulle, i.e. de potentiel chimique nul. Nous allons maintenant nous intéresser aux
propriétés de gaz de bosons massifs (des atomes par exemple). Dans ce cas le potentiel chimique
est non nul, ce qui a des conséquences importantes et se trouve à l’origine d’un phénomène
nouveau : la condensation de Bose-Einstein.

II.A Gaz de bosons libres – Information microscopique


Nous considérons un gaz parfait de bosons libres de spin s (entier) et de masse m dans une boı̂te
de volume V . L’information microscopique est encodée dans la densité d’états :
√ (2s + 1) 2m 3/2
 
ρ(ε) = V A ε avec A = (10.6)
4π 2 ~2

II.B Analyse du potentiel chimique


Relation entre N et µ – Température de Bose-Einstein
À la limite thermodynamique, la formule grand canonique pour le nombre moyen de particules
s’interprète comme une relation entre N , T et µ :
Z ∞
ρ(ε)
N= dε β(ε−µ) avec µ < 0 (10.7)
0 e −1
Nous définissons la famille d’intégrales

xα−1
Z
1
def
Jα (ϕ) = dx . (10.8)
Γ(α) 0 ex /ϕ − 1
1
Par exemple pour les magnons : A. Paduan-Filho, Bose-Einstein condensation of magnons in NiCl2 -
4SC(NH2 )2 , Brazilian J. Phys. 42, 292–305 (2012) ; disponible commme preprint arXiv:1206.0035.
2
Dans des matériaux ferromagnétiques isotropes, la loi de Bloch est une conséquence de la nullité du potentiel
chimique du gaz de magnons (sujet d’examen de Mai 2012).

197
II Gaz parfait de bosons libres Statistique de Bose-Einstein

On obtient facilement une représentation de la fonction −1sousPforme de série, en développant


l’intégrand sous forme de série géométrique, ex /ϕ − 1 = ∞ n −nx , puis en intégrant
n=1 ϕ e
chaque terme de la série :

X ϕn
Jα (ϕ) = . (10.9)

n=1

La fonctionP est bijective. Elle envoie l’intervalle [0, 1] sur l’intervalle [0, Jα (1)], avec Jα (1) = ζ(α)
où ζ(α) = ∞ n=1 n
−α est la fonction zeta de Riemann. Pour α > 1, la borne supérieure J (1)
α
est finie, ce qui va jouer un rôle crucial pour l’apparition du phénomène de condensation de
Bose-Einstein (du point de vue mathématique).
Quelques manipulations (un changement de variable x = βε) montrent que nous pouvons
reécrire la relation (10.7) comme

n Λ3T = (2s + 1) J3/2 (ϕ) (10.10)

p
où n = N/V est la densité moyenne et ϕ = eβµ < 1 la fugacité. ΛT = 2π~2 /(mkB T ) est la
longueur thermique introduite dans un chapitre antérieur.
La fonction J3/2 (ϕ) présente donc un comportement linéaire à petite fugacité. Lorsque la
fugacité tend vers sa limite supérieure, J3/2 (ϕ) tend vers la valeur limite ζ(3/2) = 2.612...

ϕ pour ϕ  1
J3/2 (ϕ) ' (10.11)
ζ(3/2) − c √1 − ϕ pour ϕ → 1−

où c est une constante positive. 3

3.0

2.5

2.0
J32HjL

1.5

1.0

0.5

0.0

0.0 0.2 0.4 0.6 0.8 1.0

Figure 10.2 : Fonction J3/2 (ϕ).


3
On considère la dérivée √

dx x ex
Z
0 1
J3/2 (ϕ) =
Γ(3/2) 0 (ex − ϕ)2
Dans la limite ϕ → 1− , l’intégrale diverge. Elle est dominée par la borne inférieure :
Z √ Z
0 1 dx x dx 1
J3/2 (ϕ) ' ∼ ∼ √
Γ(3/2) 0 (x + 1 − ϕ)2 1−ϕ x
3/2 1−ϕ

Une intégration nous donne le comportement de J3/2 (ϕ).

198
Statistique de Bose-Einstein II Gaz parfait de bosons libres

Si la température est abaissée à n fixée, le membre de gauche de l’équation (10.10) augmente,


ce qui montre que la fugacité augmente. Le potentiel chimique est une fonction décroissante de
la température. La fugacité atteint sa limite supérieure permise ϕ = 1 (i.e. µ = 0) lorsque la
température atteint la valeur TBE définie par n Λ3T = (2s + 1) J3/2 (1), i.e. T = TBE avec

2π ~2 2/3
kB TBE = n (10.12)
[(2s + 1)ζ(3/2)]2/3 m

Nous retrouvons encore une fois l’échelle de température caractéristique introduite au para-
graphe VI.C :

TBE = T∗ (frontière classique/quantique). (10.13)
[(2s + 1)ζ(3/2)]2/3
(du même coup, on remarquera l’analogie avec la température TF du chapitre précédent). En
deçà de la température TBE , l’équation (10.10) ne permet plus de déterminer µ.

Condensation
Le problème posé par l’équation (10.10) aux basses température remonte à l’équation (10.7) dont
l’obtention a supposé le passage d’une somme, N = ~k n~k B (pour simplifier nous considérons
P
dorénavant des bosons de spin nul), à une intégrale. Ce passage est autorisé si la fonction sommée
(le facteur de Bose-Einstein) varie peu à l’échelle du pas de la somme. Or lorsque µ → 0, le
nombre de bosons dans l’état fondamental, que nous noterons dorénavant
def
N0 (T ) = n~0 B (10.14)

est beaucoup plus important que les nombres de bosons dans les états excités : en effet si µ → 0−
on a
1 kB T
N0 (T ) = −βµ ' − →∞ (10.15)
e − 1 µ→0− µ
(si N est fixé, N0 ne diverge pas mais est limité par N ). Le passage de la somme à l’intégrale
n’est alors plus justifié (figure 10.3), sauf si nous singularisons le premier terme de la somme (le
seul qui  diverge , i.e. devient macroscopique) :
X
N = N0 (T ) + n~k B . (10.16)
~k (6=~0)

Le premier terme de la somme devient macroscopique (d’ordre N ) pour T < TBE , alors que
les occupations des états excités restent microscopiques ( N ). On peut encore remplacer la
somme par une intégrale pour calculer le nombre de bosons dans les états excités, en considérant
simplement que
µ=0 pour T 6 TBE (10.17)
(rigoureusement : µ ' −kB T /N0 où N0 est macroscopique). Finalement
Z ∞ √
ρ(ε) π
N = N0 (T ) + dε βε = N0 (T ) + V A ζ(3/2)(kB T )3/2 . (10.18)
0 e −1 | 2 {z }
| {z }
bosons excités N ×(T /TBE )3/2

Nous obtenons finalement le nombre de bosons  condensés  dans l’état individuel fondamental :
"  #
T 3/2

N0 (T ) = N 1 − pour T 6 TBE (10.19)
TBE

199
II Gaz parfait de bosons libres Statistique de Bose-Einstein

contribution
du fondamental

B
nλ T > TBE T <TBE

ελ ελ
Figure 10.3 : Passage de la somme à l’intégrale. Le nombre de bosons est donné par la
somme des aires des rectangles (les facteurs d’occupation). Pour T > TBE , la somme est bien
approximée par l’intégrale sous la courbe. Au dessous de la température TBE , l’occupation de
l’état fondamental est beaucoup plus grande que les occupations des états excités et la somme
des occupations n’est pas correctement approximée par l’intégrale.

Ce phénomène de condensation est tout à fait remarquable puisqu’un nombre macroscopique de


particules occupent un état quantique individuel. À T = 0, l’état d’un nombre macrosco-
pique de bosons est décrit par une unique fonction d’onde :

Ψ0 (~r1 , · · · , ~rN ) = φ0 (~r1 ) · · · φ0 (~rN ) . (10.20)

1.2

1.0

0.8
N0HTLN

0.6

0.4

0.2

0.0

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4

TTBE

Figure 10.4 : Fraction des atomes dans la phase condensée.

Nous pouvons maintenant tracer l’allure du potentiel chimique en fonction de la température.


Il est nul dans le domaine [0, TBE ]. On peut déduire du comportement de J3/2 (ϕ) au voisinage de
ϕ = 1 que le potentiel chimique présente un comportement quadratique µ(T ) ' −c (T − TBE )2
au voisinage de TBE . Finalement il rejoint l’expression classique (Maxwell-Boltzmann) µ(T ) '
− 23 N kB T ln(cT ) aux plus hautes températures T  TBE (figure 10.5).

Condition pour que le phénomène de condensation apparaisse

L’existence d’une transition (de phase) entre une situation où toutes les occupations sont micro-
scopiques et une situation où un facteur d’occupation devient macroscopique a reposé sur le fait
que la fonction J3/2 (ϕ) atteint une valeur finie lorsque ϕ = 1 (i.e. µ = 0). Plus physiquement, il

200
Statistique de Bose-Einstein II Gaz parfait de bosons libres

-1 Max.-Boltz.

ΜHT,nL
-2

-3

-4

-5
0 1 2 3 4

TTBE

Figure 10.5 : Potentiel chimique d’un gaz parfait de bosons libres. Potentiel chimique
en fonction de la température, obtenu par résolution de l’équation (10.10).

G
faut qu’il existe une température finie (T = TBE ) telle que N = N (T, V, µ = 0). Autrement dit
Z ∞
ρ(ε)
∃ T telle que N = dε βε (10.21)
0 e −1
Ceci est possible si l’intégrale converge, i.e. si
Z
ρ(ε)
dε <∞ ⇒ il y a condensation de BE (10.22)
0 ε

Il faut bien entendu qu’il existe également une loi de conservation sur le nombre de par-
ticules, comme pour des atomes (mais pas pour des photons ou des phonons).
Exemples :

• Bosons dans une boı̂te en 3D (ce chapitre) : ρ(ε) ∝ ε1/2 ⇒ OK.


Pour T < TBE , le potentiel chimique est strictement nul, µ(T ) = 0. Pour T > TBE , il
décroı̂t lorsque T augmente (cf. figure).

• Bosons dans une boı̂te en 1D ou 2D : ρ(ε) ∝ ε−1/2 ou ρ(ε) ∝ ε0 ⇒ pas de condensation.


Le potentiel chimique s’annule continûment en allant vers T → 0. Il n’y a pas de phénomène
de condensation.

• Bosons en 1D dans un puits harmonique : cf. exercice 4.7 ; ρ(ε) ∝ ε0 . Pas de condensa-
tion. On avait montré dans l’exercice que µ(T ) est une fonction régulière de T (pas de
discontinuité de ses dérivées).

Remarque sur TBE – Effet des corrélations quantiques


L’expression de la température de Bose-Einstein illustre l’effet du postulat de symétrisation.
Pour cela considérons une boı̂te cubique de volume V = L3 . La température de Bose-Einstein
prend alors la forme :
~2
TBE ∼ N 2/3 . (10.23)
kB mL2
Nous reconnaissons l’ordre de grandeur de l’énergie séparant l’énergie fondamentale ε~0 = 0 des
premiers états excités ~2 /mL2 . Si les particules étaient discernables, elles ne se placeraient dans
l’état fondamental individuel d’énergie nulle que pour des températures très petites devant cette
échelle T . ~2 /(kB mL2 ). Or l’analyse du problème de condensation des bosons montre que
le nombre de bosons dans l’état fondamental devient significatif (macroscopique) dès que T .

201
II Gaz parfait de bosons libres Statistique de Bose-Einstein

N 2/3 ~2 /(kB mL2 ), soit une échelle bien supérieure au cas des particules discernables. Ce facteur
N 2/3 a donc pour origine la nature bosonique des particules et traduit leur tendance à  vouloir
se regrouper  dans l’état fondamental (des corrélations en énergie) 4 à des températures bien
plus grandes (d’un facteur N 2/3 ) que la température associée au gap entre le fondamental et le
premier état excité ~2 /(kB mL2 ).

Figure 10.6 : Énergie moyenne et chaleur spécifique d’un gaz parfait de bosons.

II.C Énergie et chaleur spécifique pour T < TBE


Afin d’étudier les propriétés thermodynamiques sous la température de Bose-Einstein, nous
appliquons la  recette  :
(i ) nous singularisons la contribution de l’état fondamental individuel,
(ii ) nous fixons µ = 0 pour calculer la contribution des bosons excités.

Énergie
Sous la température de Bose-Einstein l’énergie s’exprime simplement comme :
Z ∞
ρ(ε) ε
E = N0 × 0 + dε βε = V A Γ(5/2)ζ(5/2)(kB T )5/2 (10.24)
0 e − 1

que nous écrivons


3ζ(5/2) T 5/2
E(T ) = N kB 3/2 pour T 6 TBE (10.25)
2ζ(3/2) TBE
| {z }
'0.77

L’énergie s’annule plus vite à basse température que celle du gaz parfait classique (approximation
de Maxwell-Boltzmann). Ceci illustre que la nature bosonique des particules favorise leur
regroupement dans l’état fondamental. Le postulat de symétrisation (la symétrisation de
la fonction à N bosons sous les permutations) induit des corrélations en énergie qui favorisent
le regroupement des particules dans le même état quantique. Remarquons que lorsque T = TBE ,
l’énergie E(TBE ) ' 0.77N kB TBE est plus basse que celle du gaz classique, 32 N kB TBE .
4
Les postulat de symétrisation induit également des corrélations spatiales favorisant leur regroupement, cf.
chapitre 11 de [34], § 11.2.5).

202
Statistique de Bose-Einstein II Gaz parfait de bosons libres

Chaleur spécifique
La chaleur spécifique est obtenue par simple dérivation du résultat précédent (l’équation (10.25)
est l’expression de l’énergie en fonction de T , N et V , i.e. l’énergie canonique ; rappelons nous
que TBE est fonction de n = N/V ) :

 3/2
15ζ(5/2) T
CV (T ) = N kB pour T 6 TBE (10.26)
4ζ(3/2) TBE
| {z }
'1.925

Pour T = TBE , la chaleur spécifique CV ' 1.925N kB excède la chaleur spécifique du gaz clas-
sique, CV = 23 N kB (cf. figure). La suppression de la chaleur spécifique à T → 0 traduit également
l’existence de corrélations en énergie entre bosons. Puisque le regroupement des bosons dans
l’état individuel fondamental est  encouragé  par le postulat de symétrisation, la réponse de
l’énergie du gaz à une élévation de température est plus lente, i.e. la chaleur spécifique plus basse
(comparativement au cas classique).

Remarque : Nous n’avons pas prouvé que la chaleur spécifique est continue en TBE , puisque
nous n’avons pas donné d’outil permettant l’analyse du régime juste au dessus de TBE (cf.
ouvrage [29]). Dans le cas de bosons piégés dans une boı̂te, la chaleur spécifique est bien continue,
cependant cela n’est pas une propriété générale. Par exemple, pour un gaz parfait de bosons
piégés dans un puits harmonique 3D (TD9), la chaleur spécifique présente une discontinuité
à TBE .

II.D Équation d’état


2E
La pression est obtenue très directement en utilisant la relation (9.20) : p = −J/V = 3V. On
−3/2
obtient p ∼ nkB T 5/2 TBE ; puisque TBE ∝ n2/3 , nous voyons que la pression est indépendante
de la densité lorsque T < TBE . Précisément :

 m 3/2
p = ζ(5/2) (kB T )5/2 pour T 6 TBE (10.27)
| {z } 2π~2
'1.341

Sous la température de Bose-Einstein, l’isotherme est plate.


Ce phénomène nous rappelle le plateau de liquéfaction de la transition liquide gaz : en suivant
l’isotherme, la pression reste constante tant qu’il y a mélange entre les deux phases. L’observation
est ici analogue : la pression du mélange gaz normal & condensat de Bose-Einstein (i.e. fraction
condensée dans l’état fondamental) est seulement fonction de la température, indépendante de
la densité. Une variation de densité à température constante ne fait que redistribuer les atomes
entre les deux phases, à pression constante.
Nous traçons les isothermes dans un diagramme p − V sur la figure 10.7. Nous raisonnons à
T fixée (isotherme) et faisons varier la densité n, i.e. V . Partons de la zone de coexistence entre
gaz et condensat (isotherme plate) : en augmentant V , nous abaissons TBE ∝ n2/3 . Tant que
TBE > T , l’isotherme est plate. Lorsque TBE = T , le condensat a disparu. Une augmentation
supplémentaire du volume V induit une diminution de la pression du gaz : l’isotherme doit
rejoindre l’isotherme classique p ' N kB T /V aux plus hautes pressions.
La ligne séparant la zone de coexistence des deux phases de la zone associée à la phase gazeuse
m 3/2
(kB TBE )5/2 ∝

est donnée en fixant TBE = T dans l’expression de la pression : p = ζ(5/2) 2π~ 2

(N/V )5/3 .

203
III Réalisations expérimentales Statistique de Bose-Einstein

s
fermion

ons
ue

bos
n 5/3

siq
as
Pauli

Cl

5/2
T
p0

T
TBE ~ TF ~ T*

Figure 10.7 : Pression d’un gaz parfait de bosons.- À gauche : pression en fonction de
la température (pour mémoire, on a reporté la pression du gaz de fermions). À droite : deux
isothermes (remarque : l’existence d’une zone où la compressibilité isotherme κT est infinie est
un artefact du modèle idéal sans interaction).

II.E Entropie et chaleur latente


Nous obtenons l’entropie très directement grâce à la relation entre chaleur spécifique et entropie
∂S
(canonique) 5 CV = T ∂T . Lorsque S = c T a est une loi de puissance, la chaleur spécifique
présente un comportement analogue CV = a c T a , i.e. CV = a S. D’où
 3/2
5ζ(5/2) T
S(T ) = N kB pour T 6 TBE (10.28)
2ζ(3/2) TBE
| {z }
'1.283

L’entropie du gaz s’annule bien à température nulle, limT →0 S(T ) = 0, traduisant l’accumulation
de tous les bosons dans un unique état individuel. Le théorème de Nernst est bien respecté.
Au delà de la température TBE , l’entropie doit rejoindre la formule de Sackur-Tetrode S '
3
2 N kB ln T + cste aux hautes températures T  TBE .
Cette expression de l’entropie permet de déduire la chaleur latente de condensation, reliée
à la variation d’entropie
 entre la phase gazeuse à T = TBE et la phase condensée Lcondens =
T Sgaz − Scondens , d’où
5ζ(5/2)
Lcondens = N kB T . (10.29)
2ζ(3/2)
Elle correspond au coût énergétique nécessaire pour passer de la phase condensée à la phase
gazeuse, sur l’isotherme. La transition de phase est donc du premier ordre.

III Réalisations expérimentales


III.A Diverses réalisations
• Le phénomène de superfluidité est lié à un phénomène de condensation (F. London, 1936).
5
Rappelons nous que la relation a été démontrée au chapitre 4, i.e. est valable pour l’entropie canonique
C
CV = T ∂S ∂S

∂T
(CV = T ∂T V,N
dans les notations de la thermodynamique). Dans le chapitre nous considérons
bien une situation à T , V et N fixés.

204
Statistique de Bose-Einstein III Réalisations expérimentales

• Le phénomène de superconductivité (découvert en 1911 par Kamerlingh Onnes ; théorie


Bardeen-Cooper-Schrieffer en 1957) : appariement des électrons pour former des  paires
de Cooper  de nature bosonique, qui se condensent à basse température.
Exemple : TBE = 1.2 K dans l’Aluminium, TBE = 9.25 K dans le Niobium (une des
températures critiques les plus élévées dans un composé simple).

• Dans les gaz ultra-froids : première observation en 1995 (au MIT, Maschusetts, et à Boul-
der, Colorado). TBE ∼ 0.2 µK.

• Beaucoup d’autres réalisations en matière condensée. Un cas exotique très étudié ces toutes
dernières années : la condensation de gaz de polaritons. 6 Grâce à leur faible masse, on
peut observer le phénomène de condensation à T ∼ 100 K.

III.B Condensation dans un piège harmonique


Gaz parfait de bosons dans un piège harmonique isotrope
Étudié en TD. La densité d’états individuelle dans un puits harmonique est ρ(ε) ∝ εα−1 avec
α = 3 (contre α = 3/2 dans un boı̂te). Température de Bose-Einstein :
 1/3
~ω N
TBE = (10.30)
kB ζ(3)

(génériquement on a TBE ∼ N 1/α δε où δε est l’échelle d’énergie caractérisant la quantification


des énergies). La fraction condensée est
"  #
T 3

N0 (T ) = N 1 − (10.31)
TBE

qui fait apparaı̂tre l’exposant α = 3. La distribution spatiale de la fraction condensée est donnée
par la fonction d’onde du fondamental
 mω 3/2 mω 2
ρ(~r) = N0 (T ) |φ0 (~r)|2 + ρexcites (~r; T ) où φ0 (~r) = e− 2~ ~r . (10.32)
π~

Expériences
Dans les expériences, le gaz est piégé dans une  mélasse optique  (dans un piège magnéto-
optique) : l’interaction entre les atomes et les lasers génère une force de friction effective qui
ralentit les atomes (i.e. refroidit le gaz). La température est encore abaissée par refroidissement
évaporatif.
Le piège est alors retiré, le gaz diffuse quelques millisecondes dans l’espace puis on prend
une  photo  qui permet de remonter au profil de densité.
Dans l’expérience on observe un profil gaussien typique d’une distribution thermique à haute
température
mω 2
− 2k r2
~
ρ(~r) = C e BT
(10.33)
Lorsque la température est abaissée on voit  pousser  un pic non gaussien, qu’on interprète
comme l’apparition du condensat.
6
Le polariton est une quasi-particule constitué du mélange d’un photon piégé dans une cavité et d’un exciton
(une paire électron-trou dans un semi-conducteur).

205
III Réalisations expérimentales Statistique de Bose-Einstein
1140 Wolfgang Ketterle: When atoms behave as waves

FIG. 7. Observation of Bose-Einstein condensation by absorption imaging. Shown is absorption vs two spatial dimensions. The
Bose-Einstein condensate is characterized by its slow expansion observed after 6 ms time of flight. The left picture shows an
expanding cloud cooled to just above the transition point; middle: just after the condensate appeared; right: after further evapo-
rative cooling has left an almost pure condensate. The total number of atoms at the phase transition is about 7!105 , the
temperature at the transition point is 2 !K [Color].

magnet coils for the plugged trap were oriented verti-


Figure 10.8 : Profil de densité d’un gaz d’atomesat
cally in reentrant flanges, and when we replaced them
the bottom of the cloud (Ketterle and van Druten,
de Rubidium ultrafroids. Figure tirée de l’ar-
1996; Surkov et al., 1996). But before breaking the
ticle :with
W.cloverleaf
Ketterle,  Nobel
coils, lecture
the weakly : When
confining axis of atoms
the behave
vacuum andasreorienting
waves : the
Bose-Einstein
coils, we wantedcondensation
to see the
and theIoffe-Pritchard
atom laser trap 
was vertical.
, Rev. In such
Mod. a geometry,
Phys. 74, the limitation.
1131–1151 Around December 1995, when we were just
(2002)
gravitational sag would reduce the efficiency of rf- starting to look at the efficiency of evaporation, we lost
induced evaporation since atoms would only evaporate the vacuum once again due to a cracked ceramic part in
an electric feedthrough and decided to reorient the
Le profilq du condensat est assez différent de lawhole gaussienne
experiment,attendue, Eq.confining
with the weakly (10.32), axisde largeur
of the
def trap now aligned horizontally. Since that time, now more
∆x ∼ `ω = mω . À T = 0, les effets de l’interaction
~
répulsive deviennent dominants. La théorie
than six years, the machine has been under vacuum. This
de champ moyen montre que le profil de densité est is indesharpla contrast
forme to the conditions in 1995, when we
had to open the chamber, pump down, and bake out
 every couple  of months. Finally, we had learned from
our
~r 2
previous mistakes and developed a very systematic
ρ(~r) = C 1 − 2 (10.34)
procedure
Rc for pumpdowns and bakeouts.
I still remember the night of March 13, 1996, when the
experiment was up and running, and Klaasjan1/5 van
où la taille du condensat croı̂t avec le nombre deDruten particules comme
and I had fine-tuned ∼ bias
Rc the `ω (N asof
field /`the
ω ) mag-où as
est la longueur de diffusion (caractérisant l’interaction). netic trap, so that the switchover to the new magnetic
trap was finally completed. It was already after mid-
En revanche, la dépendance du nombre d’atomes condensés
night, too late to starten
somefonction de when
serious work, la température
Klaasjan
suit raisonnablement la prédiction du calcul pourasked le gaz halfsans
jokingly why don’t we
interaction just try10.9).
(figure to get BEC.
Without knowing what our temperatures and densities
FIG. 8. Progress in evaporative cooling of alkali atoms up to were, without having ever measured the trap frequen-
1996. The number of atoms in the lowest quantum state is cies, we played around with the rf sweep that determines
proportional to the phase-space density and has to exceed a the cooling trajectory, and a condensate showed up
critical number of 2.612 to achieve Bose-Einstein condensa- around 2:10 a.m. We were relieved since we hadn’t pro-
tion. For N 0 "10#3 , the increase in phase-space density due to duced condensates for almost half a year, but also the
evaporation is plotted. For the Rice result of July 1995 see ease at which we got the condensate in a new trap told
Bradley et al. (1995) and the erratum (Bradley et al., 1997). us our setup was robust and that we were ready to

Rev. Mod. Phys., Vol. 74, No. 4, October 2002

206
o
the noncondensate atoms methodsimagingfor system. Our trapped
ultracold measurements
gases are thus only margin-
[1–3,5–8]. For
ficantly broader than the an allyidealdifferent
gas farfrom
fromthequantum degeneracy
theory for the velocity
noninteracting bosons in
mperatures below TyToStatistique
≠ distribution de
is Bose-Einstein
the thermodynamic limit. whose
a Gaussian Finite width
number is corrections
proportional [22] III Réalisations expérimentales
nts become suspect, as it to willT 1y2shift
. As thethe
transition
cloud temperature Tc sNd down
is cooled closer to theabout
BEC3%
separate the condensate phase transition, higher densities and lower temperatures
ents without recourse to cause a rapid increase in the significance of quantum
rary to the spirit of this statistics and of residual atom-atom interactions. Rather
than attempt to model these effects, we assume that the
om previously reported high-energy tail of the velocity distribution (i) remains in
gases [1–3,5–8]. For thermal equilibrium with the rest of the cloud and (ii) can
degeneracy the velocity be characterized by a purely ideal Maxwell-Boltzmann
se width is proportional (MB) distribution. The latter is plausible because these
oled closer to the BEC highest-energy atoms spend most of their trajectories in
FIG. 1. Total number N (inset) and ground-state fraction
s and lower temperatures the low-density, and therefore weakly interacting, outer No yN as a function of scaled temperature T yTo . The scale
significance of quantum part of the trapped cloud. Furthermore the occupation temperature To sNd is the predicted critical temperature, in
tom interactions. Rather numbers of the corresponding energy states are much less the thermodynamic (infinite N) limit, for an ideal gas in a
ects, we assume that the than one. Finally, during the free expansion the high- harmonic potential. The solid (dotted) line shows the infinite
distribution (i) remains in energy atoms undergo on average much less than one (finite) N theory curves. At the transition, the cloud consists
of 40 000 atoms at 280 nK. The dashed line is a least-
of the cloud and (ii) can collision. Guided by these assumptions, we determine the squares fit to the form No yN ≠ 1 2 sTyTc d3 which gives
deal Maxwell-Boltzmann temperature by fitting a 2D Gaussian to only the wings Tc ≠ 0.94s5dTo . Each point represents the average of three
plausible because these of our velocity-distribution images, excluding the central separate images.
st of their trajectories in
FIG. 1. Total number N (inset) and ground-state fraction
weakly interacting, outer No yN10.9as a function temperature T yT
of scaledcondensée
thermore the occupation Figure : Fraction eno . fonction
temperature To sNd is the predicted critical temperature, in
The scale de la température. Figure tirée de 4985 l’article :
ergy states are much less the thermodynamic (infinite N)
J. R. Ensher, D. S. Jin, M. R. Matthews, C. E. Wieman and E. A. Cornell, Bose-Einstein
limit, for an ideal gas in a 
free expansion the high- harmonic potential. The solid (dotted) line shows the infinite
age much less than one
condensation in acurves.
(finite) N theory diluteAtgas : measurement
the transition, of energy and ground state occupation , Phys. Rev.
the cloud consists
of 40 000 atoms at 280 nK. The dashed line is a least-
mptions, we determine Lett.
the 77, 4984 (1996).
squares fit to the form No yN ≠ 1 2 sTyTc d which gives
3
ussian to only the wings Tc ≠ 0.94s5dTo . Each point represents the average of three
es, excluding the central separate images.

4985

, Les idées importantes


• Relation (10.7) entre N et µ (pour un système thermodynamique). Il est très important de
garder en tête que µ < ε0 = 0.
• Identifier (qualitativement) le comportement µ % lorsque T &. Retrouver l’expression de la
température de Bose-Einstein TBE .
• Pour T < TBE , le potentiel chimique se bloque à µ = 0 (ou plus rigoureusement µ ' −kB T /N0 )
une fraction macroscopique de bosons N0 se placent dans l’état fondamental d’énergie nulle : il
y a condensation de Bose-Einstein.
Il faut alors singulariser la contribution N0 de l’état fondamental au nombre de bosons.
• Retrouver l’expression (10.19) de la fraction condensée en fonction de la température.
• Savoir reproduire le calcul l’énergie et de CV pour T < TBE .

+ Pour en savoir plus


• Chapitre VI de [11].
• Chapitre 12 du livre de K. Huang [13].
• Un livre plus spécialisé : [29].

207
III Réalisations expérimentales Statistique de Bose-Einstein

208
Chapitre 12

La physique statistique : mode


d’emploi

En guise de conclusion, prenons un peu de recul afin de percevoir la cohérence globale du cours
de physique statistique. L’objet de ce petit résumé est de donner une vue synthétique des aspects
techniques : quel est le minimum de choses vraiment essentielles à retenir ? Que doit-on calculer ?
Quelle est la logique ?

I Quelques notions importantes


Pour  faire de la physique statistique , il faut commencer par injecter des informations mi-
croscopiques sur le système.
• Densité d’étatsP(chapitreR 3). Compter les microétats états lorsque le spectre des énergies
est très dense : ` · · · → dE` ρ(E` ) · · · . La densité d’états encode souvent toute l’infor-
mation microscopique nécessaire à l’étude des propriétés thermodynamiques d’un système.
• Microétats/états individuels (chapitre 8). L’ensemble grand canonique fournit le  bon
langage  pour passer très rapidement de l’information à une particule (états individuels)
aux états à N particules (les microétats du système).
Un microétat du système à N particules est spécifié par la connaissance des états indi-
viduels des particules : | ` i = | λ1 , · · · , λN i. L’information est convenablement (et effi-
cacement) encodée dans la donnée des facteurs d’occupations des états individuels :
l’ensemble des {nλ }.
La partie de la physique statistique que nous avons présentée s’intéresse aux systèmes à
l’équilibre macroscopique.
• Équilibre macroscopique (chapitre 3). Cette notion doit être assimilée.
• Microétats/macroétats (chapitres 1 & 3). La distinction concerne l’information dont
on dispose sur le système : soit toutes les informations microscopiques (microétat, noté `),
soit une information incomplète à travers les probabilités d’occupation des microétats
(macroétat, l’ensemble {P` }).

II La  boı̂te à outils  de la physique statistique


La logique générale
• Les ensembles de la physique statistique.– Un système à l’équilibre se trouve dans

211
II La  boı̂te à outils  de la physique statistique La physique statistique : mode d’emploi

un certain macroétat, caractérisé par l’ensemble des probabilités d’occupation des mi-
croétats {P` }. La construction explicite de cette distribution de probabilité est effectuée
dans différentes situations correspondant à divers choix des quantités thermodynamiques
fixées : (E, V, N, · · · ) ou (T, V, N, · · · ) ou... Ces différentes situations (i.e. distributions)
sont désignées comme  les ensembles de la physique statistique .
Le choix du jeu de quantités fixées est guidé soit par la situation physique, soit par des
motivations techniques (facilité des calculs).

• Limite thermodynamique/équivalence des ensembles.– Le choix de l’ensemble ap-


proprié peut être purement motivé par des raisons techniques (ex : le traitement du postulat
de symétrisation de la mécanique quantique est simple dans l’ensemble grand canonique).
Une idée importante est de retenir qu’à la limite thermodynamique (pour les systèmes
possédant de bonnes propriétés d’extensivité) les résultats obtenus dans les différents en-
sembles coı̈ncident.

: on choisira l’ensemble qui rend les calculs les plus simples puis on utilisera l’équivalence
entre les ensembles pour revenir à la situation d’intérêt.

Les principaux ensembles


• Ensemble microcanonique : système isolé, i.e. (E, N, · · · ) fixés (chapitre 3). Les
microétats accessibles sont occupés avec équiprobabilité

P`∗ = cste (12.1)

La constante de normalisation est donnée par le nombre Ω de microétats accessibles


P`∗ = Ω1 . C’est l’ecriture du postulat fondamental de la physique statistique. L’entropie
microcanonique
S ∗ (E, N, · · · ) = kB ln Ω (12.2)
est la fonction fondamentale de l’ensemble microcanonique.

• Ensemble canonique : système thermostaté, i.e. (T, N, · · · ) fixés (chapitre 4).


Lorsque la température du système est fixée, les probabilités d’occupation des microétats
se comportent comme
P`C ∝ e−βE`
def
où β = 1/kB T (12.3)
La constante de normalisation est la fonction de partition canonique
X
e−βE`
def
Z = (12.4)
`

reliée à l’énergie libre :


F (T, N, · · · ) = −kB T ln Z (12.5)

Un truc pour se rappeler la définition de F : s’il y a un seul microétat d’énergie E0 ,


alors Z = e−βE0 et F = E0 (c’est une  énergie  libre).

• Ensemble grand canonique : contact avec un réservoir, i.e. (T, µ, · · · ) fixés (cha-
pitre 8). Si la température et le potentiel chimique sont fixés, les probabilités d’occupation
des microétats sont
P`G ∝ e−β(E` −µN` ) (12.6)

212
La physique statistique : mode d’emploi II La  boı̂te à outils  de la physique statistique

La constante de normalisation est la fonction de partition grand canonique


X
e−β(E` −µN` )
def
Ξ= (12.7)
`

reliée au grand potentiel :


J(T, µ, · · · ) = −kB T ln Ξ (12.8)

: le  truc  mentionné pour passer de Z à F s’applique également pour passer de Ξ à


J (un  potentiel  i.e. une quantité assimilée à une  énergie ). Considérons la situation
ultra-simplifiée où Ξ = e−β(E0 −µN0 ) ⇒ J = E0 − µN0 .
En ayant relaché les contraintes sur E et N , l’ensemble grand canonique fournit le  bon  lan-
gage pour passer des propriétés à une particule (exprimées en termes des états individuels
| λ i) aux propriétés thermodynamiques. La fonction de grand partition présente la facto-
risation sur les états individuels :
Y
Ξ= ξλ (12.9)
λ

Q
( :  λ  car les fonctions de partition sont des grandeurs multiplicatives) où la
fonction de grand partition de l’état individuel est
X
ξλ = e−nλ β(λ −µ) (12.10)

La somme porte sur l’occupation nλ de l’état individuel ( : en présence d’un unique


état individuel, la seule chose qui peut changer est le nombre de particules nλ qu’on y
met).
Bosons/fermions.– Les occupations sont soit nλ ∈ N (bosons) soit nλ ∈ {0, 1} (fermions)
et donc
 ∓1
B/F
ξλ = 1 ∓ e−β(λ −µ) (12.11)

d’où
1 X B/F 1X
J B/F = − ln ξλ = ± ln(1 ∓ e−β(λ −µ) ) (12.12)
β β
λ λ

qui illustre bien le passage  propriétés des états individuels −→ propriétés thermodyna-
miques .

Je souhaite insister sur un point : finalement les seules formules à retenir sont les trois
expressions encadrées. Tout le reste s’en déduit avec un peu de réflexion.
Je dois assortir cette remarque d’une mise en garde : attention à ne pas juste  retenir des
formules , mais à intégrer les idées. La physique doit d’abord être pensée, le formalisme ne
fournissant que le cadre et les outils pour la mise en pratique des idées.

213
II La  boı̂te à outils  de la physique statistique La physique statistique : mode d’emploi

Que fait-on de ces potentiels ?


La logique de la physique statistique consiste donc souvent à calculer ces fonctions génératrices,
Ω, ou Z, ou Ξ, etc, puis les potentiels thermodynamiques associés S ∗ (E, N, · · · ), ou F (T, N, · · · ),
ou J(T, µ, · · · ), etc. Ces fonctions fondamentales jouent le rôle de fonctions génératrices des
propriétés thermodynamiques.

Pour déduire ces dernières, on se souviendra :

• de la relation fondamentale de la physique thermodynamique

dE = T dS − p dV + µ dN + · · · (12.13)

• de la logique des transformations de Legendre (annexe page 100).

Exemple : F est une fonction de (T, V, N, · · · ), ce qui nous conduit à écrire F = E−T S
⇒ dF = −S dT − p dV + µ dN + · · ·

• La relation entre physique statistique et thermodynamique nous suggère les définitions des
quantités thermodynamiques : par exemple l’entropie S C = − ∂F
∂T , la pression p = − ∂V ,
C ∂F

etc.

214
Ensemble paramètres Distribution Fonction Potentiel Relation
extérieurs fixés génératrice thermodynamique thermodynamique
microcanonique E, V, N, ... S ∗ (E, V, N, · · · ) = kB ln Ω dE = T dS − pdV + µdN + · · ·
système isolé P`∗ = Ω1 (*) Ω(E, V, N, · · · ) : # de entropie ou dS = T1 dE + Tp dV − Tµ dN + · · ·
def ∗ p∗ def ∂S ∗
(postulat fond.) microétats accessibles d’où T1∗ = ∂S∂E , T ∗ = ∂V , etc
canonique T, V, N, ... P F (T, V, N, · · · ) = −kB T ln Z Legendre : F = E − T S
1 −βE`
système P`C = Ze Z = ` e−βE` énergie libre dF = −SdT − pdV + µdN + · · ·
def C def ∂F
thermostaté fct de partition (fonction de Helmholtz) d’où S C = − ∂F
∂T , p = − ∂V , etc
grand canonique T, V, µ, ... Legendre : J = F − µN
1 −β(E` −µN` ) P
contact avec P`G = Ξe Ξ = ` e−β(E` −µN` ) J(T, V, µ, · · · ) = −kB T ln Ξ dJ = −SdT − pdV − N dµ + · · ·
def ∂J def ∂J
un réservoir fct de grand partition grand potentiel d’où S G = − ∂T , pG = − ∂V , etc
de particules
isobare- T, p, N, ... G(T, p, N, · · · ) = −kB T ln Y Legendre : G = F + pV
1 −β(E` +pV` ) P
isotherme contact avec =
P`ii Ye Y = ` e−β(E` +pV` ) enthalpie libre dG = −SdT + V dp + µdN + · · ·
def ii def ∂G
un réservoir (**) (fonction de Gibbs) d’où S ii = − ∂G
∂T , V = ∂p , etc
de volume
Etc...

(*) pour E 6 E` 6 E + δE
(**) On traite le volume comme une variable prenant des valeurs discrètes pour simplifier les notations.
II La  boı̂te à outils  de la physique statistique La physique statistique : mode d’emploi

216
Annexe A

Formulaire

Fonction Gamma d’Euler


Pour Re z > 0 on a la représentation de la fonction Gamma :
Z ∞
dt tz−1 e−t .
def
Γ(z) = (A.1)
0

La relation fonctionnelle
Γ(z + 1) = z Γ(z) (A.2)
permet d’étendre la définition de la fonction dans la seconde moitié du demi-plan complexe de z.
Deux valeurs particuières :

Γ(1) = 1 et Γ(1/2) = π (A.3)

π
d’où Γ(n + 1) = n! et Γ(n + 12 ) = 2n (2n − 1)!!.

Fonction Beta d’Euler


Z 1 Z π/2
Γ(µ)Γ(ν)
B(µ, ν) = dt tµ−1 (1 − t)ν−1 = 2 dθ sin2µ−1 θ cos2ν−1 θ = (A.4)
0 0 Γ(µ + ν)

Fonction Zeta de Riemann


Une représentation intégrale

tα−1
Z
1
ζ(α) = dt valable pour Re α > 1 (A.5)
Γ(α) 0 et − 1

(on peut étendre le domaine de définition de ζ(α) dans le plan complexe de la variable α en
utilisant des relations fonctionnelles). Par développement de la fraction en série géométrique, on
montre que
X ∞
ζ(α) = n−α pour Re α > 1 . (A.6)
n=1

Quelques valeurs particulières utiles : ζ(1) = ∞, ζ(3/2) ' 2.612, ζ(2) = π 2 /6, ζ(5/2) ' 1.341,
ζ(3) ' 1.202, ζ(4) = π 4 /90, etc.
D’autres représentations intégrales utiles sont
Z ∞
1−α tα−1
(1 − 2 )Γ(α)ζ(α) = dt t valable pour Re α > 1 (A.7)
0 e +1

217
Formulaire

Intégrales gaussiennes
Z +∞ √
2
dx e−x = π (A.8)
−∞

Plus généralement
Z +∞   n+1  
n − 12 ax2 1 2 2 n+1
dx x e = Γ (A.9)
0 2 a 2

Méthode du col

Soit l’intégrale
Z b
I(λ) = dx e−λϕ(x) (A.10)
a

où la fonction ϕ(x) possède un unique minimum (absolu) en x∗ ∈]a, b[,  loin  des bords ;
on suppose de plus que ϕ00 (x∗ ) 6= 0. Dans la limite λ → ∞ l’intégrale est dominée par les
contributions du voisinage du minimum :
s

I(λ) ' e−λϕ(x∗ ) (A.11)
λ→∞ λϕ00 (x∗ )

(les restrictions sont faciles à lever ; on pourra facilement obtenir des généralisations de la formule
précédente lorsque les hypothèses ne sont pas satisfaites).

Figure A.1 : Méthode du col.

Formule de Stirling OnR peut appliquer la formule précédente à la fonction Gamma en



l’écrivant Γ(z + 1) = z z+1 0 dt e−zϕ(t) avec ϕ(t) = t − ln t. On obtient la formule de Stir-
ling
√ 1
Γ(z + 1) ' 2π z z+ 2 e−z (A.12)
z→∞

qu’on utilisera souvent sous la forme

1
ln Γ(z + 1) = z ln z − z + ln(2πz) + O(1/z) (A.13)
z→∞ 2

Remarquons qu’il s’agit des premiers termes d’une série asymptotique P (i.e. si on poursuivait le
développement en complétant par des termes cn /z pour n > 1, la série ∞
n n
n=1 cn /z ne converge
pas).

218
Formulaire

Distribution de Dirac
Rappelons la formule définissant l’action de la distribution de Dirac. Soit f (x) une fonction
continue à l’origine : Z
dx f (x) δ(x) = f (0) , (A.14)
R
où l’intégrale inclut l’origine. Autrement dit δ(x) est une fonction de  poids R dx δ(x) =
1  concentré à l’origine.
La transformée de Fourier de la distribution de Dirac est une constante (δ est la superposition
d’ondes planes à toutes les fréquences) i.e.
Z +∞
dk ikx
δ(x) = e . (A.15)
−∞ 2π

Une petite propriété utile : soit λ ∈ R∗ , on a δ(λx) = |λ|


1
δ(x). La propriété montre que la
   
distribution a la dimension physique inverse de son argument δ(x) = 1/ x .
Soit f (x) une fonction ayant un ensemble de racines simples notées xn . On a
X δ(x − xn ) 1 X
δ(f (x)) = 0
= 0 δ(x − xn ) . (A.16)
|f (xn )| |f (x)|
xn tq xn tq
f (xn ) = 0 f (xn ) = 0

1
Exemple 1 : δ(x2 − x20 ) =
 
2x0 δ(x − x0 ) + δ(x + x0 ) .
P
Exemple 2 : δ(sin x) = n∈Z δ(x − nπ) est un peigne de Dirac.

219
Bibliographie

[1] P. W. Anderson, More is different, Science 177(no 4047), 393 (4 August 1972).

[2] N. W. Ashcroft and N. D. Mermin, Solid State Physics, Saunders College (1976).

[3] R. Balian, From microphysics to macrophysics. Volume I , Springer, Berlin (1992).

[4] R. Balian, From microphysics to macrophysics. Volume II , Springer, Berlin (1992).

[5] J.-L. Basdevant and J. Dalibard, Mécanique quantique, Les éditions de l’École polytech-
nique, Palaiseau (2004).

[6] H. B. Callen, Thermodynamics and an introduction to thermostatistics, John Wiley & Sons,
New York (1985), 2nd edition.

[7] R. Castaing, Thermodynamique statistique, Masson, Paris (1970).

[8] C. Cohen-Tannoudji, B. Diu and F. Laloë, Mécanique Quantique, Hermann, Paris (1973),
tomes 1 et 2.

[9] C. Cohen-Tannoudji, J. Dupont-Roc and G. Grynberg, Photons et atomes : Introduction à


l’électrodynamique quantique, Interéditions/Éditions du CNRS (1987).

[10] L. Couture, C. Chahine and R. Zitoun, Thermodynamique - cours, exercices et problèmes


résolus, Dunod (1993).

[11] B. Diu, C. Guthman, D. Lederer and B. Roulet, Physique Statistique, Hermann, Paris
(1989).

[12] A. Georges and M. Mézard, Physique Statistique, édité par l’École Polytechnique, Palaiseau
(2008), ISBN 978–2–7302–1484–1.

[13] K. Huang, Statistical mechanics, John Wiley & Sons, New York (1963).

[14] E. T. Jaynes, Information Theory and Statistical Mechanics, Phys. Rev. 106, 620–630
(1957).

[15] M. Kardar, Statistical physics of fields, Cambridge University Press (2007).

[16] M. Kardar, Statistical physics of particles, Cambridge University Press (2007).

[17] C. Kittel, Physique de l’état solide, Dunod (1994), 5ème édition.

[18] W. Krauth, Statistical Mechanics : Algorithms and Computations, Oxford Unversity Press
(2006).

[19] H. Krivine and J. Treiner, La physique statistique en exercices, Vuibert, Paris (2003).

223
BIBLIOGRAPHIE BIBLIOGRAPHIE

[20] R. Kubo, M. Toda and N. Hashitsume, Statistical physics II : non-equilibrium statistical


mechanics, Springer-Verlag (1992).

[21] L. D. Landau and E. Lifchitz, Physique statistique, Mir (1966), tome 5.

[22] R. B. Laughlin, Un univers différent, Fayard (2005).

[23] M. Le Bellac, Physique quantique, EDP Sciences – CNRS Éditions (2003).

[24] J.-M. Lévy-Leblond and F. Balibar, Quantique – Rudiments, CNRS-InterÉditions, Paris


(1984).

[25] S.-K. Ma, Statistical mechanics, World Scientific, Singapore (1985).

[26] K. Mallick, Some recent developments in non-equilibrium statistical physics, Pramana


J. Phys. 73(3), 417–451 (2009), available at http://www.ias.ac.in/pramana/v73/p417/
fulltext.pdf.

[27] C. Ngô and H. Ngô, Physique Statistique, Dunod, Paris (2008), 3ème édition.

[28] R. K. Pathria and P. D. Beale, Statistical mechanics, Academic Press, Elsevier (2011), 3rd
edition.

[29] C. J. Pethick and H. Smith, Bose-Einstein condensation in dilute gases, Cambridge Uni-
versity Press (2002).

[30] F. Reif, Fundamentals of statistical and thermal physics, McGraw-Hill, New York (1965).

[31] F. Reif, Physique statistique, Armand Colin, Paris (1972), Berkeley : cours de physique,
volume 5.

[32] J. P. Sethna, Statistical Mechanics : Entropy, order parameter and complexity, Oxford
University Press (2006).

[33] C. Texier, Physique statistique (faiblement) hors équilibre : formalisme de la réponse


linéaire. Application à l’étude de la dissipation quantique et du transport életronique (2013),
notes de cours du DEA de physique quantique, École Normale Supérieure, disponible à
l’adresse http://www.lptms.u-psud.fr/christophe_texier/.

[34] C. Texier, Mécanique quantique, Dunod, Paris, second edition (2015).

[35] M. Toda, R. Kubo and N. Saitô, Statistical physics I : equilibrium statistical mechanics,
Springer-Verlag (1992).

224
Index

A Cumulants (définition) . . . . . . . . . . . . . . . . . . . . . 24
Agitation thermique . . . . . . . . . . . . . . . . . . . . . . . 38
Aléatoire (variable) . . . . . . . . . . . . . . . . . . . . . . . . 18 D
Argon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 De Broglie (longueur thermique de) . . . 97, 194
Avogadro (nombre d’) . . . . . . . . . . . . . . . . . . . . . 15 Debye (modèle de) . . . . . . . . . . . . . . . . . . . . . . . . 127
Debye, Petrus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12
B Dégénérescence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Bernouilli, Daniel . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Densité de modes . . . . . . . . . . . . . . . . . . . . . . . . . 122
Binomiale (distribution) . . . . . . . . . . . . . . . . . . . 25 Détente de Joule . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Bit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Développement du viriel . . . . . . . . . . . . . 145, 171
Blocage de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . . 188 Diatherme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Boltzmann, Ludwig . . . . . . . . . . . . . . . . . . . . . . . . 11 Diffusion
Born-Oppenheimer (approximation de) . . . 108 des molécules dans un gaz . . . . . . . . . . . . 107
Bose-Einstein (distribution de) . . . . . . . 119, 173 Dilatation (coefficient de) . . . . . . . . . . . . . . . . . . . 3
Boson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 75 Distribution de Bose-Einstein . . . . . . . . . . . . . 119
Brisure spontanée de symétrie . . . . . . . 154, 159 Distribution de probabilité . . . . . . . . . . . . . . . . . 19
Dulong et Petit (loi de) . . . . . . . . . . . . . . . . . . . 124
C
Capacité calorifique (voir Chaleur spécifique)3 E
Casimir (pression) . . . . . . . . . . . . . . . . . . . . . . . . 132 Échange (interaction d’) . . . . . . . . . . . . . . . . . . 151
Chaleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Einstein, Albert . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Chaleur latente . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Élementaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
de condensation de Bose-Einstein . . . . . 200 Émergence . . . . . . . . . . . . . . . . . . . . 6, 27, 123, 192
Chaleur spécifique . . . . . . . . . . . . . . . . . . . 3, 62, 84 Énergie de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . 183
gaz diatomique . . . . . . . . . . . . . . . . 3, 110, 111 Énergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
gaz parfait monoatomique . . . . . . . . . . . . 106 Énergie libre (interprétation thermo.) . . . . . . 82
Champ moyen (approximation de) . . . . . . . . 152 Enthalpie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Chaos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Enthalpie libre (fonction de Gibbs) . . . . . . . 147
Clausius, Rudolf . . . . . . . . . . . . . . . . . . . . . . . 11, 93 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
COBE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Col (méthode du) . . . . . . . . . . . . . . . . . . . . . 32, 214 de Rényi . . . . . . . . . . . . . . . . . . . . . . . . . . 29, 102
Collision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 extensivité . . . . . . . . . . . . . . . . . . . . . 58, 59, 70
Compressibilité . . . . . . . . . . . . . . . . . . . . . . . 3, 7, 87 microcanonique . . . . . . . . . . . . . . . . . . . . . . . . 57
Conjugué principe d’entropie maximale . . . 46, 57, 69
paramètre conjugué . . . . . . . . . . . . . . . . 85, 87 réduite . . . . . . . . . . . . . . . . . . 61, 63–65, 67, 69
variable canoniquement conjugué . . . . . . 39 Sackur-Tetrode (formule de). .59, 106, 200
Constante de Boltzmann . . . . . . . . . . . . . . . . . . . 29 validité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Contact thermique . . . . . . . . . . . . . . . . . . . . . . . . . 60 statistique (de von Neumann) . . . . . . . . . 29
Corps noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Équilibre macroscopique . . . . . . . . . . . . . . . . . . . 38
Corrélations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Espérance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Covariances (matrice des) . . . . . . . . . . . . . . . . . . 22 État pur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Crochets de Poisson . . . . . . . . . . . . . . . . . . . . 40, 44 Étoiles
Cumulants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23, 84 à neutrons . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

225
INDEX INDEX

Naines blanches . . . . . . . . . . . . . . . . . . . . . . 180 Lennard-Jones (potentiel de). . . . . . . . . . . . . .142


Évènement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Libre parcours moyen . . . . . . . . . . . . . . . . . . . . . 107
Exposants critiques . . . . . . . . . . . . . . . . . . . . . . . 160 Limite centrale (théorème de la) 26, 33, 44, 46
Extensivité . . . . . . . . . . . . . . . . . . . . . . . . . 58, 70, 83 Limite thermodynamique . . . . . . . . . 63, 92, 100
Longueur thermique . . . . . . . . . . . . . . . . . . 97, 194
F
Facteurs d’occupation . . . . . . . . . . . . . . . . . 55, 172 M
Fermi (énergie de) . . . . . . . . . . . . . . . . . . . . . . . . 183 Macroétat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Fermi-Dirac (distribution de) . . . . . . . . . . . . . 174 Magnon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
Fermion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 75 Maxwell (relations de) . . . . . . . . . . . . . . . . . . . . 101
Fluctuation-dissipation . . . . . . . . . . . . . . . . 84, 106 Maxwell, John C. . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Fonction de partition . . . . . . . . . . . . . . . . . . . . . . 81 Maxwell-Boltzmann (approximation de)56, 96
Fonction génératrice . . . . . . . . . . . . . . . 24, 81, 167 Mayer (relation de) . . . . . . . . . . . . . . . . . . . . 4, 106
Fond cosmologique. . . . . . . . . . . . . . . . . . . . . . . .130 Mélange statistique . . . . . . . . . . . . . . . . . . . . . . . . 28
Fugacité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167, 194 Mermin-Wagner (théorème). . . . . . . . . . . . . . .135
Méthode du col . . . . . . . . . . . . . . . . . . . . . . . 32, 214
G Microétat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Gap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 Modes propres . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
Gaussienne (distribution) . . . . . . . . . . . . . . . . . . 25 Moments (définition) . . . . . . . . . . . . . . . . . . . . . . 23
Gaz parfait . . . . . . . . . . . . . . . . . . . . . . . . . 11, 16, 26 Mouvement brownien . . . . . . . . . . . . . . . . . . . . . . 19
monoatomique . . . . . . . . . . . . . . . . . . . . . 59, 69 Moyenne (définition) . . . . . . . . . . . . . . . . . . . . . . . 20
potentiel chimique . . . . . . . . . . . . . . . . . . . . . 67
pression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 N
Sackur-Tetrode (formule de) . . . . . . . 59, 69 Nernst (théorème de) . . . . . . . . . . . . . . 69, 94, 188
validité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Gibbs (fonction de) . . . . . . . . . . . . . . . . . . . . . . . 147 O
Gibbs, J. Willard . . . . . . . . . . . . . . . . . . . . . . 11, 71 Octet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Gibbs-Duhem (relation de) . . . . . . . . . . . . . . . 101 Onsager, Lars . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Grandes déviations . . . . . . . . . . . . . . . . . . . . . . . . 33 Opalescence critique . . . . . . . . . . . . . . . . . . . . . . . . 7
Gumbel (loi de) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Opérateur densité . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Orho-hydrogène . . . . . . . . . . . . . . . . . . . . . . . . . . 113
H
Heisenberg (modèle de) . . . . . . . . . . . . . . . . . . . 151 P
Herapath, John . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Para-hydrogène . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
hétéronucléaires (molécules) . . . . . . . . . . . . . . 113 Paradoxe de Gibbs . . . . . . . . . . . . . . . . . . . . . 11, 71
homonucléaires (molécules) . . . . . . . . . . . . . . . 113 Paramètre conjugué. . . . . . . . . . . . . . . . . . . . . . . .85
Paramètre d’ordre . . . . . . . . . . . . . . . . . . . 153, 159
I Pauli (blocage de) . . . . . . . . . . . . . . . . . . . . . . . . 188
Indiscernabilité . . . . . . . . . 48, 53, 70, 71, 75, 95 Perrin, Jean . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Intrication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Phase stationnaire (approximation de la). . .32
Irréversibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Phénomènes collectifs . . . . . . . . . . . . . . . . . . . . . . . 2
Ising (modèle d’) . . . . . . . . . . . . . . . . . . . . . 12, 151 Phonons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
J
Planck (loi de) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Joule, James P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Planck, Max . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
K Poincaré (temps de) . . . . . . . . . . . . . . . . . . . . . . . 46
Kelvin (William Thomson). . . . . . . . . . . . . . . . .62 Point critique (Van der Waals) . . . . . . . 146, 148
Kronecker (symbole de) . . . . . . . . . . . . . . . . . . . . 18 Poisson (crochets de) . . . . . . . . . . . . . . . . . . . 40, 44
Pomeranchuk (effet) . . . . . . . . . . . . . . . . . . . . . . 180
L Postulat de symétrisation . . . . . . . . . . . . . . 48, 75
Landau, Lev D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Postulat fondamental . . . . . . . . . . . . . . . . . . . . . . 57

226
INDEX INDEX

Postulat fondamental de la thermodynamique Thermodynamique . . . . . . . . . . . . . . . . . . . . . . . . . . 3


57 1er principe . . . . . . . . . . . . . . . . . . . . . . . . . 4, 11
Potentiel chimique 2ème principe . . . . . . . . . . . . . . . . . . . . . . . 5, 11
canonique . . . . . . . . . . . . . . . . . . . . . . . . . . 85, 87 3ème principe . . . . . . . . . . . . . . . . . 69, 94, 188
microcanonique . . . . . . . . . . . . . . . . . . . . . . . . 66 limite thermodynamique . . . . . . 63, 92, 100
Potentiel chimique (nullité du) . . . . . . . . . . . . 192 postulat fondamental . . . . . . . . . . . . . . . . . . . 4
Pression relation fondamentale . . . . . . . . . . . . . . . . . . . 4
canonique . . . . . . . . . . . . . . . . . . . . . . . . . . 85, 87 Thomson, William (Lord Kelvin) . . . . . . . . . . 62
Casimir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Transition de phase
de radiation . . . . . . . . . . . . . . . . . . . . . . . . . . 132 du 1er ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
microcanonique . . . . . . . . . . . . . . . . . . . . . . . . 65 du 2nd ordre. . . . . . . . . . . . . . . . . . . . . . . . . . . .7
Principe de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . . 55 liquide-gaz . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15, 17 para-ferro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
Travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66, 93
Q Tsallis, Constantino . . . . . . . . . . . . . . . . . . . . . . 102
Quantique (mécanique) . . . . . . . . . . . . . . . . 10, 17
U
R Universalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6, 7
Radiation (pression de) . . . . . . . . . . . . . . . . . . . 132
Réductionnisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 V
Relation de Gibbs-Duhem . . . . . . . . . . . . . . . . 101 Van der Waals . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Relations de Maxwell . . . . . . . . . . . . . . . . . . . . . 101 Variable conjugué . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Rényi (entropie de) . . . . . . . . . . . . . . . . . . . 29, 102 Variable externe . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Réversible (transformation) . . . . . . . . 66, 85, 92 Variable interne. . . . . . . . . . . . . . . . . . . . . . . . . . . .60
Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
S Viriel (développement du) . . . . . . . . . . . . . . . . 145
Sackur-Tetrode (formule de) . . 59, 59, 106, 200 Viriel (developpement du) . . . . . . . . . . . 145, 171
validité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 von Neumann, John . . . . . . . . . . . . . . . . . . . . . . . 29
Section efficace . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Séparable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 W
Sinai (problème de) . . . . . . . . . . . . . . . . . . . . . . . . 41 Weyl (terme de) . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Sphères dures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Z
Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Zone de Brillouin . . . . . . . . . . . . . . . . . . . . . . . . . 135
Stefan-Boltzmann (loi de). . . . . . . . . . . . . . . . .131
Stirling (formule de) . . . . . . . . . . . . . . . . . . . . . . 214
Superfluidité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

T
Température de Fermi . . . . . . . . . . . . . . . . . . . . 183
Température
absolue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
microcanonique . . . . . . . . . . . . . . . . . . . . . . . . 62
Théorème d’équipartition . . . . . . . . . . . . . 95, 106
Théorème de Feynman-Hellmann . . . . . . . . . . 85
Théorème de la limite centrale . . 26, 33, 44, 46
Théorème de Liouville . . . . . . . . . . . . . . 39, 40, 44
Théorème de Mermin-Wagner. . . . . . . . . . . . .135
Théorème de Nernst . . . . . . . . . . . . . . . 69, 94, 188
Théorème H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Théorie ergodique . . . . . . . . . . . . . . . . . . . . . . . . . 47

227

Vous aimerez peut-être aussi