Vous êtes sur la page 1sur 382

Chapitre 1

Électricité dans les réseaux linéaires

1.1 Réseaux linéaires

1.1.1 Introduction
2 L’électrocinétique : il s’agit de l’étude du transport d’information (faible puis-
sance) ou du transport de puissance dans des réseaux électriques. On parle éventuel-
lement d’électronique pour le transport d’information ; ce terme prend son origine
dans l’emploi, aujourd’hui en général dépassé, de tubes à vide (à déplacement d’élec-
trons) pour la réalisation des appareils de génération, codage, transport réception
ou décodage des informations. Ces tubes (électronique à lampes) ont en général été
remplacés par de l’électronique à semi-conducteurs, sauf pour certaines applications
spécifiques (amplificateurs acoustiques de puissance, de haut de gamme).
2 Cadre de l’étude : l’étude de l’électrocinétique (passage du courant électrique dans
les réseaux de dipôles) se fait dans le cadre de l’Approximation des régimes quasi-
permanents ou A.R.Q.P. Nous développerons ultérieurement (dans le cours d’élec-
tromagnétisme) les conditions et les conséquences de cette approximation ; pour le
moment, nous nous contenterons d’affirmer ce qui suit :
L’approximation des régimes quasi-permanents consiste à limiter l’étude des réseaux
électrocinétiques à des dimensions maximales ℓmax et à des durées minimales τmin
vérifiant la condition (1.1) :

ℓmax
≪ c0 c0 = 2, 99792458 × 108 m · s−1 (1.1)
τmin

Dans ce cadre, on peut négliger tout phénomène de propagation dans le réseau élec-
trocinétique ; en particulier, la modification d’une grandeur électrique en un point du
circuit a pour conséquence des modifications instantanées des grandeurs analogues
caractérisant les autres points du réseau.
2 Exemples : pour un circuit de dimension ℓmax = 3 m, on trouve τmin ≫ 10−8 s ;
on pourra donc se placer dans le cadre de l’A.R.Q.P. pour l’étude d’un signal de
fréquence fmax ≪ 108 Hz = 100 MHz, ce qui correspond à tout ce qu’on appelle élec-
tronique basse fréquence. Par contre, l’électronique de haute fréquence peut imposer
la miniaturisation des circuits, sous peine de sortir du domaine de l’A.R.Q.P. ; ainsi
à la fréquence de réception des signaux de téléphonie cellulaire (f = 1 800 MHz donc
τmin = 5, 6 × 10−10 s), l’A.R.Q.P. impose ℓmax ≪ 17 cm, ce qui est nettement plus
restrictif.
4 Physique, MP, MP*

Prenons encore l’exemple du courant industriel, à la fréquence f = 50 Hz, donc avec


τmin = 20 ms ; la condition d’A.R.Q.P. impose donc ℓmax ≪ 6 000 km : cette condi-
tion est aisément remplie pour un réseau domestique ou une installation industrielle.
Par contre, dans un réseau d’alimentation de puissance à l’échelle continentale, il est
indispensable de prendre en compte les effets de propagation.
2 Signaux, tensions, courants : lorsque la forme d’une grandeur électrique importe,
car elle transporte de l’information, elle portera le nom de signal. Un signal électrique
peut être transporté par un courant électrique i ou par une tension électrique (ou
différence de potentiel u.
Lorsqu’un signal électrique transporte ainsi une information, elle peut être de nature
analogique (l’information est contenue dans la forme du signal) ou numérique (l’in-
formation est codée et une déformation limitée du signal n’altère pas son contenu).
Dans certains cas, les grandeurs électriques ne transportent aucune information, mais
seulement de la puissance : on parle de courants d’alimentation. C’est le cas du courant
industriel, oscillant de manière sinusoı̈dale à la fréquence de 50 Hz (60 Hz aux États-
Unis et au Japon).
2 Mesures : l’appareil essentiel des mesures électriques et électroniques réalise des
mesures de tension. Nous utiliserons deux types d’appareil :
– les voltmètres, susceptibles de faire des mesures instantanées – mode DC – ou des
mesures de tensions efficaces vraies en courant alternatif (quelle que soit sa forme,
voir plus loin) – mode AC ou RMS – ; ils sont caractérisés par :
– une précision (écart maximal entre la valeur lue et la valeur vraie), qui est en
général la somme d’une précision relative et d’une valeur intrinsèque, par exemple
0, 025 % + 2 chiffres ;
– une résolution (écart minimal entre deux valeurs distinguées par l’appareil), qui
est donnée par le nombre de chiffres (ou digits) affichés (5 ou 6 chiffres par
exemple pour une gamme complète) ;
– un appel de courant qui doit être aussi faible que possible pour que l’appareil
ne perturbe pas les circuits étudiés ; on utilise en général un modèle de Norton,
avec une résistance d’entrée, de l’ordre de 10 MΩ en parallèle avec un courant
d’erreur de l’ordre de 30 pA ;
– enfin, par les diverses limites d’utilisation : choix de gammes, bande passante en
fréquence pour les mesures en alternatif, etc.
– les oscilloscopes, susceptibles de faire des mesures instantanées d’un signal quel-
conque – mode DC – ou de sa seule partie variable, déduction faite de la moyenne
– mode AC – ; ils sont caractérisés par :
– une précision qui est en général donnée en valeur relative, 1 % à 5 % par exemple
selon les gammes ;
– une résolution qui ne dépend que du nombre de points à l’affichage ;
– un appel de courant faible, avec en général un modèle formé d’une résistance
d’entrée, de l’ordre de 1 MΩ en parallèle avec une capacité d’entrée de l’ordre de
25 pF ;
– enfin, par sa sensibilité (en mV par division), ses fréquences de balayage, etc.
On utilise aussi parfois d’autres appareils : ampèremètres, ohmmètres, capacimètres,
wattmètres ; tous exigent de débrancher un circuit pour être utilisés, ce qui explique
leurs usage moindre. On leur préfère des mesures indirectes.

1.1.2 Lois de Kirchhoff


2 Réseau électrocinétique : on appelle ainsi un ensemble de N points, ou nœuds du
réseau, numérotés A0 , . . . , AN −1 ; chaque point Ak est caractérisé par un potentiel Vk .
1 : Électricité dans les réseaux linéaires 5

Rappelons ici que, ces potentiels étant définis à une constante additive près, on ne
définit ici que N − 1 inconnues indépendantes ; on peut préciser cette indétermination
en choisissant pour nœud A0 la masse conventionnelle du réseau, assurant ainsi V0 = 0.
L’étude d’un tel réseau électrocinétique se ramène alors à la détermination des N − 1
tensions (relatives à la masse) V1 , . . . , VN −1 .
Deux nœuds Ak et Ap d’un même réseau sont (éventuellement) reliés par une branche ;
celle-ci est parcourue par un courant ipk , algébrisé du nœud p vers le nœud k. Notons
que, s’il n’existe pas de branche reliant Ap et Ak , on notera ipk = 0. Enfin, par
convention, on notera ikk = 0 pour tout k.
2 Loi des nœuds : l’A.R.Q.P. impose l’absence d’accumulation de charge électrique
en tout point du réseau ; la somme
X des courants parvenant en un nœud est nulle à
chaque instant. On notera donc ipk = 0 pour tout k la loi des nœuds écrite au
p
nœud Ak .
Contrairement aux apparences, ceci ne fournit pas N mais bien N −X 1 relations
X in-
dépendantes ; en effet, la somme de toutes les lois des nœuds s’écrit ipk = 0
k p
où
Xla Xsomme contient pour chaque couple (p, k) le terme ikp + ipk qui est nul, donc
ipk = 0 et ces relations ne sont pas indépendantes.
k p

2 Loi des mailles : puisqu’on a fait X


l’hypothèse de l’existence d’un potentiel Vp pour
tout nœud Ap du réseau, la somme (Vp − Vk ) le long d’un contour fermé fournit
X
automatiquement zéro, ce qu’on peut écrire upk = 0 avec upk = Vp − Vk : cette
maille
loi, même si elle est souvent commode pour l’analyse effective d’un circuit, ne fournit
pas d’équation particulière pour la résolution d’un problème électrocinétique.

1.1.3 Dipôles linéaires


2 Dipôles électrocinétiques : un dipôle électrocinétique est un dispositif relié au
reste du réseau par deux bornes, dites borne d’entrée E et borne de sortie S. Par
convention (cf. figure 1.1), le courant traversant i un tel dipôle est dont mesuré dans
le sens E → S.

i ur
Eb Sb

ug

Figure 1.1 – Dipôle électrocinétique

Ce dipôle est alors caractérisé par la tension à ses bornes ; cette tension peut être
définie selon deux conventions (voir la figure 1.1) : la convention générateur (tension
ug ) et la convention récepteur (tension ur ). On parle aussi respectivement de remontée
de tension ug ou de chute de tension ur .
Après le choix d’une orientation (entrée et sortie) et d’une convention (générateur ou
récepteur), le comportement d’un dipôle électrocinétique est connu si on sait relier i
et u :
– soit par la donnée d’une caractéristique courant-tension, relation donnée sous la
forme d’une courbe i = i(u), si elle existe ;
6 Physique, MP, MP*

– soit, si le courant ne dépend pas seulement de u, par la donnée d’une méthode de


détermination de i à partir de u. On rencontre cette situation dans deux cas :
– les systèmes présentant un hystérésis : l’état électrique du système dépend de son
état antérieur ;
– les systèmes présentant un comportement fréquentiel, comme les condensateurs
dur diL
ou les bobines d’induction avec respectivement iC = C ou ur = L , mais
dt dt
aussi par exemple les systèmes filtrés, etc.
2 Dipôles linéaires : on appelle ainsi un dipôle qui présente, au moins dans un certain
domaine de fonctionnement, une caractéristique affine.
Utilisant la convention des générateurs, on choisit en général de noter cette relation
linéaire sous l’une des formes équivalentes :

1
i = η − gug ug = e − ri avec g= e = rη (1.2)
r

Dans ce modèle (on parle de modèle de Thévenin dans le premier cas, de modèle de
Norton dans le second), η porte le nom de courant de court-circuit, e celui de force
électro-motrice ; g et r sont respectivement la conductance et la résistance internes
du dipôle.
i = η − gug

η ug = e − ri
η
b b e
i r
b b b b b
b b
g gug
e ri
ug

Figure 1.2 – Modèles de Thévenin et de Norton

On utilise dans ce cas les schémas de Thévenin et de Norton présentés sur la figure 1.2.
Lorsque de plus g → 0, il n’existe pas de modèle de Thévenin et on parle de générateur
idéal de Norton ou générateur idéal de courant ; si au contraire r → 0, il n’existe pas de
modèle de Norton et on parle de générateur idéal de Thévenin ou générateur idéal de
tension. Les générateurs idéaux ne sont que des modèles limites, utilisés pour simplifier
des exercices ; nous ne les considérerons pas dans les développements théoriques qui
suivent.
2 Générateurs commandés : on dit que le générateur de Norton idéal défini par η
(ou le générateur de Thévenin défini par e) est un générateur libre si la grandeur η
(ou bien e) est une constante indépendante de l’état électrique du reste du réseau.
Si au contraire cette grandeur dépend de l’état électrique du réseau, on parle de
générateur lié ou générateur commandé. Nous ne considérerons dans la suite que le
cas des générateurs liés de manière linéaire, pour lesquels on écrira par exemple le
courant de court-circuit
X η sous forme d’une combinaison linéaire des potentiels dans
le réseau, η = γj Vj .
j
1 : Électricité dans les réseaux linéaires 7

1.1.4 Quadrupôles linéaires


2 Quadrupôles : on appelle ainsi un dispositif électrocinétique relié au reste du
réseau par deux bornes d’entrée (tension ue , courant ±ie ) et par deux bornes de
sortie (tension us , courant ±is ), conformément au schéma général de la figure 1.3.
ie is
b b

e
ôl
up
ue us

dr
ua
Q
b b

ie is
Figure 1.3 – Courants et tensions d’entrée et de sortie d’un quadrupôle

Il ne s’agit donc pas de n’importe quel dispositif à quatre bornes ! Comme un dipôle,
un quadrupôle est orienté, avec une entrée et une sortie ; par contre, nous choisi-
rons systématiquement la convention de la figure 1.3, qu’on pourrait qualifier de
convention récepteur en entrée et générateur en sortie, ce qui est bien sûr adapté à
un appareil électronique destiné à faire partie d’une chaı̂ne d’appareils successifs.

2 Quadrupôles linéaires : un quadrupôle est linéaire s’il existe une relation linéaire
entre les quatre grandeurs ue , us , ue et is , permettant d’exprimer deux d’entre elles
en fonction des deux autres sous forme matricielle. La relation en question étant en
général inversible, le choix des grandeurs exprimées est a priori arbitraire ; on choisira
donc une des quatre matrices de l’équation (1.3) :

       
ue ie ie ue
= [Z] = [Y ]
us |{z} is is |{z} us
matrice impédance matrice admittance

        (1.3)
us ue us ue
= [T ] = [H]
is |{z} ie ie |{z} is
matrice transfert matrice hybride

2 Modèle équivalent : c’est le modèle de la matrice hybride qui est le plus utilisé en
électronique ; on note alors ses composantes sous la forme (1.4) :
     
us H −Zs ue us = Hue − Zs is
= (1.4)
ie Ye k is ie = Ye ue + kis

En effet, une telle écriture permet de représenter le quadrupôle comme une association
de dipôles, comportant deux termes  passifs et deux générateurs commandés, selon la
us
figure 1.4. La grandeur H = porte le nom de gain en tension en boucle ou-
u
 e is =0
us
verte ; la grandeur Zs = − porte le nom d’impédance de sortie du montage.
is ue =0
8 Physique, MP, MP*

ie b b b is

b
b
Zs
ue Ye kis Hue us

b b

b
b
Figure 1.4 – Montage équivalent à un quadrupôle linéaire

De nombreux montages électroniques ne génèrent une tension que s’ils sont eux-mêmes
alimentés, ce qui signifie que ue = 0 impose us = 0 ; on a alors Zs = 0, ce qui permet
aussi d’écrire simplement us = Hue ; dans un tel cas, H s’identifie à la fonction de
transfert déterminée en première année.

Il est souvent inutile de calculer l’impédance de sortie ; le seul fait qu’un calcul
général de tension à la borne de sortie mène à us = Hue , sans avoir fait d’hypothèse
particulière sur la valeur de is , montre automatiquement que Zs = 0.
 
ie
La grandeur Ye = porte le nom d’admittance d’entrée ; enfin, la grandeur
is =0 ue
 
ie
k=− porte le nom de coefficient de retour ; ce terme est nul dans tous les
us ue =0
montages unidirectionnels. Dans un tel cas, on écrit encore ue = Ze ie où Ze = 1/Ye
porte le nom d’impédance d’entrée.

1.1.5 Théorèmes généraux des réseaux linéaires

X en série et en parallèle : l’association en série (même courant i, tension


2 Associations
totale u = ul ) de plusieurs dipôles linéaires, modélisés selon le schéma de Thévenin,
l X P
est un dipôle linéaire de caractéristiques e = el , r = l rl . Pour cette raison, le
l
modèle de Thévenin est aussi appelé modèle série (voir la figure 1.5).

e1 e2 e3
R1 R2 33
b b b b b b b

Figure 1.5 – Associations de générateurs en série

b
b

η1 η2 η3 η4
g1 g2 g3 g4
b

Figure 1.6 – Associations de générateurs en parallèle


1 : Électricité dans les réseaux linéaires 9

X
De même, l’association en parallèle (même tension u, courant total i = il ) de
l
plusieurs dipôles linéaires,
XmodélisésPselon le schéma de Norton, est un dipôle linéaire
de caractéristiques η = ηl , g = l gl . Pour cette raison, le modèle de Norton est
l
aussi appelé modèle parallèle (voir la figure 1.6).
2 Diviseurs de tension et de courant : considérons une association en série de dipôles
linéaires passifs (ek = 0), selon la figure 1.7 : on parle alors de diviseur de tension :

rk X
uk = u r= rk (1.5)
r
k

i=0
r1 r2 ... rN
b b b b b

u1 u2 ... uN
u

Figure 1.7 – Diviseur de tension

On remarque sur la figure 1.7 qu’une association se comporte comme un diviseur de


tension alors même qu’un n’œud peut y être intercalé, sous réserve que celui-ci prélève
un courant négligeable (noté i = 0 sur le schéma).
Considérons de même une association en parallèle de dipôles linéaires passifs, selon la
figure 1.8 : on parle alors de diviseur de courant :

gk X
ik = i g= gk (1.6)
g
k

i1
b b
g1
i2
i b b
b g2 ... b
b b
...
iN
b b b
gN ǫ=0

Figure 1.8 – Diviseur de courant

On remarque sur la figure 1.6 qu’une association se comporte comme un diviseur de


courant alors même qu’une dipôle, assurant une tension négligeable (notée ǫ = 0 sur
le schéma) peut y être inséré.
2 Théorème de Millman : considérons maintenant une association en parallèle de
générateurs modélisés en série, reliant un nœud et la masse, comme sur la figure
10 Physique, MP, MP*

1.9 à gauche ; l’ensemble est encore équivalent à un générateur linéaire, qu’on peut
X ek X 1
modéliser par ses caractéristiques de Norton η = et g = , ce qui permet
rk rk
k k
X ek X 1
de relier la tension u0 et le courant i0 sous la forme i0 = − u0 , soit
rk rk
k k
encore :
P
gk ek − i0
u0 = k P (1.7)
k gk

i0 i0
b

b
...

...
rN

rN
r1

r1
u0 u0
b

b
...

eN
e1

e1 ... eN

b b b b b b
b

Figure 1.9 – Théorème de Millman

Dans le cas du circuit de la figure 1.9 à droite, le lien entre u0 et i0 reste évidemment
le même ; il constitue alors le Théorème de Millman. Dans le cas particulier où i0 = 0,
on remarque que ce théorème peut se relire ainsi : la tension u0 est le barycentre des
tensions ek , affectés des poids gk .
2 Théorème de Helmholtz : considérons enfin un réseau linéaire quelconque, formé
de N nœuds dont on cherche à déterminer les potentiels V1 , V2 , . . . , VN −1 (avec par
choix de masse V0 = 0). Ce réseau est entièrement constitué de branches linéaires
(dipôles, quadrupôles) que nous décrirons tous dans le modèle de Norton, en écrivant
donc ikp = ηkp − gkp (Vp − Vk ) le courant circulant du nœud Ak vers le nœud Ap .
Dans le cas où la branche Ap Ak est passive, on posera ηkp = 0 ; si elle est absente, on
posera ηkp = 0 et gkp = 0.
Enfin, si le générateur ηkp n’est pas X
un générateur libre, on développera son courant
de court-circuit sous la forme ηkp = αjkp Vj . Finalement, on peut dans tous les cas
j
X
écrire la loi des nœuds ikp = 0 sous la forme matricielle :
p

[G] [V ] = [J] (1.8)

où [V ] est la matrice colonne des N − 1 potentiels indépendants, [G] est une matrice
carrée de dimension N −1 qui ne dépend que des conductances et, éventuellement, des
caractéristiques αjkp des générateurs liés, et [J] est une matrice colonne de dimension
N − 1 qui ne dépend que des générateurs libres.
1 : Électricité dans les réseaux linéaires 11

Dans le cas (dont nous admettrons qu’il est général, sauf pour des réseaux mal confor-
−1
més) où la matrice [G] est inversible, on peut donc écrire [V ] = [G] [J], qui constitue
le théorème de Helmholtz‡ ou théorème de superposition :

Théorème de Helmholtz
X Le potentiel Vk en un nœud quelconque
X Ak d’un réseau linéaire est une
combinaison linéaire Vk = δki ηi des caractéristiques ηi (ou ei )
générateurs i
des générateurs linéaires du réseau. Les coefficients δki de la combinaison
linéaire ne dépendent que des éléments passifs du réseau (conductances,
résistances) ou des caractéristiques des générateurs liés.

On peut bien sûr utiliser une forme pratique du théorème de superposition : en pré-
sence de plusieurs générateurs, on calcule chaque potentiel en présence d’un seul
générateur libre, puis on somme les résultats obtenus.

On prendra garde, dans une telle application du théorème de Helmholtz, à ne pas


modifier les coefficients de la combinaison linéaire, c’est-à-dire à ne pas modifier la
répartition des éléments passifs pas plus qu’on ne modifiera les générateurs liés.

2 Théorème de Thévenin-Norton : considérons (cf. figure 1.10 à gauche) un réseau


entièrement formé de dipôles linéaires, débitant un courant i dans une certaine branche
A0 A1 , sous la tension u = V1 puisque on a choisi V0 = 0 en A0 .

i
bA A1
1
b
ire

ire
éa

éa
lin

lin

D u i u
u

u
ea

ea
és

és
R

bA bA
0 0
b

Figure 1.10 – Théorème de Thévenin-Norton

Quel que soit le dipôle D dans lequel ce réseau débite, la répartition des courants et
des tensions ne sera pas modifiée si on remplace D par un générateur idéal de courant
i (cf. figure 1.10 à droite) ; dans le réseau entièrement linéaire ainsi formé, on peut
−1
écrire la première ligne de la relation [V ] = [G] [I] sous la forme V1 = u = e − ri, où
−1
−r est le terme de ligne 1, colonne 1 de la matrice [G] , tandis que e est une certaine
combinaison linéaire des courants de court-circuit des générateurs libres intérieurs au
réseau linéaire.
On peut déterminer e comme la valeur particulière prise par la tension u lorsque i = 0,
tous les autres générateurs étant inchangés.
On peut déterminer r comme la valeur particulière prise par le rapport −u/i lorsque
e = 0, c’est-à-dire lorsqu’on éteint tous les générateurs libres du réseau linéaire.
On reconnaı̂t là le théorème de Thévenin :
12 Physique, MP, MP*

Théorème de Thévenin
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Thévenin de caractéristiques (e, r) :
• r est la résistance équivalente au réseau passivé, c’est-à-dire dans lequel
on a éteint tous les générateurs libres ;
• e est la tension à vide (en remplaçant D par un circuit ouvert) aux
bornes du réseau linéaire.

On peut bien sûr en donner la forme équivalente :

Théorème de Norton
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Norton de caractéristiques (η, g) :
• g est la conductance équivalente au réseau passivé, c’est-à-dire dans
lequel on a éteint tous les générateurs libres ;
• η est le courant de court-circuit (en remplaçant D par un fil) aux bornes
du réseau linéaire.

Dans les deux cas, on n’oubliera pas que passiver le réseau, c’est annuler les carac-
téristiques e ou η des générateurs libres, tandis qu’on ne modifie pas les générateurs
liés du réseau linéaire.

1.2 Régimes transitoires

1.2.1 Régimes d’évolution


2 Réseau linéaire en régime transitoire : on appelle ainsi un réseau électrique dans
lequel chaque grandeur électrique x(t) (tension, courant) est solution d’une équations
p
X dk x
différentielle linéaire d’ordre p > 0, que nous écrirons ak k = f (t), avec ap 6= 0.
dt
k=0
On rencontre une telle situation en présence de bobines d’induction ou de conden-
sateurs, mais aussi de composants actifs vérifiant eux-même une équation différen-
tielle ; c’est notamment le cas des amplificateurs opérationnels (cf. figure 1.11) ; on
sait en effet que ceux-ci vérifient, dans le domaine linéaire (|vs | < Vsat ), la relation
dvs
vs (t) + τ = µ0 ε(t), avec µ0 ∼ 105 et τ ∼ 10 ms.
dt

b
+
ε(t) b
b - vs (t)
b

Figure 1.11 – Amplificateur opérationnel de différence

p
dk x X
2 Régime libre, régime forcé : la solution générale de l’équation = f (t) ak
dtk
k=0
est la somme d’une solution particulière, dépendant de la forme de la fonction f (t),
1 : Électricité dans les réseaux linéaires 13

p
X
et de la solution générale λi exp (ri t) de l’équation sans second membre, où les ri
i=0
p
X
sont les racines complexes de l’équation caractéristique ak rk = 0.
k=0
La solution générale de l’équation sans second membre, qui ne dépend pas de f (t),
porte le nom de régime libre ; on parle de régime forcé pour une solution particulière
de l’équation complète qui a la même forme que la fonction f (t).
2 Systèmes stables : on dit qu’un réseau électrique en régime variable est stable
si les parties réelles Re(ri ) de toutes les racines ri de l’équation caractéristique sont
négatives. Ainsi, chacune des exponentielles exp (ri t) qui intervient dans le régime
libre vérifie |exp (ri t)| → 0 quand t → ∞.
La solution de régime libre est alors bornée et tend vers zéro au bout d’une certaine
1
durée ; on dit aussi que le régime libre est transitoire. Notons alors ri = − ± jωi
τi
(j 2 = −1) une  de cesracines de l’équation caractéristique ; on peut encore écrire
t
|exp (ri t)| = exp − et la grandeur τi est une des constantes de temps du régime
τi
transitoire.
dx
Si l’équation différentielle est d’ordre 1, l’équation de régime libre a + bx = 0 a
dt
pour seule racine de l’équation caractéristique r = −b/a qui est réelle ; il faut donc
que a et b soient de même signe. Dans ce cas, la constante de temps est τ = a/b et
dx 1
l’équation différentielle s’écrit encore + x = 0.
dt τ
Formes canoniques des systèmes du premier ordre
X Dans le cas d’une équation du premier ordre, on utilisera la notation
dx 1
+ x(t) = f (t) ; τ > 0 est la constante de temps du régime transitoire.
dt τ

d2 x dx
Si l’équation différentielle est d’ordre 2, l’équation a 2
+b + cx = 0 admet des
dt dt
solutions réelles ou complexes (conjuguées).
– Dans le premier cas, elles sont toutes deux négatives si leur produit c/a est positif
et leur somme −b/a négative, ce qui revient à affirmer que les trois coefficients a, b
et c ont même signe.
– Dans le second cas, la partie réelle commune des solutions est −b/2a qui doit être
négatif (donc a et b sont encore de même signe) tandis que b2 − 4ac < 0 impose
ac > 0 et a et c sont encore de même signe.
On ramène alors l’équation à une forme canonique en divisant par a avant de noter
c/a = ω02 , b/a = 2ξω0 et Q = 1/2ξ.

Formes canoniques des systèmes du second ordre


X Dans le cas d’une équation du second ordre, on utilisera la notation
d2 x dx
+ 2ξω0 + ω02 x(t) = f (t) ; ω0 > 0 est la pulsation caractéristique
dt2 dt
du régime libre, ξ le coefficient d’amortissement et Q = 1/2ξ le facteur
de qualité.

Il est important de noter que la condition de stabilité ci-dessus (a, b et c de même


signe) n’a pas de rapport avec le signe du discriminant de l’équation caractéristique.
14 Physique, MP, MP*

Stabilité des systèmes du premier et du second ordre


X Un système différentiel du premier ou du second ordre correspond à un
régime libre stable si tous les coefficients de l’équation différentielle sont
du même signe.

2 Nature des régimes du second ordre : le discriminantréduit de l’équation carac-


téristique d’un régime du second ordre étant δ = ξ 2 − 1 ω02 , on peut observer trois
types de régimes transitoires du second ordre :
– si ξ < 1, l’amortissement est faible et le régime
 est pseudo-périodique amorti ; on
t
écrira le régime transitoire x(t) = x0 exp − cos (ωt + ϕ) avec pour constante
τ
1 2Q p
de temps τ = = et pour pseudo-pulsation ω = ω0 1 − ξ 2 . La forme
ξω0 ω0
correspondante figure sur la figure 1.12.
x
A
b
B
b

Figure 1.12 – Régime transitoire pseudo-périodique


 
t
Les points de contact successifs de la courbe x(t) avec ses enveloppes ± exp −
τ

se situent à des intervalles de temps égaux à la pseudo-période T = ; le rapport
ω
de l’amplitude de deux tels points de contact successifs (comme A et B ci-dessus)
xA πω0
vérifie ln = δ = ; δ est le décrément logarithmique et, pour un système
xB Qω
π
faible amorti, ξ ≪ 1 donc ω ≃ ω0 et δ ≃ .
Q  
t
– si ξ = 1, le régime est dit critique et x(t) = (x0 + v0 t) exp − avec pour
τ
1
constante de temps τ = . Pour des conditions initiales données, c’est en gé-
ω0
néral le régime qui assure le rapide le plus retour à l’équilibre et pour cette raison
de nombreux appareils de mesure sont réglés pour fonctionner dans ces conditions.
L’allure de la réponse x(t) d’un réseau en régime critique est très peu différente de
celle du régime apériodique, présenté ci-dessous.
– si ξ > 1, l’amortissement est fort et le régime
 est  avec
 apériodique,  pour forme géné-
t t
rale du régime transitoire x(t) = x1 exp − + x2 exp − et pour constantes
τ1 τ2
2 1
de temps τ1/2 = p . La forme correspondante figure sur la figure 1.13,
ω0 ξ ± ξ 2 − 1
où on a fait apparaı̂tre les deux termes de constantes de temps τ1 et τ2 > τ1 .
1 : Électricité dans les réseaux linéaires 15

x
exp
(−t

2)

1)

−t
p(
ex

Figure 1.13 – Régime transitoire apériodique

1.2.2 Conditions initiales


2 Principe de l’étude : nous considérerons dans cette partie un réseau stable du
d2 x dx
second ordre régi par l’équation différentielle 2
+ 2ξω0 + ω02 x(t) = f (t), où
dt dt
le terme de second membre f (t) dépend de la tension, ou du courant, imposés par
l’opérateur à partir de t = 0+ .
À t = 0, on impose une perturbation au système en choisissant la forme de f (t). On
+ dx
cherche alors à relier x(t = 0 ) et aux valeurs analogues, supposées connues,
dt 0+
pour t = 0− , afin d’en déduire les deux constantes d’intégration qui apparaissent dans
l’expression du régime transitoire.
dx dx
On notera alors ∆x0 = x(t = 0+ ) − x(t = 0− ) et ∆ẋ0 = − les dis-
dt 0+ dt 0−
continuités de x et de sa dérivée au moment de l’établissement du régime transi-
toire en t = 0 ; on cherche à les déterminer en fonction de la grandeur analogue
∆f = f (t = 0+ ) − f (t = 0− ).
2 Discontinuités à t = 0 : pour déterminer celles-ci, considérons l’équation dif-
férentielle et réalisons-en d’abord l’intégration (après multiplication par dt) entre
Z +ε 2
d x
t = −ε et t = +ε ; on obtient donc, en faisant tendre ε → 0, 2
dt = ∆ẋ0
−ε dt
Z +ε Z +ε
dx
et dt = ∆x0 . D’autre part, x(t)dt → 0 si ε → 0 ; pour montrer cette
−ε dt −ε
propriété, il suffit de supposer qu’on cherche une solution x(t) bornée.
Z +ε
On obtient donc la première relation ∆ẋ0 + 2ξω0 ∆x0 = f (t)dt.
−ε
Une intégration de la primitive de l’équation différentielle, réalisée de même entre −ε
et +ε, montre de la même façon que ∆x0 = ∆F , où F est une primitive de f , avec
dF
donc = f (t).
dt
Finalement, la détermination de ∆x0 et ∆ẋ0 revient seulement à préciser la forme
du terme de second membre de l’équation différentielle, au voisinage de t = 0. Nous
rencontrerons essentiellement deux formes : l’échelon de Heaviside‡ y(t) = y0 H(t)
et l’impulsion de Dirac‡ y(t) = y0 δ(t).
2 Échelon et Impulsion : on appelle échelon de Heaviside la fonction définie par
H(t) = 0 pour t < 0 et H(t) = 1 pour t > 0 (cf. figure 1.14 à gauche). On peut
d’ailleurs la considérer comme la limite de la suite de fonctions H∆t continues, affines
par morceaux, représentées en pointillés sur la figure. Notons que H∆t (t) est constante
16 Physique, MP, MP*

(nulle ou égale à 1) si |t| > ∆t/2, et qu’elle a une pente constante 1/∆t dans l’intervalle
[−∆t/2 , ∆t/2].
H δ
1 1/∆t

∆t
∆t
t t
0 0

Figure 1.14 – Distributions de Heaviside et de Dirac

Ainsi définie, la suite des fonctions H∆t est dérivable, et leurs dérivées δ∆t sont
représentées en pointillés sur la figure 1.14, à droite. Il s’agit de fonctions nulles
sauf sur l’intervalle [−∆t/2 , ∆t/2], intervalle où elles prennent une valeur telle que
Z A
δ∆t (t)dt = H(A) − H(−A) = 1 pour A > ∆t/2.
−A
Nous admettrons qu’il existe un cadre mathématique, la théorie des distributions de
Schwartz‡ , dans lequel la fonction (( limite )) H de Heaviside est dérivable, sa dérivée
portant le nom d’impulsion de Dirac ou distribution de Dirac.
Distributions de Heaviside et de Dirac
dH
X On note ainsi les distributions H et δ, reliées par
dt
= δ, qui vérifient :
• H(t) = 1 pour t > 0 et H(t) = 0 pour t < 0 ;
• δ(t) = 0 pour t 6= 0 ;
Z ∞
• δ(t)dt = 1.
−∞
H modélise les tensions et courants en échelon à l’instant t = 0 ; δ
modélise les tensions et courants en impulsion au même instant.
Bien sûr, aucun générateur réel ne délivre de tensions représentées exactement pas des
grandeurs proportionnelles à H(t) ou à δ(t) ; il ne s’agit que de modèles limites, que
nous utiliserons cependant couramment, en électrocinétique comme dans d’autres do-
maines de la Physique, pour décrire des grandeurs physiques présentant des variations
rapides.

On prendra garde aux unités : si H est une grandeur sans dimension, la distribution
de Dirac δ se mesure comme l’inverse d’un temps.

2 Applications : considérons d’abord le réseau de la figure 1.15 ; D est un dipôle


quelconque, mais la tension uD (t) à ses bornes est une fonction du temps supposée
bornée, tout comme la tension uC d’ailleurs. Puisque le courant dans le réseau vérifie
duC duC
i = C , la tension aux bornes de C vérifie aussi uC + τ + uD = e(t) avec
dt dt Z + 0
τ = RC donc, par intégration entre t = 0− et t = 0+ , on obtient τ ∆uC = e(t)dt.
0−
Z 0+
L’intégrale e(t)dt est nulle sauf si la tension e(t) est proportionnelle une impul-
0−
Z 0+
sion de Dirac ; en effet, dans ce cas, e(t) = Kδ(t) impose e(t)dt = K. Sinon, on
0−
1 : Électricité dans les réseaux linéaires 17

C
b b b

b
R
uC
e(t) D uD

b
Figure 1.15 – Réseau R, C série

constate que la variation ∆uC = uC (0+ ) − uC (0− ) est nulle sauf si τ → 0, ce qu’on
obtient par exemple lorsque R → 0. Finalement, on retiendra le résultat général :

Continuité de la tension uC
X La tension uC aux bornes d’un condensateur est en général une fonction
continue du temps, même lorsque le réseau qui comporte ce condensateur
subit des variations brutales d’alimentation, sous réserve que :
• le condensateur doit être connecté par l’intermédiaire d’au moins une
résistance en série ;
• la tension d’alimentation ne doit pas comporter d’impulsion de Dirac.

Considérons alors le réseau de la figure 1.16 ; ce réseau est en quelque sorte l’(( image ))
de celui de l’étude précédente, en remplaçant les modèles série par des modèles paral-
lèle, et D est un dipôle dont le courant iD (t) est supposé borné.
b

iR iL iD
η(t) R L D

b
b

Figure 1.16 – Réseau R, L parallèle

diL
Puisque la tension aux bornes de l’inductance pure L vérifie uL = L , et du fait
dt
diL
de la loi des mailles RiR = uL , on peut écrire la loi des nœuds η(t) = iL + τ + iD
dt
L
où on a posé pour constante de temps τ = .
R
Z 0+
− +
Par intégration entre t = 0 et t = 0 , on obtient τ ∆iL = η(t)dt. Cette inté-
0−
grale est nulle sauf si la tension e(t) est proportionnelle une impulsion de Dirac ; on
en déduit un résultat général, moins utile que celui qui concerne les condensateurs
ci-dessus : le courant iL dans une bobine est en général une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine subit des variations bru-
tales d’alimentation. Ce résultat ne s’applique pas à une bobine idéale si la courant
d’alimentation comporte une impulsion de Dirac.
18 Physique, MP, MP*

Ce résultat est plus utile si on considère le montage de Norton formé de η(t) et R


en parallèle par l’association d’un générateur de Thévenin de tension e(t) = Rη(t) et
de la résistance R, en série avec L. L’ensemble formé de R et L modélise alors une
bobine réelle, dont la résistance interne R ne peut en pratique jamais être négligée.
Nous retiendrons donc ce résultat pratique important :

Continuité du courant iL
X Le courant iL dans une bobine est toujours une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine condensa-
teur subit des variations brutales d’alimentation, car la résistance interne
d’une bobine ne peut jamais être négligée.
Ce résultat s’applique sauf si le courant d’alimentation comporte une
impulsion de Dirac.

1.3 Régime harmonique forcé des réseaux linéaires

1.3.1 Principes d’étude


2 Régime transitoire et régime forcé : considérons un réseau de dipôles linéaires (y
compris les dipôles C et L) alimenté par un générateur libre imposant une tension ou
un courant sinusoı̈dal de pulsation ω. Toute grandeur électrique dans le réseau est
X dk x
alors régie par l’équation différentielle ah k = f (t), où f (t) = f0 cos (ωt + ϕ0 ).
dt
k
La solution générale de ce type d’équation comporte une solution générale de l’équa-
tion homogène associée ; nous supposerons ici le réseau stable et cette solution (régime
libre) est donc un régime transitoire, c’est-à-dire qu’il tend vers zéro au bout d’un cer-
tain temps, qui sera en pratique de l’ordre de quelques τ , si τ est la plus longue des
constantes de temps du circuit. On utilise parfois une évaluation à 3τ ou 5τ , tenant
compte du fait que exp (−3) = 5 × 10−2 et exp (−5) = 7 × 10−3 ; tout dépend en
réalité des conditions initiales.
Toutefois, une fois que ce régime transitoire a disparu, il ne reste qu’à déterminer une
solution particulière de l’équation complète. On recherchera cette solution sous forme
sinusoı̈dale, de même pulsation ω que celle à laquelle le réseau est forcé.
2 Impédances : considérons une grandeur sinusoı̈dale, x(t) = x0 cos (ωt + ϕ), solu-
X dk x
tion de l’équation différentielle ah k = f0 cos (ωt + ϕ0 ). La même égalité reste
dt
k  
T  π
vraie un quart de période plus tard, avec cos α + ω = cos α + = − sin α ;
4 2
X dk x′
ainsi, x′ (t) = x0 sin (ωt + ϕ) est solution de l’équation ah k = f ′ (t) avec
dt
k
f ′ (t) = f0 sin (ωt + ϕ0 ).
Combinant x = x(t) + jx′ (t) avec j 2 = −1, on constate la possibilité de remplacer
toute grandeur harmonique par une grandeur complexe :

X(t) = Xmax cos (ωt + ϕ) −→ X(t) = X 0 exp (jωt)


  (1.9)
X 0 = Xmax exp (jϕ) X(t) = Re X(t)
1 : Électricité dans les réseaux linéaires 19

En particulier, tout dipôle linéaire est soumis à une tension définie par u(t), parcouru
dk
par un courant i(t) ; puisque une dérivée relativement au temps k est représen-
dt
tée par (jω)k , toutes les équations différentielles linéaires deviennent des équations
algébriques linéaires, avec :

u=Zi Z = |Z| (1.10)

Dans la relation 1.10, Z porte le nom d’impédance complexe et Z celui d’impédance


réelle du dipôle étudié. On définit aussi les admittances, complexe et réelle, inverses
des impédances :

i=Y u Y = |Y | (1.11)

En particulier, les dipôles R = 1/G, L et C sont caractérisés par les relations :

1
ZR = R Z L = jLω ZC = (1.12)
jCω

2 Généralisation des théorèmes généraux : les règles de calcul dans C pour les impé-
dances complexes Z sont les mêmes que dans R pour les résistances ; tous les théorèmes
généraux établis plus haut :
X association de générateurs ;
X diviseurs de tension et de courant ;
X théorème de Millman ;
X théorème de superposition de Helmholtz ;
X théorème de Thévenin-Norton ;
restent donc valables dans le cadre des régimes harmoniques, à condition de remplacer
les forces électro-motrices e, courants de court circuits η, résistances r et conductances
g par leurs équivalents complexes e, η, Z et Y .

1.3.2 Diagrammes de Bode


2 Définitions : la représentation d’un quadrupôle linéaire en régime permanent est
maintenant donné par le schéma de la figure 1.17.

ie b b
i
b s
b

b
b

Zs
ue Ye kis Hue us

b b
b

b
b

Figure 1.17 – Quadrupôle linéaire en régime harmonique


 
us
Les grandeurs complexes H(ω) = (gain en tension en boucle ouverte, ou
u
 e is =0
us
fonction de transfert), Z s (ω) = − (impédance de sortie, souvent nulle),
is u =0
e
20 Physique, MP, MP*

   
ie i
Y e (ω) = (admittance d’entrée) et k(ω) = − e (coefficient de
ue i =0 us u =0
s e
retour, toujours nul dans les montages unidirectionnels) sont maintenant des fonctions
de la pulsation ω.
On appelle diagrammes de Bode‡ les deux représentations donnant le module et
l’argument de H(ω) en fonction de la pulsation ω ; pour des raisons de commodité,
on trace en fait deux diagrammes logarithmiques :

Diagrammes de Bode
X Les diagrammes de Bode d’un quadrupôle linéaire en régime harmonique
sont constitués du tracé :
• en gain, défini par G = 20 lg |H(ω)| en fonction de lg ω (en fait, on
ω
utilise presque toujours l’abscisse sans dimension lg x où x = , où ω0
ω0
est une pulsation caractéristique du système) ;
• en phase, défini par ϕ = arg (H(ω)) en fonction de lg ω (ou encore en
fonction de lg x).

Bien que G soit sans dimension, on lui attribue toujours le nom de déciBel (symbole
dB), unité nommée en hommage à Bell‡ .
2 Filtres du premier ordre : deux filtres simples du premier ordre doivent être iden-
H0
tifiés immédiatement, le filtre passe-bas H(ω) = où x = ω/ω0 et H0 > 0 et le
1 + jx
H0 jx
filtre passe-haut H(ω) = ; les diagrammes correspondants en gain et en phase
1 + jx
sont tracés sur les figures 1.18 et 1.19.
G G

0 lg x 0 lg x

G0 G0
−3 dB −3 dB
pe

dB
nt

20
e

+

20

e
nt
dB

pe

Passe-bas Passe-haut

Figure 1.18 – Diagrammes en gain de filtres du premier ordre

On y a noté G0 = 20 lg H0 et on remarque que, lorsque x = 1 donc ω = ω0 (c’est la


H0 π
pulsation de coupure), |H(ω)| = √ donc G ≃ G0 − 3 dB et ϕ = − .
2 4
1 dus
2 Lien avec les régimes transitoires : l’équation différentielle us + = H0 ue est
ω0 dt
H0
associée à la fonction de transfert du filtre passe-bas H(ω) = , et l’équation
1 + jω/ω0
1 dus H0 due H0 jω/ω0
différentielle us + = au filtre passe-haut H(ω) = ; dans les
ω0 dt ω0 dt 1 + jω/ω0
1 : Électricité dans les réseaux linéaires 21

ϕ ϕ

0 lg x
+π/2

lg x
−π/2
Passe-bas 0 Passe-haut

Figure 1.19 – Diagrammes en phase de filtres du premier ordre

deux cas, la constante de temps τ de l’équation homogène associée au régime libre


vérifie donc la relation :

ω0 τ = 1 (1.13)

2 Filtres du second ordre : on doit encore identifier les formes canoniques de trois
fonctions de transfert du second ordre, correspondant respectivement aux filtres :
H0
– passe-bas H(ω) = , avec toujours H0 > 0 et x = ω/ω0 ; on pose ici
1 + 2jξx − x2
aussi ξ = 1/2Q ;
H0 2jξx H0
– passe-bande H(ω) = , qu’on écrit encore H(ω) =
1 + 2jξx − x2 1 + jQ (x − 1/x)
avec les mêmes notations que pour le passe-bas ;
−H0 x2
– passe-haut H(ω) = , qu’on peut obtenir à partir du filtre passe-bas
1 + 2jξx − x2
en faisant le changement jx → 1/jx, c’est-à-dire en changeant simplement le sens
de l’axe des abscisses en lg x, avec un déphasage de π.
L’allure du diagramme de Bode correspondant dépend de la valeur du coefficient
d’amortissement ξ ou, si on préfère, du facteur de qualité Q. Les tracés de la figure
1.20 détaillent le cas du filtre passe-bas du second ordre.
G ϕ

lg x lg x

G0 ξ = 0, 1 ξ = 0, 1

ξ = 10 ξ = 10
−π/2
p en

b
te −

ξ=1 ξ=1
40
B d

−π b

Figure 1.20 – Filtre passe-bas du second ordre


22 Physique, MP, MP*

Le changement de facteur de qualité influe exclusivement sur le comportement au voi-


sinage de ω = ω0 ; en particulier, on observe la possibilité d’une résonance seulement
df
si la fonction f (x2 ) = (1 − x2 )2 + 4ξ 2 x2 présente un maximum, donc si 2
s’annule,
dx
1 1 p
ce qui impose ξ < √ ou Q > √ et x = x0 = 1 − 2ξ 2 .
2 2
On en déduit simplement l’allure (figure 1.21) des diagrammes correspondant au filtre
passe-haut, avec la même influence du facteur d’amortissement ; nous poursuivrons
donc l’étude des seuls filtres passe-bas, puisque les résultats concernant les filtres
passe-haut s’en déduisent.
G ϕ

lg x

ξ = 0, 1 G0 ξ = 0, 1

ξ = 10 ξ = 10
π/2
B

b
d
40

ξ=1 ξ=1
te +
pen

lg x

Figure 1.21 – Filtre passe-haut du second ordre

Lorsque le filtre passe-bas est non résonant, c’est-à-dire pour ξ assez élevé, on peut
H0
factoriser la fonction de transfert H(ω) = , avec donc deux
(1 + jω/ω1 ) (1 + jω/ω2 )
1 1
pulsations de coupure successives ω1 = et ω2 = , où τ1 et τ2 sont aussi les
τ1 τ2
constantes de temps du régime transitoire apériodique associé à l’équation différen-
ξ dus 1 d2 us
tielle us +2 + = H0 ue ; on retrouve ainsi le lien entre régime transitoire
ω0 dt ω02 dt2
et régime forcé, analogue au cas des filtres d’ordre 1 :

ω 1 τ1 = ω 2 τ2 = 1 (1.14)

Lorsque le filtre passe-bas est résonant, pour ξ assez faible, on peut définir une bande
Hmax
passante à −3 dB en cherchant les valeurs de x = ω/ω0 telles que H = √ , avec
2
H = |H|. Rappelons d’abord que le maximum de H est atteint pour x = ωr /ω0
p H0
donné par x = 1 − 2ξ 2 ≃ 1 donc Hmax ≃ ; on cherche donc les solutions de

(x2 − 1)2 + 4ξ 2 x2 = 8ξ 2 ; les deux solutions vérifient sont proches de 1, de part et
ω0
d’autre de x0 avec pour écart ∆x ≃ 2ξ, ce qu’on peut encore écrire ∆ω ≃ : le
Q
facteur de qualité mesure l’acuité de la bande passante.
1 : Électricité dans les réseaux linéaires 23

Dans ce cas, le régime transitoire est pseudo-périodique amorti, de pseudo-pulsation


p 2Q
ω = ω0 1 − ξ 2 , avec la constante de temps d’amortissement τ = , ce qui montre
ω0
encore une fois le lien entre le régime harmonique forcé et le régime transitoire :

ω0 2
ω ≃ ωr ≃ ω0 ∆ω ≃ ≃ (1.15)
Q τ

On peut faire à part l’étude du filtre passe-bas, car celui-ci est toujours résonant, avec
une pulsation de résonance ωr exactement égale à ω0 , et une bande passante à −3 dB
ω0
exactement égale à ∆ω = , quelle que soit la valeur du facteur de qualité ou du
Q
coefficient d’amortissement ξ. Toutefois, celui-ci influe notablement sur la forme du
diagramme de Bode, comme le montre la figure 1.22.
G ϕ

lg x lg x
G0
ξ = 0, 1

ξ = 10
−π/2
b
dB

pe

ξ = 0, 1
nt

ξ=1
20

e
+


20
e
nt

dB
pe

−π b

Figure 1.22 – Filtre passe-bande du second ordre

Le régime transitoire associé à ces diagrammes de Bode est, selon la valeur du facteur
de qualité, apériodique, critique ou pseudo-périodique ; dans ce dernier cas, il existe
un lien simple entre pseudo-pulsation ω et pulsation de résonance ωr d’une part, et
entre constante de temps τ et facteur de qualité Q d’autre part, sous la forme :

ω0 2
ω ≃ ωr = ω0 ∆ω = = (1.16)
Q τ

1.4 Puissance et énergie électriques

1.4.1 Échanges d’énergie d’un dipôle


2 Couplage énergétique au réseau : considérons un dipôle D modélisé dans la conven-
tion des récepteurs. Lors de la durée dt, la charge électrique dq = idt traverse ce dipôle
et son potentiel passe de VE à VS = VE − ur , avec donc une variation d’énergie po-
tentielle des charges égale à dEp = −dqur (voir la figure 1.23).
24 Physique, MP, MP*

dq
E

b
Générateur D ur

b
dq
Figure 1.23 – Échanges de puissance

L’énergie perdue par les charges électriques est, pour assurer la conservation de l’éner-
gie totale, transférée au dipôle D, qui reçoit dont le travail électrique δWr = −dEp et
δWr
une puissance électrique Pr = .
δt
On retiendra, en convention des récepteurs, les expressions de l’énergie et de la puis-
sance électrique reçues par un dipôle :

δWr = Pr × dt Pr = u r × i (1.17)

En convention des générateurs, les expressions analogues δWg = Pg × dt et Pg = ug i


désignent bien sûr le travail et la puissance fournis par le dipôle au reste du réseau.
2 Quelques cas particuliers : envisageons les échanges d’énergie des résistances R,
condensateurs C et bobines d’induction L.
Dans le cas d’un dipôle résistif, ur = Ri donc Pr = Ri2 > 0 : la puissance est
exclusivement fournie au dipôle par le reste du réseau, avant que le dipôle ne la
dissipe sous forme thermique. On parle alors d’effet Joule pour cette dégradation de
l’énergie électrique.
dur dEe
Dans le cas d’un condensateur, i = C donc Pr = où on a noté l’énergie
dt dt
1 1 q2
électrostatique emmagasinée par le condensateur Ee = Cu2 = . Le condensateur
2 2C
peut donc être considéré comme un accumulateur d’énergie (pendant les phases de
charge, lorsque ur et i sont de même signe), susceptible de restituer cette énergie
(pendant les phases de décharge, lorsque ur et i sont de signes contraires).
di dEm
De même, dans le cas d’une bobine, ur = L donc Pr = où on a noté l’énergie
dt dt
1
magnétique emmagasinée par la bobine Em = Li2 . La bobine peut aussi être consi-
2
dérée comme un accumulateur d’énergie (pendant les phases de montée du courant),
susceptible de restituer cette énergie par la suite.

Échanges énergétiques des dipôles


X Une résistance R reçoit en permanence la puissance P = Ri2 de la part
du reste du réseau. Cette puissance est ensuite dissipée sous forme ther-
mique ; c’est l’effet Joule.
Un condensateur et une bobine sont des accumulateurs réversibles d’éner-
1 1
gie, avec les expressions Ee = Cu2 et Em = Li2 respectivement pour
2 2
les énergies électrostatique et magnétique.
1 : Électricité dans les réseaux linéaires 25

Malgré leur ressemblance apparente, on ne doit jamais confondre P = Ri2 (une


1 1
puissance, en watt) avec Ee = Cu2 ou Em = Li2 (des énergies, en joule).
2 2

2 Énergie et conditions initiales : en régime variable, on a vu que, sauf cas particulier,


la tension uC aux bornes d’un condensateur et le courant iL dans une bobine sont
des fonctions continues du temps. On peut donner une interprétation énergétique de
ce résultat : une discontinuité de uC ou de iL se traduisent par une discontinuité de
l’énergie Ee ou Em correspondante, ce qui ne peut exister qu’en cas d’apport d’une
puissance infinie.
On ne peut envisager une telle puissance infinie que dans le cadre d’une modélisation
excessivement simplifiée d’un réseau électrique ; ainsi, l’absence de toute résistance
permet le passage d’un courant infini ; ou encore l’emploi d’un générateur fournissant
une impulsion idéalisée (impulsion de Dirac) se traduit par une tension infinie.
Si on exclut ces cas de figure, on doit bien observer des variations continues au cours
du temps des grandeurs énergétiques Ee et Em , donc de uC et iL .

1.4.2 Puissance en régime harmonique


2 Puissance instantanée et puissance moyenne : considérons un dipôle linéaire quel-
conque alimenté en régime harmonique de pulsation ω, de sorte que la tension à ses
bornes (en convention récepteur) et le courant qui le traverse s’expriment sous la
forme u(t) = Umax cos (ωt + ϕu ) et i(t) = Imax cos (ωt + ϕi ).
La puissance instantanée fournie à ce dipôle par le reste du réseau prend alors la
forme P (t) = Umax Imax cos (ωt + ϕu ) cos (ωt + ϕi ), ce qu’on peut encore écrire comme
Umax Imax
somme de deux termes, P (t) = [cos (2ωt + ϕu + ϕi ) + cos (ϕu − ϕi )].
2
T π
Le premier terme est périodique, de période = ; il est de moyenne nulle. Le second
2 ω
terme correspond donc à la puissance moyenne consommée par le dipôle, qu’on écrit :

Umax Imax
hP i = √ √ cos |ϕu − ϕi | (1.18)
2 2


√ efficaces : dans l’expression (1.18), les termes Ueff = Umax / 2 et
2 Grandeurs
Ieff = Imax / 2 portent respectivement les noms de tension efficace ou courant efficace.

On utilise aussi la notation URMS = Ueff et IRMS = Ieff , où RMS désigne la racine du
carré moyen (root of the mean square) ; plus généralement, pour toute fonction, réelle
ou complexe, T -périodique, on définit ainsi :
Z τ +T
2 1 2
fRMS = f (t) dt (1.19)
T τ

En effet, dans le cas particulier d’une grandeur sinusoı̈dale f (t) = f0 cos ωt, on re-
f0
trouve bien fRMS = √ ; toutefois, on prendra garder à ne pas généraliser à d’autres
2
formes de signaux (cf. figure 1.24), périodiques mais de moyenne f¯ non nulle.
2 Facteur de puissance : on peut alors réécrire l’expression (1.18) en faisant intervenir
le facteur de puissance cos ϕ selon :
26 Physique, MP, MP*

f f f

f¯ f¯ f¯
fa t fa t fa t

r q r
f2 f2
fRMS = f¯2 + a fRMS = f¯2 + fa2 fRMS = f¯2 + a
2 3

Figure 1.24 – Grandeurs RMS pour différents signaux périodiques

hP i = Ueff Ieff cos ϕ ϕ = ϕ u − ϕi (1.20)

2
Ainsi, dans le cas d’un dipôle résistif, ϕ = 0 et Ueff = RIeff donc hP i = RIeff ; pour
une bobine ou un condensateur, ϕ = ±π/2 donc hP i = 0.
On peut généraliser ces résultats en notant que l’impédance Z = u/i du dipôle a
Umax Ueff
pour module Z = = et pour argument arg Z = arg u − arg i = ϕ ; ainsi,
Umax Ieff
2
hP i = ZIeff cos ϕ, où on reconnaı̂t Z cos ϕ = Re(Z) ; on montre de même une relation
analogue avec Y = 1/Z :

2 2
hP i = Re(Z)Ieff = Re(Y )Ueff (1.21)

On peut encore exprimer la puissance moyenne consommée par le dipôle en remar-


quant que u = Umax exp (j(ωt + ϕu )), i∗ = Imax exp (−j(ωt + ϕi )) d’où on déduit
ui∗ = Umax Imax exp (j(ϕu − ϕi )), ce qui permet d’écrire :

1 ∗
hP i = Re(P ) P = ui (1.22)
2

On remarquera que le produit ui est dépourvu de toute signification physique. Plus


généralement, on n’utilisera les notations complexes que pour les grandeurs linéaires,
jamais pour les produits ou plus généralement pour les grandeurs énergétiques.
Notons que la plupart des appareils électriques sont conçus pour fonctionner à fré-
quence et tension efficaces donnés (par exemple, f = 50 Hz et Ueff = 220 V pour le
réseau domestique) ; la valeur de cos ϕ dépend alors exclusivement de leur constitution
électrocinétique, c’est-à-dire de leur impédance.
Ainsi, un moteur électrique est constitué de bobinages (stator) et son inductance est
essentiellement celle d’une bobine donc Im(Z) > 0 et ϕ > 0.
La conséquence d’une valeur élevée de |ϕ| (donc cos ϕ < 1) pour hP i et Ueff don-
nés, c’est une valeur plus élevée que nécessaire de Ieff et, donc, des pertes par effet
Joule dans les fils d’amenée du courant. C’est pour limiter ces pertes en ligne que les
fournisseurs d’électricité imposent des valeurs minimales de cos ϕ à toute installation.
2 Adaptation d’impédance : considérons enfin un montage quadrupôle linéaire uni-
directionnel quelconque, alimenté par la sortie d’un autre montage de ce type, et
alimentant lui-même l’entrée d’un montage ultérieur (cf. figure 1.25).
1 : Électricité dans les réseaux linéaires 27

ie,n is,n

b b b b

b
Z s,n−1 Z s,n

ue,n

us,n
H n−1 ue,n−1 Y e,n H n ue,n Y e,n+1

b b b

b
Étage n − 1 Étage n Étage n + 1

Figure 1.25 – Transferts de puissance entre étages successifs

Dans une telle installation, le courant de sortie is,n de l’étage n est le courant d’entrée
ie,n+1 de l’étage ultérieur, et de même pour les tensions us,n = ue,n+1 . Il n’en va pas de
même pour les puissances : ce qui est fourni par le générateur de tension en = H n ue,n
est en partie dissipé dans l’impédance de sortie Z s,n de l’étage n, et en partie seulement
utilisé dans l’admittance d’entrée Y e,n+1 de l’étage n + 1.
On assure l’adaptation d’impédance de la chaı̂ne électronique si, pour chaque étage,
l’impédance d’entrée Z e,n+1 est choisie de sorte à recevoir la plus grande puissance
possible de la part du générateur (en , Z s,n ) qui l’alimente. On peut écrire la puissance
1
moyenne transférée d’étage en étage sous la forme hP i = Re (ui∗ ) avec u = Z e,n+1 i
2
en
et i = .
Z e,n+1 + Z s,n
Notons alors en = e0 exp (jψ), Z s,n = Xg +jYg et Z e,n+1 = X +jY , de façon à obtenir
 
e2 X + jY
hP i = 0 Re : le problème de l’adaptation d’impédance
2 (X + Xg )2 + (Y + Yg )2
X
consiste à rechercher le maximum de la fonction f (X, Y ) = ,
(X + Xg )2 + (Y + Yg )2
sachant qu’en pratique X > 0, Xg > 0 tandis que Y comme Yg sont quelconques.
Un maximum sera évidemment toujours atteint en fonction de Y si Y = −Yg ; il reste
X df
alors à rendre maximal f (X) = ; la solution de = 0 est X = Xg . Dans
(X + Xg )2 dX
e2
ce cas, la puissance transférée à l’étage n + 1 est égale à hP i = 0 , exactement égale
2X
à celle dissipée dans l’impédance de sortie de l’étage n puisque les deux impédances
ont même partie réelle.
Adaptation d’impédance
X Il y a transfert maximal de puissance du générateur de sortie d’un étage
à l’impédance d’entrée de l’étage suivant lorsque les deux impédances
(de sortie et d’entrée) successives sont des complexes conjugués.
En pratique, ces impédances sont choisies si possibles toutes réelles, donc
toutes égales.
On dispose alors de chaı̂nes électroniques normalisées, comme par exemple avec les va-
leurs Z e = Z s = 50 Ω en électronique de laboratoire (connecteurs BNC, électronique
aux normes IEEE, etc.) ou Z e = Z s = 75 Ω (télévision, vidéo).

Il est important de retenir la valeur Z e = Z s = 50 Ω ; elle correspond aux impé-


dances de sortie de tous les générateurs que nous utiliserons en travaux pratiques,
aux impédances de câbles, etc.
28 Physique, MP, MP*

Ce qu’il faut absolument savoir

Dans un réseau linéaire, toute grandeur électrique vérifie une équation différen-
X dk x
tielle ak k = f (t) ; si f (t) = 0 le régime est libre.
dt
k

Pour un réseau stable, toutes les racines rj de l’équation caractéristique vérifient


Re(rj ) < 0 ; pour les ordres 1 ou 2, tous les ak ont alors même signe.
On définit l’échelon de Heaviside H(t < 0) = 0, H(t > 0) = 1 ou de l’impulsion
dH R +β
de Dirac δ(t) = , avec δ(t 6= 0) = 0 et −α δ(t)dt = 1.
dt
dx
Une équation stable d’ordre 1 s’écrit τ + x(t) = f (t) ; τ est la constante de
dt Z ǫ
temps et la variation de x à l’instant t = 0 vérifie τ ∆x = lim f (t)dt.
ǫ→0 −ǫ

d2 x dx
Une équation stable d’ordre 2 s’écrit 2
+ 2ξω0 + ω02 x(t) = f (t) ; ω0 est
dt dt
la pulsation propre et ξ = 1/2Q le coefficient d’amortissement, Q le facteur de
qualité. Les variationsZ de x et de ẋ à l’instantZt = 0 vérifient les deux équations
ǫ ǫ
dF
∆ẋ + 2ξω0 ∆x = lim f (t)dt et ∆x = lim F (t)dt, où f = .
ǫ→0 −ǫ ǫ→0 −ǫ dt
uC (t) et iL (t) sont continus, sauf branchement direct ou impulsion en entrée.
H0 H0 jx
Filtres du premier ordre : H = passe-bas, H = passe-haut, avec
1 + jx 1 + jx
x = ω/ω0 . Pulsation de coupure à −3 dB, ω0 .
H0 −H0 x2
Filtres du second ordre : H = 2
passe-bas, H =
1√+ 2jξx − x 1 + 2jξx − x2
passe-haut, résonants si ξ < 1/ 2 ; dans ce cas, ωr ≃ ω0 et ∆ω ≃ ω0 /Q.
H0
Hc = passe-bande, ωr = ω0 et ∆ω = ω0 /Q.
1 + jQ(x − 1/x)
Zk
En régime permanent ou forcé, diviseurs de tension (série) uk = u ; diviseurs
Z
P
Y Y k uk − i0
de courant (parallèle) ik = k i ; théorème de Millman u0 = kP
Y kYk
pour le potentiel u0 en un nœud relié à des points de potentiels uk fixés (i0 est le
courant de fuite) ; théorème de superposition pour plusieurs générateurs libres ;
théorème de Thévenin-Norton, eeq = uvide , η eq = icourt-circuit et Z eq = Z passivé .
Pour un quadrupôle linéaire :
b b b
b

b
b

ie Zs is
ue Ye kis Hue us

b b
b

b
b

Puissance : instantanée P = u(t) × i(t), moyenne hP i = Re(P ) en régime har-


2 2
monique avec P = u × i∗ /2, donc hP i = Ueff Ieff cos ϕ = Re(Z)Ieff = Re(Y )Ueff .
Chapitre 2

Électronique

2.1 Signaux et opérateurs

2.1.1 Signaux

x
2 Signaux analogiques : l’objectif de l’électronique (( signal ))
est le transport, éventuellement à longue distance, d’informa-
tions contenues dans la forme de la fonction x(t) ; nous pren-
drons ici pour exemple le signal x(t) ci-contre.
t
Il peut arriver que la tension u(t) = u0 x(t) ou le courant
i(t) = i0 x(t) représentent directement le signal à transporter ; toutefois, ce cas est
exceptionnel car les fréquences d’oscillation du signal ne sont a priori pas adaptées
au support de transport de l’information (ondes hertziennes, câble, fibre optique, etc.) ;
de plus, on peut souhaiter effectuer de plus un multiplexage, c’est-à-dire transporter
sur la même ligne plusieurs signaux simultanément.
On utilise alors la modulation d’une grandeur électrique choisie en fonction du sup-
port physique, grandeur dite porteuse, par le signal x(t). À l’arrivée, l’opération de
démodulation restitue le signal x(t).

2.1.2 Modulation

2 Modulation d’amplitude : supposons par exemple que le support de transport


d’information soit transparent à la fréquence fp , dite fréquence porteuse ; ce terme si-
gnifie que le support transporte l’information avec une atténuation et une déformation
négligeables.

U0 = cte cos ωp t réalisé par oscillateur, cf. + loin

+ × u(t) = (U0 + αx(t)) cos ωp t


αx(t)

Figure 2.1 – Modulation d’amplitude


30 Physique, MP, MP*

On appellera porteuse la tension u(t) = U0 cos ωp t avec ωp = 2πfp . On transporte le


signal en modulation d’amplitude (AM) en réalisant u(t) = (U0 + αx(t)) cos ωp t, où α
sera choisi assez faible pour que l’amplitude Um (t) = U0 +αx(t) soit toujours positive.

Après modulation, le signal x(t) présenté plus haut prend alors l’allure de la figure 2.2 ;
on remarque qu’il est impératif que les variations d’amplitude du signal modulant x(t)
doivent rester lentes devant les variations de la porteuse, pour que les deux parties
du signal modulé u(t) (fréquence et amplitude) restent faciles à distinguer lors de
l’opération de démodulation.
u

signal modulant x(t)

signal modulé u(t)

Figure 2.2 – Signal modulé en amplitude

Si la porteuse est assez peu déformée par la modulation, on pourra montrer qu’elle
peut être considérée comme une combinaison linéaire de signaux sinusoı̈daux dont les
fréquences s’étendent de part de d’autre de la fréquence fp de la porteuse. L’étendue
ainsi occupée dans l’espace des fréquences porte le nom de largeur de bande ; plus
celle-ci est réduite, plus on peut utiliser le même support pour transporter un grand
nombre de signaux simultanés.
2 Démodulation : le schéma de démodulation (pour restituer x(t) à partir d’un
signal comportant plusieurs grandeurs simultanément modulées en amplitude) figure
sur le schéma 2.3 ; on utilise un filtre passe-bande sélectif (ou tuner ) pour sélectionner
la fréquence fp , un détecteur de crête DtC (pour mesurer l’amplitude Um = U0 +αx(t)
à partir de u(t)) puis un filtre passe-haut (pour éliminer la composante constante U0
et restituer la partie variable αx(t)).

u(t) = (U0 + αx(t)) cos ωp t DtC αx(t)

Figure 2.3 – Démodulation d’amplitude

Le schéma de modulation (pour obtenir u(t) à partir de x(t)) figure sur le schéma
2.1 ; on utilise un additionneur et un multiplieur.
Le principe même de l’ensemble modulation, démodulation en amplitude explique
l’utilité de divers montages linéaires (additionneurs, soustracteurs, filtres) ou non
linéaires (détecteur de crête, multiplieurs) qui seront présentés ou étudiés plus loin.
2 : Électronique 31

2 Modulation de fréquence : la modulation d’amplitude est de moins en moins


utilisée dans le domaine industriel car les signaux modulés AM sont détériorés par
toute diminution accidentelle d’amplitude du signal transporté (par exemple, par le
passage sous un tunnel lors de la réception hertzienne, etc.)
On utilise à la place la modulation de fréquence (FM), dans laquelle le signal porteur de
pulsation ωp est modulé en un signal de la forme u(t) = U0 cos (ωp + αx(t)) t, le taux
de modulation α étant assez faible pour que la pulsation instantanée Ω(t) = ωp +αx(t)
reste voisine de ωp ; ainsi, le signal peut continuer à n’occuper qu’une largeur de bande
réduite en fréquence.
u

signal modulant x(t)

signal modulé u(t)

Figure 2.4 – Signal modulé en fréquence

La modulation de fréquence consiste donc à réaliser un oscillateur à fréquence variable,


celle-ci étant contrôlée par le signal x(t) ; contrairement au cas de la modulation
d’amplitude, on ne reconnaı̂t pas aisément dans la forme du signal modulé en fréquence
(cf. figure 2.4) la forme exacte de x(t).
La démodulation de fréquence consiste en fait à réaliser une mesure de fréquence : la
pulsation Ω(t) ainsi mesurée contient dans sa partie variable αx(t) le signal désiré.

2.1.3 Opérateurs
2 Opérateurs non linéaires : certains ont été cités ci-dessus : multiplieurs et détecteurs
de crête en particulier. On sait aussi réaliser, par exemple au moyen d’amplificateurs
opérationnels, des comparateurs à hystérésis. Certains montages non linéaires seront,
dans ce qui suit, présentés à titre d’exercice seulement ; ils ne figurent toutefois pas
en tant que tels au programme.
2 Opérateurs linéaires : les opérateurs linéaires évoqués ci-dessus peuvent tous,
au moins en principe, être réalisés au moyen d’amplificateurs opérationnels, même si
on utilise aussi d’autres composants pour pallier aux limitations des amplificateurs
opérationnels. Rappelons que ces limitations sont de deux ordres :
– limitation en fréquence ; la bande passante à −3 dB de l’amplificateur opérationnel
lui-même est très basse (inférieure à 1 kHz) ; pour les montages à base d’amplifi-
cateur opérationnel, on peut augmenter la fréquence d’utilisation jusqu’à environ
100 kHz, la contrepartie de la montée en fréquence étant une diminution du gain
en amplitude. Cette perte de gain n’est pas en général une contrainte sévère.
– limitation en courant, donc en puissance : le courant de sortie d’un amplificateur
opérationnel ne peut pas dépasser 10 à 20 mA, sous peine de saturation ; sous une
32 Physique, MP, MP*

tension de sortie elle-même limitée à environ 10 V, l’appareil ne peut pas délivrer


plus de 100 mW.
2 Filtres et spectres de fréquence : l’importance du filtrage (passe-bas, passe-bande
ou passe-haut) est déjà apparue plus haut lors de la présentation de principe de la
démodulation d’amplitude par exemple. Considérons le signal modulé le plus simple
possible, le signal x(t) à transmettre étant lui-même sinusoı̈dal, x(t) = x0 cos ωt, ce qui
correspond à un signal modulé u(t) = (U0 + αx0 cos ωt) cos ωp t avec, conformément à
la remarque faite plus haut, ωp ≫ ω.
Une simple opération trigonométrique montre qu’on peut aussi écrire ce même signal
αx0
sous la forme u(t) = U0 cos ωp t + [cos(ωp + ω)t + cos(ωp − ω)t]. On peut alors
2
représenter (cf. figure 2.5) le spectre en fréquence du signal modulé, faisant apparaı̂tre
l’amplitude de chaque terme harmonique en fonction de la fréquence correspondante.

a
U0

αx0 /2
f
fp
fp − f fp + f

Figure 2.5 – Spectre en fréquence d’un signal simple modulé AM

Ce spectre fait apparaı̂tre la largeur de bande occupée par le signal (de largeur 2f de
part et d’autre de la fréquence centrale fp ). Nous verrons ultérieurement comment les
méthodes d’analyse de Fourier permettent de généraliser le principe de cette étude à
des formes de signaux plus complexes.
Les filtres (passe-bande, passe-bas ou passe-haut) permettent d’opérer des modifica-
tions sur le spectre de fréquences d’un signal ; on peut simplement comprendre le
rôle du filtre en superposant l’allure du diagramme de Bode en gain d’un filtre avec
le spectre de fréquence du signal filtré ; ainsi, pour économiser de la bande passante
tout en transportant la même quantité d’information, on peut appliquer à un signal
modulé en amplitude un filtre passe-haut non résonant, comme sur la figure 2.6 ; sa
fréquence de coupure sera choisie entre fp − f et fp .
Il est à noter que le schéma de la figure 2.6 est strictement qualitatif. En particulier,
le filtrage est considéré comme presque idéal : les composantes filtrées disparaissent
complètement, les composantes non filtrées sont maintenues presque intégralement.
Ce n’est pas le genre de situation auquel nous a habitué l’étude des filtres du second
ordre (coupure à ±40 dB par décade au maximum). On n’oubliera pas ici que les
filtres réels de l’électronique industrielle peuvent être d’ordre bien plus élevé. Un filtre
d’ordre 8 peut ainsi réaliser une coupure à ±160 dB par décade.
Le signal obtenu en sortie
n du montage dont le principe
o est décrit sur la figure 2.6
αx0
s’écrit alors u(t) ≃ H0 U0 cos ωp t + cos(ωp + ω)t , si H0 est le gain (constant)
2
du filtre dans sa partie passante. on dit ici qu’on a récupéré une bande latérale unique
(BLU) du signal modulé.
2 : Électronique 33

a a

Diagramme de
Bode du filtre

f f
fp fp
fp − f fp + f fp + f

avant filtrage après filtrage

Figure 2.6 – Exemple de filtrage : modulation BLU

Plus généralement, si on applique un filtre linéaire de fonction de transfert complexe


H(ω) = H(ω) exp (jϕ(ω)) à un signal composite, c’est-à-dire comportant plusieurs
pulsations
Xdifférentes, on pourra appliquer le théorème de superposition à ce signal
ue (t) = ak cos(ωk t + φk ) pour déterminer le signal de sortie correspondant, chaque
k
pulsation étant filtrée, c’est-à-dire, amplifiée d’un facteur H(ωk ) et déphasée d’un
facteur ϕ(ωk ), indépendamment des autres :

Filtrage d’un signal composite


X L’application d’un dispositif linéaire, défini par sa fonction de transfert
H(ω) =X H(ω) exp (jϕ(ω)) à un signal d’entrée composite, de la forme
ue (t) = ak cos(ωk t+φk ) fournit en sortie du dispositif un autre signal
k
composite, chaque fréquence étant amplifiée (si |H(ωk )| > 1) ou atténuée
(si |H(ωk )| < 1) et déphasée
X (si ϕ(ωk ) 6= 0) séparément, avec pour signal
de sortie global us (t) = H(ωk )ak cos(ωk t + φk + ϕ(ωk )).
k

2 Oscillateurs : la réalisation d’oscillateurs spontanés fait aussi partie des fonctions


de l’électronique analogique. Un oscillateur spontané est un dispositif qui génère en
sortie un signal périodique, par exemple sinusoı̈dal ; on trouve aussi des oscillateurs
fournissant des signaux périodiques en créneaux, en dents de scie, etc.
u u

t t
Osc xe OC

T = T (xe )

Figure 2.7 – Oscillateurs sinusoı̈daux électroniques

Un tel montage ne présente pas forcément de bornes d’entrée (oscillateur spontané


Osc, cf. figure 2.7 à gauche), ou bien le signal d’entrée permet de contrôler certaines
34 Physique, MP, MP*

caractéristiques (amplitude, fréquence, phase) du signal de sortie généré (oscillateur


contrôlé OC, par exemple en fréquence, cf. figure 2.7 à droite).
On peut réaliser un oscillateur sinusoı̈dal à partir d’un filtre quelconque du second
N (ω)
ordre, régi par la fonction de transfert H(ω) = , si on peut
1 + 2jξω/ω0 − ω 2 /ω02
contrôler la valeur de ξ ; en effet, l’équation différentielle qui régit le régime libre
1 d2 us 2ξ dus
associé s’écrit 2 2
+ + us (t) = 0.
ω0 dt ω0 dt
Si l’amortissement est assez faible, la solution générale de cette équation prend la
forme d’un régime pseudo-périodique très faiblement amorti, caractérisé par la pseudo-
pulsation ω ≃ ω0 (figure 2.8 à gauche) ; si ξ = 0, on réalise un oscillateur harmonique
strictement sinusoı̈dal, c’est-à-dire que le système cesse d’être stable ; on parle d’ac-
crochage des oscillations (figure 2.8 au centre).
u u u

t t t

ξ > 0, faible ξ=0 ξ<0

Figure 2.8 – Effet de l’amortissement sur un régime libre du second ordre

Ce cas (( idéal )) ξ = 0 ne peut en pratique jamais être réalisé de manière durable, car
on ne peut pas réaliser une égalité parfaite de paramètres physiques ; dès qu’on pense
y être arrivé, de petites modifications inévitables nous en éloignent. Ces modifications
sont dues par exemple aux oscillations elles-mêmes : le réseau dissipe de la puissance
par effet Joule dans ses résistances internes, s’échauffe, et perd l’accrochage.
À partir de là, soit ξ redevient légèrement positif, et les oscillations s’atténuent, soit ξ
redevient légèrement négatif. Dans le cas où ξ < 0, les oscillations sont alors amplifiées
avec une amplitude exponentiellement croissante (figure 2.8 à droite) ; il intervient
en général des comportements non linéaires (saturations, par exemple) qui limitent
la croissance de ces oscillations, et c’est en général dans ce cadre que sont réalisés
les oscillateurs quasi-sinusoı̈daux les plus simples. L’allure d’un signal oscillant avec
amplification et saturation est représenté sur la figure 2.9.
u

Figure 2.9 – Oscillateur quasi-sinusoı̈dal avec amplification et saturation


2 : Électronique 35

L’étude de la condition d’accrochage des oscillations revient en pratique à l’étude du


1 d2 us 2ξ dus
signe des différents termes de l’équation différentielle 2 2
+ + us (t) = 0,
ω0 dt ω0 dt
et en particulier au changement de signe du terme du premier ordre. On ne s’étonnera
pas de ce résultat si on garde en mémoire le réseau du second ordre le plus simple
possible, à savoir un réseau R, L, C série pour lequel la charge q d’une des armatures
d2 q dq q
du condensateur vérifie l’équation de régime libre L 2 + R + = 0. L’étude
dt dt C
formelle réalisée ci-dessus montre que :
– si R > 0, ce réseau est stable et présente des oscillations amorties ;
– si R = 0 (situation qui ne peut être réalisée physiquement sans l’apport d’un réseau
actif), ce réseau est instable et présente des oscillations spontanées ; ces oscillations
elles-mêmes ne sont en général pas durables du fait de la difficulté de maintenir la
relation exacte R = 0.
– si enfin on sait simuler R < 0, le bilan énergétique montre que le réseau équivalent
à R < 0 fournit de l’énergie au réseau (puissance Pr = Ri2 6 0, ∀t) qui dissipe
cette énergie en fournissant des oscillations amplifiées de son signal de sortie.
On remarque que le régime d’oscillation étudié est un régime libre, totalement in-
dépendant d’un éventuel signal d’entrée ue ; le résultat ne dépend d’ailleurs pas du
numérateur N (ω) de la fonction de transfert. On peut aussi retrouver les conditions
d’oscillations en considérant simplement cette fonction H(ω) ; la condition d’accro-
chage (ξ = 0, ω = ω0 ) est en effet équivalente à l’annulation du dénominateur de
la fonction de transfert 1 + 2jξω/ω0 − ω 2 /ω02 ; qualitativement, on dira que lorsque
H = |H(ω)| → ∞, un montage électronique devient instable et réalise un oscillateur
spontané pour la seule pulsation ω qui réalise cette condition.
On peut d’ailleurs considérer que ces oscillations ont pour origine l’amplification in-
définie des inévitables petites variations des grandeurs électriques du montage (par
exemple dues à la présence d’une alimentation, aux effets d’antenne, etc.) ; cette ampli-
fication infinie n’a lieu que pour la seule pulsation ω pour laquelle H = |H(ω)| → ∞.

2.1.4 Généralisation : régimes harmonique et transitoire

2 Équations différentielles et fonction de transfert : l’évolution d’une grandeur élec-


trique x(t) dans un réseau
X linéaire est en général régie par une équation différentielle ;
toutefois, si x(t) = ak cos (ωk t + φk ) est une somme de grandeurs sinusoı̈dales,
k
chaque composante harmonique xk = ak cos (ωk t + φk ) peut être traitée en utilisant
le formalisme complexe (impédances, admittances, etc.), c’est-à-dire en remplaçant
les dérivées par une multiplication par jωk et les primitives par une division par jωk .
Nous montrerons au prochain chapitre le cadre (séries et transformées de Fourier)
dans lequel on peut montrer l’équivalence entre les deux points de vue ; en particu-
lier, on peut retrouver l’équation différentielle à partir de la fonction de transfert, en
remplaçant chaque terme jω par une dérivée.
Lien entre régime transitoire et régime harmonique
X Si les deux grandeurs complexes xe et xs sont reliées par une fonction de
transfert, fraction rationnelle
P en jω, alors on peut passer de la fonction
k
xs N k (jω)
de transfert H(ω) = = Pk k
à l’équation différentielle reliant
xe k Dk (jω)
X dk xs X dk xe
xe (t) et xs (t) en régime quelconque, Dk k = Nk k .
dt dt
k k
36 Physique, MP, MP*

2 Stabilité d’un système linéaire : adoptons la notation de PLaplace p = jω pour


k
N k p
écrire la fonction de transfert d’un système linéaire, H(p) = Pk k
. Alors, l’équa-
k Dk p
tion différentielle d’évolution de la sortie en régime libre (donc pour xe = 0) s’écrit
X dk xs X
Dk k = 0 ; l’équation caractéristique associée s’écrit donc Dk pk = 0 et ses
dt
k k
solutions sont les nombres complexes pi , où i = 1, . . . , n si n est le degré de l’équation
différentielle.
2 Pôles de la fonction de transfert : l’identité des outils mathématiques utilisés en
Électronique et dans le cours de Sciences Industrielles de l’Ingénieur peut être illustrée
dans le cadre de l’étude générale de la stabilité des systèmes linéaires.
On appelle pôles de la fonction de transfert les n nombres complexes wi annulant le
dénominateur de H(ω), c’est-à-dire tels que |H(wi )| → ∞. Ces nombres ne s’inter-
prètent en termes de pulsations ωi = wi que si wi ∈ R+ .
Notant aussi jωi = pi et pi = ai + jbi (parties réelle et imaginaire) pour i = 1, . . . , n,
on vient de montrer que le régime libre (solution générale de l’équation homogène
associée) est une combinaison linéaire de termes exp (pi t) = exp (ai t) exp (jbi t) ; la
stabilité du système impose donc ai < 0 ; ceci revient à dire que Im(wi ) > 0.
Stabilité d’un système linéaire
X • En Physique : un système linéaire de fonction de transfert H(ω) est
stable si et seulement si les pôles wi de la fonction de transfert ont tous
leur partie imaginaire strictement positive.
• En Sciences Industrielles de l’Ingénieur : un système linéaire de fonction
de transfert H(p) est stable si et seulement si les pôles pi de la fonction
de transfert ont tous leur partie réelle strictement négative.

Remarquons qu’une seule partie imaginaire nulle impose l’instabilité ; en effet, pour
la pulsation particulière ωi ∈ R, on aura |H(ωi )| → ∞ : on a vu que le système
constitue alors un oscillateur spontané à la pulsation |ωi |.

2.2 Montages à base d’amplificateur opérationnel

2.2.1 L’amplificateur opérationnel


2 Présentation : l’amplificateur opérationnel de différence est un dispositif qui se
présente en général sous la forme d’un boı̂tier à huit broches, dont sept sont connectées
(cf. figure 2.10).
ip+
b
is
+
+Vcc ǫ b
b - vs
− + −Vcc ip− b

Figure 2.10 – Amplificateur opérationnel

Nous ne nous intéresserons ici qu’à 5 de ces bornes ; deux d’entre elles sont alimentées
en continu au moyen d’une source de puissance fournissant les tensions constantes
2 : Électronique 37

±Vcc , où Vcc est en général de l’ordre de 10 V à 15 V ; cet apport énergétique permet
à l’appareil de fonctionner en amplificateur.
La présence d’une alimentation symétrique définit aussi une référence interne de ten-
sion à l’amplificateur opérationnel, point de potentiel nul relativement auquel la ten-
sion de sortie vs est définie. On note v+ et v− les potentiels des deux entrées, dites
non inverseuse et inverseuse de l’amplificateur, et ǫ = v+ − v− .
2 Caractéristique de transfert : un amplificateur opérationnel idéal ne consomme
aucun courant en entrée : ip+ = ip− = 0 ; de plus, la tension vs dépend seulement de
ǫ, selon la caractéristique de transfert de la figure 2.11.
vs
Vsat b

pente µ0
−ǫm ǫ
b b
ǫm

b −V
sat

Figure 2.11 – Caractéristique de transfert d’un amplificateur opérationnel

Il existe un domaine linéaire dans lequel on peut écrire vs = µ0 ǫ, avec un coefficient


d’amplification en boucle ouverte µ0 ≃ 105 ; cette relation linéaire n’est garantie que
si |vs | 6 Vsat , où la tension de saturation vérifie Vsat . Vcc ; en pratique, pour une
alimentation ±Vcc = ±15 V, on constate en général Vsat ≃ 14, 5 V.
Compte tenu de la valeur très élevée de µ0 , la plus grande valeur de la tension d’entrée
en régime linéaire vérifie ǫm ∼ Vsat /µ0 ∼ 0, 14 mV ; en pratique, on posera souvent
µ0 → ∞ et ǫm → 0 ; on parle de modèle d’amplificateur idéal.
2 Saturation en courant : en plus de la limite vs 6 Vsat , il existe une seconde limite
au régime linéaire de fonctionnement des amplificateurs opérationnels : la saturation
en courant. Le régime linéaire est ainsi limité par la condition |is | 6 isat , avec un
courant de saturation en sortie isat ≃ 20 mA en général.
2 Limitations en fréquence : en régime variable, la relation vs (t) = µ0 ǫ(t) ne s’ap-
plique que pour les variations très lentes des signaux d’entrée ǫ(t) et de sortie vs (t) ;
dans le cas général, on doit remplacer cette relation par l’équation différentielle d’évo-
dvs
lution τ + vs (t) = µ0 ǫ(t), où la constante de temps τ est très élevée, τ ≃ 15 ms
dt
en général.
On peut aussi recopier cette relation sous forme complexe dans le cas des régimes
vs µ0
harmoniques forcés, sous la forme = µ = ; l’amplificateur opérationnel
ǫ 1 + jωτ
se comporte donc comme un filtre passe-bas du premier ordre, de gain statique (très
1
élevé) µ0 et de pulsation de coupure (très basse) ω0 = soit une fréquence de coupure
τ
ω0 1
= ≃ 10 Hz.
2π 2πτ
Cette fréquence de coupure peut sembler très basse, mais il ne faut pas oublier la
valeur élevée de µ0 . On peut en particulier continuer à considérer que l’amplificateur
µ0 µ0
opérationnel est idéal tant que |µ| > 100 ≫ 1, donc tant que √ ≃ > 100
1+ω τ 2 2 ωτ
ω
ou encore 6 10 kHz : c’est ce qu’on appelle le domaine des basses fréquences en

électronique.
38 Physique, MP, MP*

2 Défauts des amplificateurs opérationnels : en plus des limitations signalées ci-dessus


(saturations en tension et en courant, limitations en fréquence), les amplificateurs
opérationnels réels présentent certains défauts, parmi lesquels on peut citer :
– le décalage en tension ou offset ; il se traduit par une caractéristique de transfert
de la forme vs = µ0 ǫ + ed en régime permanent, avec |ed | de l’ordre de quelques
mV en général. Il est possible de compenser ce défaut ci nécessaire sur certains
amplificateurs opérationnels ; c’est le rôle des deux bornes que nous n’avons pas
décrites plus haut ;
– les courants d’entrée ip+ et ip− ne sont pas exactement nuls ; leur valeur commune
ip ≃ ip+ ≃ ip− vérifie en général |ip | . 100 nA pour des amplificateurs à base de
transistors (séries 741) ou |ip | . 1 nA pour des amplificateurs à base de transistors
à jonction (séries 081).

Amplificateurs opérationnels
X Un amplificateur opérationnel idéal est caractérisé par deux propriétés :
• les courants d’entrée sont toujours nuls ;
• si |us | < Vsat ∼ 15 V et |is | < isat ∼ 20 mA, le régime est linéaire.
En régime de fonctionnement linéaire, un amplificateur opérationnel
idéal est caractérisé par la relation us = µ0 ǫ = µ0 (v+ − v− ), où
µ0 ∼ 105 ≫ 1 permet toujours de faire l’approximation v+ ≃ v− .
En régime de saturation en tension, un amplificateur opérationnel idéal
adopte en sortie la tension us = ±Vsat , où us a le signe de ǫ = v+ − v− .
Les amplificateurs opérationnels réels présentent un certain nombre de
défauts. En particulier, en régime variable, la tension de sortie est régie
dus µ0
par les équations τ + us = µ0 ǫ ou us = ǫ, où τ ∼ 15 ms.
dt 1 + jωτ

On prendra garde à ne pas confondre idéal et linéaire : un amplificateur opérationnel


idéal peut parfaitement fonctionner en régime non linéaire, c’est-à-dire en saturation.

2.2.2 Montages linéaires usuels


2 Montage non inverseur : considérons le montage de la figure 2.12. En l’absence
de tout courant d’entrée, le groupe Z 1 , Z 2 forme un diviseur de tension ; en régime
Z1
linéaire, on a donc ue = v + = v − = u d’où l’expression de la fonction de
Z1 + Z2 s
Z
transfert H(ω) = 1 + 2 . Puisque us ne dépend pas de is , l’impédance de sortie est
Z1
nulle. On remarque aussi que le courant d’entrée ie est nul, donc l’impédance d’entrée
est infinie et le coefficient de retour est nul. Le schéma équivalent au montage, dans
le domaine linéaire, figure sur le schéma.

Z2
Montage non inverseur : H(ω) = 1 + Ze = ∞ (2.1)
Z1

R2
Si Z 1 = R1 et Z 2 = R2 , H(ω) = 1 + et il s’agit d’un amplificateur non inverseur :
R1
si Z 1 = ∞ (circuit ouvert) et Z 2 quelconque (on choisit souvent de mettre simplement
un fil, Z 2 = 0), H(ω) = 1 et il s’agit d’un suiveur.
2 Montage inverseur : considérons maintenant le montage de la figure 2.13.
2 : Électronique 39

b b is
+
ie b b
b - b b

b
ue b b us ue H(ω)ue

b
Z2
Z1 b b b

b
b b b
b

Figure 2.12 – Montage non inverseur

b b
ie Z1 Z2 b b

b
b b is
-
b b ue Ze H(ω)ue
ue b +
us
b b b
b

b
b b b

Figure 2.13 – Montage inverseur

En régime linéaire, v + = v − = 0 et le théorème de Millman permet d’affirmer


u /Z + us /Z 2 Z
v− = e 1 ; on en déduit H(ω) = − 2 ; comme us ne dépend pas de
1/Z 1 + 1/Z 1 Z1
ue , l’impédance de sortie est encore nulle. Par contre, le courant d’entrée n’est plus
nul, avec ie = ue /Z 1 ; l’impédance d’entrée du montage est donc Z 1 , et le coefficient
de retour est nul.

Z2
Montage inverseur : H(ω) = − Ze = Z1 (2.2)
Z1

Ce montage présente aussi de nombreuses applications ; parmi celles-ci, on peut citer :


R2
– si Z 1 = R1 et Z 2 = R2 , H(ω) = − ; il s’agit d’un amplificateur inverseur ;
R1
1 1
– si Z 1 = R et Z 2 = , H(ω) = − et le montage est en principe un
jCω jRCω
intégrateur ; toutefois, l’intégration des composantes continues pose un problème
de dérive et donc de saturation ; pour ce qui est de la fonction de transfert, ce
problème est signalé par le fait que |H(ω)| → ∞ lorsque ω → 0. En pratique, on
remplace donc le condensateur C par sa mise en parallèle avec une grande résistance
ρ 1
ρ, de façon à obtenir H(ω) = − . Ce filtre passe-bas du premier ordre
R 1 + jρCω
1
redevient un intégrateur dès que ω ≫ , pulsation qu’on peut choisir aussi faible
ρC
40 Physique, MP, MP*

que nécessaire. Par contre, les composantes continues et de très basse fréquence
ρ
sont simplement amplifiées puisque H(0) = − .
R
1
– si Z 1 = et Z 2 = R, H(ω) = −jRCω et le montage est un dérivateur.
jCω
2 Additionneur, soustracteur et déphaseur : considérons maintenant le montage formé
de trois entrées représenté sur la figure 2.14. Les différents potentiels indiqués sont
relevés par rapport à la masse.

2R R
u1 b b b

u2 b b
-
2R b us
b +

u0 b b
b

Y
αY

b
b

Figure 2.14 – Montage à trois entrées

En régime linéaire, v + = v − ; d’autre part, une double application du théorème de


u0 u + u2 + 2us
Millman fournit v + = et v − = 1 ; on en déduit l’expression de la
1+α 4
(1 + α)(u1 + u2 ) − 4u0
tension de sortie du montage, us = − . Sur cette base, on peut
2(1 + α)
distinguer divers cas particuliers :
• Si u0 = 0, les valeurs de Y et α sont indifférentes (on peut choisir deux fils, ce qui
u + u2
revient à mettre la borne + à la masse) ; on a alors us = − 1 et il s’agit
2
d’un circuit additionneur (à un coefficient multiplicatif près).
• Si u1 = u2 , tout se passe comme si la borne − était reliée par une résistance
égale (à R) d’une part à l’entrée u1 , d’autre part à la sortie u2 ; on a alors
(1 + α)u1 − 2u0
us = − .
1+α
♦ avec α = 1, on obtient us = u0 − u1 ; il s’agit d’un circuit soustracteur.
1
♦ avec Y = et αY = jCω, donc α = jRCω, et si on relie les deux entrées
R
1 − jRCω
pour imposer u1 = u0 = ue , on obtient us = u ; la fonction
1 + jRCω e
us
de transfert H(ω) = vérifie alors |H| = 1 pour tout ω : il s’agit d’un
ue
circuit déphaseur. Le déphasage apporté par un tel circuit est arg H(ω) =
arg(1 − jRCω) − arg(1 + jRCω) = −2 arctan RCω.
Le diagramme de Bode en phase est reporté sur la figure 2.15 ; le déphasage
varie le plus rapidement en fonction de ω pour RCω ∼ 1.
2 : Électronique 41

lg RCω

b −π/2

−π b

Figure 2.15 – Montage déphaseur

2 Filtres de Butterworth : considérons maintenant la structure présentée sur la figure


2.16, réalisée au moyen de quatre admittances Y 1 , Y 2 , Y 3 et Y 4 et d’un potentiomètre.

b b

Y4
b b b b
b

+
Y1 Y2 b b

Y3 b -
ue u
us
b

b b b b b b

r r′

Figure 2.16 – Filtres de Butterworth

Posant r′ + r = kr, on remarque d’abord que us = kv − ; d’autre part, le théorème


Y u + Y 2 v + + Y 4 us Y2
de Millman impose u = 1 e ; enfin, v + = u ; si on écrit
Y1+Y2+Y4 Y2+Y3
finalement en régime linéaire v + = v − , on obtient l’expression générale de la fonction
kY 1 Y 2
de transfert H(ω) = .
(1 − k)Y 2 Y 4 + (Y 1 + Y 4 )(Y 2 + Y 3 )
On peut alors proposer plusieurs applications :
k
• Si Y 1 = Y 2 = 1/R, Y 3 = Y 4 = jCω, H(ω) = ; il
1 + (3 − k)jRCω − R2 C 2 ω 2
s’agit d’un filtre passe-bas du second ordre, avec pour pulsation caractéristique
1 3−k
ω0 = et pour coefficient d’amortissement ξ = .
RC 2
−kR2 C 2 ω 2
• Si Y 1 = Y 2 = jCω, Y 3 = Y 4 = 1/R, H(ω) = ; il
1 + (3 − k)jRCω − R2 C 2 ω 2
s’agit d’un filtre passe-haut du second ordre, avec les mêmes pulsation caracté-
ristique et coefficient d’amortissement.
jkRCω
• Si Y 1 = Y 3 = jCω, Y 2 = Y 4 = 1/R, H(ω) = ;
1 + (3 − k)jRCω − R2 C 2 ω 2
il s’agit enfin d’un filtre passe-bande du second ordre, avec encore les mêmes
pulsation caractéristique et coefficient d’amortissement.
42 Physique, MP, MP*

r′
• Dans les trois cas, k = 1 + varie de 1 à +∞, donc le coefficient d’amortissement
r
varie de 1 à −∞, en passant pas la valeur critique 0 ; pour ξ 6 0, le système
est donc instable. En particulier pour ξ = 0 (k = 3), on obtient la condition
d’accrochage d’un oscillateur sinusoı̈dal de pulsation ω0 .

2 Montages adaptateurs d’impédance : on peut utiliser divers montages pour adapter


l’étage d’entrée d’un circuit à l’étage de sortie du circuit précédent dans un montage
électronique en cascade. La situation la plus simple consiste parfois à utiliser un
suiveur ; comme on l’a vu, c’est un montage d’impédance d’entrée infinie (donc sans
appel de courant) qui réalise en sortie une image de la tension d’entrée, us = ue .
Son utilisation s’impose dès qu’on veut utiliser la valeur d’une tension en un point
d’un réseau sans appeler de courant, par exemple pour ne pas perturber le réseau en
question.
On peut aussi utiliser d’autres montages, permettant de réaliser entre un point et la
masse l’équivalent d’une impédance de correction ; considérons par exemple le montage
de la figure 2.17.

ie ie
b b b
r
b
+
ue b
b -

R r
b b b
b

i
ue

Figure 2.17 – Montage équivalent à une impédance

Le courant d’entrée circule en fait dans r puisque i+ = 0 ; en régime linéaire, v + = v −


donc v + − us = rie = ri = v − − us et les deux résistances r sont parcourues par
le même courant ie ; finalement, on voit aussi que ue = −Rie , d’où la valeur de
l’impédance d’entrée du quadrupôle Z e = −R. Le montage est qualifié de résistance
négative ; il peut compenser une partie de la résistance d’un réseau, par exemple pour
augmenter un facteur de qualité ou limiter un phénomène dissipatif.
Notons que dans ce cas l’effet Joule est (( inversé )) : de la puissance est fournie au reste
du réseau ; elle trouve son origine dans l’alimentation continue ±Vcc de l’amplificateur
opérationnel.

2.2.3 Stabilité d’un montage


2 Stabilité des montages à amplificateur opérationnel : on a vu que le composant
lui-même (l’amplificateur opérationnel) doit être considéré comme un filtre passe-bas
d’ordre 1. Même en présence de circuits purement résistifs et alimentés en régime per-
manent, l’étude complète d’un tel montage passe impérativement par l’établissement
d’une équation différentielle de régime libre ; on dira alors que le montage est stable
si sa solution est transitoire.
Dans le cas contraire, la solution de régime libre contient un terme exponentiel crois-
sant (en valeur absolue), qui devrait donc tendre vers ±∞ au bout d’un certain temps.
2 : Électronique 43

On n’atteint bien sûr jamais de tensions ou de courants infinis, car les saturations (en
tension ou en courant) de l’amplificateur opérationnel interviennent avant. On dira
dans ce cas que le montage fonctionne en régime saturé ; il n’est pas toujours possible
de prévoir s’il s’agira de saturation positive ou négative.
2 Amplificateur inverseur et comparateur : considérons à nouveau le montage non
inverseur de la figure 2.12, réalisé avec Z 1 = R1 et Z 2 = R2 . Si on tient compte du
caractère non idéal de l’amplificateur opérationnel, on doit écrire v+ − v− = ǫ(t) avec
dus R1
τ + us (t) = µ0 ǫ(t), v+ (t) = ue (t) et v− (t) = us (t). L’équation différen-
dt R1 + R2
dus µ0 (R1 + R2 )
tielle du régime libre est donc τ ′ +us = H ′ ue , où on a posé H ′ =
dt (µ0 + 1)R1 + R2
′ R1 + R2
et τ = τ .
(µ0 + 1)R1 + R2
R1 + R2 τ H′
Étant donné que µ0 ≫ 1, on peut écrire H ′ ≃ et τ ′ ≃ . La solution
R1 µ0
particulière de cette équation (si ue est constant) correspond à un montage amplifi-
cateur non inverseur de gain en tension H ′ : ce résultat est donc presque le même que
celui qu’on obtenait pour un amplificateur idéal. Cette solution est atteinte après une
durée de l’ordre de grandeur de τ ′ ; comme on a vu que τ ≃ 15 ms, µ0 ≃ 105 , alors
un montage ayant un gain H ′ = 100 sera en régime permanent au bout d’une durée
de l’ordre de 15 µs.
On peut faire une remarque supplémentaire, en notant que la bande passante (à
dus
−3 dB) du filtre passe bas associé à l’équation différentielle τ + us (t) = µ0 ǫ est
dt
∆ω = 1/τ ; de même, le montage non inverseur a une bande passante ∆ω ′ = 1/τ ′ . On
a donc établi plus haut la relation :

µ0 × ∆ω = H ′ × ∆ω ′ (2.3)

Ainsi, le bouclage de l’amplificateur opérationnel, c’est-à-dire l’établissement d’un lien


électrique entre la sortie et l’entrée − de l’amplificateur, par le pont diviseur R1 , R2 se
traduit pas une forte chute du gain (qui passe de µ0 à H ′ ) accompagnée par une forte
augmentation de la bande passante (qui passe de ∆ω à ∆ω ′ ), tandis que le produit
gain × bande passante reste constant : c’est une propriété qu’on a déjà eu l’occasion
de citer.
Considérons maintenant le même montage, dans lequel on a inversé le branchement
des bornes d’entrée de l’amplificateur opérationnel (figure 2.18).
La permutation des bornes revient à échanger v+ et v− dans ce qui précède ou, ce qui
revient au même, à changer µ0 en −µ0 . On obtient donc la nouvelle équation de régime
dus −µ0 (R1 + R2 ) R1 + R2
libre τ ′′ +us = H ′′ ue , avec H ′′ = et τ ′′ = τ .
dt (−µ0 + 1)R1 + R2 (−µ0 + 1)R1 + R2
R1 + R2 R1 + R2
Puisque µ0 ≫ 1, on peut écrire H ′′ ≃ ≃ H ′ mais aussi τ ′′ ≃ −τ .
R1 µ0 R1
′′ ′ ′′
On trouve donc  τ ≃ −τ ; le signe négatif de τ impose un comportement du régime
t
libre en exp − ′′ → ∞ lorsque t → ∞ : le montage est instable.
τ
Cette instabilité est limitée par le passage en saturation en tension, qui se fera au
bout d’une durée de l’ordre de |τ ′′ |, c’est-à-dire en quelques dizaines de microsecondes.
Après cette durée, le montage adoptera donc en régime permanent de fonctionnement
une tension de sortie us = ±Vsat .
44 Physique, MP, MP*

b b
-

Vsat
b b us
+Vsat
b +

2
+ R1R+R
1
ue b b us
b ue
R2 b b

R1

− R1R+R 2
Vsat
b b b
b

1
−Vsat

Figure 2.18 – Montage comparateur à hystérésis

Le signe de us est déterminé par la caractéristique de transfert 2.11 ; us aura le signe


de ǫ = v+ − v− . Puisque, même en régime de saturation, les bornes d’entrée de
R1
l’amplificateur opérationnel n’appellent pas de courant, on aura v+ = us
R1 + R2
R1
tandis que v− = ue . Finalement, il vient ǫ = us − ue .
R1 + R2
Le montage fonctionnera donc en saturation positive si ǫ > 0 avec us = +Vsat ,
R1
donc si ue < Vsat ; il fonctionnera en saturation négative si ǫ < 0 avec
R1 + R2
R1
us = −Vsat , donc si ue > − Vsat . La caractéristique de transfert us = f (ue )
R1 + R2
correspondante figure sur le tracé 2.18.
Ce montage est qualifié de comparateur puisque l’état de la sortie us dépend de
la comparaison de la tension d’entrée aux bornes d’un certain intervalle. Il pré-
sente le phénomène d’hystérésis, c’est-à-dire que dans certains cas, son état n’est
pas défini
 de manière instantanée mais dépend de son histoire antérieure ; ainsi, pour
R1 R1
ue ∈ − Vsat , + Vsat , la tension de sortie us peut a priori prendre
R1 + R2 R1 + R2
n’importe laquelle des deux valeurs ±Vsat . En pratique, on constate que, sauf en pré-
sence de perturbations très importantes, la sortie reste en permanence dans l’état
électrique où elle se trouvait lorsque ue est entré dans cet intervalle, et ceci dure
jusqu’à ce que ue quitte cet intervalle.
2 Généralisation : on peut d’abord donner une interprétation qualitative du passage
ou non en régime de saturation. Supposons par exemple qu’une perturbation électrique
quelconque donne naissance à une petite augmentation de us . La présence de la boucle
de retour R1 , R2 sur le montage comparateur 2.18 provoque une augmentation de v+ ,
elle-même à son tour amplifiée d’un facteur µ0 : l’augmentation de us ne diminue pas,
bien au contraire.
Par contre, dans le cas d’un bouclage à la borne −, comme pour le montage non
inverseur 2.12, l’augmentation de us se traduit par une augmentation de v− ; elle est
donc automatiquement modérée par l’amplificateur opérationnel.
Ce raisonnement suppose en fait un certain délai entre les perturbations en sortie d’un
montage et leur influence en retour après bouclage ; ce délai est en pratique assuré
par l’existence d’une constante de temps de l’amplificateur opérationnel.
On peut généraliser ce raisonnement dans le cadre d’une théorie générale du bouclage.
2 : Électronique 45

Considérons le cas de la figure 2.19, dans laquelle un amplificateur de gain complexe


H est bouclé par deux chaı̂nes de retour, de gains β+ et β− , de sorte que la gran-
deur d’entrée de l’amplificateur s’écrive x′e = xe + β+ xs − β− xs . Une telle situation
est évidemment plus complexe que celle d’un  montage (( simple )) à amplificateur
opérationnel, pour lequel us = µ v + − v − , ce qui correspond au cas particulier où
β+ = β− = µ et xe = 0.

β+ xs
β+

+
xe x′e xs
H b

β−
β− xs

Figure 2.19 – Schéma d’un amplificateur bouclé

Dans le cadre plus général de la figure 2.19, la grandeur de sortie du montage vérifie
xs = Hx′e = H (xe + βxs ), où on a posé β = β+ − β− . On peut donc définir pour le
x H
montage bouclé le gain effectif H b = s = .
xe 1 − βH
Considérons maintenant le cas où l’amplificateur est un filtre passe-bas du premier
H0
ordre, H = , tandis que les deux opérateurs de bouclage ont un gain réel
1 + jω/ω0
1 1 + jω/ω0 1 + jω/ωb0
positif : β+ > 0, β− > 0. On peut alors écrire = −β + =
Hb H0 Hb0
H0
où on a posé Hb0 = et ωb0 = ω0 (1 − βH0 ).
1 − βH0
Ainsi, la chaı̂ne bouclée se comporte elle-même comme un filtre passe bas du premier
ordre, mais avec une valeur différente du gain statique H0 et de la bande passante
ω0 ; seul le comportement asymptotique (pour ω → ∞) est identique pour les deux
montages bouclé et non bouclé.
On remarque à nouveau que, lors du bouclage, le produit du gain par la bande passante
est constant :

H0 × ω0 = Hb0 × ωb0 (2.4)

On peut donc représenter les diagrammes de Bode en gain des systèmes bouclé et non
bouclé, sur la figure 2.20, en fonction de la valeur de β par rapport au cas critique
1
βc = , avec d’ailleurs βc ∼ 0 souvent.
H0
Un bouclage négatif (ou rétroaction) est caractérisé par β− ≫ β+ et donc par une
diminution du gain avec augmentation de la bande passante.
Le système est alors stabilisé ; en particulier, l’équation différentielle du régime libre
Hb0 dus
associée à la fonction de transfert H b = s’écrit us + τb0 = 0 avec
1 + jω/ωb0 dt
1 1 1
τb0 = donc τb0 = . Puisque β+ ≪ β− , τb0 > 0 et le régime
ωb0 ω0 1 − (β+ − β− ) H0
46 Physique, MP, MP*

β1 > βc ∼ 0

H
ω

β2 < βc ∼ 0

pe
nt
e

β3 < β2

20
dB
Figure 2.20 – Bouclage, gain et bande passante

libre est stable, avec même une durée de régime transitoire nettement plus courte
1
qu’en l’absence de bouclage : τb0 ≪ .
ω0
Au contraire, un bouclage positif (ou réaction positive), caractérisé par β+ ≫ β− ,
s’accompagne d’une augmentation du gain, mais pour une bande passante réduite ;
dans le cas extrême, la gain peut devenir infini pour une fréquence unique : le système
devient instable ; il forme par exemple un oscillateur spontané pour cette fréquence.
On peut aussi comprendre cette perte de stabilité du système en notant que, dans
dus 1
l’équation différentielle du régime libre us + τb0 = 0 avec τb0 = , la condition
dt ωb0
β+ ≫ β− impose τb0 < 0 et un régime libre instable.
Nous admettrons finalement la généralisation suivante :

Stabilité des montages à amplificateur opérationnel


X Un montage comportant un amplificateur opérationnel sera en général
stable (et fonctionnera donc en régime linéaire) s’il n’existe qu’un seul
lien électrique entre la sortie et la borne − (ou borne inverseuse).
Au contraire, s’il n’existe qu’un bouclage de la sortie à la borne + (ou
borne non inverseuse), ou bien aucun bouclage, le montage est instable
et l’amplificateur fonctionne en régime de saturation.

Dans le cas où il existe plusieurs bouclages (comme pour les filtres de Butterworth
de la figure 2.16), on ne peut pas conclure a priori ; toutefois, le contexte de l’énoncé
permet souvent de savoir quel est le type de régime à étudier.
2 : Électronique 47

Ce qu’il faut absolument savoir

Pour être transporté, un signal s(t) doit être modulé ; il est transporté à la
fréquence fp du signal porteur sp (t).
En modulation d’amplitude, sp (t) = (A + ks(t)) cos 2πfp t. En modulation de
fréquence, sp (t) = A cos 2π (fp + ks(t)) t.
Un montage linéaire est caractérisé par une fonction de transfert, fraction
N (ω) u
rationnelle en ω, H(ω) = = s . On passe de la notation complexe
D(ω) ue
d 1
Z
D(ω)us = N (ω)ue à l’équation différentielle en faisant ↔ jω et dt ↔ .
dt jω
Lorsque D(ω) = 0, le système forme un oscillateur spontané.
X
Un signal composite xe (t) = ak cos (ωk t + φk ), après traversée d’un montage
k
linéaire de fonction de transfert
X H(ω) = H(ω) exp (jϕ(ω)), forme un nouveau
signal composite xs (t) = H(ωk )ak cos (ωk t + φk + ϕk ).
k

Un amplificateur opérationnel idéal n’appelle pas de courant à ses bornes.


Un amplificateur opérationnel fonctionne en régime linéaire sous réserve que
µ0
|us | < Vsat ∼ 15 V et |is | < isat ∼ 20 mA ; dans ce cas, us = ǫ où
1 + jωτ
µ0 ∼ 105 et τ ∼ 15 ms ; en pratique, ǫ ∼ 0.
En saturation de tension, us = ±Vsat . 15 V, avec le signe de ǫ.
Les montages à amplificateur opérationnel sont stables en cas de bouclage ex-
clusif à la borne −, saturés en cas de bouclage exclusif à la borne +.
Résultats à savoir retrouver très rapidement :
Z2
Pour le montage non inverseur, H(ω) = 1 + et Z e = ∞.
Z1
Z2
Pour le montage inverseur, H(ω) = − et Z e = Z 1 .
Z1
Résultat à savoir identifier très rapidement :
1 − jω/ω0
Un montage déphaseur correspond à H(ω) = H0 ; le déphasage vaut
1 − jω/ω0
alors arg(H(ω)) = −2 arctan ω/ω0 .
Chapitre 3

Analyse de Fourier

3.1 Décomposition en séries de Fourier

3.1.1 Introduction
2 Signaux périodiques : pour l’étude des signaux (par exemple électriques) pério-
diques, nous serons amenés à décomposer toute fonction du temps sur une base for-
mée de fonctions harmoniques (c’est-à-dire sinusoı̈dales), de pulsation ω. On pourra
prendre pour exemple le signal tracé sur la figure 3.1, composé de deux fonctions har-
moniques : u(t) = u1 cos ω0 t + u1 cos ω1 t ; dans le cas de l’exemple proposé, u1 = u0 /2
et ω1 = 3ω0 .
u
u(t)

u1 cos ω1 t u0 cos ω0 t

Figure 3.1 – Exemple de signal à deux composantes harmoniques

L’intérêt d’une telle décomposition, si elle est possible, est évident : pour chaque com-
posante harmonique de pulsation ωk , on pourra appliquer tous les résultats développés
dans le cours concernant les régimes harmoniques forcés : calculs d’impédance Z(ωk ),
de fonctions de transfert H(ωk ), etc. Dans le cas d’un réseau linéaire, l’existence d’un
théorème de superposition permet alors de considérer le comportement du système
en sommant les contributions des différents termes harmoniques.

À titre d’exemple, supposons que la tension u(t) soit filtrée par un filtre passe haut
jω/ω0
du premier ordre, de fonction de transfert H(ω) = ; cette fonction de
1 + jω/ω0
transfert prend deux valeurs bien différentes pour les deux composantes harmoniques
j 1
de u(t), puisque H(ω0 ) = , de norme √ = 0, 71 et d’argument π/4 = 45◦ , et
1+j 2
50 Physique, MP, MP*

3j 3
H(ω1 ) = , de norme √ = 0, 95 et d’argument 18◦ . Le signal de sortie us (t),
1 + 3j 10
représenté sur la figure 3.2, montre bien l’atténuation relative de la composante de
basse fréquence, et le déphasage correspondant. Le signal complet est alors totalement
déformé.
us
0.71u0 cos(ω0 t + 45◦ )
us (t)

0.95u1 cos(ω1 t + 18◦ )

Figure 3.2 – Filtrage différentiel de deux composantes harmoniques

Imaginons maintenant que cette même tension u(t) alimente une bobine, de résistance
R et d’inductance propre L, ces deux grandeurs étant choisies de sorte que R = Lω0 .
Le courant électrique i(t) qui parcourt la bobine s’obtient alors comme somme de deux
composantes, i0 cos(ω0 t + ϕ0 ) et i1 cos(ω1 t + ϕ1 ), avec, du fait de la notation complexe
u0 u0 u1 u1
u = Zi = (R + jLω)i, les expressions i0 = =√ et i1 = =√ ;
|Z(ω0 )| 2R |Z(ω1 )| 10R
de même, ϕ0 = − arg(Z(ω0 )) = −45◦ et ϕ0 = − arg(Z(ω0 )) = −18◦ .
L’allure du courant iL qui parcourt la bobine est reporté sur la figure 3.3 ; on remarque
au contraire du tracé précédent que c’est cette fois-ci la composante de haute fréquence
qui est atténuée.
iL
iL (t) u0 cos(ω0 t − 45◦ )

R 2

u1 cos(ω1 t − 18◦ )

R 10

Figure 3.3 – Courant dans une bobine alimenté par deux tensions harmoniques

2 Notations : une fonction harmonique de pulsation ω > 0 pourra écrire sous la


forme fω (t) = α cos (ωt + ϕ), c’est-à-dire aussi fω (t) = a cos ωt + b sin ωt, avec les
p a b
relations α = a2 + b2 , cos ϕ = et sin ϕ = − . Une telle fonction est évidemment
α α

T -périodique, avec T = .
ω
On peut encore écrire la même fonction fω (t) = c exp (jωt) + c′ exp (−jωt), où on a
a − jb a + jb
noté j 2 = −1 et c = et c′ = . Naturellement, on choisira la notation
2 2
3 : Analyse de Fourier 51

complexe (c, c′ ) ou la notation réelle (a, b ou bien α, ϕ) en fonction des circonstances


particulières, en particulier selon que les grandeurs étudiées sont complexes ou réelles.

Ici et dans toute la suite, on remarquera l’intervention de termes du type exp (−jωt),
qui semblent avoir une pulsation négative. En réalité, il n’existe que des pulsations
positives, et ce type de terme n’intervient que dans la décomposition formelle d’une
fonction cos ωt ou sin ωt, à pulsation strictement positive.

3.1.2 Séries de Fourier


+∞
X
2 Définitions : on appelle série de Fourier toute somme f (t) = ck exp (jkωt),
k=−∞
si cette somme converge. Il s’agit d’une somme de fonctions harmoniques, de pulsations
toutes proportionnelles, ωk = kω ; le terme d’ordre k est donc périodique de période
2π 2π
et la somme est donc T -périodique, avec T = .
kω ω
Les termes k = ±1, de pulsation ω, portent le nom de terme fondamental ; les termes
±k avec k > 1 portent le nom d’harmoniques d’ordre k. Enfin, l’unique terme k = 0
est constant ; il s’agit donc automatiquement de la valeur moyenne de la série f (t).
Compte tenu des remarques qui précèdent, la même série de Fourier peut s’écrire

a0 X
sous la forme trigonométrique f (t) = + (ak cos kωt + bk sin kωt) ; l’origine du
2
k=1
a0
la notation pour le terme constant apparaı̂tra ultérieurement. La même série peut
2

a0 X
d’ailleurs aussi s’écrire sous la forme f (t) = + αk cos (kωt + ϕk ).
2
k=1
a0
Les termes et ak cos kωt sont les termes pairs de la série ; les termes bk sin kωt en
2
sont les termes impairs.

Il est essentiel de ne pas confondre le caractère pair et impair des fonctions cos kωt
et sin kωt, avec la parité éventuelle de l’entier k ! Ainsi, un harmonique pair (avec
k pair) contient un terme pair ak cos kωt et un harmonique impair bk sin kωt.

On retiendra les relations entre les différentes notations des séries de Fourier :

a0 = 2c0 ak = ck + c−k bk = j(ck − c−k ) (3.1)

2 Notations : dans la suite, nous noterons φk (t) = exp(jkωt)


P les fonctions complexes
qui servent de base à l’écriture des séries de Fourier : f = k ck φk .
De plus, nous ne chercherons pas à développer ici l’ensemble des propriétés des séries
de Fourier
X ; nous nous contenterons donc d’étudier des sommes finies de la forme
f (t) = ck exp (jkωt), où I est un certain intervalle fini.
k∈I
Le fait d’étudier des séries tronquées présente l’énorme avantage de ne manipuler que
des sommes finies, sans se préoccuper de problèmes de convergence, d’interversion de
sommes, etc. De plus, négliger les termes correspondant à k → ∞ est légitime en
électronique, puisque tout dispositif réel présente toujours une bande passante limitée
et ne permettra pas le passage de composantes de très haute fréquence.
52 Physique, MP, MP*

La largeur de l’intervalle I ne dépend que du degré de précision attendu sur la repré-


sentation d’un signal authentique par une série de Fourier ; nous ne nous poserons pas
ce problème ici.

3.1.3 Norme sur l’espace des fonctions


2 Moyenne quadratique : lors de l’étude de la puissance en régime harmonique,
nous avons défini la valeur efficace d’une fonction T -périodique quelconque par la
1 T
Z
2
relation feff = |f (t)|2 dt ; on peut montrer que la relation qui, à la fonction f ,
T 0
associe sa valeur efficace feff , est une norme (sur l’espace E des fonctions continues,
T -périodiques).
Cette valeur efficace porte aussi le nom de moyenne quadratique (puisque c’est la
moyenne du carré de la norme de f ) ; on utilise encore l’abréviation anglaise RMS
(pour root of the mean square) et on la notera indifféremment (en rappelant que z ∗
est le conjugué du complexe z) :
s
T
1
Z
kf k = feff = f (t) f ∗ (t) dt (3.2)
T 0

À cette norme, on associe l’équivalent d’un produit scalaire, défini par la relation :
s
T
1
Z
hf |gi = f (t) g ∗ (t) dt (3.3)
T 0

Il s’agit d’une forme (fonction de E × E → C) sesquilinéaire, c’est-à-dire qu’elle est


linéaire pour la première fonction et antilinéaire pour la seconde ; ainsi, pour tout
nombre complexe λ, hλf |gi = λ hf |gi tandis que hf |λgi = λ∗ hf |gi. De même, on

notera que hf |gi = hg|f i pour tout couple de fonctions (f, g).
D’autre part, hf1 + f2 |gi = hf1 |gi + hf2 |gi, et hf |g1 + g2 i = hf |g1 i + hf |g2 i, de façon
évidente, pour toutes fonctions f , f1 , f2 , g, g1 et g2 .
Enfin, par construction, kf k2 = hf |f i.
2 Caractère orthonormé des fonctions φk : considérons à nouveau les fonctions φk
définies plus haut, φk (t) = exp (jkωt) ; cette famille de fonctions est orthonomée. En
1 T
Z
2
effet, hφk |φl i = exp (j(k − l)ωt) dt ; si k = l, la fonction intégrée vaut 1 et
T 0
Z T  T
exp (j(k − l)ωt)
hφk |φk i = 1 ; sinon, exp (j(k − l)ωt) dt = = 0 d’où on déduit
0 j(k − l)ω 0
hφk |φl i = 0 pour k 6= l.
Cette propriété peut être mise à profit pour expliciter les coefficientsX
ck d’une série de
Fourier. Considérons en effet la série de Fourier (tronquée) f (t) = ck exp (jkωt) ;
k∈I
on remarque immédiatement que hf |φk i = ck et donc que hφk |f i = c∗k : les coefficients
de la décomposition de f sont aussi les (( produits scalaires )) de f avec les vecteurs
de base φk .
C’est exactement la même situation qu’un vecteur r = xex + yey + zez pour lequel
les composantes x, y et z s’identifient aux projections r · ex , r · ey et r · ez .
3 : Analyse de Fourier 53

3.1.4 Approximation d’un signal périodique


2 Approximation d’un signal : considérons une
X fonction F , T -périodique, et cherchons
à quelle condition la série de Fourier f = ck φk en constitue une approximation
k X
satisfaisante, de façon à pouvoir écrire F (t) ≃ f (t) = ck exp (jkωt). On veut pour
k∈I
cela que la différence ∆F = F − f soit (( électriquement )) petite, c’est-à-dire corres-
ponde à un signal transportant peu d’énergie. Nous chercherons donc à minimiser la
grandeur efficace associée k∆F k.
Il ne s’agit en fait que d’une situation mathématiquement
X très ordinaire ; chercher la
convergence éventuelle de la série f (t) = ck exp (jkωt), c’est étudier si la forme
k∈I
k∆F k de l’écart ∆F entre f et son éventuelle limite F tend bien vers zéro.
* +
X X
2
Par définition, k∆F k = F − ck φk F − cl φl soit, en développant ce pro-


k l
duit pseudo-scalaire au moyen
X des propriétés de sesquilinéarité
X citées plus haut, l’ex-
pression k∆F k2 = kF k2 − (ck hφk |F i + c∗k hF |φk i)+ ck c∗l δkl . La dernière somme
k k,l
X X
∗ 2
peut être réécrite ck cl δkl = |ck | ; les deux sommes intermédiaires font appa-
k,l k
raı̂tre les projections Ck = hF |φk i deX
la fonction F étudiée
Xsur la base des φk , et on
2 2
peut encore écrire k∆F k = kF k − ∗ ∗
(ck Ck + ck Ck ) + |ck |2 .
k k

Puisque nous (( soupçonnons )) que les coefficients ck de la meilleure approximation


de F doivent être proches des projections Ck de F sur la base des φkX , calculons aussi
2
la somme des carrés des écarts entre ces deux suites de termes, soit |Ck − ck | ; il
k
2 2 2
X X X X
vient facilement |Ck − ck | = |Ck | + |ck | − (Ck c∗k + c∗k Ck ).
k k k k
X
La comparaison des deux expressions permet d’écrire k∆F k2 = kF k2 − |Ck |2 + ǫ,
k
2
X
|Ck − ck | . Pour un signal F donné, kF k2 et 2
P
où on a posé ǫ = k |Ck | sont fixés ;
k
rendre l’écart minimal, c’est donc rendre ǫ minimal, ce qui est possible en choisissant,
comme on s’y attendait, ck = Ck pour tout k ∈ I ; alors, ǫ = 0.

Approximation d’un signal périodique


X La meilleure approximation d’un signal F , T -périodique, par une série
(tronquée) de Fourier de pulsation ω = 2π/T est obtenue sous la forme :
T
1
X Z
F (t) ≃ ck exp (jkωt) ck = F (t) exp (−jkωt) dt
T 0
k∈I

Si l’approximation est satisfaisante, k∆F k ≪ kF k, et on montrera même dans le cours


de Mathématiques sous quelles conditions k∆F k → 0 lorsque l’intervalle I s’étend de
−∞ à +∞ ; nous retiendrons donc que l’écart entre kF k2 et k |Ck |2 est d’autant
P
plus faible que l’approximation est bonne.
54 Physique, MP, MP*

Théorème de Parseval
X
X
Si ck exp (jkωt) est une bonne approximation d’un signal F , la valeur
k∈I
X
efficace de F est la somme kF k2 = Feff
2
≃ |ck |2 .
k∈I

On peut aisément interpréter ce résultat en remarquant que |ck |2 est la valeur efficace
de l’harmonique k, c’est-à-dire de la fonction ck φk ; ainsi, le théorème de Parseval
s’interprète en termes énergétiques, la puissance transportée par le signal F étant la
somme des puissances transportées par chacun de ses harmoniques.
On peut illustrer ce résultat dans le cas du courant circulant dans une bobine présenté
u0 u1
en 3.1.1 ; on avait alors écrit iL (t) = √ cos (ω0 t + ϕ0 ) + √ cos (ω1 t + ϕ1 ), avec
2R 10R
ω1 = 3ω0 et u1 = u0 /2. La puissancedissipée dans la bobine ne dépend que  de sa
2 u20 2 1 2
résistance, avec P (t) = RiL (t) = cos (ω0 t + ϕ0 ) + cos (ω1 t + ϕ1 ) + f (t),
2R 20
u2
où la fonction f (t) = √0 cos (ω0 t + ϕ0 ) cos (ω1 t + ϕ1 ) est de moyenne nulle.
R 20
La figure 3.4 présente l’allure des deux termes dont la somme forme la puissance P (t) ;
on voit que le passage au carré renforce encore l’importance relative du terme de basse
u20

1
fréquence ; en moyenne, il ne reste que hP i = 1+ , somme des deux termes
4R 20
du théorème de Parseval.
P

ω0
ω1

Figure 3.4 – Puissance dissipée dans une bobine

2 Série trigonométrique : la relation (3.1) permet d’exprimer les coefficients ak et


bk de la série trigonométrique qui réalise la meilleure approximation d’un signal F
donné ; on obtient facilement les relations :

T
a0 1
Z
= F (t)dt
2 T 0 (3.4)
T T
2 2
Z Z
ak = F (t) cos(kωt)dt bk = F (t) sin(kωt)dt
T 0 T 0

On remarque que le facteur 2 dans la définition de a0 permet d’obtenir une expression


unique pour a0 et les ak .
Dans toute la suite, nous admettrons la convergence de la série de Fourier de F vers
la fonction F ; on montrera en Mathématiques que cette convergence est uniforme si
F est continue, et nous écrirons donc :
3 : Analyse de Fourier 55

∞  
a0 X
F (t) = + ak cos(kωt) + bk sin(kωt) (3.5)
2
k=1

3.1.5 Calcul des séries de Fourier


2 Domaine d’intégration : le terme qui figure sous le signe somme des trois relations
Z T
(3.4) est T -périodique ; on peut donc remplacer cette somme par une intégrale
Z τ +T 0

sur n’importe quel intervalle de largeur T , .


τ

2 Parité : considérons un signal pair, c’est-à-dire que F (−t) = F (t). Dans ce cas, les
2 T /2
Z
coefficients bk = F (t) sin(kωt)dt sont des intégrales d’une fonction impaire
T −T /2
sur un domaine symétrique, donc bk = 0. La décomposition de F ne comporte donc
que des fonctions paires, cos(kωt).
2 T /2
Z
De même, un signal impair vérifie F (−t) = −F (t) et ak = F (t) cos(kωt)dt ;
T −T /2
ce sont des intégrales d’une fonction impaire sur un domaine symétrique, donc ak = 0.
La décomposition de F ne comporte donc que des fonctions impaires, sin(kωt), et sa
valeur moyenne a0 est nulle.

Parité et série de Fourier


X La décomposition de Fourier d’un signal de parité donnée ne contient
que des termes de même parité ; ainsi, ak = 0 pour un signal impair et
bk = 0 pour un signal pair, ∀k.

2 Dérivation : dans le cas d’un signal F dérivable, la convergence uniforme de la série


permet la dérivation terme à terme de celle-ci (ce résultat est en fait immédiat si on se
contente d’une approximation de F par une série tronquée, c’est-à-dire par une somme
∞  
a0 X dF
finie) ; si on écrit F (t) = + ak cos(kωt) + bk sin(kωt) , la dérivée F ′ (t) =
2 dt
k=1
′ ∞  
a X
s’écrira donc F ′ (t) = 0 + a′k cos(kωt) + b′k sin(kωt) avec les relations :
2
k=1

a′0 = 0 a′k = kωbk b′k = −kωak (3.6)

2 Intégration : si un signal comporte une partie continue a0 /2, celle-ci s’intègre sous
la forme a0 t/2 + cte, qui n’est pas périodique et ne peut être traitée dans ce cadre.
Dans tout autre cas, la primitive d’une somme de fonctions harmoniques est aussi une
somme de fonctions périodiques, et on peut aussi en proposer une intégration terme
∞  
a0 X
Z
à terme. Ainsi, si F (t) = + ak cos(kωt) + bk sin(kωt) et Φ = F (t)dt, on
2
k=1
∞  
α0 X
aura Φ(t) = + αk cos(kωt) + βk sin(kωt) avec les relations :
2
k=1
56 Physique, MP, MP*

bk ak
αk = − βk = (3.7)
kω kω

On ne peut évidemment pas déterminer α0 , qui joue le rôle de constante d’intégration.


2 Exemple : fonction créneau : il s’agit de la fonction CrT , de période T , impaire,
définie par CrT = 1 si 0 < t < T /2 et CrT = −1 si T /2 < t < T . Elle est représentée
sur la figure 3.5. S’agissant d’une fonction impaire, on peut se contenter de calculer
2 T /2 4 T /2
Z Z
les coefficients bk = CrT (t) sin(kωt)dt soit bk = sin(kωt)dt ou, après
T −T /2 T 0
 
4 kωT
calcul, bk = 1 − cos .
kωT 2
CrT ak
1

k
b b b b b b
−T /2 t
bk
T /2

k
−1 b b
0 1 2 3 4 5

Figure 3.5 – Série de Fourier d’un créneau

Comme on n’oublie pas par ωT = 2π, on peut encore écrire ces coefficients :

4
Créneau impair : b2p = 0 b2p+1 = (3.8)
(2p + 1)π

Le spectre correspondant est tracé sur la figure 3.5 ; on remarque qu’il ne contient que
des termes impairs (c’est-à-dire en sin kωt), eux-mêmes d’ordre impair (b2p = 0). On
notera aussi que la suite des b2p+1 décroı̂t lentement : il faut beaucoup d’harmoniques
pour former une bonne approximation de la fonction créneau. Cette circonstance est
due aux discontinuités de la fonction, qui correspondent à des transitions rapides,
c’est-à-dire à des termes de haute fréquence, qui sont justement des harmoniques de
rang élevé.
Cr′T ak

1
b b
k
−T /2 T /2 t
b b bk

−1 b b b b b b
k
0 1 2 3 4 5

Figure 3.6 – La fonction créneau définie de manière paire


3 : Analyse de Fourier 57

On pourrait éventuellement définir une fonction créneau décalée d’un quart de période,
donc paire ; elle est représentée sur la figure 3.6, avec son spectre en fréquence. Le
décalage fait que la nouvelle série ne contient que des termes pairs (en cos kωt) mais
toujours seulement des harmoniques d’ordre impair.
On peut enfin représenter quelques termes de la série de Fourier de la fonction créneau,
pour montrer qualitativement comment la série converge vers CrT ; les trois premiers
termes (harmoniques 1, 3 et 5) ainsi que leur somme sont représentés sur la figure 3.7.

harmonique 1

harmonique 5
harmonique 3

Figure 3.7 – Premiers harmoniques de la fonction créneau impaire

2 Exemple : fonction triangle (ou dents de scie) : il s’agit de la fonction TrT , de


période T , impaire, définie par TrT = 4t/T si −T /4 < t < T /4 et TrT = 2 − 4t/T si
T /4 < t < 3T /4. Elle est représentée sur la figure 3.8.
TrT ak
1

k
b b b b b b
−T /2 t 0 1 2 3 4 5
b b bk
T /2

b b
k
−1

Figure 3.8 – Série de Fourier d’un triangle

Au lieu de calculer directement sa série de Fourier, nous remarquerons qu’il s’agit


d’une primitive de la fonction créneau, à un simple facteur multiplicatif près ; en ef-
dTrT 4 dTrT 4
fet, = si −T /4 < t < T /4 et = − si T /4 < t < 3T /4. On peut
dt T dt T

dTrT 4 ′ ′
X 4(−1)p+1
donc écrire = CrT (t), où CrT (t) = cos ((2p + 1)ωt). L’inté-
dt T p=1
π(2p + 1)
gration terme à terme, avec une constante d’intégration nulle puisque le triangle est
58 Physique, MP, MP*


X 16(−1)p+1 sin ((2p + 1)ωt)
de moyenne nulle, fournit TrT (t) = ; finalement on
p=1
T π(2p + 1) (2p + 1)ω
obtient les coefficients bk , qui sont d’ailleurs représentés sur la figure 3.8 :

8(−1)p+1
Triangle impair : b2p = 0 b2p+1 = (3.9)
(2p + 1)2 π 2

On remarque bien sûr la décroissance plus rapide des coefficients b2p+1 avec le rang
2p + 1 : le triangle présente des variations beaucoup moins brutales que le créneau.
Il faut donc moins d’harmoniques de haute fréquence pour en réaliser une bonne
approximation ; la convergence rapide de la série de Fourier du triangle est illustrée
sur la figure 3.9.

harmonique 1

harmonique 5
t

harmonique 3

Figure 3.9 – Premiers harmoniques de la fonction triangle impaire

On retiendra impérativement les propriétés suivantes :

Fonctions créneau et triangle


X Les fonctions créneau et triangle ne contiennent que des harmoniques
d’ordre impair k = 2p + 1 ; pour un créneau, le spectre des harmoniques
décroı̂t comme 1/k ; pour un triangle, ce spectre décroı̂t comme 1/k 2 .

2 Autres exemples : le calcul de nombreuses séries de Fourier sera effectué en cours de


Mathématiques ; en principe, ce calcul ne fait pas à proprement parler du programme
de Physique. On peut toutefois souvent utiliser des coefficients de Fourier donnés,
ou calculés au moyen d’un logiciel de calcul formel. Nous donnerons seulement ici,
à titre d’exemple, le spectre de Fourier d’une fonction (( redressée )), définie par la
partie positive d’un terme harmonique, F (t) = max (0 , sin ωt) ; une telle situation
correspond, en électricité, lorsqu’on veut produire une tension continue à partir d’une
alimentation alternative.
On peut alors déterminer les coefficients de Fourier au moyen de la syntaxe Maple
suivante :
> a0:=omega/Pi*int(sin(omega*t),t=0..Pi/omega);
3 : Analyse de Fourier 59

> a:=k->omega/Pi*int(sin(omega*t)*cos(k*omega*t),t=0..Pi/omega);
> b:=k->omega/Pi*int(sin(omega*t)*sin(k*omega*t),t=0..Pi/omega);
On obtient alors les ak au moyen des commandes :
> a0; a(1); a(2); a(3); a(4);
a0 1 2 2
qui fournissent = , a2 = − , a4 = − , les autres termes étant nuls, et :
2 π 3π 15π
> b(1); b(2); b(3); b(4);
1
qui fournissent b1 = , les autres termes étant nuls. Finalement, on peut écrire ce
2
1 1 2 2
signal redressé sous la forme F (t) ≃ f (t) = + sin(ωt)− cos(2ωt)− cos(4ωt) ;
π 2 3π 15π
la convergence de cette série à trois termes seulement est illustré sur la figure 3.10.
F (t) f (t)

t t

Figure 3.10 – Série tronquée d’un signal redressé

3.1.6 Applications des séries de Fourier


2 Opérateurs linéaires : on a vu ci-dessus que de nombreux signaux peuvent être
représentés de manière très satisfaisante au moyen d’un petit nombre d’harmoniques,
c’est-à-dire au moyen d’une série de Fourier tronquée. L’avantage de cette représenta-
tion est évident : lors du passage du signal par un opérateur linéaire, on peut traiter
chaque composante séparément, en notation complexe.

Opérateurs linéaires et série de Fourier


X Un opérateur linéaire de fonction de transfert H(ω) = H(ω) exp (jϕ(ω))

transforme un signal d’entrée xe (t) périodique, de période , de série
ω
a0e X
de Fourier xe (t) = + αke cos(kωt + φke ), en un signal de sortie
2
k

xs (t) périodique, de même période , dont la série de Fourier peut
ω
a0s X
être écrite xs (t) = + αks cos(kωt + φks ), avec α0s = H(0)α0e ,
2
k
αks = H(kω)αke et φks = φke + ϕ(kω).

Il ne faut surtout pas oublier de traiter chaque composante (ak , bk ) avec sa pulsation
ωk = kω, au lieu par exemple de traiter tous les termes comme s’ils avaient la même
pulsation ω que le fondamental !
60 Physique, MP, MP*

2 Grandeurs efficaces : considérons enfinun signal périodique F (t), décomposable


a0 X
en série de Fourier selon F (t) = + ak cos kωt + bk sin kωt ; le théorème de
2
k
X a0 ak − jbk
2
Parseval affirme que la grandeur Feff est égale à |ck |2 avec c0 = , ck =
2 2
k
ak + jbk a2 b2
et c−k = ; on a donc |ck |2 + |c−k |2 = k + k . Finalement, la grandeur
2 2 2
2
efficace Feff peut s’écrire comme la somme quadratique des termes efficaces associés
séparément à chacune des composantes de Fourier de F :

∞  2
b2
 a 2 
0
X a k
2
Feff = + + k (3.10)
2 2 2
k=1

3.2 Transformées de Fourier

3.2.1 Définition
2 Généralités : au contraire de l’étude des séries de Fourier, les notions dévelop-
pées dans ce chapitre ne seront pas traitées en cours de Mathématiques. Nous nous
contenterons donc de justifications qualitatives, dont la formalisation complète relève
de la théorie des distributions de Schwartz‡ et figure en général au programme de
l’enseignement du second cycle universitaire.
Nous considérerons dans tout ce qui suit des fonctions f à valeurs complexes d’une
variable réelle, absolument intégrables sur R, c’est-à-dire telles que l’intégrale impropre
Z +∞
|f (t)| dt converge. Les propriétés présentées ici s’étendent aussi à certaines
t=−∞
distributions, et notamment à la distribution de Dirac‡ , dont nous rappellerons plus
loin les propriétés.
sin x
2 Sinus cardinal : nous définirons la fonction sinus cardinal par sinc(x) = ;
x
cette notation sera utilisée dans toute la suite du cours de Physique, avec le prolon-
gement par continuité sinc(0) = 1.
sinc(u)
1

 

b b sinc = 0, 13
2

b b
−2π 2π b u
b b b b b0 b b b
b b
−π π
b b
 

sinc = −0, 21
2

Figure 3.11 – La fonction sinus cardinal


3 : Analyse de Fourier 61

Le tracé de cette fonction est reporté sur la figure 3.11, avec quelques points re-
marquables Z ; ajoutons aux propriétés qui sont indiqués sur cette figure la valeur des
∞ Z ∞
intégrales sinc(u)du = π et sinc2 (u)du = π.
−∞ −∞
La fonction tracée sur la figure 3.11 présente un maximum principal en u = 0 ; celui-ci
(grisé sur la figure) est souvent caractérisé par sa largeur à la base égale à 2π.

On parle aussi parfois de largeur à mi-hauteur du maximum principal ; elle est ici
assez proche de la demi-largeur à la base du même maximum, donc de π.
Les points indiqués sur la figure 3.11 correspondent aux points de contact de la fonc-
1
tion sinc avec les enveloppes ± ; ils sont immédiatement voisins des maxima secon-
u
daires de la fonction.
2 Transformée de Fourier directe : considérant une fonction quelconque f , non né-
cessairement périodique,√on généralise la définition (3.4) des coefficients de Fourier en
posant (le coefficient 1/ 2π est conventionnel) :
+∞
1
Z
fˆ(ω) = √ f (t) exp(−jωt) dt (3.11)
2π t=−∞

La fonction transformée est aussi une fonction complexe d’une variable réelle, mais
l’unité de mesure de sa variable est changée ; si t se mesure en seconde, ω est une
pulsation en radian par seconde. Ainsi, la transformée de Fourier passe de l’espace
direct (des variables temporelles t) à l’espace réciproque (des pulsations ω).

3.2.2 Propriétés fondamentales


2 Premier exemple : intéressons nous au calcul de la transformée de Fourier d’une
impulsion de faible durée, de valeur élevée, centrée en t = 0, définie (cf. figure 3.12)
1 ∆t
par f (t) = si |t| < , et f (t) = 0 sinon. Cette fonction est construite pour
∆t 2 Z +∞
assurer une aire unité (grisée) sous la courbe f (t) dt = 1.
t=−∞
f fˆ
1
∆t

∆t ω

t
b
0 2∆ω

Figure 3.12 – Impulsion centrée en t = 0 et sa transformée de Fourier


+∆t/2
1
Z
La transformée de Fourier de f est donc fˆ(ω) = √
exp (−jωt) dt, que
∆t 2π −∆t/2
 +∆t/2  
ˆ 1 exp (−jωt) 1 ω∆t
l’on peut écrire f (ω) = √ = √ sinc .
∆t 2π −jω −∆t/2 2π 2
62 Physique, MP, MP*

Sur la figure 3.12, on a représenté à côté de f sa transformée de Fourier, Re(fˆ(ω)), avec



sa demi-largeur à la base ∆ω = ; elle ne dépend que de la durée de l’impulsion.
∆t
Sur le tracé de la fonction fˆ, comme ce sera souvent le cas lors d’études dans l’espace
des pulsations, on voit apparaı̂tre des composantes à pulsation négative. Il ne s’agit
que d’un artifice de calcul, les termes exp (+jωt) et exp (−jωt) n’ayant en général
de sens physique que par leurs parties réelles, qui sont identiques et correspondent
bien à une pulsation positive.

2 Généralisation : considérons maintenant le cas de la figure 3.13, impulsion de


même largeur et de même durée que la précédente, mais décalée en t = t0 .
Z t0 +∆t/2
1
La transformée de Fourier de f est donc fˆ(ω) = √ exp (−jωt) dt, que
 ∆t 2π t0 −∆t/2
1 ω∆t
l’on peut écrire fˆ(ω) = √ exp (−jωt0 ) sinc .
2π 2
Sur la figure 3.13, on a représenté à côté de la fonction
 f la partie réelle de sa trans-
1 ω∆t
formée de Fourier, Re(fˆ(ω)) = √ cos (ωt0 ) sinc ; la partie imaginaire est
2π 2
semblable à un décalage d’un quart de période près.
f fˆ ω0
1 b
∆t

∆t ω

b
t
t0

2∆ω

Figure 3.13 – Impulsion et sa transformée de Fourier

La demi-largeur à la base ∆ω = 2π/∆t de l’enveloppe de fˆ est inchangée par rapport


au cas précédent ; la période ω0 = 2π/t0 de la fonction cos (ωt0 ) est manifestement
accidentelle puisqu’elle ne dépend que du choix de l’origine des instants.
2 Largeurs de f et fˆ : nous retiendrons, comme un résultat général, que les largeurs
à mi-hauteur d’une fonction quelconque f (t) et de sa transformée de Fourier fˆ(ω)
varient en sens inverse l’une de l’autre :

∆t × ∆ω ∼ 2π (3.12)

Étendues dans les espaces direct et réciproque


X Une fonction f (t) de courte durée a une transformée de Fourier fˆ qui
s’étend sur un grand domaine de fréquences ; à la limite, une impulsion
instantanée contient toutes les fréquences de 0 à +∞.
Réciproquement, une fonction de longue durée présente forcément une
certaine périodicité, et son spectre de fréquences est limité à un petit
intervalle.
3 : Analyse de Fourier 63

2 Théorème de Parseval : pour donner une interprétation énergétique à une fonction


f (t) quelconque, on calculera en électricité la puissance |f (t)|2 associée et l’énergie
Z +∞
transportée prend donc la forme |f (t)|2 dt. Dans le cas de l’impulsion décrite
t=−∞
Z +∞
1
plus haut, on obtient immédiatement |f (t)|2 dt = .
∆t
Z +∞ t=−∞ Z +∞  
1 ω∆t
Calculons l’intégrale analogue |fˆ(ω)|2 dω = sinc2 dω soit,
ω=−∞ 2π ω=−∞ 2
Z +∞ Z +∞
ω∆t 1
en notant u = , |fˆ(ω)|2 dω = sinc2 (u) du. On remarque donc
2 ω=−∞ ∆tπ u=−∞
Z +∞ Z +∞
la relation |f (t)|2 dt = |fˆ(ω)|2 dω dont on admet la généralisation :
t=−∞ ω=−∞

Théorème de Parseval
X Une fonction f (t) et sa transformée de Fourier fˆ vérifient le théorème
Z +∞ Z +∞
de Parseval, |f (t)|2 dt = |fˆ(ω)|2 dω : l’énergie totale trans-
t=−∞ ω=−∞
portée par le signal f est la somme des énergies transportées par chacune
des fréquences qui le composent.

3.2.3 Inversion de la transformée de Fourier


2 Distribution de Dirac : l’impulsion de courte durée définie ci-dessus admet, au
sens des distributions, une limite quand ∆t → 0 : la distribution de Dirac‡ . Pour
compléter les propriétés déjà affirmées à son sujet, remarquons d’abord que l’impulsion
f représentée en 3.13 n’est pas centrée à l’instant 0 mais à l’instant t0 ; sa limite quand
∆t → 0 est donc la distribution t → δ(t − t0 ), décalée dans le temps. Z ∞
Soit aussi une fonction g quelconque. Le calcul de l’intégrale I = g(t) f (t) dt se
−∞
Z t0 +∆t/2
1
ramène à l’expression I = g(t)dt, c’est-à-dire à la valeur moyenne gm (t0 )
∆t t0 −∆t/2
sur un intervalle de largeur ∆t centré en t0 . Lorsque la largeur de cet intervalle tend
vers 0, on a bien sûr gm (t0 ) → g(t0 ), ce qui permet d’écrire la propriété fondamentale
qui définit la distribution de Dirac :

Distribution de Dirac
X Pour toute Z ∞fonction g, la distribution de Dirac est l’objet qui assure
l’égalité g(t)δ(t − t0 )dt = g(t0 ).
−∞

Z ∞
Avec g(t) = 1 et t0 = 0 on retrouve bien sûr la propriété déjà énoncée, δ(t)dt = 1.
−∞

2 Transformée de Fourier de la distribution de Dirac : considérons


 maintenant la
ˆ 1 ω∆t
limite de la fonction f (ω) = √ exp (−jωt0 ) sinc lorsque ∆t → 0, donc
  2π 2
ω∆t 1
sinc → 1 ; on trouve alors fˆ → √ exp (−jωt0 ). La transformée de Fourier
2 2π
de la distribution de Dirac (impulsion de durée nulle) est une exponentielle (de module
1 quelle que soit la pulsation ω, donc s’étendant sur toutes les fréquences) :
64 Physique, MP, MP*

1
f (t) = δ(t − t0 ) ⇒ fˆ(ω) = √ exp (−jωt0 ) (3.13)

En particulier, la transformée de Fourier de la distribution de Dirac δ(t) est la fonction,


1
constante δ̂ = √ .

K
2 Sinus cardinal et distribution de Dirac : étudions les fonctions fK (t) = sinc(Kt).
π
Par construction, fK prend des valeurs faibles dès que |Kt| ≫ π, et prend la valeur
Z +∞
K
pour t = 0 ; de plus, on a toujours fK (t) dt = 1.
π t=−∞
Si on fait tendre K vers l’infini, la suite de fonctions fK (t) tend donc vers une fonction
nulle pour tout t 6= 0, infinie en t = 0 et d’intégrale égale à 1 sur R : on reconnaı̂t la
distribution de Dirac et on écrira :
K
lim sinc(Kt) = δ(t) (3.14)
K→∞ π

2 Transformée inverse : définissons, par analogie avec la transformée de Fourier


directe (3.11), la transformée de Fourier inverse d’une fonction de la pulsation g(ω),
permettant de repasser de l’espace réciproque (espace des pulsations) à l’espace direct
(temporel) :
+∞
1
Z
ǧ(t) = √ g(ω) exp(+jωt) dω (3.15)
2π ω=−∞

On peut noter dans (3.15) le changement de signe dans l’exponentielle par rapport
à (3.11) ; on peut aussi relire cette définition en notant que ǧ est une combinaison
1
linéaire de termes harmoniques exp(+jωt), avec une amplitude √ g(ω) pour la

composante de pulsation ω.
2 Lien avec la transformée directe : considérons enfin le cas où g(ω) = fˆ(t) est
ˇˆ
elle-même une transformée
Z +∞ Z de Fourier directe. On peut  alors écrire la ǧ = f sous la
+∞
1
forme ǧ(t) = f (t′ ) exp(−jωt′ ) dt′ exp(jωt) dω ou, en admettant
2π ω=−∞ t′ =−∞
Z +∞ Z +∞ 
1 ′
l’interversion des sommes, ǧ(t) = f (t ) exp (jω(t − t )) dω dt′ .

2π t′ =−∞ ω=−∞
Z K
Puisque hK (t − t′ ) = exp (jω(t − t′ )) dω = 2Ksinc(K(t − t′ )) l’intégrale en ω est
−K
lim h∞ (t − t′ ) = 2πδ(t − t′ ), compte tenu de (3.14).
K→∞
Z +∞
Revenant au calcul précédent, ǧ(t) = f (t′ )δ(t − t′ ) dt′ = f (t). On montre ainsi
t′ =−∞
que la combinaison de deux transformées de Fourier successives, directe et inverse,
ramène à la fonction de départ :
TF directe TF inverse
f (t) −→ fˆ(ω) = g(ω) g(ω) −→ ǧ(t) = f (t)
(3.16)
TF inverse TF directe
g(ω) −→ ǧ(t) = f (t) f (t) −→ fˆ(ω) = g(ω)
3 : Analyse de Fourier 65

Comme on l’a noté en (3.16), le résultat est évidemment le même quel que soit l’ordre
des transformations.
Ainsi, on peut passer de l’espace direct (temporel) à l’espace inverse (fréquentiel) et
réciproquement, ce qui justifie enfin pleinement l’emploi des notations complexes pour
d
les dérivations et vice-versa ⇋ jω, quelle que soit la forme du signal étudié.
dt

3.2.4 Réponse impulsionnelle d’un système linéaire


2 Réponse impulsionnelle : nous étudions ici un système linéaire qui transforme
une grandeur d’entrée xe (t) en une grandeur de sortie xs (t). On peut bien sûr en
x
faire l’étude par l’intermédiaire de la fonction de transfert complexe H(ω) = s ;
xe
en pratique, cela revient à faire une série de mesures pour de nombreuses valeurs de
ω judicieusement choisies. Nous allons montrer qu’une mesure unique peut suffire à
caractériser complètement le système linéaire.
Lorsque xe = aδ(t), c’est-à-dire lorsqu’on impose à l’entrée du système une impulsion
a
de très courte durée ∆t, et de grande amplitude x0 = à l’instant t = 0, la sortie
∆t
du système prend le nom de réponse impulsionnelle et on la notera axis (t). C’est cette
réponse impulsionnelle qui contient toute l’information recherchée : elle permet de
déterminer la fonction de transfert H(ω) et donc aussi la réponse xs (t) à une entrée
xe (t) quelconque.
2 Décomposition en impulsions : pour montrer ce résultat, décomposons un signal
d’entrée quelconque xe (t) en une somme d’impulsions successives. Cette décomposi-
tion peut être illustrée qualitativement sur la figure 3.14. Cette décomposition corres-
Z +∞
pond à l’écriture xe (t) = xe (t′ )δ(t − t′ ) dt′ : à l’instant t′ on doit prendre en
t′ =−∞
compte une impulsion de hauteur xe (t′ ) ; c’est le terme xe (t′ )δ(t − t′ )dt′ de la somme.
xe

xe (t)

b
t
t′

Figure 3.14 – Décomposition en impulsions d’un signal quelconque

On a vu que, à l’entrée impulsionnelle xe (t′ )δ(t − t′ )dt′ correspond la sortie impul-


sionnelle xe (t′ )xis (t − t′ )dt′ ; compte tenu du caractère linéaire du système étudié,
la sortieZdu montage est donc une somme de réponses impulsionnelles, qu’on écrira
+∞
xs (t) = xe (t′ )xis (t − t′ ) dt′ .
t′ =−∞
Il est donc possible de déterminer xs (t) par le calcul de cette intégrale, qui porte le
nom d’intégrale de convolution (ou produit de convolution) des fonctions xe et xis ,
avec la notation générale xs = xe ∗ xis .
66 Physique, MP, MP*

2 Lien avec la fonction de transfert : le calcul effectif des intégrales de convolution


est possible, mais le passage par les transformées de fourier rend le résultat beaucoup
plus explicite. Nous voulons représenter Z +∞le signal de sortie comme une somme de
1
grandeurs sinusoı̈dales, xs (t) = √ x̂s (ω) exp (jωt) dω ; on reconnaı̂t bien
2π ω=−∞
x̂s (ω)
sûr ici xs (ω) = √ , amplitude complexe de la composante de pulsation ω.

Il reste à déterminer la transformée de Fourier x̂s , qu’on écrit en combinant la dé-
finition de la transformée
Z +∞ de ZFourier directe et l’intégrale de convolution ci-dessus,
+∞ 
1 ′ i ′ ′
selon x̂s (ω) = √ xe (t )xs (t − t ) dt exp (−jωt) dt ou, au moyen
2π t=−∞ t′ =−∞
d’une permutationZ +∞ des sommes et en introduisant
Z +∞ un facteur multiplicatif adéquat,

1 ′ ′ i
x̂s (ω) = √ xe (t ) exp (−jωt ) xs (t − t′ ) exp (−jω(t − t′ )) dt dt′ .
2π t′ =−∞ t=−∞
À un changement de variables près, l’intégrale sur t définit la transformée de Fourier
Z +∞
directe de xis , et x̂s (ω) = x̂is (ω) xe (t′ ) exp (−jωt′ ) dt′ . Enfin, en changeant de
t′ =−∞
notation
√ t′ → t, on reconnaı̂t
√ la transformée de Fourier du signal d’entrée xe au facteur
2π près et x̂s (ω) = 2πx̂is (ω)x̂e (ω).
x̂e (ω)
Finalement, on note aussi xe (ω) = √ l’amplitude complexe de la composante de

pulsation ω du signal d’entrée, pour obtenir :

xs √
H(ω) = = 2π × x̂is (3.17)
xe

La fonction de transfert H(ω) est proportionnelle à la transformée de Fourier de la


réponse impulsionnelle. Nous n’utiliserons ce résultat que dans une optique qualita-
tive :

Réponse impulsionnelle et fonction de transfert


X Une réponse impulsionnelle de longue durée correspond à une fonction
de transfert de faible largeur (avec donc un pic étroit et un facteur de
qualité élevé) ; réciproquement, un régime transitoire bref correspond à
une fonction de transfert de faible facteur de qualité, donc à un amortis-
sement élevé.

Cette propriété générale est parfaitement illustrée dans le cas d’une fonction de trans-
fert d’ordre 2 ; considérons par exemple un filtre passe-bas, de fonction de transfert
H0
normalisée H(ω) = . L’équation différentielle correspondante est donc,
jω ω2
1+ − 2
Qω0 ω0
d 1 d2 xs 1 dxs
compte tenu du passage automatique ⇋ jω, 2 + + xs = H0 xe .
dt ω0 dt2 Qω0 dt
La forme générale de la solution de régime permanent est un régime transitoire apé-
riodique, critique ou pseudo-périodique selon les valeurs de Q relativement à la valeur
critique Qc = 2.
On a vu que pour Q ≫ Qc , le régime transitoire est pseudo-périodique, donc de grande
durée et de pseudo-pulsation ω ≃ ω0 ; la fonction de transfert présente alors un pic
étroit centré sur ωr ≃ ω0 .
3 : Analyse de Fourier 67

Réciproquement, pour Q ≪ Qc , le régime transitoire est apériodique, de courte durée ;


la fonction de transfert présente alors une grande largeur dans l’espace des pulsations.
On peut proposer (cf. figure 3.15) le principe d’une mesure de fonction de transfert
effectuée par ce moyen sur un système linéaire.

Générateur Système linéaire Oscilloscope et


d’impulsions H(ω) module de calcul

Figure 3.15 – Principe de détermination de H par une mesure impulsionnelle

Dans ce schéma, un oscilloscope permet de représenter simultanément, dans l’espace


temporel, les grandeurs xe (t) (impulsion imposée à l’entrée du système linéaire) et
xs (t) (signal de sortie, ici pseudo-périodique amorti). Ces deux tracés sont proposés
sur la figure 3.16.
Un module de calcul (transformée de Fourier rapide ou FFT, fast Fourier transform),
aujourd’hui associé à de nombreux oscilloscopes, permet de tracer l’allure de la trans-
formée de Fourier de ce signal de sortie (ici, on reconnaı̂t un filtre passe-bande).

xe (t)

xs (t)

Tracés temporels Résultat de la FFT

Figure 3.16 – Signaux d’entrée et de sortie dans une mesure impulsionnelle

Contrairement au tracé simple de la figure 3.16, les oscilloscopes utilisent en général


un tracé logarithmique pour l’amplitude H = |H|, en ordonnée, et une graduation
en fréquence f = ω/2π pour l’abscisse. L’allure de la FFT tracée est alors bien sûr
légèrement modifiée.
68 Physique, MP, MP*

Ce qu’il faut absolument savoir

Tout signal de période T = 2π/ω peut être décomposé en série de Fourier,


∞ 
2 T

a0 X Z
f (t) = + ak cos kωt + bk sin kωt , où ak = f (t) cos kωtdt et
2 T 0
k=1
2 T
Z
bk = f (t) sin kωtdt.
T 0

2 a20 X a2k + b2k
La valeur efficace d’un signal périodique est feff = + .
4 2
k=1

Si le signal f (t) est appliqué à l’entrée un système linéaire de fonction de trans-


fert H(ω) = H(ω) exp (jϕ(ω)), le signal de sortie est obtenu sous la forme
∞  
a0 X  
H(0) + H(kω) ak cos kωt + ϕ(kω) + bk sin kωt + ϕ(kω) .
2
k=1

Un signal créneau périodique ne contient que des harmoniques d’ordre k impair ;


leur amplitude décroı̂t comme 1/k.
Un signal triangle (ou dents de scie) périodique ne contient que des harmoniques
d’ordre k impair ; leur amplitude décroı̂t comme 1/k 2 .
On passe du calcul en régime harmonique (fonction de transfert H) au régime
d
quelconque (équation différentielle) en remplaçant partout jω par .
dt
Un système linéaire est stable si les pôles ωi , annulateurs du dénominateur de
la fonction de transfert H(ω), ont tous une partie imaginaire Im(ωi ) > 0.
Z +∞
ˆ 1
La transformée de Fourier de f (t) est f (ω) = √ f (t) exp (−jωt) dt ;
Z +∞2π t=−∞
1
on retrouve f à partir de fˆ par f (t) = √ fˆ(ω) exp (jωt) dω.
2π ω=−∞
Les largeurs de f et fˆ varient en sens inverse : ∆t × ∆ω ∼ 2π. En particulier,
la transformée de Fourier d’une impulsion de largeur ∆t est proportionnelle à
ω∆t
la fonction sinc .
2
La réponse d’un système linéaire à une impulsion (régime transitoire impul-
sionnel) et la fonction de transfert ont des largeurs inverses l’une de l’autre.
Chapitre 4

Lignes électriques et propagation d’ondes

4.1 Lignes électriques

4.1.1 Modélisation d’une ligne bifilaire


2 Ligne bifilaire : on appelle ainsi une ligne électrique constituée de deux conducteurs
électriques, de grande longueur. Elle peut être constituée de deux fils (câble plat, câble
coaxial), ou bien d’un seul fil avec un retour du courant par le sol. Dans tous les cas,
on sera amené à se poser le problème de la propagation des signaux électriques le
long de la ligne dès que sa longueur totale L ne vérifie pas les conditions d’A.R.Q.P.,

c’est-à-dire si L & c0 τ , avec pour durée caractéristique τ = , où c0 est la célérité de
ω
propagation des ondes élecromagnétiques et ω la pulsation des signaux dans la ligne.
Nous ne pourrons donc pas appliquer les lois de Kirchhoff à la ligne toute entière, mais
seulement à un élément de longueur dx de ligne, que l’on pourra choisir arbitrairement
court.
2 Résistivité, conductivité : considérons donc un brin de fil, assimilé à un conducteur
cylindrique de longueur ℓ et de section droite s. On sait que la résistance électrique de
deux éléments identiques, placés en série, est Req = 2R : lorsque la longueur double,
la résistance double. Plus généralement, la résistance électrique est proportionnelle à
la longueur du conducteur.
De même, l’association en parallèle de deux conducteurs identiques conduit à une
R
résistance équivalente Req = : ainsi, lorsque la section du fil double, la résistance
2
est divisée par deux. Plus généralement, la résistance électrique est inversement pro-
portionnelle à la section du conducteur.
Nous regrouperons ces deux résultats sous la forme :

1 ℓ 1ℓ
R= =̺ = (4.1)
G s γs

Le coefficient ̺, qui ne dépend que de la nature du conducteur (et de sa température)


porte le nom de résistivité du conducteur ; son inverse γ porte le nom de conductivité.

La tableau 4.1 indique la conductivité de divers métaux à la température ambiante.


On notera que, pour un câble de cuivre de 1 mm2 de section, la résistance unitaire
1
(résistance par unité de longueur) a pour valeur Ru = = 1, 7 Ω · m−1 .
γs
70 Physique, MP, MP*

cuivre argent aluminium


γ 5, 97 × 107 6, 30 × 107 3, 77 × 106 S · m−1

Table 4.1 – Conductivité électrique des métaux

2 Caractéristiques de ligne : considérons un élément de ligne bifilaire de longueur dx ;


on supposera par exemple qu’elle est formée d’un fil (de résistance unitaire Ru ) avec
retour du courant par le sol ; cet élément de longueur a une résistance dR = Ru dx.
D’autre part, l’influence électromagnétique entre le fil et le sol se traduit par la création
d’un champ électrique et d’un champ magnétique.
La création du champ E s’accompagne d’une accumulation de charges électriques sur
les faces en regard des deux conducteurs : c’est un effet capacitif.
Considérons deux brins de ligne de longueur ℓ, leur association, de longueur 2ℓ, peut
être traitée comme la mise en parallèle des deux condensateurs. Puisque deux conden-
sateurs en parallèle ont des capacités qui s’ajoutent, la capacité de ligne est propor-
tionnelle à la longueur considérée.
Pour une longueur élémentaire dx, on écrira donc dC = Cu dx, où Cu est la capacité
unitaire de ligne (appelée aussi capacité par unité de longueur). Nous montrerons ul-
térieurement que les capacités unitaires de ligne sont en général de l’ordre de grandeur
de la constante ε0 = 8, 85 × 10−12 F · m−1 .
La création du champ B s’accompagne d’une force électro-motrice induite par les
variations du courant : c’est un effet inductif.
Considérons encore deux brins de ligne de longueur ℓ, leur résultante, de longueur 2ℓ,
peut être traitée comme la mise en série des deux bobines d’induction équivalentes.
Puisque deux bobines en série ont des inductances propres qui s’ajoutent, l’inductance
de ligne est proportionnelle à la longueur considérée.
Pour une longueur élémentaire dx, on écrira donc dL = Lu dx, où Lu est l’inductance
unitaire de ligne. Nous montrerons ultérieurement que les inductances unitaires de
ligne sont en général de l’ordre de grandeur de la constante µ0 = 4π × 10−7 H · m−1 .
Enfin, le milieu isolant qui sépare les deux fils de la ligne peut présenter des fuites
électriques ; l’association de deux brins de fil étant une association en parallèle, la
conductance de fuite est encore proportionnelle à la longueur de l’élément considéré,
et on notera dG = Gu dx, où Gu est la conductance unitaire de fuite.
Finalement, le schéma électrique électrique équivalent à un élément infinitésimal de
ligne bifilaire est représenté, à une date t quelconque, sur le schéma 4.1.

i(x, t) dL = Lu dx i(x + dx, t)


b b b b b
b

dG = Gu dx
dC = Cu dx

dR = Ru dx
u(x, t) u(x + dx, t)

b b
b

Figure 4.1 – Schéma d’un élément de ligne

2 Lignes idéales : nous traiterons essentiellement dans la suite des lignes idéales,
dans lesquelles on peut négliger les effets résistifs : Ru = 0 (pas de résistance des fils
de la ligne) et Gu = 0 (ou, ce qui revient au même, 1/Gu → ∞ : la résistance de fuite
à travers l’isolant qui sépare les deux fils est infinie ; il s’agit d’un isolant parfait).
4 : Lignes électriques et propagation d’ondes 71

En ce qui concerne Ru , on peut évaluer les conditions de validité de cette approxi-


mation en affirmant qu’on peut négliger la partie résistive de l’impédance dR + jdLω
devant la partie inductive dès lors que Ru ≪ Lu ω soit, avec les valeurs proposées plus
ω
haut, pour f = ≫ 200 kHz : cette approximation n’étant pas pleinement satisfai-

sante, nous reviendrons ultérieurement sur l’effet de Ru ; par contre, nous admettrons
que l’approximation Gu = 0 est toujours raisonnable.
Dans ce cas, la ligne est entièrement caractérisée par les grandeurs Lu et Cu . Une
analyse dimensionnelle montre qu’on peut déduire de Lu et Cu deux caractéristiques
essentielles de la propagation des signaux électriques le long de la ligne.
Lu L jLω
Écrivons d’abord = = = ZL ZC ; cette grandeur est donc le carré d’une
Cu C jCω
résistance, que l’on nomme impédance caractéristique de ligne, et qu’on notera Zc :

r
Lu
Zc = (4.2)
Cu

Avec les valeurs proposées plus haut, Zc ∼ 300 Ω ; en général, les impédances des
lignes bifilaires valent quelques dizaines à quelques centaines d’ohm.
[LC]
De même, l’analyse dimensionnelle du produit Lu Cu montre [Lu Cu ] = où d est
[d2 ]
une distance ; faisant intervenir la pulsation ω0 de résonance d’un circuit L, C, on
1
obtient [Lu Cu ] = 2 ; ce produit est donc l’inverse du carré d’une vitesse en on
[dω0 ]
définira une célérité caractéristique de ligne c :

1
c= √ (4.3)
Lu Cu

Avec les valeurs proposées plus haut, c ∼ 3, 0 × 108 m · s−1 ; nous montrerons ultérieu-
rement que la célérité caractéristique d’une ligne vérifie toujours c 6 c0 , où c0 est la
c0
célérité des ondes électromagnétiques dans le vide. On posera éventuellement c = ,
n
où n > 1 porte le nom d’indice pour la ligne étudiée.

4.1.2 Équations des télégraphistes

L’élément de longueur dx de ligne représenté sur la figure 4.1 étant de dimension


arbitrairement faible, les conditions d’A.R.Q.P. s’appliquent localement et on peut
utiliser les lois des nœuds et des mailles ; on les développera au premier ordre en dx.
∂i(x, t)
2 Loi des mailles : elle s’écrit u(x, t) = u(x + dx, t) + dRi(x, t) + dL avec,
∂t
∂u(x, t)
au premier ordre en dx, u(x + dx, t) = u(x, t) + dx. On en déduit la première
∂x
équation des télégraphistes :

∂u(x, t) ∂i(x, t)
= −Ru i(x, t) − Lu (4.4)
∂x ∂t
72 Physique, MP, MP*

∂u(x + dx, t)
2 Loi des nœuds : i(x, t) = i(x + dx, t) + dGu(x + dx, t) + dC devient,
∂t
∂i(x, t) ∂u(x + dx, t)
au même ordre, = −Gu u(x + dx, t) − Cu ; toutefois, les deux
∂x ∂t
∂u(x, t)
termes en u(x + dx, t) = u(x, t) + dx doivent, à cet ordre du développement,
∂x
être remplacés par u(x, t). On en déduit la seconde équation des télégraphistes :

∂i(x, t) ∂u(x, t)
= −Gu u(x, t) − Cu (4.5)
∂x ∂t

2 Équation de propagation : la combinaison des deux équations des télégraphistes


mène à une équation de propagation ; pour l’établir, nous utiliserons les notations
simplifiées u et i au lieu de u(x, t) et i(x, t).
L’équation (4.4) traduit la chute de tension (résistive et inductive) sur une longueur
dx ; de même, (4.5) traduit la perte de courant (conductive et capacitive) sur la même
longueur. Il s’agit d’un système d’équations aux dérivées partielles couplées pour les
deux fonctions inconnues u(x, t) et i(x, t).
Le principe du découplage des équations est le même pour toute étude de propagation
d’ondes ; on cherche par exemple à éliminer i(x, t) en dérivant la première équation
par rapport au temps, et la seconde par rapport à x, pour faire apparaı̂tre les dérivées
∂2u ∂2u
secondes 2
et 2 de la fonction qu’on cherche à conserver. On obtient dans (4.4),
∂x ∂t
∂2u ∂2i ∂2u ∂2i
 
∂i ∂u
2
= −R u − L u ou 2
= R u G u u + Cu − Lu ; de même, dans
∂x ∂x ∂x∂t ∂x ∂t ∂x∂t
∂2i ∂u ∂2u
(4.5), = −Gu − Cu 2 . Sachant qu’on peut intervertir l’ordre de deux
∂t∂x ∂t ∂t
dérivés partielles par rapport aux deux variables indépendantes x et t, on obtient
enfin l’équation de propagation des télégraphistes :

∂2u ∂2u ∂u
= Lu Cu + Ru Gu u + (Ru Cu + Gu Lu ) (4.6)
∂x2 ∂t2 ∂t

Cette équation se simplifie pour une ligne idéale (Ru = 0, Gu = 0) et prend alors la
forme (4.7), qui montre l’importance de la grandeur c définie plus haut :

∂2u 1 ∂2u 1
2
= 2 2 c= √ (4.7)
∂x c ∂t Lu Cu

Il s’agit de ce qu’on appelle l’équation de d’Alembert ; son importance en Physique, et


son intervention dans de nombreux domaines autres que l’Électrocinétique, justifient
qu’on en fasse une étude générale.

La même méthode s’applique si on souhaite déterminer une équation différentielle


vérifiée par le courant i(x, t) ; l’équation obtenue a d’ailleurs la même forme. Toute-
fois, résoudre séparément pour u(x, t) et i(x, t) n’est en général pas souhaitable car
ces grandeurs ne sont pas indépendantes ; par exemple, une fois connue la solution
u(x, t), on en déduira immédiatement i(x, t) par la relation (4.5), à une constante
d’intégration près.
4 : Lignes électriques et propagation d’ondes 73

4.2 Étude générale de l’équation de d’Alembert

4.2.1 Ondes planes


2 L’équation de d’Alembert : nous généralisons l’équation différentielle obtenue, en
l’absence de tout terme résistif, pour la tension u(x, t) comme pour le courant i(x, t)
dans une ligne idéale, sous le nom d’équation de d’Alembert‡ à une dimension pour
la fonction inconnue f (x, t) :

∂ 2 f (x, t) 1 ∂ 2 f (x, t)
= (4.8)
∂x2 c2 ∂t2

Dans une telle équation, la grandeur c a forcément la dimension d’une vitesse.


Nous verrons ultérieurement que l’équation de d’Alembert peut être généralisée aux
problèmes à trois dimensions ; elle prend alors la forme :

1 ∂ 2 f (r, t) ∂ 2 f (r, t) ∂ 2 f (r, t) ∂ 2 f (r, t)


∆f (r, t) = ∆f (r, t) = + + (4.9)
c2 ∂t2 ∂x2 ∂y 2 ∂z 2

L’opérateur différentiel du second ordre ∆ porte le nom de laplacien ou opérateur de


Laplace‡ .
Dans la suite de ce chapitre, nous ne traiterons que d’ondes à une dimension ; on
parle aussi d’ondes planes (parfois notées OP), c’est-à-dire de grandeurs f (x, t) qui
ne dépendent que d’une seule variable cartésienne x. Ainsi, la grandeur physique
f (x, t) est une constante, à une date t donnée, dans tout plan x = cte, qui porte alors
le nom de plan d’onde.
2 Ondes planes : la solution d’une équation de d’Alembert à une dimension peut
être déterminée au moyen du changement de variables (x, t) → (α = x−ct, β = x+ct).
∂f ∂f ∂α ∂f ∂β
On réalise le changement de variables au moyen des relations = +
∂x ∂α ∂x ∂β ∂x
∂f ∂f ∂f ∂f ∂f ∂α ∂f ∂β ∂f ∂f
donc = + , = + = −c +c ; le même procédé
∂x ∂α ∂β ∂t ∂α ∂t ∂β ∂t ∂α ∂β
∂2f ∂2f ∂2f ∂2f
appliqué encore une fois fournit les dérivées secondes = + + 2 et
∂x2 ∂α2 ∂β 2 ∂α∂β
2 2 2 2
∂ f ∂ f ∂ f ∂ f
= c2 2 + c2 2 − 2c2 .
∂t2 ∂α ∂β ∂α∂β
∂2f
L’équation de d’Alembert prend alors la forme particulièrement simple = 0;
∂α∂β
∂f
on en déduit que ne dépend pas de α ; c’est donc une certaine fonction h(β).
∂β
∂f
L’intégration de l’équation différentielle = h(β) mène à f (α, β) = H(β) + K(α),
∂β
où H est une primitive de h. La constante d’intégration K(α) ne dépend pas de β ;
toutefois, l’intégration ci-dessus a été faite à α fixé mais rien n’interdit, si on reprend le
même calcul pour une autre valeur de α, de trouver une autre constante d’intégration.
Celle-ci donc été notée K(α), et c’est une fonction de α.
La symétrie du résultat f (α, β) = H(β) + K(α) était prévisible ; si on était parti
∂2f
de l’équation sous la forme = 0 en intervertissant l’ordre des intégrations, on
∂β∂α
obtiendrait le même résultat, les fonctions H et K étant indépendantes et arbitraires.
74 Physique, MP, MP*

Structure des ondes planes


X Toute onde plane, c’est-à-dire toute fonction f (x, t) solution de l’équation
∂ 2 f (x, t) 1 ∂ 2 f (x, t)
de d’Alembert 2
= 2 , s’écrit comme la somme de deux
∂x c ∂t2
ondes planes progressives, c’est-à-dire deux fonctions qui ne dépendent
respectivement que de x − ct et x + ct, f (x, t) = f+ (x − ct) + f− (x + ct).

2 Ondes planes progressives : on donne ce nom aux grandeurs qui ne dépendent que
de la variable x ± ct ; nous considérerons ici la fonction f+ (x − ct) puisqu’on obtient
la même interprétation pour f− (x + ct) en changeant le signe de c.
S’agissant d’une fonction quelconque, sa forme ne peut pas être déterminée a priori ;
toutefois, on peut en donner une interprétation graphique en supposant une forme
de fonction quelconque. Puisqu’elle dépend de deux paramètres, nous choisirons de la
représenter par des (( photographies )) successives, à trois instants t < t′ < t′′ , comme
sur la figure 4.2.
f+
à t à t′ à t′′

x
x0 x′0 x′′0

Figure 4.2 – Onde plane progressive

La fonction retrouve en x′0 et à l’instant t′ , la même valeur qu’elle avait à l’instant t


x′ − x0
en x0 si x0 − ct = x′0 − ct′ , ce qu’on peut encore écrire 0′ = c : on reconnaı̂t ici
t −t
la définition d’une vitesse constante ; ainsi, la forme de la grandeur f se propage sans
déformation le long de l’axe (Ox), à la vitesse c.

Cette absence de déformation est liée, dans le cas de la ligne électrique bifilaire, au
caractère idéal de celle-ci (Ru = 0, Gu = 0). En présence de termes dissipatifs, on
peut continuer à voir des phénomènes de propagation, mais avec une atténuation
progressive de l’amplitude de l’onde.
On caractérise au moyen de l’adjectif progressif chacune des deux composantes f+ et
f− de l’onde plane, en précisant dans quel sens cette progression a lieu :

Onde plane progressive


X Une fonction quelconque f+ (x − ct) (ou, respectivement, f− (x + ct))
décrit une grandeur qui se propage sans déformation le long de l’axe
(Ox) à la vitesse +c (respectivement, à la vitesse −c).
On parle alors d’ondes planes progressives (notation OPP), se propa-
geant dans le sens de l’axe (Ox) pour la première f+ (x − ct), et dans le
sens inverse pour la seconde f− (x + ct).
4 : Lignes électriques et propagation d’ondes 75

4.2.2 Ondes harmoniques


2 Ondes planes progressives harmoniques : considérons une onde plane progressive
dans le sens de l’axe (Ox) à la célérité c, c’est-à-dire une fonction quelconque de la
variable x − ct ou, ce qui revient au même, de la variable t − x/c. Si cette fonction
est périodique, elle peut être développée
Z +∞ en série de Fourier, et sinon en intégrale de
1 h x i
Fourier selon F+ (t − x/c) = √ F̌ (ω) exp jω t − dω.
2π ω=−∞ c
On retrouve ici encore des composantes qui semblent être de pulsation négative.
Comme on l’a déjà fait remarquer, il ne s’agit que d’un artefact de calcul, par
exemple pour représenter une fonction sinusoı̈dale sous forme complexe, comme
x 1 x x
dans cos ω t − = exp jω t − + exp −jω t − .
c 2 c c
Chacun des termes de cette somme est une onde plane progressive, fonction harmo-
nique (on dit aussi sinusoı̈dale ou, pour emprunter un vocabulaire d’origine optique,
monochromatique) ; on adoptera parfois les notations OPPH, OPPS ou OPPM :
h  x i
A± (x, t) = a exp jω t ∓ (4.10)
c

Dans (4.10), la grandeur a = a0 exp (jϕ) avec a0 > 0 est l’amplitude complexe de
l’onde, a0 son amplitude réelle et ϕ sa phase à l’origine. Les deux signes ± corres-
pondent bien sûr aux deux sens possibles de propagation.
Une telle onde est une fonction sinusoı̈dale du temps, de pulsation ω, de fréquence
ω 1 2π
ν= , de période T = = .
2π ν ω
On peut aussi choisir d’écrire cette même ondehsous des formes équivalentes, en modi-
x i
fiant l’écriture de l’exponentielle complexe exp jω t − qui décrit la propagation,
c
par exemple pour l’onde progressive :
  
t x
exp [j (ωt − kx)] = exp [j2π (νt − σx)] = exp j2π − (4.11)
T λ

ω
Puisque ω est la pulsation, le coefficient k = porte le nom de pulsation spatiale
c
k
ou vecteur d’onde ; de même, σ = porte le nom de fréquence spatiale ou nombre


d’onde ; enfin, λ = est la période spatiale ou longueur d’onde. k et σ se mesurent
k
−1
en m et λ en mètre.
Afin de proposer une première généralisation des expressions (4.11), on peut introduire
le vecteur k = kex , justifiant le terme de vecteur d’onde ; si sa norme k désigne la
pulsation de l’oscillation spatiale, sa direction ex décrit le sens de la propagation.

OPPH
X On appellera onde plane progressive harmonique toute fonction de l’es-
pace et du temps prenant, au point r et à l’instant t, la forme complexe
f (r, t) = a exp [j (ωt − k · r)], où a = a0 exp(jϕ) est l’amplitude com-
plexe de l’onde, ω > 0 sa pulsation, et k = ku avec k > 0 et u2 = 1 est
le vecteur d’onde. u est la direction de propagation de l’OPPH et k sa
pulsation spatiale. Cette onde se propage dans le sens positif de l’axe u
avec la vitesse de phase vϕ = ω/k, vϕ = vϕ u.
76 Physique, MP, MP*

Le terme vitesse de phase est employé ici car cette vitesse intervient dans l’écriture

u·r
du terme de phase de l’onde f (r, t) = a exp ϕ (r, t), avec ϕ (r, t) = ω t − .

On préférera l’emploi du terme vitesse de phase à celui, plus vague, de vitesse de


propagation. Nous verrons en effet qu’on peut définir d’autres vitesses dans l’étude
générale des ondes, et que, sauf dans le cas simple de l’équation de d’Alembert, ces
différentes vitesses ne sont pas forcément égales.

2 Notations complexes : si on considère une fonction quelconque de x et de t de


la forme (4.11), c’est-à-dire une OPPH, alors on remarque que, conformément aux
règles générales de dérivation des fonctions représentées dans l’espace de Fourier, on
d
peut faire la substitution = jω ; on peut aussi faire la même remarque pour les
dt
d
dérivations relativement à x et écrire = −jk. Dans le cas plus général d’une
dx
OPPH de la forme exp [j (ωt − k · r)] = exp [j (ωt − kx x + ky y + kz z)], on peut écrire
de manière équivalente les trois dérivées relativement à x, y et z et retenir :

∂ ∂ ∂ ∂
= jω = −jkx = −jky = −jkz (4.12)
∂t ∂x ∂y ∂z

Nous utilisons ici la notation complexe f ((r, t)) = a exp [j (ωt − k · r)] pour décrire
une onde plane ; toutefois, les grandeurs physiques (donc réelles) étudiées étant en
général données par Re(f (r, t)), il est a priori équivalent d’utiliser l’autre convention
g (r, t) = a exp [j (k · r − ωt)] ; dans ce cas, on n’oubliera pas de remplacer dans
∂ ∂
tous les calculs intermédiaires (complexes) les dérivées selon = −jω, = jkx ,
∂t ∂x
∂ ∂
= jky , = jkz ; en fin de calcul bien sûr, le retour aux parties réelles assure
∂y ∂z
que le sens physique ne change pas.

4.2.3 Atténuation et dispersion


2 Méthodes d’étude des ondes : nous avons vu que les ondes planes, solution
de l’équation de d’Alembert, se propagent sans s’atténuer ni se déformer (voir par
exemple la figure 4.2). Il ne s’agit toutefois que d’un cas particulier, et nous rencontre-
rons d’autres phénomènes ondulatoires à l’occasion desquels la propagation s’accom-
pagne d’une atténuation de l’amplitude des ondes, ou d’une dispersion (par exemple
un étalement des maxima).

L’atténuation de l’amplitude des ondes lors de leur propagation peut avoir deux
origines, l’une géométrique et l’autre physique. Nous verrons par exemple dans le
cours d’optique qu’une onde lumineuse émise par une source ponctuelle s’écrit sous
a
la forme W (r, t) = exp [j (ωt − kr)] : cette onde voit son amplitude diminuer
r
comme l’inverse 1/r de la distance à la source et on parle de dilution géométrique
de l’amplitude de l’onde. Toutefois, il n’y a ici aucune diminution de l’énergie trans-
portée avec la distance : la puissance surfacique rayonnée est proportionnelle à
|W (r, t) |2 , donc à 1/r2 ; à travers une surface 4πr2 de sphère de rayon r, on
retrouve bien un transport de puissance constant. Par contre, en présence de phéno-
mènes dissipatifs (comme l’effet Joule, entre autres), on assistera à une diminution
plus rapide de l’amplitude de l’onde.
4 : Lignes électriques et propagation d’ondes 77

Les ondes que nous étudierons sont solutions d’autres équations différentielles, plus
ou moins semblables à l’équation de d’Alembert. Il n’existe alors pas forcément de
solution générale de l’équation de propagation ; on cherchera alors souvent à résoudre
directement sous la forme d’OPPH, ce qui revient à remplacer les dérivées par des
multiplications complexes, et donc à déterminer une relation simple entre k et ω ;
cette relation prend alors le nom d’équation de dispersion.
∂2f 1 ∂2f
 
2
Considérons par exemple l’équation de Klein-Gordon = 2 + ω0 f ,
∂x2 c ∂t2
que nous rencontrerons régulièrement lors de l’étude des ondes.
Si une OPPH de la forme f (r, t) = a exp [j (ωt − k · r)] vérifie cette équation, on doit
1
imposer la condition nécessaire −k2 f = 2 −ω 2 f + ω02 f , obtenue en remplaçant

c
chaque dérivée par la multiplication associée conformément à (4.12).
1
La solution f n’est pas nulle seulement si −k2 = 2 −ω 2 + ω02 , qui est l’équation

c
de dispersion recherchée. On résume ici la liste de quelques équations aux dérivées
partielles qu’on rencontrera régulièrement dans la suite du cours de Physique, et les
équations de dispersion associées :

∂2f 1 ∂2f ω2
d’Alembert : = k2 =
∂x2 c2 ∂t2 c2

∂2f 1 ∂2f ω 2 − ω02


 
2
Klein-Gordon : = + ω 0 f k2 = (4.13)
∂x2 c2 ∂t2 c2

∂2f 1 ∂f ω
Diffusion : = k 2 = −j
∂x2 D ∂t D

Ces équations fournissent k 2 sous forme d’un nombre réel éventuellement négatif, ou
sous forme d’un nombre complexe ; alors qu’on choisira toujours ω ∈ R+ , on se rend
compte qu’en général k ∈ C : on va voir que cette circonstance se traduit par une
absorption de l’onde.
D’autre part, la relation entre k et ω n’est en général pas linéaire ; on va voir que cette
circonstance se traduit par une dispersion de l’onde.
2 Absorption : considérons une OPPH de la forme f = a exp [j (ωt − kx)] où k
est complexe, k = kr + jki , avec kr > 0 et ki ∈ R. On peut encore recopier cette
expression sous la forme f = a exp [ki x] exp [j (ωt − kr x)], ce qui décrit un phénomène
ω
de propagation le long de l’axe (Ox) à la vitesse de phase vϕ = , mais avec une
kr
amplitude de l’onde A(x) = a exp [ki x] qui varie au fur et à mesure de la propagation.
Il existe des milieux amplificateurs, dans lesquels on observera une amplitude crois-
sante au fur et à mesure de la propagation (par exemple dans la cavité d’oscillation
d’un laser) ; toutefois, le cas le plus fréquent est celui des milieux absorbants pour
1
lesquels ki < 0. L’onde porte alors le nom d’onde évanescente et on notera δ = −
ki
la distance caractéristique de son atténuation :
 x
f (x, t) = a exp − exp [j (ωt − kx)] (4.14)
δ
78 Physique, MP, MP*

Si l’onde se propage dans le sens contraire de l’axe (Ox), on trouvera de même kr < 0
et ki > 0 ; plus généralement, l’absorption de l’onde peut être immédiatement identi-
fiée si Re(k) × Im(k) < 0.
2 Dispersion : considérons maintenant une OPPH pour laquelle k est réel, mais
avec une relation ω = ω(k) non nécessairement linéaire. Dans un tel cas, la vitesse de
ω
phase vϕ = n’est plus une constante caractéristique de l’onde, mais une fonction
k
de la pulsation ω (ou du vecteur d’onde k) : on écrira en général vϕ = vϕ (ω).
Prenons l’exemple d’une onde vérifiant l’équation de Klein-Gordon présentée plus
haut, avec donc ω 2 − ω02 = c2 k 2 . Il n’y aura propagation (sans atténuation) que si
k ∈ R, donc si ω > ω0 (on dit que ω0 est une pulsation de coupure basse) ; nous nous
placerons dans ce cas pour calculer la vitesse de phase.
ω c
Celle-ci vaut vϕ = = p . Dans ce cas, les ondes de plus haute fréquence
k 1 − ω02 /ω 2
sont les plus lentes (avec une vitesse limite égale à c lorsque ω ≫ ω0 ), et une vitesse
limite infinie lorsque ω → ω0+ (mais l’équation de Klein-Gordon perd souvent son sens
physique au voisinage de la pulsation de coupure ω0 ).

Il est en principe toujours possible d’exprimer vϕ en fonction de ω ou bien de k ;


c’est en général la première expression qui est attendue car l’oscillateur qui alimente
le système impose généralement sa pulsation ω.

Plus généralement, des ondes harmoniques de fréquences différentes se propagent a


priori à des vitesses différentes : c’est le sens du terme dispersion (parties ensemble,
ces différentes ondes arriveront en ordre dispersé). Toutefois, une onde parfaitement
harmonique n’a guère de réalité physique ; toute onde réelle sera un peu plus complexe,
et devra être représentée sous forme combinaison linéaire de plusieurs OPPH, ou pour
être plus général sous la forme d’une intégrale de Fourier.
Considérons d’abord le cas simple d’une somme de seulement deux OPPH de même
amplitude, f (r, t) = a0 [cos (ω1 t − k1 x) + cos (ω2 t − k2 x)] ; une simple transformation
trigonométrique permet d’écrire f (r, t) = 2a0 cos (ωm t − km x) cos (δωt − δkx), où on
ω1 + ω2 k1 + k2 ω1 − ω2 k1 − k2
a posé ωm = , km = , δω = et δk = .
2 2 2 2
Le terme 2a0 cos (ωm t − km x) décrit manifestement une propagation (( moyenne )),
tandis que le terme cos (δωt − δkx) varie plus lentement en fonction de t et x puisqu’a
priori |δω| ≪ ωm et |δk| ≪ km ; il s’agit d’un terme d’enveloppe, à variation lente,
comme on le voit sur la figure 4.3, tracée à t fixé.
f
Gb cos (δωt − δkx)
Φb
f (r, t)

− cos (δωt − δkx)

Figure 4.3 – Superposition de deux OPPH

Sur ce tracé, le point G correspond à δωt − δkxG = 2nπ (avec n ∈ Z) ; c’est un point
δω
qui vérifie donc xG = xG0 + t ; il désigne le maximum du groupe ou paquet d’onde,
δk
4 : Lignes électriques et propagation d’ondes 79

δω
et se déplace à la vitesse de groupe vg = . Par contre, le point Φ correspond à
δk
ωm
ωm t − km xΦ = 2mπ (avec m ∈ Z), soit xΦ = xΦ0 + t. Ce point, qui correspond à
km
ωm
une valeur particulière de la phase, se déplace à la vitesse de phase vϕ = .
km
Z +∞
Pour être plus général, on pourra noter f (x, t) = A(k) exp [j (ωt − kx)] dk une
k=−∞
onde décrite comme une intégrale de Fourier, avec, dans cette intégrale, ω = ω(k).
Nous nous limiterons alors à l’étude d’ondes pour lesquelles k reste voisin de k0 , la
répartition des amplitudes A(k) prenant la forme de la figure 4.4 : on parlera d’onde
quasi-monochromatique ou de paquet d’onde.
|A(k)|
∆k

b
k
k0

Figure 4.4 – Paquet d’onde quasi-monochromatique : répartition d’amplitude

Si ∆k ≪ k0 , on peut faire un développement limité de la fonction ω(k) au voisinage



de k0 , en posant ω(k0 ) = ω0 et ω(k) = ω0 + (k − k0 ). Dans la suite, nous
dk k0
poserons q = k − k0 et nous définirons la vitesse de groupe vg , en même temps que
nous rappelons la définition de la vitesse de phase :

ω dω
vϕ = vg = (4.15)
k dk

On peut alors écrire ωt−kx = (ω0 +vg q)t−(k0 +q)x, avant de recopier l’expression de
Z +∞
l’onde f (x, t) = exp [j(ω0 t − k0 x)] A(q) exp [jq (vg t − x)] dq, qui apparaı̂t ainsi
q=−∞
comme le produit de deux termes :
• un terme de phase exp [j(ω0 t − k0 x)] = exp [jk0 (vϕ t − x)], qui se propage le long
de l’axe (Ox) à la vitesse de phase vϕ ; ce terme est périodique, avec une période

spatiale λ0 = ;
k0
Z +∞

• un terme de groupe A(q) exp [jqξ] dq où ξ = vg t − x ; au facteur 1/ 2π
q=−∞
près, on reconnaı̂t une transformée de Fourier (inverse) de A(q), c’est-à-dire

une certaine fonction F (ξ), de grande largeur (puisque ∆k est petit). Cette
∆k
fonction F (vg t − x) décrit aussi un terme qui se propage, mais à la vitesse de
groupe vg .
2π 2π
Puisque λ0 = ≪ , on peut proposer (figure 4.5) un tracé qualitatif de l’onde
k0 ∆k
quasi-monochromatique, faisant apparaı̂tre les deux termes et leur produit : l’onde
80 Physique, MP, MP*

terme de groupe

b vg
terme de phase

b vϕ
λ0

2π/∆k

Figure 4.5 – Termes de phase et de groupe d’une onde quasi-monochromatique

quasi-monochromatique est formée d’un paquet, qui se déplace globalement à la vitesse


vg , tandis que les plans de phase défilent à l’intérieur de ce paquet, à la vitesse vϕ .

Reprenant l’exemple de l’équation de dispersion de Klein-Gordon ω 2 − ω02 = c2 k 2 ,


on calcule facilement la vitesse de groupe enqdérivant cette expression relativement à
dω 2
k, ce qui fournit 2ω = 2c k soit vg = c 1 − ω02 /ω 2 ; on remarque bien que cette
dk
c
expression est différente de celle vϕ = p obtenue pour la vitesse de phase.
1 − ω02 /ω 2

On peut remarquer ici la relation vϕ vg = c2 . Cette relation, qui est une consé-
quence particulière de la seule équation de Klein-Gordon, ne doit en aucun cas être
généralisée.

2 Vitesse de l’énergie : dans le cadre général de l’étude d’une onde quelconque,


nous ne pouvons évidemment pas définir de grandeur énergétique. Toutefois, l’étude
des signaux électriques a montré que la puissance moyenne était proportionnelle à la
1
moyenne temporelle f 2 (t) ou, dans le cas d’une notation complexe, à Re f f ∗ .


2
Dans une moyenne de ce type, les oscillations rapides du terme de phase disparaissent
et il ne subsiste que la variation, plus lente, du terme de groupe.
Nous admettrons donc que la vitesse de transport de l’énergie s’exprime souvent se-
lon vE = vg ; toutefois, il nous faudra établir cette expression pour chaque onde
rencontrée, en fonction des propriétés énergétiques qui sont associées aux grandeurs
physiques qui se propagent.
De plus, cette expression n’est pas exacte dans certains cas : lorsque le paquet d’onde
comporte des fréquences très différentes, ou pour certaines ondes évanescentes par
exemple. La notion de paquet d’onde n’a alors plus de sens, et on doit adopter d’autres
méthodes de description.

2 Célérité limite : nous vérifierons aussi, à chaque fois que ce sera possible, les
relations (issues de la théorie de la Relativité) :

vE 6 c0 donc souvent vg 6 c0 (4.16)


4 : Lignes électriques et propagation d’ondes 81

où c0 est la vitesse de la lumière dans le vide, qui est aussi la vitesse limite du transport
de l’énergie ; par contre, on pourra indifféremment trouver vϕ 6 c0 ou vϕ > c0 , car la
vitesse de phase n’est pas associée à un transport d’information ou d’énergie.
2 Le cas de l’équation de d’Alembert : si l’OPPH f (x, t) = exp [j (ωt − kx)] vérifie
∂2f 1 ∂2f 2 ω2
l’équation de d’Alembert = , on obtient la condition nécessaire k = ,
∂x2 c2 ∂t2 c2
donc les vitesses de phase et de groupe sont égales et constantes ; on dit alors que
l’onde n’est pas dispersée.

Équation de d’Alembert ⇒ vϕ = vg = c = cte (4.17)

Toutes les ondes monochromatiques composant le paquet d’onde se propagent à la


même vitesse, et le paquet d’onde ne se déforme donc pas.

4.3 Propagation des ondes électriques

4.3.1 Onde dans une ligne électrique


2 Ligne idéale : revenons maintenant à l’étude particulière des ondes électriques dans
∂u ∂i
une ligne bifilaire idéale, régies par les équations des télégraphistes = −Lu et
∂x ∂t
∂i ∂u 1
= −Cu , donc aussi par une équation de d’Alembert de célérité c = √ . On
∂x ∂t Lu Cu
a vu que la solution générale de cette équation s’écrit sous la forme de la superposition
de deux ondes progressives en sens inverse :

u(x, t) = u+ (x − ct) + u− (x + ct) (4.18)

ou encore, dans le cas particulier d’une onde harmonique de pulsation ω = ck :

u(x, t) = u0+ exp [j (ωt − kx)] + u0− exp [j (ωt + kx)] (4.19)

Déterminons alors le courant i, dans le cas général de l’équation (4.18), au moyen de la


∂i
= Cu cu′+ (x − ct) − cu′− (x + ct)
 
seconde équation des télégraphistes. On obtient
∂x
∂u+ du+ ∂α
puisque la dérivée de u+ (α) relativement à t est = ; avec α = x − ct il
∂t dα ∂t
∂u+ du+ ∂u−
vient = −c = −cu′+ (x − ct). De même, = cu′− (x + ct).
∂t dα ∂t
L’intégration de cette équation pourrait comporter un terme constant (par rapport à
x) ; ce terme éventuel, qui n’est pas une onde, ne nous concerne pas ici et nous écrirons
donc l’onde de courantr sous la forme i(x, t) = Cu [cu+ (x − ct) − cu− (x + ct)].
Cu
Le terme Cu × c = est l’inverse de l’impédance caractéristique de ligne définie
Lu
en (4.2) ; finalement, le courant dans la ligne prend la forme générale :

u+ (x − ct) − u− (x + ct)
i(x, t) = (4.20)
Zc
82 Physique, MP, MP*

Le signe du coefficient d’impédance dépend du sens de propagation de l’onde. Ce


résultat est absolument général pour l’étude des ondes associées à deux variables
couplées : vitesse v et pression p pour les ondes acoustiques, champs E et B pour
les ondes électromagnétiques, etc. L’oubli du signe − à ce niveau a toujours des
conséquences graves.
On peut aussi retrouver plus simplement cette équation dans le cas harmonique en
écrivant sous forme complexe les équations des télégraphistes ; par exemple, la seconde
u k 1
équation impose −j(±k)i = jωCu u donc =± , avec le signe + pour l’onde
i ω Cu
u+ progressant dans le sens de l’axe (Ox) et le signe − pour l’onde u− progressant
en sens contraire. On trouve dans ce cas :

u0+ exp [j (ωt − kx)] − u0− exp [j (ωt + kx)]


i(x, t) = (4.21)
Zc

2 Impédance de ligne : dans le cas particulier du régime harmonique, les relations


(4.19) et (4.21) permettent de définir, en tout point x de la ligne bifilaire, une impé-
dance de ligne, impédance apparente pour le signal transporté à l’abscisse x :

u(x, t) u exp (−jkx) + u0− exp (jkx)


Z(x) = = Zc 0+ (4.22)
i(x, t) u0+ exp (−jkx) − u0− exp (jkx)

4.3.2 Réflexion du signal


2 Coefficients de réflexion : supposons que la ligne soit terminée, à une certaine
abscisse x0 , par un dispositif électrique quelconque (branchement de la ligne sur un
montage électronique par exemple), tandis que le générateur qui alimente la ligne est
disposé à une abscisse x1 < x0 . On considère alors que le générateur crée une onde
incidente ui (x, t) = u0+ exp [j (ωt − kx)], tandis que le dispositif qui clôt la ligne est
la source de l’onde réfléchie ur (x, t) = u0− exp [j (ωt + kx)].
u (x0 , t)
On définit alors le coefficient de réflexion en tension ru = r ; c’est un nombre
ui (x0 , t)
complexe, dont le module mesure l’amplitude de l’onde réfléchie, relativement à l’onde
incidente qui lui a donné naissance.
Choisissant de modifier l’origine de l’axe (Ox) pour que le dispositif réfléchissant soit
u
placé en x0 = 0, on peut alors écrire ru = 0− . On remarque ici qu’on aurait aussi pu
u0+
i (0, t)
définir un coefficient de réflexion en courant ri = r ; on obtient alors immé-
ir (x0 , t)
diatement ri = −ru . Finalement, on peut aussi recopier l’expression de l’impédance
de ligne (4.22) en fonction de ru selon :

u0− exp (−jkx) + ru exp (jkx)


ru = ⇒ Z(x) = Zc (4.23)
u0+ exp (−jkx) − ru exp (jkx)

2 Impédance terminale : le dispositif réfléchissant placé à la fin x = 0 de la ligne


1 + ru
est caractérisé par son impédance terminale Z(x = 0) = Zc ; cette relation
1 − ru
Z(x = 0) − Z c
s’inverse aussi sous la forme ru = .
Z(x = 0) + Z c
4 : Lignes électriques et propagation d’ondes 83

On peut alors étudier, selon les valeurs de l’impédance terminale Z(x = 0) disposée
en bout de ligne, distinguer trois cas particuliers :
• Si la ligne est ouverte à son extrémité, le courant i(0, t) est nul à tout instant donc
Z(x = 0) = ∞ et ru = 1. Il y a donc réflexion totale, sans déphasage, de l’onde
de tension incidente.
On remarque aussi bien sûr que ri = −1 ; le courant réfléchi annule, en x = 0,
le courant incident pour assurer l’annulation du courant en bout de ligne.
• Si la ligne est court-circuitée à son extrémité, la tension u(0, t) est nulle à tout
instant donc Z(x = 0) = 0 et ru = −1. Il y a donc réflexion totale avec
déphasage de π de l’onde de tension incidente.
On remarque encore que ri = +1 ; tout le courant incident repart, sans dépha-
sage, après passage par ce court-circuit.
• Enfin, on peut assurer l’absence de réflexion en imposant ru = 0 donc ri = 0, ce
qui impose Z(x = 0) = Zc ; il faut brancher en bout de ligne une résistance de
valeur égale à l’impédance caractéristique de la ligne.

Si on place en bout de ligne une résistance égale à la valeur de l’impédance caractéris-


tique de ligne, on parle d’adaptation d’impédance de la ligne à son utilisation. C’est
cette situation qui est recherchée lorsque on veut transmettre le long d’une ligne des
signaux de manière unidirectionnelle.
Le terme d’adaptation doit être rapproché de le situation décrite précédemment en
Électronique, lorsqu’on choisit de connecter une charge de résistance égale à la ré-
sistance interne du générateur qui l’alimente, pour assurer un transfert maximal de
puissance à la charge.
Remarquons que dans ce cas, l’impédance de ligne vérifie encore Z(x) = Zc pour
tout x : l’adaptation d’impédance, si elle est réalisée, ne dépend pas de la longueur
de câble utilisé. Par exemple, les câbles BNC utilisés en Électronique de laboratoire
et en informatique pour les connexions de cartes réseau vérifient Zc = 50 Ω : on
doit, pour éviter la réflexion du signal, connecter le câble sur un montage électronique
d’impédance d’entrée Ze = 50 Ω.
Finalement, on peut proposer (cf. figure 4.6) une situation d’adaptation d’impédance
complète, en présence de câbles d’impédance caractéristique Zc , d’un générateur d’im-
pédance interne R = Zc et d’étages électroniques dont les impédances d’entrée et de
sortie sont aussi égales à R.

b b b b
b

R b b R b
câble, Zc = R R
b b b

b
b

x=0 x=ℓ
Étage électronique

Figure 4.6 – Adaptation d’impédance en Électronique

Dans un tel montage, l’impédance terminale R est adaptée au câble et il n’y a donc
pas d’onde réfléchie ; de plus, l’impédance du câble vu de son entrée x = 0 est égale
à l’impédance terminale x = ℓ ; le générateur (( voit )) donc une impédance de charge
égale à R, et transfère donc une puissance maximale à ce câble.
84 Physique, MP, MP*

4.3.3 Ondes stationnaires

2 Formation d’ondes stationnaires par réflexion : on considère ici une ligne électrique
alimentée en régime harmonique, le générateur situé en x < 0 imposant dans la ligne
une onde de tension incidente ui = u0 exp [j (ωt − kx)] ; un choix adapté de l’origine
des temps permet d’imposer u0 ∈ R+ .
Un dispositif réfléchissant situé en x = 0 assure une réflexion au moins partielle de
l’onde, avec le coefficient de réflexion ru = ρ exp (jϕ), où ρ 6 1. On constate donc
l’apparition d’une onde réfléchie, ur = ru u0 exp [j (ωt + kx)].
L’onde de tension totale dans la ligne peut donc se mettre sous la forme u = ui + ur ,
que l’on décomposera en une somme u = (1 − ρ)u0 exp [j (ωt − kx)] + us , où on a fait
apparaı̂tre us = ρu0 exp [jωt] {exp [−jkx] + exp [jkx + ϕ]}.
Le premier terme u = (1−ρ)u0 exp [j (ωt − kx)] est une onde progressive, qui disparaı̂t
en cas de réflexion totale (ρ = 1). Le second terme peut, lui, se mettre sous la forme
us = 2ρu0 exp [jϕ/2] exp [jωt] cos (kx + ϕ/2), et la tension réelle correspondante vaut
donc Re(us ) = 2ρu0 cos (ωt + ϕ/2) cos (kx + ϕ/2).
La séparation des dépendances en x et t permet d’identifier cette tension comme une
onde stationnaire : la vibration de us (x, t) se fait sur place, sans propagation : cette
onde est en effet la résultante de deux ondes progressives de même amplitude ρu0 , se
propageant en sens inverse. Plus généralement :


 f (x, t) = f0 [cos (ωt − kx) + cos (ωt + kx)]
Onde stationnaire : (4.24)
f (x, t) = 2f0 cos (ωt) cos (kx)

On peut donner une illustration graphique de l’onde stationnaire en représentant, à


plusieurs instants successifs, la tension us (x, t), selon la figure 4.7.
us
tension maximale

tension à t
x

tension à t′
tension minimale

λ/2

Figure 4.7 – Onde stationnaire

En tout point de la ligne tel que cos (kx + ϕ/2) = 0, la tension est en permanence
nulle ; on parle de nœuds de vibration. Deux nœuds consécutifs sont donc séparés d’une
π λ
distance égale à = .
k 2
De même, en tout point de la ligne tel que cos (kx + ϕ/2) = ±1, la tension oscille
avec une amplitude maximale, égale à 2ρu0 ; on parle de ventres de vibration. Deux
λ
ventres consécutifs sont également séparés de .
2
4 : Lignes électriques et propagation d’ondes 85

2 Généralisation : il est possible de rechercher a priori une solution d’une équation de


∂2f 1 ∂f
d’Alembert = 2 2 (ou d’une autre équation de propagation) par une méthode
∂x2 c ∂t
dite de séparation des variables : on détermine pour cela les conditions nécessaires
que doivent vérifier deux fonctions des deux variables indépendantes χ(x) et τ (t)
pour que f (x, t) = χ(x)τ (t) soit solution de l’équation de propagation. Si une telle
solution existe, et prend la forme d’une grandeur harmonique, il s’agit nécessairement
d’une onde stationnaire.
Dans le cas de l’équation de d’Alembert, la condition nécessaire imposée à χ(x) et
d2 χ 1 d2 τ
τ (t) peut s’écrire τ (t) = χ(x) ou encore, en procédant à la séparation des
dx2 c2 dt2
2 2
1 d χ 1 1 d τ
variables x et t, 2
= 2 ; on ne s’occupera pas des difficultés mathé-
χ(x) dx c τ (t) dt2
matiques liées à la division par des fonctions qui pourront s’annuler périodiquement.
L’égalité de deux fonctions f (x) = g(t) de deux variables indépendantes impose
alors nécessairement que ces deux fonctions soit simultanément constantes ; en ef-
df (x) dg(t) dg(t) df (x)
fet = = 0, et réciproquement, = = 0. Finalement, notant
dx dx dt dt
2 2
d χ d τ
α cette constante commune, 2
= αχ(x) et 2 = αc2 τ (t), et on pourra distinguer
dx dt
trois cas :
• Si α > 0, les solutions τ (t) et χ(x) sont des combinaisons d’exponentielles réelles.
√  √ 
Dans l’expression τ (t) = τ1 exp +c αt + τ2 exp −c αt , le terme τ1 est né-
cessairement nul (sinon la solution n’a pas de sens physique lorsque t → ∞) et
la solution τ (t), exponentiellement décroissante au cours du temps, décrit un
phénomène transitoire, qu’on n’étudiera pas plus ici.
De plus, nous verrons ci-dessous que ce type de solution n’est en général pas
compatible avec les conditions aux limites imposées à l’onde.
• Si α = 0, les solutions τ (t) et χ(x) sont des fonctions affines, de la forme at + b
et a′ x + b′ . Nous verrons là encore que ce type de solution n’est pas non plus
compatible avec les conditions aux limites imposées à l’onde.
• Enfin, le cas α < 0 correspond à la seule solution de type ondulatoire ; c’est en
général celle qui nous intéressera dans la suite. Posant α = −k 2 avec k > 0, on
peut alors écrire χ(x) = χ0 cos (kx + ϕ).
De même, on peut écrire, moyennant un choix adapté de l’origine des durées,
τ (t) = τ0 cos ωt, à condition de poser ω = ck. Finalement, cette solution de
l’équation de d’Alembert peut s’écrire f (x, t) = f0 cos (kx + ϕ) cos ωt, où on a
posé f0 = χ0 τ0 : c’est bien une onde stationnaire.

2 Cavités résonantes : considérons enfin une onde stationnaire, écrite sous la forme
f (x, t) = f0 cos (kx + ϕ) cos ωt, disposée dans ce qu’on appelle une cavité résonante
de longueur L, c’est-à-dire un intervalle [0 , L] de l’axe (Ox) avec les conditions aux
limites f (x = 0, t) = f (x = L, t) = 0, ∀t.

On peut rencontrer des cavités résonantes avec bien d’autres conditions aux limites
que la simple annulation aux deux extrémités de la cavité ; l’étude faite ici est
seulement limité au cas le plus simple.
On peut illustrer la notion de cavité résonante dans le cadre optique (une onde lu-
mineuse entre deux miroirs ; nous montrerons ultérieurement qu’un miroir métallique
86 Physique, MP, MP*

impose l’annulation de l’onde lumineuse à sa surface) ou dans le cadre hydrodyna-


mique (une onde sonore entre deux parois rigides ; celles-ci imposent l’annulation de
la vitesse de déplacement de l’air sur la surface des parois). La figure 4.8 représente
une de ces situations, avec diverses solutions présentant l’annulation de l’onde sur les
deux limites de la cavité.

n=1
λ/2
b b
x
n=3

n=7 b b

λ/2

Figure 4.8 – Onde stationnaire dans une cavité résonante

La double condition ci-dessus impose cos ϕ = 0 (donc ϕ = π/2 à π près ; le décalage de


π, qui revient à changer f0 en −f0 , n’a pas de sens physique) et cos (kL + ϕ) = 0 donc
sin kL = 0. il existe donc un entier n > 0 tel que kL = nπ. On interprète cette relation

en introduisant à nouveau la longueur d’onde λ = ; la condition d’établissement
k
d’une onde stationnaire est alors :

λ
L=n (4.25)
2

L’interprétation physique du nombre entier n est alors claire (voir la figure 4.8 par
exemple) : la longueur de la cavité est un nombre entier de demi-longueurs d’onde.
On voit graphiquement que cette condition est obligatoirement vérifiée pour imposer
une double annulation de l’onde aux deux extrémités de la cavité.

4.3.4 Transport d’énergie dans une ligne

2 Puissance : dans une ligne électrique le long de laquelle circule une onde de
tension et de courant, on peut déterminer la puissance électrique fournie à l’abscisse
x de la ligne par l’ensemble de ce qui se trouve avant cette abscisse (le générateur
et une partie de la ligne), en écrivant P (x, t) = u(x, t)i(x, t) ; la figure 4.9 montre en
effet que ces grandeurs sont définies en convention générateur pour cet ensemble.
b
b

i(x, t)
ligne électrique u(x, t)

b
b

Figure 4.9 – Puissance fournie par une partie de la ligne

Les expressions (4.18) et (4.20) montrent que la puissance transportée par la ligne
1
u2 (x − ct) − u2− (x + ct) .

peut se mettre sous la forme instantanée P (x, t) =
Zc +
4 : Lignes électriques et propagation d’ondes 87

Cette expression montre que les ondes incidente et réfléchie transportent de la puis-
sance indépendamment l’une de l’autre dans les deux sens de propagation ; on pourrait
u2 (x − ct) u2 (x + ct)
par exemple poser P+ (x, t) = + et P− (x, t) = − − .
Zc Zc
Si on utilise une notation complexe avec les expressions (4.19) et (4.21), la puissance
1
moyenne transportée hP i = Re (ui∗ ) s’écrit de même comme une différence de deux
2
|u |2 − |u0− |2
termes, hP i = 0+ ou, en fonction du coefficient de réflexion en x = 0,
2Zc
|u |2
hP i = 0+ 1 − |ru |2 .

2Zc
On définit alors un coefficient de réflexion énergétique R par R = |ru |2 = |ri |2 ; la
puissance totale transportée par l’onde s’annule dans le cas de la réflexion totale,
R = 1. Au contraire, R = 0 dans le cas où la ligne est adaptée à son impédance
terminale ; dans ce cas, aucune puissance n’est réflechie, et toute la puissance de
l’onde incidente est donc dissipée dans cette impédance terminale.
Dans tous les cas, cette puissance transportée ne dépend pas de x : la propagation
dans la ligne ne s’accompagne d’aucune perte d’énergie, puisque le modèle utilisé fait
abstraction de tout terme dissipatif.
2 Ligne avec pertes : reprenons enfin l’étude d’une ligne électrique, avec de faibles
pertes en ligne : nous supposerons donc que Gu = 0 mais nous prendrons en compte
le terme Ru , tout en admettant que son influence reste faible. Les équations des
∂u ∂i ∂i ∂u
télégraphistes deviennent alors = −Ru i−Lu et = −Cu soit, en notations
 ∂x ∂t ∂x ∂t
−jku + (Ru + jLu ω)i = 0
complexes, le système ; ce système homogène a une
jCu ωu − jki = 0
solution triviale (u = 0, i = 0). Si on veut qu’une onde non nulle se propage dans
la ligne, on devra donc imposer l’annulation de son déterminant, ce qui fournit une
ω2
relation entre ω et k qui n’est autre que la relation de dispersion, −k 2 + 2 = jRu Cu ω.
c
Le terme imaginaire jRu Cu ω étant supposé faible, la solution sera proche de k = ±ω/c
qui correspond à l’absence de pertes. Nous choisirons de poser k = k0 (1 − jǫ) avec
k0 > 0 (ce qui correspond à un choix de sens de propagation) et |ǫ| ≪ 1 ; le signe −
permet d’espérer une solution telle que ǫ > 0, donc Re k × Im k < 0, ce qui décrit
l’absorption de l’onde par dissipation progressive de son énergie par effet Joule.
ω2
On obtient alors k02 (1 − 2jǫ) ≃ 2 − jRu Cu ω ; on en déduit bien que k0 = ω/c
c
Ru
correspond au terme de propagation, tandis que ki = −ǫk0 = < 0. On observera
2Zc
2Zc
bien une onde évanescente, avec une longueur caractéristique d’atténuation δ = .
Ru
Reprenant enfin les ordres de grandeur précédemment cités, une ligne de résistance
par unité de longueur Ru = 1, 7 Ω · m−1 et d’impédance caractéristique Zc = 50 Ω
sera caractérisée par une atténuation de l’onde d’un facteur 1/e ≃ 0, 37 au bout
d’une longueur δ ≃ 59 m. Après quelques centaines de mètres de câble électrique
(( ordinaire )), il est indispensable d’utiliser un dispositif réamplifiant le signal. C’est
là par exemple l’origine de la limite de longueur dans une connexion poste à poste
dans un réseau informatique câblé.
88 Physique, MP, MP*

Ce qu’il faut absolument savoir

On appelle équation de d’Alembert toute équation aux dérivées partielles de la


1 ∂2f
forme ∆f = 2 2 , où c est une vitesse.
c ∂t
∂2f ∂2f ∂2f ∂2f
En général, ∆f = + + ; à une dimension, ∆f = .
∂x2 ∂y 2 ∂z 2 ∂x2
Dans le cas de l’équation de d’Alembert à une dimension, la solution générale
porte le nom d’onde plane (OP) et s’écrit comme la somme de deux ondes
planes progressives (OPP), se propageant à la vitesse ±c en sens inverse :
f (x, t) = f+ (x − ct) + f− (x + ct).
On appelle onde plane progressive harmonique (OPPH) une grandeur complexe
de la forme f (r, t) = a exp [j (ωt − k · r)], d’amplitude complexe a, de pulsation
ω, de fréquence ν = ω/2π et de période T = 2π/ω ; de vecteur d’onde k = ku,
de nombre d’onde σ = k/2π et de longueur d’onde λ = 2π/k.
ω dω
u est la direction de propagation, vϕ = la vitesse de phase et vg = la
k dk
vitesse de groupe de l’onde, en général égale à la vitesse de l’énergie.
∂ ∂ ∂ ∂
Pour une OPPH, = jω, = −jkx , = −jky et = −jkz .
∂t ∂x ∂y ∂z
La superposition de deux ondes progressives en sens inverse forme une onde
au moins partiellement stationnaire, qui s’écrit comme un terme découplé,
Re(f (x, t)) = f1 (x) × f2 (t).
Dans une onde stationnaire, les nœuds de vibration se succèdent tous les λ/2 ;
il en va de même des ventres de vibration.
Un conducteur cylindrique, de section s et de longueur ℓ, présente une résis-
tance électrique R = ̺ℓ/s, où ̺ = 1/γ est la résistivité du matériau, et γ sa
conductivité.
Un élément de ligne électrique idéale peut être modélisé au moyen de l’in-
ductance par unité de longueur Lu , de la capacité par unité de longueur Cu ;
éventuellement on tient compte des pertes au moyen de la résistance par unité
de longueur de ligne Ru et de la conductance de fuite par unité de longueur
Gu .
Dans une ligne
p idéale, tension et courant
p vérifient une équation de d’Alembert
avec c = 1/ Lu Cu . En notant Zc = Lu /Cu l’impédance caractéristique, une
OPPH vérifie u/i = ±Zc , où le signe est celui du sens de propagation.
En disposant en bout de ligne une impédance terminale Z0 , on fait apparaı̂tre
des ondes réfléchies, les coefficients de réflexion en tension ru , en courant ri et en
1 + ru Z0 − Zc
énergie R vérifiant ri = −ru , R = |ru |2 et Z0 = Zc , soit ru = .
1 − ri Z0 + Zc
Il y a réflexion totale sur une extrémité de ligne ouverte ou court-circuitée ; il
y a adaptation d’impédance et absence de réflexion si Z0 = Zc .
Chapitre 5

L’onde lumineuse

Ce chapitre présente une description rapide de l’ensemble des propriétés associées à


la propagation de la lumière, considérée comme une onde. À l’exception de l’étude de
la polarisation, toutes ces notions seront développées dans les chapitres suivants.

5.1 La nature de la lumière

5.1.1 Historique
2 Lumière et géométrie : la lumière se propage, dans un milieu homogène, en ligne
droite depuis sa source (le Soleil, une lampe) jusqu’à sa réception dans un détecteur
photosensible (l’œil, une photodiode, etc.). Ce fait, qui est aujourd’hui connu de tous,
n’était pas évident pour les penseurs de l’Antiquité.
On doit cette affirmation aux penseurs arabes du moyen-âge, et notamment au ma-
thématicien et physicien irakien ibn al-Haytam (Alhazen) à qui on attribue la pre-
mière affirmation des lois de la réflexion et de la réfraction. On attribue aujourd’hui
la paternité de la redécouverte de ces lois au français Descartes et au néerlandais
Snell Van Royen.
L’anglais Newton contribua à fonder l’optique moderne dans son ouvrage, Opticks,
publié en . On y trouve une description de nombreux phénomènes lumineux,
comme l’arc-en-ciel ou les interférences lumineuses, ainsi que des spéculations sur la
nature de la lumière, hésitant entre une conception purement corpusculaire et une
théorie vibratoire.
Séparément, les physiciens Huygens‡ , Young‡ et Fresnel‡ développent une théorie
purement ondulatoire, qui est pratiquement celle que nous étudions ici.

5.1.2 L’onde lumineuse


2 Réflexion et réfraction : ces phénomènes, qui ont fait l’objet d’une description
géométrique dans le cadre du programme de première année, peuvent s’interpréter
dans le cadre d’une théorie ondulatoire ; il suffit pour cela de considérer la lumière
comme la propagation d’un phénomène doublement périodique, c’est-à-dire présentant
à la fois une périodicité spatiale et une périodicité temporelle.
Conformément à l’étude des ondes électriques, nous noterons λ la période spatiale
(on longueur d’onde) et T la période temporelle du phénomène, sans préciser pour

l’instant sa nature. On utilisera aussi les pulsations associées, k = (le vecteur
λ
92 Physique, MP, MP*


d’onde) et ω = . La vitesse de propagation associée (en fait, la vitesse de phase de
T
ω λ
l’onde lumineuse) est alors vϕ = = .
k T
La théorie ondulatoire de Huygens et Fresnel permet de décrire les phénomènes de
réflexion et de réfraction en considérant seulement que la vitesse de phase dépend du
milieu considéré. Adoptant les notations actuelles, on notera cette vitesse de phase :

c0
vϕ = c = c0 = 2, 99792458 × 108 m · s−1 (5.1)
n

où c0 est la vitesse de la lumière dans le vide, et n, qui porte le nom d’indice optique
du milieu étudié, est une caractéristique du milieu. On a déjà eu l’occasion d’affirmer
que vϕ n’est pas forcément inférieur à c0 ; toutefois, dans le domaine optique, on a
toujours n > 1 dans les milieux transparents. La figure 5.1 présente une justification
simple des lois de la réfraction, dans un modèle (( mécanique )) de propagation d’onde.

λ1
v2
b n2
ℓ θ2 z
n1
θ1
b
λ2

(R)
v1

Figure 5.1 – Réfraction d’une onde (modèle mécanique)

L’onde lumineuse est ici représentée par un ensemble de personnages avançant en


parallèle, à la même vitesse (on peut penser à une parade militaire) ; ils sont alignés
sur les lignes pointillées du schéma.
La vitesse commune de ces rangées de personnages représente la vitesse de propa-
gation de l’onde. Deux rangées successives de ces personnages sont séparées par une
longueur d’onde, c’est-à-dire par une période spatiale de l’onde ; ces rangées succes-
sives porteront le nom de plans d’onde. Dans chaque plan d’onde, les personnages
sont équidistants.
La trajectoire d’un de ces personnages est un rayon lumineux (R) ; la réfraction est
le phénomène qu’on observe lorsque le défilé aborde une région où les personnages
doivent se déplacer à une vitesse différente. Sur la figure, la zone grisée est par exemple
une zone de descente, et la vitesse v2 y est plus élevée que la vitesse v1 dans la zone
non grisée.
Pour conserver l’alignement, le défilé doit alors changer de direction ; en effet, la
succession des rangées doit être conservée à l’interface (sur le dioptre) ; la longueur ℓ
λ1 λ2
vaut en effet à la fois ℓ = = .
sin θ1 sin θ2
D’autre part, les personnages du défilé doivent quitter le dioptre au même rythme
qu’ils y arrivent ; les pulsations des deux ondes, arrivant sur le dioptre puis en partant,
doivent être identiques, soit ω1 = ω2 .

On peut relier ce résultat à l’ensemble des propriétés de l’électronique linéaire : un


signal d’entrée de pulsation ω est, en électronique, associé à un signal de sortie de
5 : L’onde lumineuse 93

même pulsation si le montage est linéaire. Il existe bien sûr en Optique des milieux
non linéaires, susceptibles de produire des ondes de pulsation ωs différente de la
pulsation imposée à l’entrée ωe . Le domaine de l’optique non linéaire, vaste et en
plein développement, ne nous concerne pas cette année.
2πv
Enfin, pour une onde de vitesse v, λ = ; d’autre part, on posera ici encore v = c/n,
ω
λ1 n2
c étant une vitesse arbitraire. On en déduit donc = .
λ2 n1
On retrouve donc bien la loi de Snell-Descartes de la réfraction :

n1 sin θ1 = n2 sin θ2 (5.2)

Les relations liant ω1 , ω2 , λ1 , λ2 , n1 et n2 méritent aussi d’être retenues ; nous donne-


rons bien sûr ultérieurement (voir le § 5.4.2) une justification formelle de l’ensemble
de ces résultats.

Onde lumineuse et passage par un dioptre


X Lors du changement de milieu qui accompagne la traversée d’un dioptre,
les ondes lumineuses conservent la même pulsation (ω1 = ω2 ) mais
changent de vitesse de propagation (vϕ = c0 /n) et donc de longueur
d’onde ; on notera λ = λ0 /n, où la grandeur λ0 désigne la longueur
d’onde que l’on observerait si cette onde se propageait dans le vide. On
utilise systématiquement cette longueur d’onde dans le vide dans toute
la suite.

On peut regretter l’abus de langage courant qui consiste à parler de longueur d’onde
(sans préciser dans le vide) pour cette valeur λ0 . Ici et dans toute la suite, on
n’utilisera que la seule grandeur λ0 , même si elle est parfois notée λ.

2 Dispersion : les indices optiques de quelques milieux transparents figurent dans le


tableau 5.1 ; ces indices dépendent en fait de nombreux paramètres, dont la longueur
d’onde λ0 . Ils sont ici donnés pour le doublet de raies jaunes (doublet D) émises
par les lampes spectrales à vapeur de Sodium (λ1 = 589, 0 nm et λ2 = 589, 6 nm
pour les deux raies du doublet ; on utilise en général la longueur d’onde moyenne
λ0 = 589, 3 nm pour décrire ce doublet).

matériau air (1 bar, 273 K) eau verres optiques


indice optique 1,0003 1,33 1,35 à 2,00

Table 5.1 – Indices optiques

Le (( verre optique )) dans ce tableau décrit en fait de nombreux matériaux : les verres
ordinaires (dits verres crown en Optique), essentiellement constitués de Silice SiO2
(70%) et d’oxydes de Sodium (Na2 O, 15%) et de Calcium (CaO, 10%), les verres au
plomb (dits verres flint en Optique et improprement appelés cristal en verrerie, avec
remplacement de l’oxyde de calcium par l’oxyde de Plomb PbO), les verres borosili-
catés (avec adjonction d’oxyde de Bore B2 O3 comme le Pyrex), etc.
Les verres optiques et les autres matériaux transparents ne sont pas seulement carac-
térisés par leur indice mais aussi par le comportement de celui-ci en fonction de la
dn
longueur d’onde λ0 . On définit par exemple la dispersion ; celle-ci est en pratique
dλ0
94 Physique, MP, MP*

toujours négative pour les milieux transparents. L’expérience et certaines modélisa-


tions microscopiques mènent à la loi de Cauchy, ou loi de dispersion normale (5.3),
où A, B et C sont des constantes ; on omet souvent le terme C.

B C
n(λ0 ) = A + + 4 (5.3)
λ20 λ0

Du fait de la dispersion, les vitesses de phase vϕ (λ0 ) et de groupe vg (λ0 ) ne sont en


c0 2πc0
général pas égales ; on peut en effet écrire n(λ0 ) = = et, en dérivant
  v (λ
ϕ 0 ) λ0 ω
dω c0 λ0 dn
cette expression, vg (λ0 ) = = 1+ .
dk n n dλ0
En général, la différence
entre ces deux vitesses vϕ et vg est faible car la dispersion
dn n c0
reste faible : ≪ donc vg ≃ vϕ = .
dλ0 λ0 n

Dispersion par un milieu transparent


X La donnée de n(λ0 ) est équivalente à la donnée de l’équation de disper-
sion ω(k) puisque n = c0 /vϕ = c0 k/ω et λ0 = cω/2π.
dn
Dans le cas des milieux transparents de faible dispersion, est faible,
dλ0
négatif, donc vg . vϕ = c0 /n.

2 Théories ondulatoire et corpusculaire : une théorie mécanique permet aussi de


prévoir une loi semblable à celle de Snell-Descartes ; c’est ainsi que s’établit la loi de
la réfraction, en considérant que le rayon lumineux de la figure 5.1 est la trajectoire
de particules de lumière, description adoptée par Descartes comme par Newton.
Dans chaque milieu homogène (de part et d’autre du dioptre), les particules avancent
à vitesse constante en l’absence de toute force appliquée ; la traversée du dioptre
s’accompagne d’une force (de freinage ou d’accélération selon le cas), dirigée selon
la normale (Oz) au dioptre, de sorte que la composante tangentielle de la vitesse
est conservée. On obtient ainsi la loi v1 sin θ1 = v2 sin θ2 , et dans ce modèle l’indice
optique est proportionnel à la vitesse et non pas à l’inverse de celle-ci.
Il n’avait pas échappé aux physiciens de l’époque le problème posé par cette définition
de l’indice. Ainsi, Fermat écrit : La démonstration de la réfraction me semble un
véritable paralogisme (. . . ) parce qu’elle suppose que le mouvement de la lumière qui
se fait dans l’air et dans les corps rares est plus lent que celui qui se fait dans l’eau et
dans les autres corps ce qui semble choquer le sens commun. La mesure directe de la
vitesse de la lumière dans le vide et dans l’eau (par Foucault‡ et Fizeau‡ ) achèvera
de discréditer cette description mécaniste de la lumière.
2 Diffraction : considérons maintenant une onde plane, décrite qualitativement sur
la figure 5.2 par la succession de ses plans d’onde (traits pointillés).
Lorsque l’onde se propage vers un obstacle, on peut considérer, dans le point de vue
de Huygens, que chaque point d’un plan d’onde est une source d’ondes sphériques ; la
superposition de ces ondes garde, du fait des symétries, son caractère d’onde plane,
par compensation deux à deux des ondes divergent hors de la direction de l’onde
principale.
Lors du passage par un obstacle (sur la figure 5.2, une fente transparente percée dans
un écran opaque), cette symétrie est perdue et une partie de l’onde se propage hors
de la direction de l’onde incidente. Il s’agit du phénomène de diffraction.
5 : L’onde lumineuse 95

b b

b
∆θ

b b

b ∆θ

b b

Figure 5.2 – Diffraction de la lumière

La diffraction constitue donc un écart aux lois de la propagation rectiligne de l’optique


géométrique. Ce phénomène n’a lieu de façon significative que si les dimensions de
l’obstacle (par exemple, la largeur a de la fente de la figure 5.2) est comparable à la
dimension caractéristique de l’onde, à savoir sa longueur d’onde λ0 .
Nous montrerons en particulier, par le calcul de l’onde résultant de la superposition
des ondes émises sur un intervalle de largeur a, que l’ouverture angulaire du faisceau
diffracté, de part et d’autre de la direction de l’optique géométrique, est de l’ordre de
grandeur de λ0 /a.

Diffraction de la lumière
X La diffraction est un écart aux lois de propagation de l’optique géomé-
trique, qu’on observe lorsque une onde lumineuse traverse une ouverture
de faible dimension a, ou lorsqu’elle est réfléchie par un dispositif de
faible dimension a :
• lorsque a ≫ λ0 , on peut négliger la diffraction et traiter la propagation
dans le cadre de l’optique géométrique ;
• lorsque a et λ0 sont comparables, la diffraction devient significative et
l’ouverture angulaire ∆θ est de l’ordre de grandeur de λ0 /a ;
• enfin, lorsque a ≪ λ0 , la diffraction se fait dans toutes les directions
et l’obstacle peut être considéré comme une source de lumière isotrope.

2 Interférences : un autre phénomène qu’on peut considérer comme une preuve di-
recte du caractère ondulatoire de la lumière réside dans l’observation des interférences
lumineuses. On observe cette situation lorsque deux ondes lumineuses (ou plus), issues
d’une même source, peuvent parvenir au même point en suivant des chemins différents
(cf. figure 5.3 à gauche).
La source S éclaire le point M via deux dispositifs D1 et D2 , déviant la lumière dans
la direction de la zone d’observation. Si on étudie alors le comportement, au cours du
temps, des deux ondes lumineuses qui se superposent en M , on peut observer diverses
situations :
• si le déphasage entre les deux ondes, tel qu’il résulte de la différence de trajet, est
faible (représentation correspondant à la figure 5.3 à droite, en haut), la somme
96 Physique, MP, MP*

D1
t
b
Sb M Interférences constructives

D2
Interférences destructives

Figure 5.3 – Interférences lumineuses

des deux ondes qu’on observe en M a une amplitude élevée : on observe une
quantité importante de lumière. On parle alors d’interférences constructives ;
• si au contraire ce déphasage est proche de π (figure 5.3 à droite, en bas), la somme
des deux ondes en M a une amplitude faible (ou nulle) : on n’observe que peu
de lumière. On parle d’interférences destructives.
L’observation de l’alternance de zones sombres et claires, qu’on appelle franges d’in-
terférence, constitue à la fois une preuve du caractère ondulatoire de la lumière et une
méthode métrologique adaptée à la mesure très précise de faibles dimensions.

Interférences lumineuses
X La superposition en un même point de plusieurs ondes provenant d’une
même source peut conduire à la formation de franges d’interférence, jux-
taposition de zones alternativement sombres et claires.

Figure 5.4 – Figures d’interférence

Les photographies de la figure 5.4 montrent des figures d’interférence, juxtaposition


de franges claires et sombres. Sur l’image de gauche, les franges sont de forme assez
complexes ; à droite, elles sont quasiment rectilignes.

Figure 5.5 – Contraste de franges circulaires

On observe aussi la différence de contraste (le contraste désigne l’écart relatif de lu-
minosité entre franges claires et franges sombres) dans le cas des figures d’interférence
5 : L’onde lumineuse 97

de la figure 5.5 ; il s’agit dans les deux cas du même dispositif interférentiel mais les
franges (quasiment circulaires ici) sont bien contrastées à gauche, très peu à droite.
2 Polarisation : on classe habituellement les ondes de toutes natures en deux ca-
tégories : les ondes longitudinales, lorsque la grandeur oscillante vibre le long de la
direction de propagation, et les ondes transverses, lorsque cette grandeur oscillante
vibre perpendiculairement à la propagation.
Dans le cas des ondes sismiques par exemple, on peut rencontrer simultanément les
deux types de vibration ; les ondes longitudinales sont des ondes de compression et
les ondes transverses des ondes de cisaillement ; on peut illustrer cette différence de
comportement au moyen d’un modèle de déformation d’un milieu continu, représenté
par une succession de masses ponctuelles en interaction élastique (fig. 5.6).

Modèle de milieu continu Modèle de milieu continu


b b b b b b b b b b b b

b
b
b b b b b b b b
b
b
Onde de compression Onde de cisaillement

Figure 5.6 – Ondes longitudinale et transversale

Dans le cas des ondes lumineuses, l’identification n’est pas aussi facile ; ce sont les
phénomènes de polarisation qui ont permis cette identification.
On doit leur première description à Huygens‡ et leur première étude quantitative au
français Malus. On se contentera ici de dire qu’un même rayon lumineux, incident
sur certains types de cristaux transparents (par exemple la calcite, qui porte le nom de
spath d’Islande lorsqu’elle est transparente), peut donner lieu à deux rayons émergents
(figure 5.7). On parle de rayon extraordinaire pour celui qui subit une réfraction, même
en incidence normale.

Cristal

Figure 5.7 – Rayon ordinaire et rayon extraordinaire

La présence de deux ondes différentes transportées sur une même direction de pro-
pagation suggère une interprétation en terme d’ondes transverses ; donc un caractère
vectoriel de l’onde lumineuse.
Ainsi, on peut imaginer que, si une onde lumineuse se propage selon la direction ez ,
elle peut avoir deux composantes vectorielles, dirigées selon ex et ey , et qui peuvent se
propager indépendamment. Dans un milieu cristallin, les deux axes (Ox) et (Oy) ne
sont pas nécessairement équivalents et on peut imaginer deux vitesses de propagation
différentes.
Nous ferons la majorité des études ultérieures en Optique dans le cas des milieux
fluides ou des solides amorphes (verres), c’est-à-dire isotropes ; ainsi, la polarisation
ne se manifestera que rarement. Nous préciserons ultérieurement le cadre d’étude
de l’optique, vectoriel (seulement si c’est nécessaire, en présence de phénomènes de
polarisation) ou non (on parlera d’approximation scalaire de l’Optique).
98 Physique, MP, MP*

5.1.3 Longueur d’onde des ondes lumineuses

2 La couleur : les récepteurs d’ondes lumineuses ne sont pas sensibles aux ondes
lumineuses (ou plus généralement aux ondes électromagnétiques) de la même façon
selon la pulsation ω ou, ce qui revient au même, selon la longueur d’onde dans le vide
2πc0
λ0 = de ces ondes. On peut aussi dire qu’ils se comportent comme des filtres,
ω
sélectionnant telle ou telle longueur d’onde, et donc caractérisés par des fonctions de
transfert variées.
Ainsi, l’œil humain dispose de quatre types de récepteurs lumineux disposés dans le
plan de la rétine. Les bâtonnets, situés surtout en périphérie de la rétine, permettent
de percevoir la luminosité et le mouvement ; sensibles aux faibles intensités, ils sont
les seuls à être utilisés pour la vision de nuit.
Les cônes, situés surtout dans un zone appelée fovéa, permettent de différencier les
couleurs. Il existe chez l’homme trois types de cônes :
– sensibles surtout dans le rouge (avec un maximum de sensibilité pour λ0 = 570 nm) ;
– sensibles surtout dans le vert (sensibilité maximum pour λ0 = 535 nm) ;
– sensibles surtout dans le bleu (sensibilité maximum pour λ0 = 445 nm).
Ces trois types de cellules photosensibles n’ont pas la même sensibilité aux variations
d’intensité lumineuse ; en particulier, l’œil humain moyen présente une sensibilité
maximale aux alentours de λ0 = 555 nm, dans le jaune. C’est d’ailleurs pour rendre
compte de cette sensibilité particulière que le système international définit des unités
spécifiques pour la mesure des intensités, flux et éclairement lumineux (ces définitions
ne sont pas au programme) ; le candela est l’intensité lumineuse I d’une source à
λ0 = 555 nm qui émet une puissance par unité d’anglessolide dP/dΩ = 1/683 W·sr−1 ;
le lumen est l’unité de flux lumineux intégré, Φ = IdΩ ; enfin, le lux est l’unité

d’éclairement, flux par unité de surface, E = .
dS
Les mesures photométriques porteront, selon se cas, sur l’intensité énergétique I
(mesurée en W·m−2 ), ou bien sur l’éclairement E (mesuré en lux, symbole lx). Dans
le cadre de notre programme, il nous suffit de savoir que ces deux grandeurs sont
toujours proportionnelles pour une longueur d’onde donnée, mais que le coefficient
de proportionnalité dépend de la longueur d’onde.

2 Étendue du spectre électromagnétique : les ondes lumineuses ne sont qu’un cas


particulier des ondes électromagnétiques ; celles-ci sont généralement dénommées en
fonction de leur longueur d’onde dans le vide, conformément à la figure 5.8. Les
divisions qui y sont présentées sont en partie arbitraires.
2 L’effet Doppler-Fizeau : il consiste en une modification de la longueur d’onde
apparente d’une onde lorsque l’émetteur et le récepteur sont en mouvement relatif.
L’étude quantitative de cet effet ne fait pas partie du programme ; toutefois, il n’est
pas possible d’éviter de l’évoquer ici, au moins à titre documentaire, tout comme l’ont
fait de nombreux problèmes récents des concours d’entrée dans les Grandes Écoles.
2 Effet Doppler-Fizeau classique : considérons une onde, de nature quelconque, émise
par une source S en mouvement relativement à un certain référentiel galiléen (K) à
la vitesse vS = vS ex . Dans ce cas, la source S peut être décrite comme émettant des
(( tops )) périodiques, le k-ième top étant émis à l’instant tk = kT0 lorsque la source est
au point d’abscisse xS,k = vS tk ; T0 est la période propre du signal émis, c’est-à-dire
sa période pour un observateur qui accompagne S dans son mouvement.
Supposons maintenant que le récepteur R se déplace à la vitesse vR = vR ex ; au
moment de l’émission du k-ième top, le récepteur est en x0 +vR tk mais il ne recevra ce
5 : L’onde lumineuse 99

400

446

500

542

578
600

700
λ0 (nm)
b b b b b b b

orange
violet

rouge
jaune
bleu

vert
b b b b b b b

8 × 10−7
4 × 10−7

λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques

Rayons X
Rayons γ
Rayons

Ondes
Micro
ondes

radio
U.V.
Lumière

I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014

4 × 1014
ν (Hz)

Figure 5.8 – Spectre des ondes électromagnétiques

signal que plus tard, lorsqu’il sera rejoint par le signal qui voyage à la vitesse vϕ , donc
à l’instant t′k défini par la condition d’arrivée xR,k = x0 + vR t′k = xS,k + vϕ (t′k − tk ).
vϕ − vS
On en déduit t′k = tk ; la période apparente de réception est T = t′k+1 −t′k pour
vϕ − v R
vϕ − v S
le récepteur, d’où la relation T = T0 : la modification de période apparente
vϕ − v R
du signal porte le nom d’effet Doppler-Fizeau.
On remarque la compatibilité de la relation obtenue avec la mécanique classique :
cette relation ne dépend pas du choix du référentiel galiléen (K), puisqu’une vitesse
d’entraı̂nement commune ve transforme toutes les vitesses v en v ′ = v + ve et laisse
donc la relation ci-dessus inchangée.
vS
Par exemple, pour un récepteur fixe et une source mobile, on note β = la vitesse de

la source rapportée à celle de l’onde, et la pulsation apparente de réception ω = 2π/T
ω0
est reliée à la pulsation d’émission par la relation ω = . Lorsque la source se
1−β
rapproche du récepteur, β > 0 et ω > ω0 (décalage vers les hautes fréquences) ; au
contraire, lorsque la source s’éloigne du récepteur, β < 0 et ω < ω0 (décalage vers
les basses fréquences). Cet effet est mis à profit dans le cas des ondes sonores pour
effectuer des mesures de vitesse.
2 Le cas des ondes lumineuses : les ondes lumineuses (ou des ondes électroma-
gnétiques, de façon plus générale) ne peut être traité dans le cadre de la mécanique
classique, mais dans celui de la théorie relativiste, puisque la vitesse des ondes étu-
diées est c = c0 /n ∼ c0 . Toutefois, on peut montrer que l’expression précédente reste
valable lorsque la vitesse relative de l’émetteur et du récepteur reste faible devant
celle c de la lumière.
Ainsi, si une source S s’éloigne, dans le vide, du récepteur R avec une vitesse v, la
100 Physique, MP, MP*

v
f0
θ z
b b
S R
Figure 5.9 – Effet Doppler-Fizeau et ondes lumineuses

composante d’éloignement radiale étant donnée par vz = −v cos θ (cf. figure 5.9), on
peut montrer que la pulsation d’émission ω0 (mesurée dans le référentiel de l’émetteur)
et la pulsation apparente de réception ω (mesurée par le récepteur R) sont reliées par
la relation ω ≃ ω0 (1 − v cos θ/c0 ).
La vitesse c0 étant d’autre part un invariant (c’est-à-dire qu’elle ne dépend pas du
référentiel galiléen utilisé), la longueur d’onde varie, au même ordre d’approximation,
en proportion inverse, λ ≃ λ0 (1 + v cos θ/c0 ). Un éloignement (v > 0) se traduit
donc par une augmentation de longueur d’onde apparente (décalage vers le rouge)
et un rapprochement par une diminution de celle-ci (décalage vers le bleu). Cet effet
trouve son application dans le cadre de l’Astrophysique (pour la mesure des vitesses
radiales d’éloignement des astres et galaxies) mais aussi pour la mesure des vitesses
des véhicules, l’effet Doppler-Fizeau s’appliquant aussi aux ondes radar.

5.1.4 Photons et sources de lumière


2 Quantification de l’énergie du rayonnement : alors que tout modèle corpusculaire
de la lumière était abandonné au profit d’une description ondulatoire, l’étude de la
répartition spectrale des sources thermiques (par exemple, les filaments chauffés de
lampes à incandescence) a amené Planck‡ à retrouver une description quasiment
particulaire des échanges d’énergie du rayonnement avec la matière : l’énergie lumi-
neuse n’est émise ou absorbée que par quanta, unités indivisibles égales à ǫ = hν,
où ν est la fréquence du rayonnement électromagnétique émis ou absorbé et h est la
constante de Planck :

h = 6, 6261 × 10−34 J · s (5.4)

2 Les photons : les travaux de Planck furent complétés en  par ceux d’Einstein,
interprétant l’effet photoélectrique comme une interaction individuelle (et non plus
collective, comme dans une source thermique) entre les électrons d’un métal et des
particules individuelles, appelées ultérieurement photons, présentes dans tout flux lu-
mineux. L’énergie individuelle de ces particules est justement le terme ǫ = hν décrit
par Planck.
D’autres expériences mirent ultérieurement en évidence toutes les caractéristiques mé-
caniques de ces particules, obligeant à adopter une double description (on parle de
dualité onde-corpuscule de la lumière. L’extension par De Broglie de cette descrip-
tion aux particules matérielles est à la base de la théorie quantique.
Les photons se déplacent à la vitesse c0 , qui est celle de la lumière dans le vide. On
doit donc impérativement les décrire dans le cadre relativiste.
Dans ce cadre, on peut montrer que toute particule de masse m et de vitesse v
mv
possède une quantité de mouvement (ou impulsion) p = p et une énergie
q 1 − v 2 /c20
E = p2 c2 + m2 c40 . Ces relations générales admettent deux limites, respectivement
à des vitesses faibles ou voisines de c0 :
5 : L’onde lumineuse 101

• Lorsque v ≪ c0 (particules quasi-classiques), on peut écrire au premier ordre en


1
v/c les expressions p ≃ mv et E ≃ mc20 + mv 2 ; le terme mc20 , qui subsiste seul
2
dans tous les cas pour une particule au repos (p = 0) porte le nom d’énergie au
repos de la particule.
• Lorsque v → c0 , l’impulsion d’une particule ne pouvant être infinie, on doit avoir
m → 0 ; c’est en particulier le cas des photons, particules de masse nulle mais
dont l’énergie ǫ et l’impulsion p ne sont pourtant pas nulles, avec en particulier

ǫ = hν donc p = .
c0

Propriétés des photons


X Les photons sont les quanta du rayonnement électromagnétique. Ces
particules, de masse nulle, ont pour énergie ǫ = hν = hc0 /λ0 et pour
quantité de mouvement p = hν/c0 = h/λ0 dans un rayonnement élec-
tromagnétique de fréquence ν et de longueur d’onde (dans le vide) λ0 .

2 Sources spectrales : la quantification est une propriété naturelle de toute onde


confinée par des conditions aux limites, comme on l’a montré lors de l’étude des ondes
électriques. L’étude des structures atomiques montre la même quantification, et les
niveaux d’énergie d’un atome appartiennent à une série dénombrable de valeurs Ek .
Lors d’une transition énergétique, un atome émet ou absorbe donc un photon d’énergie
hν = |Ef − Ei |, en fonction des énergies initiale et finale d’un atome.
Lorsque les transitions énergétiques dans une source ont lieu exclusivement de façon
individuelle entre atomes de la source et rayonnement émis, seules certaines valeurs de
la fréquence sont possibles pour le photons émis ; on parle alors de sources spectrales.
Ces sources n’émettent de la lumière que pour des longueurs d’onde très précises, avec
seulement de faibles largeurs de raies dues, par exemple, à l’agitation thermique des
atomes de la source et à l’effet Doppler-Fizeau qui l’accompagne. L’allure du spectre
énergétique émis par une telle source est présenté sur la figure 5.10.

dI
546 nm

dλ0
577 nm
579 nm
405 nm

436 nm

492 nm

λ0

Figure 5.10 – Spectre d’émission d’une lampe à vapeur de Mercure

2 Sources thermiques : lorsque l’émission lumineuse ne s’effectue pas dans une va-
peur peu dense et transparente, mais à la surface d’un solide, les échanges d’énergie
entre l’émetteur et le rayonnement sont collectifs et décrits par un modèle statistique.
Dans le cas limite du corps noir idéal (qui sera décrit dans le cours d’Électromagné-
tisme), on prévoit un spectre énergétique continu d’émission, dont la forme générale
102 Physique, MP, MP*

est universelle et dont les caractéristiques ne dépendent que de la température T de


la source. Ce spectre de rayonnement thermique est présenté sur la figure 5.11.

dI
dλ0

98 % × Itotal
λm /2

8λm
λ λ0
b m

Figure 5.11 – Spectre d’émission d’une source thermique (corps noir)

Nous montrerons ultérieurement que la longueur d’onde λm à laquelle on observe le


C
maximum d’émission vérifie la loi de Wien‡ , λm = , où la constante universelle C
T
vérifie C = 2, 895 × 10−3 m · K.
L’intensité totale émise par unité de surface du corps rayonnant vérifie la loi de
I
Stefan‡ , = σT 4 , où la constante universelle σ (constante de Stefan) vérifie
S
σ = 5, 67 × 10−8 W · m−2 · K−4 . Ainsi, plus la température de l’émetteur est élevée,
plus il émet une puissance totale importante, concentrée vers les courtes longueurs
d’onde.
On remarque (zone grisée sur la courbe de la figure 5.11)
 que 98 % de l’intensité émise
λm
par un tel émetteur sont concentrés dans l’intervalle , 8λm .
2
Un corps noir chauffé à T = 1 500 K émet ainsi à raison de 287 kW · m−2 avec un
maximum d’émission pour la longueur d’onde 1, 93 µm, dans le proche infrarouge ; la
quasi-totalité de ce rayonnement est concentrée dans l’intervalle [0, 96 µm ; 15, 4 µm].
Le Soleil peut aussi être considéré comme un émetteur thermique, de température de
surface T ≃ 5 780 K, avec un maximum d’émission vers 500 nm, dans le visible. Son
émission se concentre dans l’intervalle [250 nm ; 2, 0 µm], qui couvre notamment tout
le domaine visible, mais comporte aussi des composantes infrarouges et ultraviolettes.

5.2 L’onde électromagnétique

5.2.1 La nature des ondes lumineuses


2 La théorie électromagnétique de la lumière : l’astronome danois Rømer proposa
la première détermination de la vitesse de la lumière en  par une méthode astro-
nomique (cf. figure 5.12) basée sur les occultations de Io, satellite de Jupiter, par le
cône d’ombre de la planète autour de laquelle Io est en mouvement.
Rømer a constaté que la période apparente de révolution de Io autour de Jupiter
variait en fonction de la position de la Terre au moment de la mesure ; il faut en effet
tenir compte d’un temps de parcours différent par la lumière pour parvenir à la Terre
selon que sa position est, sur la figure, en T1 ou en T2 . Les mesures encore peu précises
de Rømer fournirent c0 ≃ 2, 1 × 108 m · s−1 ; les méthodes ultérieures citées plus haut
5 : L’onde lumineuse 103

Cône d’ombre

Soleil

bT T1 b
2

o r b ite de I

o
Jupiter

Figure 5.12 – Détermination par Rømer de la vitesse de la lumière

permirent d’améliorer progressivement la précision de la mesure pour s’approcher de


la valeur aujourd’hui connue à c0 ≃ 3, 00 × 108 m · s−1 .
En , le physicien écossais Maxwell développa une théorie électromagnétique
unifiée, montrant la capacité des champs électromagnétiques à vérifier une équation
de propagation (équation de d’Alembert) dans le vide :

∂2E ∂2B
∆E = ε0 µ0 ∆B = ε0 µ0 (5.5)
∂t2 ∂t2

1
avec pour vitesse de propagation c0 = √ ≃ 3, 0 × 108 m · s−1 . Sur la base de cette
ε0 µ0
identification numérique, Maxwell proposa d’interpréter les ondes lumineuses comme
un cas particulier d’ondes électromagnétiques, affirmant ainsi que le lumière consiste
en ondulations transverses du support des phénomènes électriques et magnétiques,
c’est-à-dire en fait de ce qu’on identifie aujourd’hui comme l’espace vide lui-même.
2 Géométrie du champ électromagnétique : nous admettrons provisoirement les pro-
priétés du champ électromagnétique associé à une onde lumineuse se propageant dans
un milieu transparent d’indice n ; ces propriétés seront établies dans le cours d’Élec-
tromagnétisme.
L’onde électromagnétique plane progressive décrite sur la figure 5.13 se propage dans
la direction de l’axe (Ox) ; elle a pour vecteur d’onde k = kex , pour pulsation ω avec
c0 ω
pour vitesse de phase vϕ = = .
n k
Les champs électrique et magnétique sont en permanence perpendiculaires à la direc-
tion de propagation : il s’agit d’ondes transverses. L’onde représentée sur la figure 5.13
est de plus polarisée rectilignement selon (Oy), c’est-à-dire que le champ électrique
oscille au cours du temps tout en gardant une direction fixe ; nous verrons ultérieu-
rement que ce n’est pas un cas général puisque la direction de E peut être variable
dans le plan (Oyz). On notera (sur la figure 5.13, E0 = E 0 ey ) :

E = E0 exp [j (ωt − kx)] (5.6)

Le champ magnétique est en permanence perpendiculaire au champ électrique et au


vecteur d’onde, le trièdre (k, E, B) étant direct et l’amplitude du champ magnétique
vérifie B0 = E0 /vϕ ; on peut donc écrire :
104 Physique, MP, MP*

z
y

B(t′ )
t′ > t

E(t′ )
E(t) E∧B
x
B(t)

Figure 5.13 – Onde électromagnétique

n
B= ex ∧ E0 exp [j (ωt − kx)] (5.7)
c0

Les expressions (5.6) et (5.7) sont évidemment des notations complexes, commodes
pour le calcul mais dépourvues de sens direct ; on pourra les remplacer, pour une
interprétation physique, par l’étude des champs électrique et magnétique réels, à savoir
E = Re (E) et B = Re (B).

5.2.2 Transport d’énergie lumineuse


2 Propagation de l’énergie : l’onde électromagnétique décrite ci-dessus transporte
évidemment l’énergie dans la direction du vecteur d’onde, donc dans la direction
de E ∧ B. On peut analyser simplement l’unité de mesure de ce produit vectoriel
[U ]
en remarquant que [E] = , si U est une tension et L une longueur, tandis que
[L]
[µ0 ] [I] [U I]
[B] = , si I est un courant. On en déduit que [E ∧ B] = [µ0 ] 2
[L] [L ]
On notera bien que le produit vectoriel E ∧ B est défini à partir des vecteurs réels
E et B, et non pas à partir des grandeurs complexes. Plus généralement, les nota-
tions complexes ne s’appliquent qu’aux grandeurs linéaires, et jamais aux grandeurs
quadratiques, notamment énergétiques.

2 Vecteur de Poynting : on voit apparaı̂tre ci-dessus une densité surfacique de puis-


sance, qui s’exprime en watt par mètre carré, en définissant le vecteur de Poynting :

E∧B
R= (5.8)
µ0

Ce vecteur a pour interprétation la puissance P rayonnée par l’onde électromagnétique


à travers une surface (S), qui s’exprime comme le flux du vecteur de Poynting :
x
P = R · ndS (5.9)
(S)
5 : L’onde lumineuse 105

La variation temporelle rapide de cette expression (avec des pulsations de l’ordre de


1014 rad · s−1 ) explique qu’on ne s’intéresse qu’exceptionnellement à cette grandeur
P ; on se contente en général de calculer sa moyenne car aucun détecteur ne peut
suivre des évolutions aussi rapides.
2 Puissance moyenne d’une onde lumineuse : le vecteur de Poynting moyen associé
à l’onde électromagnétique déjà écrite prend, conformément aux méthodes générales
d’étude des grandeurs harmoniques, la forme :

E ∧ B∗
 
1
hRi = Re (5.10)
2 µ0

La puissance
x moyenne transportée par l’onde à travers une surface (S) s’écrit alors
hP i = hRi · ndS. Au vu de 5.6 et 5.7, et puisque E ∧ (ex ∧ E∗ ) = ex E · E∗ , on
(S)
n
écrira encore le vecteur de Poynting moyen hRi = Re (E · E∗ ) ex .
2µ0 c0

Puissance transportée par une onde


X La puissance moyenne transportée par une onde électromagnétique à
travers une section droite d’aire S est P = α × n × S × Re(E · E∗ ), où la
constante α est universelle (α = 1/2µ0 c20 ).

On se contente en général en Optique de retenir la relation de proportionnalité


P ∝ S × Re(E · E∗ ), sans mémoriser la constante de proportionnalité.

5.3 Polarisation de la lumière

5.3.1 États de polarisation


2 Polarisation : on appelle direction de polarisation d’une onde électromagnétique
la direction du champ électrique E ; c’est donc un vecteur du plan perpendiculaire à la
direction de propagation, direction qui était notée (Ox) ci-dessus. Cette polarisation
est donc entièrement définie par la direction du champ électrique E(t) à tout instant
t. Elle ne dépend donc que des seules projections non nulles du champ complexe E
dans le plan (Oyz). On notera en général :
 
0  
E 0y
E =  E 0y  exp [j (ωt − kx)] = E0J (5.11)
E 0z
E 0z

où le vecteur J est un vecteur complexe, unitaire, appelé vecteur de Jones. Ce vec-
teur permet de déterminer la direction du champ électrique réel et fournit donc une
nomenclature simple de tous les états de polarisation possibles.
 
1
2 Polarisation rectiligne : considérons d’abord le cas simple où J = , donc aussi
0
E = E 0 ey exp [j (ωt − kx)] et E = Re (E) = |E 0 |ey cos (ωt − kx + arg(E 0 )) : il s’agit
d’un champ identique à celui représenté sur la figure 5.13, avec une direction fixe pour
le champ électrique, alignée sur l’axe (Oy) : on parle de polarisation rectiligne.
106 Physique, MP, MP*

On peut aussi rencontrer des ondes lumineuses polarisées rectilignement


  selon
 d’autres

0 cos α
directions, avec par exemple les vecteurs de Jones J = ou J = ,
1 sin α
respectivement pour une onde polarisée rectilignement selon (Oz) ou selon un axe
arbitraire du plan de polarisation (Oyz), faisant l’angle α avec (Oy).
On notera que la phase commune arg(E 0 ) des deux composantes de E 0 ne joue aucun
rôle ici puisqu’on peut l’annuler par changement de l’origine des durées ; on n’hésitera
pas à faire ce type de choix dans la suite.
2 Polarisation circulaire : considérons maintenant le cas d’un vecteur de Jones présen-
tant deux composantes de même amplitude, mais déphasées  de π/2, avec par  exemple
  0
1 1 E0
J= √ ; le champ électrique Re(E) est E = √  cos (ωt − kx) , ce qu’on
2 j 2 − sin (ωt − kx)
peut représenter sur la figure 5.14 (à gauche), à différents instants successifs mais pour
une même valeur de x.
z z
t′ & t t′ & t
ci

t )′
rc

E(
ire droite

ω(t′ − t)
u la
x E(t) y x y
i re g a u

b b

E( ω(t − t) ′ E(t)
ula

t ′) he
circ
c

   
1 1 1 1
J= √ J= √
2 j 2 −j

Figure 5.14 – Polarisations circulaires



Le champ électrique correspondant tourne donc sur un cercle de rayon E0 / 2 à la
vitesse angulaire ω dans le sens des aiguilles d’une montre pour un observateur qui
regarde l’onde se propager vers lui ; on parle donc ici de polarisation circulaire droite.
 
1 1
Considérons de même le cas où J = √ ; le champ électrique réel s’écrit
  2 −j
0
E0
alors E = √  cos (ωt − kx) , représenté sur la figure 5.14 (à droite) ; on parle
2 sin (ωt − kx)
logiquement de polarisation circulaire gauche.

L’identification des signes ±j avec le sens droite ou gauche de la polarisation cir-


culaire doit être fait avec précaution ; en particulier, cette conclusion serait inversée
pour une onde se propageant dans le sens opposé de l’axe (Ox). Il est donc vivement
conseillé de toujours procéder en deux étapes : d’abord représenter le champ élec-
trique réel pour deux instants successifs, puis identifier la polarisation en se plaçant
dans le cas d’un observateur qui regarde l’onde se propager vers lui.
     
1 1 1 1 0
On peur remarquer que √ =√ ±j ; ainsi, toute onde po-
2 ±j 2 0 1
larisée circulairement peut être considérée comme la superposition de deux ondes
polarisées rectilignement selon deux directions orthogonales, déphasées de ±π/2.
5 : L’onde lumineuse 107

      
1 1 1 1 1 1
De même, = √ √ +√ ; toute onde polarisée rectiligne-
0 2 2 j 2 −j
ment est la superposition de deux ondes polarisées circulairement en sens inverse.
2 Polarisation elliptique : revenons maintenant au cas le plus général d’un vecteur
de Jones quelconque, ses deux composantes étant de norme et de phase arbitraires.
On peut choisir l’origine des durées pour rendre réelle l’une des composantes (nous
la noterons
 A ∈ R+ +
 ) mais pas l’autre (notée donc B exp (jϕ) avec B ∈ R ) ; ainsi,
A
J= donc le champ électrique réel a pour composantes instantanées
B exp (jϕ)
Ex = E0 A cos (ωt − kx) et Ey = E0 B cos (ωt − kx + ϕ). C’est l’équation paramé-
trique d’une ellipse, dont les grand et petit axes ainsi que le sens de parcours dé-
pendent des valeurs de A, B et ϕ.
La polarisation la plus générale d’une onde électromagnétique est donc une polarisa-
tion elliptique, dont les cas rectiligne et circulaire ne sont que des dégénérescences.
Sous réserve de choisir les axes (Oy) et (Oz) alignés avec respectivement de grand
axe (de longueur 2a) et le petit axe (de longueur 2b) del’ellipse, le vecteur
 de Jones 
1 a cos α
le plus général peut alors être écrit J = √ ou encore J = ,
a2 + b2 ǫjb ǫj sin α
avec ǫ = ±1 et 0 6 α 6 π/2. En effet, le champ électrique correspondant a pour com-
posantes Ey = E0 cos α cos (ωt − kx) et Ey = ∓E0 sin α sin (ωt − kx), qui correspond
à une vibration de polarisation elliptique droite (ǫ = −1) ou gauche (ǫ = +1), sauf si
α = 0 ou π/2 (polarisation rectiligne) ou si α = π/4 (polarisation circulaire).
2 Polarisation naturelle : la plupart des sources lumineuses naturelles (en particu-
lier, les sources thermiques et les lampes spectrales) émettent des ondes qui sont la
superposition aléatoire d’un grand nombre d’ondes indépendantes, de polarisations
différentes. Il n’est en général pas possible de suivre les évolutions de la direction du
champ électrique E dans le plan de polarisation ; cette direction semble évoluer de
manière aléatoire dans ce plan.
Dans une telle situation, on parle de polarisation naturelle ; on dit encore que la
lumière observée est non polarisée. On n’observera donc d’effets liés à la polarisation
de l’onde électromagnétique qu’en présence de dispositifs polarisants, ou en présence
de sources particulières (les lasers sont des sources de lumière polarisée).

5.3.2 Dispositifs polarisants


2 Polariseur : on appelle polariseur rectiligne ou, plus simplement, polariseur, un
dispositif qui réalise la projection du champ électrique incident sur une direction
particulière u : l’onde résultante est donc polarisée rectilignement selon la direction
u. Le premier polariseur rectiligne a été découvert par Malus et perfectionné par
Nicol ; le principe en est représenté figure 5.15 à gauche : le cristal de calcite présente
deux indices différents pour les deux polarisations rectilignes qui constituent la lumière
naturelle incidente (I). La géométrie du cristal est calculée de sorte qu’un des deux
rayons parvienne sur la mince couche séparant les deux parties du cristal sous une
incidence supérieure à l’angle limite de réfraction totale. Le faisceau émergent (P) est
donc polarisé.
On utilise plus couramment des polariseurs dichroı̈ques, formés de lames minces uti-
lisées en incidence normale (cf. figure 5.15 à droite). Ils sont formés de matériaux
qui présentent une anisotropie d’absorption, les lames couramment utilisées absor-
bant plus de 80 % de l’intensité pour une des deux polarisations rectilignes et moins
de 1 % pour l’autre ; la lumière résultante est donc presque complètement polarisée.
Les polariseurs dichroı̈ques les plus courants sont des polaroı̈ds, formées d’une feuille
108 Physique, MP, MP*

(P)
(P)
(I)
(I)

Figure 5.15 – Polariseurs rectilignes

de polyvinyle étirée mécaniquement. Les chaı̂nes polymères longues sont alors étirées
et des molécules polarisables (de l’iode I2 ) sont alors fixées le long de ces chaı̂nes,
provoquant l’absorption de lumière dans la direction d’alignement.
Dans les deux cas, on peut décrire l’effet d’un polariseur rectiligne idéal comme une
projection du vecteur de Jones sur la direction du vecteur u. On peut décrire cette
projection par une matrice de Jones ; par exemple, pour un polariseur qui aligne le
champ électrique sur la première direction (Oy) du plan de polarisation, la matrice
1 0
de Jones du polariseur est [M ] = et le polariseur transforme la polarisation
0 0
définie par J en une polarisation définie par J′ = [M ]J.
2 Analyseur et loi de Malus : un polariseur rectiligne de direction de polarisation
quelconque dans (Oyz), u = cos θey + sin θez est caractérisé par J′ =
 u (J · u) donc,
cos2 θ cos θ sin θ
après calcul, par la matrice de Jones [M ] = .
cos θ sin θ sin2 θ

Analyseur
Lumière à analyser
Mesure de I
Polariseur

Figure 5.16 – Analyse d’une polarisation

Un tel dispositif peut être utilisé pour déterminer la nature de la polarisation d’une
onde quelconque qui traverse ce polariseur, sous réserve d’effectuer une mesure d’in-
tensité (ou d’éclairement, ce qui revient au même) après traversée de ce polariseur
(( tournant )). L’ensemble (polariseur rectiligne et mesure de lumière) porte le nom
d’analyseur et est représenté sur la figure 5.16.
Considérons d’abord le cas où la lumière à analyser est polarisée ; nous
 considérerons
 le
cos α
cas général d’une polarisation elliptique de vecteur de Jones J = . Après
±j sin α
passage par l’analyseur, le champ électrique  est proportionnel au vecteur de Jones
cos θ
[M ]J = (cos α cos θ ± j sin α sin θ) . L’intensité lumineuse mesurée sera alors
sin θ
proportionnelle à E · E , donc à | cos α cos θ ± j sin α sin θ|2 = sin2 α + cos 2α cos2 θ.

Le tracé de la courbe donnant I(θ) = I0 sin2 α + cos 2α cos2 θ est reporté sur la figure
5.17 dans trois cas : α = 0 (polarisation rectiligne), α = π/4 (polarisation circulaire)
et α quelconque (polarisation elliptique). L’étude des variations de I(θ) nous renseigne
donc sur la nature de la polarisation étudiée. Dans le cas d’une polarisation rectiligne
(α = 0), la relation I(θ) = I0 cos2 θ porte le nom de loi de Malus de la polarisation.
Considérons à nouveau ci-dessus l’exemple de la polarisation circulaire. Le champ
électrique tournant rapidement, avec une longueur constante, dans le plan d’analyse,
il est naturel d’obtenir une projection moyenne constante sur toute direction u du plan
(Oyz). Cependant, on obtiendrait le même résultat en projetant sur le même vecteur
5 : L’onde lumineuse 109

I(θ)
Polarisation rectiligne

Polarisation
circulaire

Polarisation
elliptique θ
π 2π 3π 4π 5π

Figure 5.17 – Analyse d’une polarisation inconnue

u un champ électrique de polarisation aléatoire : il n’est pas possible de distinguer


une polarisation naturelle et une polarisation circulaire par cette méthode.

2 Lames biréfringentes : nous admettrons l’existence de dispositifs polarisants sus-


ceptibles d’introduire un déphasage arbitraire entre deux composantes rectilignes du
plan de polarisation. L’étude de ces dispositifs, qui ne figure par au programme, est
ici présentée de manière très succincte, et seulement à titre documentaire.
Si le dispositif en question déphase la composante  (Oz) relativement
 à la composante
1 0
(Oy), la matrice de Jones associée est [M ] = .
0 exp (jϕ)
En particulier, on parlera de lame demi-onde (ou lame λ/2) lorsque le déphasage ϕ
correspond à la propagation sur la moitié d’une longueur d’onde, soit ϕ = π ; on
parlera de même de lame quart d’onde (ou lame λ/4) lorsque ϕ = π/2.
On remarque que la lame n’aura pas d’autre effet qu’un déphasage global lorsque le
champ incident est aligné sur un des axes (Oy) ou (Oz) ; pour cette raison, ces deux
axes portent le nom d’axes neutres de la lame.
À titre d’exemple d’application, une lame quart  d’onde
  transforme
  une
 polarisation
1 0 1 1
circulaire en polarisation rectiligne puisque = ; le champ ré-
0 j j −1
sultant est aligné sur la seconde bissectrice des axes (Oyz). Cette propriété permet
de distinguer polarisation circulaire et polarisation naturelle, au contraire de l’emploi
d’un simple analyseur.     
1 0 1 1
Remarquons encore que = : une lame quart d’onde trans-
0 j ±1 ±j
forme aussi une polarisation rectiligne (alignée une bissectrice de ses axes neutres) en
polarisation circulaire ; c’est même ce type de dispositif qui permet de créer une onde
polarisée circulairement.

5.4 L’approximation scalaire

5.4.1 La grandeur lumineuse


2 Conditions de l’approximation : la polarisation de l’onde électromagnétique peut
n’avoir aucun effet sur un dispositif optique, par exemple parce que celui-ci ne mo-
difie pas l’état de polarisation naturelle de la lumière. Dans ce cas, les observations
faites au moyen de ce dispositif font intervenir des mesures d’intensité lumineuse (ou
d’éclairement), proportionnel à E · E∗ , que l’on peut aussi écrire |E y |2 + |E z |2 ; les
110 Physique, MP, MP*

deux composantes E y et E z sont indépendantes mais vérifient les mêmes relations


pour la propagation, l’atténuation, le déphasage, etc.
Tout se passe donc comme si on pouvait ne considérer qu’une seule de ces deux
composantes, quitte à multiplier ensuite tous les résultats par deux : c’est ce qu’on
appelle l’approximation scalaire, dans laquelle on décrit la grandeur lumineuse par
l’oscillation d’une seule onde, scalaire et non plus vectorielle.

Approximation scalaire
X Lorsqu’un dispositif optique n’introduit aucun effet de polarisation et est
utilisé en lumière non polarisée, on remplace l’étude du champ électro-
magnétique (E (r, t) , B (r, t)) par celle d’une grandeur vibrante unique,
appelée grandeur lumineuse, que nous noterons W (r, t).

On rencontre aussi le terme amplitude lumineuse, et les notations A (r, t) ou S (r, t)


pour décrire la grandeur lumineuse.

2 La grandeur lumineuse : la notion d’onde lumineuse est antérieure à la détermina-


tion de la nature électromagnétique des ondes lumineuses ; on ne précisera donc pas
dans la suite si la grandeur W (r, t) est proportionnelle, ou égale, à une composante
du champ électrique.
Comme précédemment, on utilisera éventuellement une notation complexe W (r, t),
de sorte que l’onde réelle vérifie W (r, t) = Re(W (r, t)).

Enfin, on ne précisera pas l’expression des constantes

2 α et α qui interviennent dans
l’écriture de l’intensité lumineuse I(r) = α W (r, t) ou dans celle de l’éclairement
E(r) = α′ W 2 (r, t) ; dans ces expressions, la notation hf (t)i désigne la moyenne

temporelle de la grandeur variable f (t) au cours d’une durée suffisamment longue ;


l’intervention de cette moyenne temporelle rend compte de la limite des appareils
de mesure (qu’il s’agisse de l’œil ou de dispositifs électroniques), qui ne peuvent pas
suivre les oscillations extrêmement rapides des ondes lumineuses.
Dans le cas des ondes sinusoı̈dales (c’est-à-dire, des ondes monochromatiques, avec
donc une longueur d’onde λ0 fixée), on pourra utiliser la notation complexe avec
k k′
I(r) = Re (W (r, t) W ∗ (r, t)) et E(r) = Re (W (r, t) W ∗ (r, t)). Puisque dans ce
2 2
cadre la dépendance temporelle est harmonique, on écrira W (r, t) = w(r) exp (jωt),
k k′
ce qui permet d’écrire encore I(r) = |w(r)|2 et E(r) = |w(r)|2 .
2 2

L’onde lumineuse
X Dans le cadre de l’approximation scalaire, l’onde lumineuse est une gran-
deur vibrante, W (r, t) ; l’intensité I et l’éclairement E sont proportion-
nels à la moyenne temporelle W 2 (r, t) du carré de cette grandeur.

Les ondes monochromatiques s’écrivent W (r, t) = w(r) exp (jωt) (en


notation complexe) ; I et E sont proportionnels à |w(r)|2 .

2 Équation de propagation : l’onde lumineuse est réputée vérifiée l’équation de


d’Alembert à la vitesse c (dans le milieu étudié), à savoir :

1 ∂2
∆W (r, t) = W (r, t) (5.12)
c2 ∂t2
5 : L’onde lumineuse 111

ou encore, pour une onde sinusoı̈dale W (r, t) = w(r) exp (jωt) :

ω2
∆w(r) = − w(r) (5.13)
c2

ω
Dans cette expression, le vecteur d’onde k dans le milieu étudié vérifie k = tandis
c
ω 2π
que, pour une onde de même fréquence dans le vide, on écrirait k0 = = . On
c0 λ0
c0
pourra donc faire intervenir l’indice optique n = sous la forme :
c

ω 2π
k = nk0 = n avec k0 = (5.14)
c0 λ0

5.4.2 Ondes planes, ondes sphériques


2 Structure des ondes planes : une onde lumineuse plane est une solution de (5.12)
qui ne dépend que d’une seule variable d’espace, W (r, t) = W (x, t). Dans ce cas, on
sait que la solution générale de l’équation est la somme de deux ondes progressives en
sens inverse, W (x, t) = W+ (x − ct) + W− (x + ct).
Dans le cas particulier des ondes planes monochromatiques, l’équation (5.13) devient
d2 w(x)
= −k02 w(x) d’où w(x) = w+ exp (−jk0 x)+w− exp (jk0 x) ; on retrouve bien la
dx2
somme de deux ondes planes progressives monochromatiques en sens inverse, puisque
W (x, t) = w+ exp [j (ωt − k0 x)] + w− exp [j (ωt + k0 x)].
Plus généralement, si une onde lumineuse plane progressive monochromatique se pro-
page dans un milieu transparent et dans une direction qui n’est pas dans la direction
d’un des axes de coordonnées, nous la noterons selon la forme générale (5.15), en
fonction de l’amplitude w0 de l’onde, et du vecteur d’onde k = ke, où e est le vecteur
unitaire de la direction de propagation de l’onde lumineuse.

W (r, t) = W (x, y, z, t) = w0 exp [j (ωt − k · r)] (5.15)

2 Lois de Snell-Descartes : considérons une onde lumineuse plane progressive se


propageant dans un milieu d’indice n1 en direction du dioptre (localement assimilé à
un plan) (Oxy) séparant ce milieu du milieu d’indicen2 . On pourra noter cette onde
sin θ1
n1 ω 
incidente w1 = w01 exp (−jk1 · r), avec k1 = 0  ; l’angle θ1 est ainsi
c0
cos θ1
l’angle d’incidence de cette onde sur le plan du dioptre, tandis que (Oxz) est le plan
d’incidence (figure 5.18).
Nous admettrons l’existence d’une onde transmise w2 = w02 exp (−jk2 · r) dans le
milieu d’indice n2 et d’une onde réfléchie w′1 = w′01 exp (−jk′1 · r) réfléchie vers le
milieu d’indice n1 , et chercherons à quelle condition ces ondes peuvent vérifier la
relation de passage imposée par la continuité de l’onde w de part et d’autre du dioptre :
w1 (z = 0− ) + w′1 (z = 0− ) = w2 (z = 0+ ) ; les justifications théoriques à la base de
cette relation de passage seront établies ultérieurement.
Écrivantcette relation en un point quelconque (x, y, 0) du plan du dioptre, on aura
n1 ω
sin θ1 x + w′01 exp −j k1x
 ′ ′

w01 exp −j x + k1y y = w02 exp (−j [k2x x + k2y y]).
c0
112 Physique, MP, MP*

n2
θ2
θ1′ z
n1
θ1

Figure 5.18 – Réfraction et réflexion d’une onde sur un dioptre

Cette relation doit être vérifiée ∀(x, y) ; les fonctions x 7→ exp (ax) pour diverses

valeurs de a formant une famille libre, cette relation impose k1y = k2y = 0, mais aussi
′ n 1 ω
k1x = k2x = sin θ1 : on dira que la composante tangentielle du vecteur d’onde se
c0
conserve.

La relation k1y = k2y = 0 montre que les deux ondes réfléchie et transmise se pro-
pagent dans le plan d’incidence (c’est la première loi de Descartes), ce qui permet de
faire le tracé de la figure 5.18 définissant les angles de réflexion θ1′ et de réfraction θ2 .
′ n1 ω n2 ω
On en déduit alors k1x = sin θ1′ et k2x = sin θ2 , d’où il découle immédiate-
c0 c0

ment θ1 = θ1 et n1 sin θ1 = n2 sin θ2 : on retrouve ainsi la deuxième loi de Descartes.
Ces propriétés nous incitent à considérer que le rayon lumineux de l’Optique géo-
métrique est bien représenté par la direction du vecteur d’onde de l’onde lumineuse
w (r, t).

Lois de Snell-Descartes
X La continuité (admise) de l’onde lumineuse de part et d’autre d’un
dioptre impose la conservation de la composante tangentielle du vec-
teur d’onde ; on en déduit les deux lois de Snell-Descartes de la réflexion
et de la réfraction :
• l’onde réfléchie et l’onde réfractée se propagent dans le plan d’incidence,
défini par l’onde incidente et la normale au dioptre au point d’incidence ;
• l’onde réfléchie est symétrique de l’onde incidente par rapport à la
normale ; lors de la réfraction, l’onde traverse la normale et vérifie la
relation n1 sin θ1 = n2 sin θ2 .

2 Ondes sphériques : si une onde lumineuse se propage dans le vide depuis un point
source O, on peut la chercher sous la forme w(r) = w(r) en  coordonnées sphériques ;
ω2

1 d dw
on peut aussi montrer l’expression du laplacien ∆w = 2 r2 = − 2 w et on
r dr dr c
a(r) d2 a ω2
en trouve la solution en écrivant w(r) = , qui mène à = − 2 a, d’où une
r dr2 c
solution pour a(r) en somme de deux exponentielles complexes conjuguées, avec donc
exp [j (ωt − k0 r)] exp [j (ωt + k0 r)]
W (r, t) = a+ + a− .
r r
exp [j (ωt − k0 r)]
On parle d’onde sphérique divergente depuis O pour W (r, t) = a+
r
5 : L’onde lumineuse 113

exp [j (ωt + k0 r)]


(qui se propage dans le sens des r croissants), tandis que a− est
r
convergente vers O (puisqu’elle se propage dans le sens des r décroissants).
Dans les deux cas, on remarque un facteur d’amplitude (proportionnel à 1/r) dont on
néglige souvent en général les variations tant qu’on reste à grande distance de O.

2 Les ondes de l’optique géométrique : considérons des ondes qui se propagent dans
les conditions de Gauss, c’est-à-dire telles que la direction de propagation fait en tout
endroit un angle faible avec l’axe optique (Ox) ; la figure 5.19 présente la propagation
d’une onde plane (à gauche) et d’une onde sphérique (à droite) dans ces conditions.
y y

α x S x
b

Figure 5.19 – Ondes plane et sphérique dans les conditions de Gauss

Sur cette figure, les traits pleins désignent les directions de propagation, et les traits
pointillés les surfaces à phase constante ; pour une onde plane, exp [j (ωt − k · r)] = cte
définit des plans perpendiculaires à k.
Pour une onde sphérique, exp [j (ωt − kr)] = cte définit des sphères centrées sur S.
Dans les deux cas, on parle de surfaces d’onde ou de surfaces équiphase.
Dans les deux cas, les surfaces d’onde sont perpendiculaires aux rayons lumineux.
Nous généraliserons bientôt ce résultat sous le nom de théorème de Malus.

2 Caractérisation des ondes planes et sphériques : pour l’onde plane de la figure 5.19,
k = nk0 (cos αex + sin αey ) donc w(r) = w0 exp [j (ωt − nk0 (x cos α + y sin α))] ou,
dans les conditions de Gauss, w(r) = w0 exp [j (ωt − nk0 (x + yα))]. Nous noterons
encore ce résultat sous la forme w(r) = w0 exp [j (ωt − Φ(x, y))], la phase Φ d’une
onde plane variant en raison affine de y à x fixé, Φ(x, y) = nk0 (x + yα).

Considérons de même l’onde sphérique de la figure 5.19, pour laquelle nous écrirons
a
w(r) = 0 exp [j (ωt − Φ(x, y, z))], où Φ(x, y, z) = ±nk0 r, avec le signe + pour une
r
onde divergente p et le signe − pour une onde convergente. La distance r de S au point
(x, y, z) est r = (x − xS )2 + y 2 + z 2 .
y2
Dans le plan de figure (z = 0), on peut écrire r ≃ |x − xS | + dans les
2|x − xS |
conditions de Gauss ; d’autre part, |x−xS | = ±(x−xS ) avec la même signification pour
les signes + et − que ci-dessus. Finalement, on obtient dans tous les cas Φ(x, y, z) =
y2
 
nk0 (x − xS ) + .
2(x − xS )

Finalement, dans un plan de front (plan perpendiculaire à l’axe optique (Ox)), la


phase d’une onde dépend des coordonnées (y, z) dans ce plan, ainsi que de la longueur
d’onde λ0 dans le vide, et de l’indice n du milieu.
114 Physique, MP, MP*

Phase d’une onde plane dans les conditions de Gauss


X Si la phase s’écrit (à x fixé et à une constante additive près) sous la

forme Φ = n [αy + βz], l’onde est plane et se propage dans la direction
λ0
définie par les cosinus directeurs α et β, définis par e·ey = α et e·ez = β,
où e est le vecteur unitaire qui dirigé k.

Phase d’une onde sphérique dans les conditions de Gauss


X Si la phase s’écrit (à x fixé et à une constante additive près) sous la forme
2π ρ2
Φ=n , avec ρ2 = y 2 + z 2 , l’onde est sphérique et passe par
λ0 2(x − xS )
un point de convergence en x = xS .

2 Approximation plane d’une onde sphérique : considérons le cas d’une onde plane
émise depuis l’origine O d’un système de coordonnées (Oxy), et atteignant le point
M0 de coordonnées (x0 , ǫ) (cf. figure 5.20).
y onde
plane
onde M1
b
sphérique r = OM1
ǫ
M0
b b
x0 x

Figure 5.20 – Onde plane et onde sphérique


q
L’onde sphérique a pour phase en M1 ϕ(M1 ) = nr avec r = x20 + ǫ2 soit, si
λ0
ǫ2 ǫ2
   

x0 ≫ ǫ, ϕ(M1 ) = n x0 + . On peut aussi écrire ϕ(M1 ) = ϕ(M0 ) 1 + 2 ,
λ0 2x0 2x0
où M0 est le projeté de M1 sur l’axe (Ox).
De même, on peut comparer l’amplitude de l’onde en M1 et en M0 ; ces amplitudes
w(M1 ) x0 ǫ2
variant comme l’inverse de la distance à la source, = ≃ 1 − 2 . Dans les
w(M0 ) r 2x0
deux cas, on constate que les écarts sont du second ordre en ǫ/x0 ; on pourra donc
éventuellement, si ǫ ≪ x0 , écrire que l’onde émise de O prend en M0 et en M1 la même
valeur (même amplitude et même phase) ; c’est l’approximation des objets à l’infini,
pour lesquels on remplace l’onde sphérique issue de O par une onde plane parallèle à
l’axe optique (Ox) du système ; en effet, une telle onde plane vérifie exactement, par
construction, w(M0 ) = w(M1 ).

Toutefois, les conditions de cette approximation doivent être précisées quantitative-


ment, selon l’usage qu’on veut en faire :
• Si on ne s’intéresse donc qu’à l’amplitude de l’onde, il suffit que ǫ ≪ x0 pour
pouvoir assimiler une onde sphérique à une onde plane. Par exemple, pour une
zone éclairée de largeur ǫmax ≃ 1 cm, un objet placé à quelques mètres peut
très raisonnablement être considérée comme à l’infini, du point de vue de la
répartition de l’amplitude lumineuse obtenue.
5 : L’onde lumineuse 115

• Par contre, si on prend en compte la phase de l’onde, la condition peut être beaucoup
plus restrictive ; en effet, l’écart de phase entre onde plane et onde sphérique
π nǫ2
est de l’ordre de ϕ(M1 ) − ϕ(M0 ) ≃ ; cet écart n’est négligeable (par
p λ0 x0
exemple devant π) que si ǫ ≪ x0 λ. Ainsi, si on éclaire dans le domaine visible
(λ0 ∼ 500 nm) un dispositif optique de largeur ǫmax ≃ 1 cm, on ne pourra
traiter la source comme disposée à l’infini que si x0 ≫ 200 m.
Ainsi, une source ponctuelle S disposée à un mètre de distance d’une lentille (voir plus
bas) éclaire celle-ci de manière quasiment uniforme, mais on ne peut pas assimiler
l’onde à une onde plane, puisqu’on sait bien que l’image S ′ de S est en général
différente de celle F ′ qu’on obtient à partir d’un objet à l’infini.
2 Optique géométrique et transformation de phase : l’optique géométrique peut être
considérée comme l’étude des appareils (lentilles, miroirs, etc.) ayant pour but de
transformer une onde sphérique en une autre onde sphérique (stigmatisme pour un
couple de points à distance finie), une des deux ondes pouvant être remplacée par une
onde plane (si l’objet ou l’image est à l’infini).
Tout dispositif optique dans les conditions de Gauss peut donc être assimilé à un
système plan, perpendiculaire à l’axe optique, réalisant une transformation de phase.

y Π1 Π2
I1 I2 e(ρ)
b b
e(ρ) α
C2 S x
b b b 2 b
S1 C1

e0

Figure 5.21 – Lentille sphérique mince

Considérons par exemple une lentille mince, milieu d’indice nV , disposée dans l’air
(pour lequel nous prendrons n ≃ 1), séparée de l’extérieur par deux surfaces sphériques
de centres C1 et C2 et de rayons R1 et R2 (cf. figure 5.21). Un rayon lumineux qui
traverse cette lentille doit, pour passer du plan de front Π1 eu plan de front Π2 , se
e(ρ)
propager à travers la lentille (indice nV , distance parcourue ≃ e(ρ) dans les
cos α
conditions de Gauss ; α est l’angle du rayon dans la lentille avec l’axe (Ox)) mais
aussi dans le vide (indice n ≃ 1, distance parcourue ≃ e0 − e(ρ)).

Cette traversée augmente donc la phase de l’onde de ∆Φ(ρ) = (e0 + (nV − 1)e(ρ)).
λ0
On calcule facilement e(ρ) en déterminant les abscisses x1 et x2 de I1 et I2 . Prenant
2 ρ2
pour x1 l’origine en S1 , il vient (x1 − R1 ) + ρ2 = R12 donc x1 ≃ ; en effet, la
2R1
condition cos α ≃ 1 impose x1 ≪ R1 .
ρ2
De même, x2 ≃ − avec l’origine en S2 . Enfin, e(ρ) = e0 − x1 + x2 et le déphasage
2R2    
2π nV − 1 1 1
apporté par la lentille est ∆Φ(ρ) = nV e0 + + ρ2 ; on choisit
  λ 0 2 R 1 R 2
1 1
de noter V = (nV − 1) + .
R1 R2
116 Physique, MP, MP*

Une onde sphérique arrivant sur la lentille (supposée mince, coupant l’axe optique
au point origine x = 0), divergente depuis le point source d’abscisse xS = p, donc
2π ρ2
de phase Φi = , sera donc transformée en une onde émergente, dont la phase
λ0 2p
2π ρ2 1
 
varie en fonction de ρ selon Φe = + V ; on peut donc définir un point de
λ0 2 p
′ 1 1 1
convergence sur l’axe, d’abscisse p telle que + V = ′ . V = ′ est la vergence de la
p p f
lentille, f ′ sa distance focale
 image. Larelation qui définit V peut se généraliser sous
1 1
la forme V = (nV − 1) − à toutes les lentilles minces sphériques, quel
S1 C1 S2 C2
que soit le caractère convexe ou concave de leurs faces.

5.4.3 Propagation de l’onde optique


2 Propagation dans un milieu quelconque : le parcours de la lumière dans un dispo-
sitif optique réel impose de nombreuses réfractions et réflexions successives ; le milieu
constituant un système optique est en général hétérogène, même s’il est souvent formé
d’une succession de milieux homogènes, et la trajectoire est une certaine courbe, sou-
vent formée de segments de droite.
Considérons une courbe quelconque C, susceptible d’être éventuellement parcourue
par la lumière dans un milieu non nécessairement homogène. Ce milieu est caractérisé
par l’indice optique n(r) au point r. Le temps de trajet par la lumière sur un élément
n(r)
de longueur ds de la courbe C peut être écrit sous la forme dt = ds ; on choisira
c0
1
de le noter dt = dL où on a défini le chemin optique élémentaire dL, grandeur
c0
algébrique qui généralise aux trajets optiques la notion d’abscisse curviligne définie
pour les trajectoires mécaniques :

dL = n(r)ds (5.16)

Pour un trajet fini de A à B, on écrira encore, en choisissant de noter (AB) le chemin


optique total L de A à B :

Z B
L = (AB) = n(r)ds (5.17)
A

Si l’élément de longueur ds est assez court, l’onde lumineuse peut être considérée
comme localement plane, de vecteur d’onde k = nk0 et où et désigne le vecteur unitaire
k
tangent à la courbe C ; on peut encore écrire dL = · dr puisque ds = et · dr.
k0
L’onde lumineuse en deux points voisins r et r + dr vérifie donc la relation de pro-
pagation W (r + dr, t) = W (r, t) exp (−jk · dr) ≃ W (r, t) (1 − jk0 dL) en fonction
du chemin optique. C’est une équation différentielle, de la forme dW = −jk0 dLW
dont la solution générale, en un point M quelconque atteint à partir d’une source S
arbitraire, s’écrit :

W (M, t) = W (S, t) exp (−jk0 L) = W (S, t) exp [−jk0 (SM )] (5.18)


5 : L’onde lumineuse 117

Phase de l’onde optique


X La phase de l’onde optique en un point M est, relativement à sa phase

au point d’émission S, augmentée de ∆ϕ = (SM ) :
λ0
 

w(M ) = w(S) exp −j k0 (SM )
λ0

2 Le théorème de Malus : considérons un faisceau lumineux issu d’une source ponc-


tuelle S. On appellera surface d’onde ou surface équiphase de ce faisceau l’ensemble
des points M tels que (SM ) = constante ou L = constante.
Déterminer la forme d’une surface d’onde, c’est déterminer la direction de sa normale
grad L, qu’on obtient par définition selon dL = net · dr = grad L · dr pour tout
déplacement dr. Cette égalité impose grad L = net : la normale des surfaces équiphase
(dirigée par grad L) est donc la direction de et (la tangente aux rayon lumineux).

Théorème de Malus
X Les rayons lumineux sont orthogonaux aux surfaces d’onde.
118 Physique, MP, MP*

Ce qu’il faut absolument savoir

L’onde optique est caractérisée par une grandeur vibrante W (M, t) ; dans le
cas des ondes monochromatiques, on l’écrit W (M, t) = w(M ) exp (jωt). L’onde
se propage à la vitesse de phase c = c0 /n, où n est l’indice optique du milieu
(n > 1 en général). On retiendra c0 ≃ 3, 00 × 108 m · s−1 .
L’intensité et l’éclairement lumineux sont proportionnels à W (M, t)2 ou, dans

le cas monochromatique, à |w(M )|2 .


On caractérise l’onde par sa longueur d’onde dans le vide λ0 = 2πc0 /ω. Pour
la lumière visible, λ0 varie de 400 nm (bleu) au 700 nm (rouge). En général,
l’indice n dépend de λ0 , souvent sous le forme n(λ0 ) = a + b/λ20 , sauf pour le
vide (n = 1).
Lors de sa propagation, une onde optique se déphase progressivement ; on écrira
w(M ) = w(S) exp (−jΦ) où le déphasage entre la source S et le point M est

Φ= (SM ), où (SM ) est le chemin optique parcouru.
λ0
Pour une onde plane, la phase Φ varie comme k · r ; en particulier, si A et B

sont sur un même rayon rectiligne, ΦB − ΦA = k · AB, avec kkk = n . Pour
λ0
une onde sphérique, la phase Φ varie comme kr ; en particulier, si A et B sont

sur un même rayon, ΦB − ΦA = n AB.
λ0
Les rayons lumineux sont, en tout point, perpendiculaires aux surfaces d’onde
(surfaces équi-phase) : c’est le théorème de Malus.
Lors de la traversée d’un dioptre plan séparant deux milieux d’indices différents
n1 et n2 , l’onde subit une réflexion et une réfraction. Les ondes réfléchie et
réfractée se propagent dans le plan d’incidence (défini par le rayon incident et
la normale au dioptre au point d’incidence). Au cours de la réflexion comme de
la réfraction, le rayon traverse cette normale. Le rayon réfléchi est symétrique
du rayon incident relativement à la normale ; le rayon réfracté vérifie la relation
n1 sin θ1 = n2 sin θ2 .
On rend compte des phénomènes de polarisation en décrivant l’onde lumineuse
comme une onde électromagnétique, caractérisée par le trièdre orthogonal direct
(k, E, B) ; la direction de polarisation est celle du vecteur E ; elle est donc
orthogonale à la direction de propagation.
Sauf en lumière non polarisée (lorsque la direction de E varie aléatoirement), le
vecteur E décrit en général une ellipse dans le plan de polarisation, avec pour
cas particuliers les polarisations rectiligne et circulaire (droite ou gauche, selon
le sens de rotation apparent de E pour un observateur qui regarde l’onde se
diriger vers lui).
Un polariseur (rectiligne) projette le champ électrique sur une direction fixe.
L’utilisation d’un polariseur tournant (angle variable θ) suivi d’une mesure
d’intensité (analyseur) permet de déterminer la polarisation de l’onde étudiée.
En particulier, la loi de Malus I = I0 cos2 θ identifie une polarisation rectiligne.
Chapitre 6

Optique géométrique

6.1 Imagerie dans les conditions de Gauss

6.1.1 Stigmatisme
2 Objets et images : le but des systèmes optiques utilisés en imagerie est la formation
d’images (nettes) à partir d’objets lumineux. Nous considérons dans la suite qu’un
objet lumineux est un ensemble de points A, et que le système doit, pour chaque point
A, former une image ponctuelle A′ .
Rappelons ici qu’on appelle objet tout point à partir duquel une onde lumineuse
sphérique diverge. Si ce point de divergence est situé après la face d’entrée du système
optique étudié, on dit que l’objet est virtuel, et qu’il est réel sinon. Un objet virtuel A
est, en pratique, un faisceau convergent qui convergerait vers A, si le système optique
était absent. Si le faisceau sphérique divergent devient un faisceau parallèle, l’objet
est rejeté à l’infini.
De même, on appelle image tout point vers lequel une onde lumineuse sphérique
converge. Si ce point de convergence est situé après la face de sortie du système
optique étudié, on dit que l’image est réelle, et qu’elle est virtuelle sinon. Une image
virtuelle A′ est, en pratique, un faisceau divergent qui semble provenir du point A′ .
Si le faisceau sphérique convergent devient un faisceau parallèle, l’image est rejetée à
l’infini.
2 Condition de stigmatisme : on dit qu’un système optique (Σ) est stigmatique pour
le couple (A, A′ ), ou encore que A′ est l’image de A, si tout rayon lumineux issu de
A passe, après traversée du système (Σ), par le point A’.

Système
A A′
b b

(Σ)

Figure 6.1 – Stigmatisme d’un système optique (Σ)


120 Physique, MP, MP*

La figure 6.1 présente un cas de stigmatisme, pour un point objet réel A et un point
image réel A′ . Le tracé (en pointillés) des surfaces équiphase montre que les points A
et A′ peuvent être considérés comme les limites de telles sphères équiphase, lorsque
leur rayon r → 0. On peut interpréter cette propriété comme suit : si tous les rayons
lumineux quittent A avec, pour l’onde optique w(A), la même phase, alors des rayons
lumineux retrouveront la même phase lorsqu’ils convergent en A′ .
On peut d’ailleurs donner une interprétation directe de cette propriété, en imaginant
l’arrivée, en un même point M , de plusieurs ondes lumineuses w1 , w2 , . . .X, déphasées
arbitrairement. Notant par exemple wi = w0 exp (−jϕi ), la somme w = wi peut
i
être représentée sur la figure 6.2 comme la somme d’un grand nombre de complexes
arbitrairement déphasés.

b b b

Déphasages aléatoires Déphasages nuls Déphasages faibles

Figure 6.2 – Ajout d’ondes déphasées : un point de vue géométrique

Lorsque on somme (somme vectorielle bien sûr) en M un grand nombre d’ondes


arbitrairement déphasées (figure 6.2 à gauche), on obtient manifestement une quasi-
annulation deux à deux des ondes qui s’ajoutent en M : on n’observera pas de lumière
(on pourrait parler d’interférences destructives). Au contraire, lorsque les déphasages
des ondes qui se superposent en M sont nuls ou très faibles (figure 6.2 au centre),
l’ajout des amplitudes conduit à une amplitude totale maximale : on observera un
maximum de lumière (on pourrait parler d’interférences constructives). Ainsi, ce n’est
que dans le cas où toutes les phases sont égales à l’arrivée en A′ qu’on observera l’image
de A. Ce résultat peut être énoncé comme suit :
Condition de stigmatisme
X Le système optique (Σ) est stigmatique pour le couple (A, A′ ) si et seule-
ment si tous les rayons issus de l’objet A atteignent l’image A′ avec le
même chemin optique L = (AA′ ) ; celui-ci est donc indépendant du rayon
lumineux particulier choisi et on écrira (AA′ ) = cte.

2 Limites de l’optique géométrique : il existe un troisième cas, présenté sur la figure


6.2 à droite ; c’est celui où les différents déphasages sont faibles mais non nuls. Comme

la phase de l’onde optique s’exprime selon Φ(M ) − Φ(S) = (SM ), cela signifie que
λ0
les écarts entre chemins optiques sur les différents rayons qui parviennent en un point
M donné sont du même ordre de grandeur que λ0 ; la plupart du temps, cela veut
aussi dire que la dimension caractéristique du système optique étudié est du même
ordre de grandeur que λ0 .
Dans un tel cas, on pourra observer une accumulation de lumière non nulle ailleurs
qu’au niveau de l’image géométrique, et en pratique de part et d’autre de celle-ci : il
s’agit des phénomènes de diffraction. Avant même leur étude au chapitre prochain,
nous noterons dès maintenant les deux propriétés principales de la diffraction :
6 : Optique géométrique 121

Diffraction et imagerie
X Lorsque la dimension a d’un système optique et la longueur d’onde λ0
sont d’un ordre de grandeur comparable, on observera des écarts à la
formation de l’image géométrique, qui reste le centre de la zone lumineuse
(ou tache de diffraction).
Nous établirons que l’ordre de grandeur de l’écart angulaire de part et
d’autre de l’image géométrique est en général donné par ∆θ ∼ λ0 /a.

Nous négligerons dans l’étude de l’imagerie géométrique les phénomènes de diffraction,


sauf pour préciser qualitativement les limites de qualité des instruments d’optique,
lorsqu’ils sont dus à la diffraction.

6.1.2 Conditions de Gauss


2 Stigmatisme des systèmes centrés : ici et dans toute la suite, nous étudions un sys-
tème optique (Σ) centré, d’axe de symétrie (Ox) ; du fait de la symétrie de révolution,
l’étude se fera dans le plan (Oxy) de la figure 6.3.
y
+

α H(α) x
b b
A
(Σ)

Figure 6.3 – Notations pour un système centré

On appellera A un point de l’axe, et un rayon lumineux issu de A est entièrement


caractérisé par l’angle orienté α fait par ce rayon avec l’axe optique. Un tel rayon
coupe l’axe optique en un point de l’axe que nous noterons H(α).
Enfin, toutes les surfaces (dioptres, miroirs) rencontrées par un tel rayon au cours
de sa propagation seront supposées régulières (sans point anguleux), ce qui signifie
qu’au niveau de leur intersection avec l’axe optique, elles sont normales à celui-ci ; en
particulier, un rayon lumineux incident sur (Σ) le long de l’axe optique (α = 0) reste
confondu avec ces axe jusqu’à sa sortie de (Σ).
Un système centré est stigmatique pour un couple de points (A, A′ ) de l’axe optique
si et seulement si H(α) = A′ , ∀α ; ceci implique que le chemin optique L(α) = (AA′ )
soit indépendant de α.
De telles relations ne sont, même pour des systèmes optiques simples (formés par
exemple d’un dioptre unique) qu’exceptionnellement vérifiées, et seulement pour un
couple unique de points (A, A′ ) ; nous nous contenterons donc dans la suite de condi-
tions de stigmatisme approché, en imposant L(α) ≃ cte, au moyen donc d’un déve-
loppement limité.
2 Stigmatisme dans les conditions de Gauss : le chemin optique L(α) est évidemment
une fonction paire de α, puisque le changement de α et −α correspond aux mêmes
parcours du fait de l’invariance de révolution (voir le trajet pointillés sur la figure
6.3). On en déduit que, pour des angles assez faibles, le développement de L(α) ne
contient que des termes pairs, L(α) = L0 + h(A)α2 + k(A)α4 + . . ..
On appelle relation de conjugaison la condition h(A) = 0 ; elle impose en général la
position du point A′ . Si elle est réalisée, le chemin optique est constant au quatrième
122 Physique, MP, MP*

ordre près en α et on aura réalisé le stigmatisme approché du système optique pour le


couple de points (A, A′ ), où l’image A′ de A est alors définie comme A′ = lim H(α).
α→0

Stigmatisme approché des systèmes centrés


X Si tous les rayons lumineux sont limités à des angles (par rapport à l’axe
optique) faibles, on dit que le système vérifie la première condition de
Gauss. Dans ce cadre, un système centré présente, pour tout objet de
l’axe optique, le stigmatisme approché pour un couple (A, A′ ), où le point
A′ , situé sur l’axe optique, porte le nom d’image de Gauss de A.

2 Aplanétisme dans les conditions de Gauss : la formation d’images ponctuelles à


partir d’objets ponctuels n’est pas suffisante pour parler d’imagerie ; nous chercherons
donc à quelle condition un objet étendu AB peut donner une image étendue A′ B ′ par
un système optique (Σ).
Isolons pour cela un des dioptres qui constituent le système centré (Σ), et remplaçons
celui-ci par la sphère tangente qui figure sur le schéma 6.4. On note C le centre de cette
sphère, S son sommet (son intersection avec l’axe optique) et I le point d’incidence
du rayon AIA′ sur le dioptre, qui sépare des milieux d’indices n et n′ .
y
I b x′
+

B
u′ b
A α θ x
b bS b b
u C A′ α′

b
R
B n n′

Figure 6.4 – Aplanétisme d’un système centré

La rotation de l’ensemble d’un angle arbitraire θ de l’ensemble laisse le dioptre in-


changé mais transforme le couple objet A, image A′ en un couple (B, B ′ ), pour lequel
le système reste évidemment stigmatique. On pourra considérer que l’objet AB et
l’image A′ B ′ sont contenus dans des plans de front (plans perpendiculaires à l’axe
optique) si leurs dimensions restent assez faibles devant le rayon de courbure R du
dioptre : les rayons doivent rester limités à des points B ou B ′ voisins de l’axe.
Un système qui forme des images droites, dans un plan de front, à partir d’objets
droits, dans des plans de front, est dit aplanétique. Cette propriété s’étend par asso-
ciativité à tout système centré :

Aplanétisme approché des systèmes centrés


X Si tous les rayons lumineux restent (par rapport à l’axe optique) à des
distances faibles (devant les divers rayons de courbure des dioptres et
miroirs), on dit que le système vérifie la seconde condition de Gauss.
Dans ce cadre, un système centré présente, pour tout objet étendu AB
dans un plan de front, l’aplanétisme approché : l’image de AB est A′ B ′ ,
image droite dans un plan de front.

2 Invariant de Lagrange et Helmholtz : considérons, sur la figure 6.4, le rayon lumi-


neux particulier BSB ′ . La relation de Snell-Descartes n sin u = n′ sin u′ devient, dans
6 : Optique géométrique 123

A′ B ′ AB
les conditions de Gauss, n =n (on assimile les sinus et les tangentes). On
SA′ SA
remarque de même, en considérant le rayon lumineux AIA′ et en assimilant SI à un
SI SI
segment de droite, que |α| = et |α′ | = .
SA SA′
Ces deux relations considérées ensemble, et prenant en compte les divers signes,
conduisent à nABα = n′ A′ B ′ α′ ; le terme nABα se conserve ainsi à la traversée d’un
dioptre ; il se conservera évidemment de proche en proche à la traversée d’un nombre
quelconque de dioptres et forme finalement l’invariant de Lagrange et Helmholtz‡
(6.1), pour un système optique formant une image de dimension A′ B ′ à partir d’un
objet de dimension AB.

nentrée × AB × α = nentrée × A′ B ′ × α′ (6.1)

Dans cette relation, les indices des milieux d’entrée et de sortie sont la plupart du
temps identiques, les systèmes centrés étant plongés dans l’air.

Il est important de retenir, dans cette relation, la définition des angles α et α′ : ce


sont les angles algébriques faits avec l’axe optique, avant et après le système centré,
par le même rayon lumineux, issu de A et donc passant par A′ .

2 Conjugaison et grandissement : tout système centré utilisé dans les conditions de


Gauss est donc à la fois stigmatique et aplanétique ; il est donc entièrement caractérisé
par deux relations :

• la relation de conjugaison, qui permet de déterminer la position A′ = f (A) de


l’image A′ (sur l’axe optique) d’un objet ponctuel arbitraire A (également sur
l’axe optique) ;
• les relations de grandissement, qui permettent de déterminer la dimension A′ B ′ de
l’image étendue dans un plan de front de l’objet AB, lui même étendu dans un
plan de front.

On définit alors le grandissement linéaire transversal γ par la relation (6.2) ; c’est en


général une fonction de la position de l’objet A.

A′ B ′
γ= (6.2)
AB

Toutefois, l’existence de l’invariant de Lagrange et Helmholtz permet de remplacer


l’étude de γ par celle du grandissement angulaire (ou grossissement) G, défini par la
relation (6.3), qui montre aussi son lien avec γ. L’étude de G est préférable à celle de
γ pour les systèmes afocaux (systèmes formant des images à l’infini à partir d’objets à
l’infini), c’est-à-dire lorsqu’on définit toutes les dimensions apparentes par des angles.

α′ nentrée
G= Gγ = (6.3)
α nsortie
124 Physique, MP, MP*

6.2 Lentilles et miroirs

6.2.1 Lentilles sphériques


2 Lentilles sphériques minces : on a déjà eu l’occasion de présenter ce type de
dispositif ; la figure 6.5 rappelle quelques notations relatives aux lentilles minces, et
en particulier le fait que leur épaisseur décroı̂t avec la distance ρ à l’axe optique.
Notant R1 et R2 les rayons algébriques  des deux  faces (sur la figure, R1 > 0 et
1 1
R2 < 0), on a montré que e(ρ) = e0 − − ρ2 .
R1 R2
y

e(ρ)
Ab S1 b b
S
b 2
Ab′ x

ρ O
b b
I1 I2
e0

Figure 6.5 – Lentille sphérique mince

Considérons alors le rayon lumineux AI1 I2 A′ ; pour le calcul du chemin optique


L = (AI1 I2 A′ ), on peut remplacer les trajets courts de I1 à I2 par leurs projec-
tions horizontales (puisque dans les conditions de Gauss cos α ≃ 1), alors qu’on ne
pourra pas faire cette approximation pour les trajets longs AI1 et I2 A′ .
Le trajet I1 I2 comporte une distance e(ρ) parcourue dans le verre (indice nV ) et la
longueur complémentaire e0 − e(ρ) parcourue dans l’air, assimilé  au vide(indice 1)
1 1
donc (I1 I2 ) = e0 + (nV − 1) e(ρ) où (I1 I2 ) = nV e0 − (nV − 1) − ρ2 .
R1 R2
Notons alors p l’abscisse de A par rapport au sommet d’entrée dans la lentille (p < 0
pour cet objet réel sur la figure) et p′ l’abscisse de A′ par rapport au sommetp de
′ 2 2
sortie de la lentille (p > 0 pour cette image réelle)  ; on2 a alors AI1 = p + ρ
ρ
soit, dans les conditions de Gauss, (AI1 ) = −p 1 + 2 . De même on obtient
2p
ρ2
 
h
(I2 A ) = p 1 + ′2 et le chemin optique total est L = −p + ne0 + p′ + ρ2 où on
′ ′
2p   2
1 1 1 1
a posé h = − + ′ − V , avec V = (nV − 1) − .
p p R1 R2
Cette expression s’interprète ainsi :
– le chemin optique (AA′ ) pour un rayon qui reste sur l’axe optique (ρ = 0) est formé
de deux trajets dans l’air (distances −p et +p′ ) et d’un trajet dans le verre de la
lentille (distance e0 , indice nV ) ;
– lorsque ρ 6= 0, le rayon s’éloigne de l’axe, les trajets dans l’air s’allongent mais le
trajet dans la lentille diminue.
– il existe donc une condition de compensation de ces variations, au moins à cet ordre
du développement. Cette condition h = 0 assure un chemin optique (AA′ ) constant,
quel que soit le rayon qui joint A à A′ : c’est donc l’image de Gauss de A′ qu’on
détermine ainsi.
2 Relation de Descartes : on déduit immédiatement de ce qui précède, si la lentille
est mince et qu’on peut confondre au même point O les sommets S1 et S2 des faces
6 : Optique géométrique 125

d’entrée et de sortie, la relation de conjugaison de Descartes :

1 1 1 1 1
− + ′ =− + =V = ′ (6.4)
p p OA OA ′ f

On dira qu’une lentille mince est convergente si V ′ > 0 ou, ce qui revient au même,
si f ′ > 0 ; dans le cas contraire, elle est dite divergente. Une lentille convergente
1 1
correspond à − > 0, ce qui est le cas des lentilles présentées sur la figure 6.6.
R1 R2
Dans tous les cas, le centre de la lentille est plus épais que le bord, ce qui justifie la
représentation conventionnelle des lentilles convergentes.

R1 > 0, R2 < 0 R2 > R1 > 0

R1 > 0, R2 → ∞ Schéma conventionnel

Figure 6.6 – Lentilles sphériques minces convergentes

1 1
De même, les lentilles divergentes correspondent à − < 0, donc aux lentilles à
R1 R2
bords plus épais que le centre ; quelques exemples sont présentés sur la figure 6.7.

R1 < 0, R2 > 0 R1 > R2 > 0

R1 < 0, R2 → ∞ Schéma conventionnel

Figure 6.7 – Lentilles sphériques minces divergentes

2 Foyers et relations de grandissement de Newton : on appelle foyer objet F le point


de l’axe optique dont l’image est à l’infini, et foyer image F ′ le point image d’un point
de l’axe optique rejeté à l’infini. La relation de conjugaison impose OF ′ = f ′ = −OF .
On note aussi f = OF = −f ′ la distance focale objet de la lentille.
On emploie parfois les termes foyer principal objet ou image pour distinguer ces points
(situés sur l’axe) d’autres points Φ (respectivement Φ′ ) situés dans le plan de front
de F (respectivement, de F ′ ) mais hors de l’axe optique. Du fait de l’aplanétisme de
la lentille, l’image de Φ est aussi à l’infini, et Φ′ est aussi l’image d’un objet à l’infini
(mais dans les deux cas, hors de l’axe optique).
126 Physique, MP, MP*

B
B
b
Fb′ A′ B′ b b
A F O A ′ ′ O
FA F

B′

Figure 6.8 – Foyers et centre optique

La connaissance des foyers F et F ′ permet de construire l’image d’un objet arbitraire


AB, au moyen de deux rayons passant par F (donc émergent parallèlement à l’axe
optique) et incident parallèlement à l’axe optique (donc émergent en passant par F ′ ;
les tracés correspondants sont reportés sur la figure 6.8, dans le cas d’un objet réel,
pour une lentille convergente et pour une lentille divergente.
Dans les deux cas, l’existence de triangles semblables en O permet d’établir les re-
A′ B ′ F ′ A′
lations de grandissement pour γ = , avec d’une part γ = ′ (triangles sem-
AB F O
′ FO
blables en F ) et d’autre part γ = (triangles semblables en F ) : ce sont les
FA
relations de Newton pour le grandissement :

F ′ A′ f′
γ=− ′
= (6.5)
f FA

OA′ A′ B ′ OA′
La première expression s’écrit aussi γ = 1 − soit, du fait de (6.4), = ;
f′ AB OA

ceci montre que les points B, O et B sont alignés. Les droites correspondantes (en
pointillés sur la figure 6.8 sont donc des rayons lumineux qui passent pas O et ne sont
pas déviés ; pour cette raison, le point O est appelé centre optique de la lentille.
La nouvelle expression du grandissement ainsi obtenue porte le nom de relation de
Descartes pour le grandissement :

OA′ p′
γ= = (6.6)
OA p

Enfin, la simple comparaison des deux relations (6.5) permet d’établir une relation
de conjugaison, dite de Newton, et qui est parfois plus commode que la relation de
Descartes (6.4) :

F A · F ′ A′ = −f ′2 (6.7)

On remarquera la signification géométrique de la relation (6.7) : les grandeurs F A et


F ′ A′ sont toujours de signe contraire. Pour une lentille convergente en particulier,
F et F ′ étant disposées dans cet ordre, cela signifie en particulier qu’on objet réel
disposé avant F a toujours son image disposée après F ′ ; on peut en tirer d’autres
conclusions analogues dans chaque cas particulier.
6 : Optique géométrique 127

p′ − f ′ f′
Recopiant l’égalité des deux expressions (6.5) sous la forme − = ,
f ′ p + f′
′ ′
après développement puis division par p, p et f , on retrouve donc aussi la relation
1 1 1
de conjugaison de Descartes − + ′ = ′ ; il faut en général savoir passer des
p p f
relations algébriques aux schémas de construction, et réciproquement.

2 Constructions géométriques : les constructions géométriques sont basées sur cinq


règles, dont les trois premières ont déjà été établies ci-dessus :
Rayons de construction (1)
X • Un rayon lumineux qui passe par le foyer F ressort de la lentille paral-
lèlement à l’axe optique.
• Un rayon lumineux qui atteint la lentille parallèlement à l’axe optique
ressort de celle-ci en passant par F ′ .
• Un rayon lumineux qui atteint la lentille en son centre optique O n’est
pas dévié.
2 Objets et images à l’infini : considérons maintenant un foyer secondaire objet,
c’est-à-dire un point Φ situé dans le même plan de front que F . L’image de Φ est
à l’infini, mais disposée hors de l’axe optique ; on peut déterminer sa direction en
imaginant un rayon (éventuellement fictif) issu de Φ et passant par O, donc non
dévié. On en déduit la direction angulaire α′ de l’image de Φ, et en particulier la
relation α′ = −F Φ/f ′ , comme on le voit sur la figure 6.9 (à gauche, dans le cas d’une
lentille convergente).

Φ Φ′

α
b b
F O α ′ O F′

f′ f′

Figure 6.9 – Foyers secondaires

Considérons de même un foyer secondaire image, c’est-à-dire un point Φ′ situé dans


le même plan de front que F ′ . L’objet dont Φ′ est image est à l’infini, mais hors de
l’axe optique ; on en détermine la direction en imaginant un rayon (éventuellement
fictif) passant par O et Φ′ , non dévié. On en déduit la direction angulaire α de l’objet
dont Φ′ est image, avec α = F ′ Φ′ /f ′ (cf. figure 6.9 à droite, toujours dans le cas d’une
lentille convergente).

Objets et images à l’infini


X Un objet ou une image à l’infini est uniquement caractérisé par sa di-
mension angulaire.
• Dans le cas objet dans le plan focal −→ image à l’infini, on remplace
l’étude du grandissement (γ → ∞ ici) par la relation α′ = −AB/f ′ .
• Dans le cas objet à l’infini −→ image dans le plan focal, on remplace
le grandissement (ici γ → 0) par la relation A′ B ′ = f ′ α.
128 Physique, MP, MP*

En pratique, on considérera souvent qu’un objet A est à l’infini s’il est (( suffisamment
loin )) du système considéré ; on peut donner une idée quantitative de cette condition
1 1 1
en remarquant que, si |p| ≫ f ′ , la relation de conjugaison − + ′ = ′ fournit
p p f
f ′p
p′ = ′ ≃ f ′ ; l’image A′ est donc voisine du foyer image F ′ .
f +p
On pourra considérer que l’image est à l’infini si l’écart F ′ A′ est assez faible ; cet écart
f ′2 f ′2
est donné par F ′ A′ = f ′ − p′ = ′ ≃− ; on peut donc considérer que F ′ et A′
f +p p
sont confondus si F ′ A′ ≪ f ′ , donc si |p| ≫ f ′ .
La validité de cette condition dépend bien sûr de la précision recherchée ; ainsi, un
appareil photographique équipé d’un objectif de distance focale f ′ = 50 mm (objectif
reproduisant la vision ordinaire sur une pellicule de 24 mm × 36 mm) traitera un
objet comme disposé à l’infini pour une distance supérieure à 30 m environ, c’est-à-
dire pour un rapport f ′ /|p| inférieur à 0, 2 % ; on peut autoriser des critères plus ou
moins contraignants selon la qualité de l’image désirée.
La construction du rayon émergent associé à un rayon incident quelconque peut mettre
à profit la notion de foyer secondaire ; la figure 6.10 montre comment un rayon lumi-
neux arbitraire passe par un foyer secondaire objet Φ (et on construit donc le faisceau
parallèle émergent), mais peut aussi être considéré comme appartenant à un faisceau
incident parallèle (avec convergence au foyer secondaire image Φ′ ).

I
Φb Φb′
Ab α b b
Ab′ x
F O F′ α′

Figure 6.10 – Construction de rayons et foyers secondaires

Rayons de construction (2)


X • Tout rayon passant par un foyer secondaire objet Φ émerge en tant
qu’élément d’un faisceau parallèle ; on détermine la direction de ce fais-
ceau en traçant le rayon fictif ΦO.
• Tout rayon incident peut être considéré comme appartenant à un fais-
ceau parallèle, qu’on complète avec un rayon passant par O. Ce faisceau
converge en un foyer secondaire Φ′ .

2 Grandissement angulaire : la même figure 6.10 montre aussi la relation qui lie les
angles faits à l’entrée et à la sortie de la lentille par un même rayon lumineux avec
OI OI
l’axe optique : dans les conditions de Gauss, α = − et α′ = − montrent que

OA OA′
α p
le grandissement angulaire est G = = ′ ; on retrouve simplement la relation de
α p
Lagrange et Helmholtz (6.1) dans le cas particulier des milieux extrêmes identiques :
6 : Optique géométrique 129

α′ 1
G= = (6.8)
α γ

6.2.2 Miroirs sphériques


2 Miroirs sphériques : reprenant le principe de l’étude effectuée pour les lentilles,
on étudie le miroir concave de la figure 6.11.
y
bI

B
θ A′ x
b b b bS
A C
B′ b
J

Figure 6.11 – Stigmatisme du miroir sphérique

Nous calculerons le chemin optique (AIA′ ) pour deux points A, d’abscisse p, et A′ ,


d’abscisse p′ , de l’axe optique (Ox) d’un miroir sphérique de sommet S confondu avec
O, de centre C et de rayon R = SC ; R < 0 sur la figure.
On détermine d’abord les coordonnées (x, y) de I en écrivant l’équation du cercle,
2 2 y2
x − R + y 2 = R soit, à l’ordre le plus bas, x = .
s 2R
 
p p
Il vient donc AI = (x − p)2 + y 2 ≃ p2 + y 2 1 − au même ordre, soit encore
R
y2 1 y2 1
   
1 ′ ′ 1
AI ≃ −p + − ; au même ordre, IA ≃ −p + − . Finalement,
2 p R 2 p′ R
le chemin optique (AIA′ ) = −p − p′ + hy 2 sera constant, et A′ sera l’image de A,
seulement sous réserve de la relation de conjugaison h = 0, soit :

1 1 2 1 1 2
+ = ou + = (6.9)
p p′ R SA SA′ SC

Le miroir étant invariant par toute rotation d’angle θ autour de C, il est aussi forcé-
ment aplanétique, avec pour image de l’objet AB l’arc (assimilé à un segment dans
les conditions de Gauss) A′ B ′ ; on peut d’ailleurs identifier le trait pointillé BCB ′ de
la figure 6.11 avec un rayon lumineux et identifier la relation de grandissement :

A′ B ′ CA′
γ= = (6.10)
AB CA

Cette relation s’interprète donc comme l’existence, par ailleurs évidente, d’un centre
optique, puisque le rayon BCB ′ parvient sur le miroir en J sous incidence normale ;
il est donc réfléchi sur lui-même.
130 Physique, MP, MP*

Centre optique d’un miroir


X Un rayon qui atteint un miroir sphérique en passant par son centre re-
vient sur lui-même ; au changement de sens près, il n’est donc pas dévié
et le centre du miroir est aussi son centre optique.

Toutefois, les relations (6.9) et (6.10) ne sont pas établies avec la même origine. Pour
p′ − R
le grandissement, on passe à l’origine au sommet en écrivant γ = soit encore
p−R
p′ 1/R − 1/p′ p′
γ= ou, compte tenu de la relation de conjugaison, γ = − ; c’est la
p 1/R − 1/p p
relation de grandissement de Descartes :

A′ B ′ SA′ p′
γ= =− =− (6.11)
AB SA p

On peut d’ailleurs, à l’inverse, obtenir une relation de conjugaison avec origine au


CA′ CA′ − CS
centre en identifiant les deux expressions du grandissement, =− soit,
CA CA − CS
après simplification en croix et division par CA, CA′ et CS, la relation :

1 1 2
+ ′
= (6.12)
CA CA CS

2 Foyers et relations de Newton : comme pour une lentille mince, on définit les foyers
objet F (sur l’axe, dont image et à l’infini) et image F ′ (image sur l’axe d’un objet à
l’infini). Faisant respectivement tendre vers l’infini SA′ (ou CA′ ) puis SA (ou CA), on
trouve que les deux foyers sont confondus et vérifient SF = SF ′ = R/2, c’est-à-dire
qu’ils sont situés au milieu de l’intervalle [CS].

B I

A′ Cb Fb b
A F′ S

B′ J

Figure 6.12 – Miroir sphérique concave

La figure 6.12 place ces foyers et résumes certaines règles de construction de rayons
propres aux miroirs sphériques. On y remarque la représentation symbolique des mi-
roirs par leur plan tangent (avec indication de la concavité). On y a fait figurer quatre
rayons de construction :
6 : Optique géométrique 131

Constructions géométriques
X Pour déterminer l’image d’un objet B hors de l’axe optique par un miroir
sphérique, on peut utiliser :
• le rayon incident sur le miroir en passant par le sommet S, qui est
réfléchi en faisant, avec l’axe optique (qui est aussi la normale au point
d’incidence) un angle égal à celui fait à l’entrée ;
• le rayon incident sur le miroir en passant par le centre optique C, qui
n’est pas dévié, de sorte que B, C et B ′ sont alignés ;
• le rayon incident sur le miroir parallèlement à l’axe optique, qui émerge
du miroir en passant par le foyer F ′ ;
• le rayon incident sur le miroir en passant par le foyer F , qui émerge
du miroir parallèlement à l’axe optique.

La figure 6.12 montre l’existence de triangles, semblables en F = F ′ , qui permettent


A′ B ′ F ′ A′
d’établir deux nouvelles relations de grandissement, à savoir γ = = ′ dans
AB F S
′ ′ ′ ′ A′ B ′ FS
les triangles F SI et F A B , et γ = = dans les triangles F SJ et F AB.
AB FA
On retiendra ces deux relations de grandissement, et la relation de conjugaison (dite
de Newton) qui en découle sous la forme :

2
SF F ′ A′ 2 R
γ=− =− F A · F ′ A′ = SF ′ = (6.13)
FA SF ′ 4

2 Grandissement angulaire : reprenant la géométrie de la figure 6.12, on a tracé sur


la figure 6.13 un rayon issu d’un point A sous l’angle α ; après réflexion sur le miroir,
ce rayon atteint (pour cause de stigmatisme) l’image A′ de A sous l’angle α′ .

bH
B
bI
α
A′ Cb Fb b
′ S
α A

bJ

B

Figure 6.13 – Grandissement angulaire par un miroir sphérique concave

SH
Ces angles, tous deux négatifs sur la figure 6.13, vérifient les relations α = et
SA

SH α SA
α′ = ; on en déduit la relation de grandissement angulaire G = = . La
SA ′ α SA′
comparaison avec l’expression (6.11) du grandissement linéaire montre que G = −1/γ.
On peut considérer qu’il s’agit d’un cas particulier de l’invariant de Lagrange et Helm-
holtz (6.1), à condition de poser nsortie = −nentrée . En effet, il est possible de considérer
que les lois de la réflexion (en particulier la relation de Descartes i′ = −i) sont équi-
valentes aux lois de la réfraction (notamment n sin i = n′ sin i′ ) à condition de poser
n′ = −n.
132 Physique, MP, MP*

On peut aussi considérer que le signe − dans la relation G = −1/γ permet de rendre
compte du changement de sens de propagation lors de la réflexion ou, si on préfère,
du changement d’orientation de l’axe optique si on voulait le définir, à l’entrée comme
à la sortie d’un système à miroir, dans le sens moyen des rayons lumineux.
Finalement, on écrira la relation de Lagrange et Helmholtz pour un miroir sphérique :

Gγ = −1 (6.14)

6.2.3 Description optique de l’œil


2 Description sommaire : l’œil est pratiquement toujours le premier détecteur op-
tique utilisé pour le réglage d’un dispositif optique ; il est donc important de connaı̂tre,
même brièvement, sa structure et quelques termes associés. La figure 6.14 décrit très
sommairement une coupe de l’œil humain, qui forme un globe sphérique de 25 mm
de diamètre environ.

Corps vitré
Cornée
Rétine
Pupille
Nerf
Cristallin optique
Iris

Figure 6.14 – Vue en coupe de l’œil humain

• La cornée, protège l’œil de l’extérieur ; c’est une membrane transparente. Elle est
emplie du corps vitré, liquide très visqueux qui donne à l’œil sa forme.
• La pupille est la partie centrale de l’œil ; elle comporte un diaphragme (l’iris) dont le
diamètre d’ouverture varie en fonction de la luminosité. C’est la pigmentation de
l’iris qui détermine la couleur de l’œil. La pupille contient un liquide transparent,
l’humeur aqueuse, qui, avec le corps vitré, maintient la pression exercée sur le
globe oculaire et permet donc de déterminer sa forme.
• Le cristallin est un milieu biconvexe, légèrement déformable, situé derrière l’iris ; sa
forme détermine les propriétés optiques de l’œil. Son épaisseur est de l’ordre de
5 mm sur une largeur double.
• La rétine est le film sensible sur lequel se forment les images. C’est une mem-
brane nerveuse qui tapisse le fond de l’œil, d’environ 0, 25 mm d’épaisseur et
de quelques centimètres carrés de surface. Elle comporte plus de 100 millions
de cellules nerveuses (bâtonnets) sensibles à l’intensité lumineuse et servant à
la détection du mouvement, et moins de 10 millions d’autres cellules (cônes)
sensibles aux nuances de couleur.
• Le nerf optique, long de 3 à 6 centimètres, transmet l’image rétinienne au cerveau.

2 La vision : la vergence totale de l’œil est d’environ V ≃ 50 δ, correspondant à une


focale d’environ 2 cm, ce qui permet la convergence des images au fond de l’œil, sur
6 : Optique géométrique 133

le plan de la rétine. Cette vergence résulte de l’action des différents constituants de


l’œil : la cornée, l’humeur aqueuse, le cristallin et le corps vitré. Toutefois, le dioptre
sphérique séparant l’air de la cornée assure la majeure partie de cette vergence.
Les indices optiques du corps vitré et de l’humeur aqueuse sont proches de celui de
l’eau (n ≃ 1, 37) et invariables ; par contre, un muscle en anneau (les fibres de Zinn)
maintient, déplace ou déforme le cristallin (n ≃ 1, 42) en fonction des nécessités de la
vision. Cette déformation permet donc de changer la vergence de l’ensemble de l’œil,
donc de faire la mise au point (sur le plan de la rétine) d’images d’objets situés à
distance variable : c’est l’accommodation.
En l’absence d’effort musculaire (on parle de vision sans accommoder), l’œil forme
sur le plan de la rétine une image nette des objets situés à l’infini ; le plan de la rétine
est donc le plan focal image de l’œil au repos.
2 Limites et défauts de vision : pour un œil normal (ou emmétrope), tout objet situé
à l’infini forme une image nette sur la rétine, sans que le cristallin ne change de forme ;
on dit que le ponctum remotum Pr (distance maximale de vision nette) est rejeté à
l’infini.
La déformation du cristallin en vision de près permet un augmentation de la vergence
de l’œil assurant une vision nette des objets situés au-delà du punctum proximum Pp
(distance minimale de vision nette). Ce point est à une distance de l’ordre de 10 cm
pour les enfants très jeunes, et il augmente avec l’âge et se fixe à environ 25 cm chez
l’adulte.
Avec un œil myope (trop convergent), Pp est plus faible que pour un œil normal mais
l’image d’un objet à l’infini se forme, sans accommodation, en avant de la rétine :
la vision de l’infini est floue. On corrige donc ce défaut en plaçant devant l’œil une
lentille divergente.
Au contraire, l’œil hypermétrope n’est pas assez convergent ; on corrige ce défaut en
plaçant devant l’œil une lentille convergente.
On dit que l’œil est astigmate si la cornée ou le cristallin présente des irrégularités de
courbure ; on corrige ce défaut avec des lentilles cylindriques ou toriques.
On parle enfin d’œil presbyte si la capacité d’accommoder disparaı̂t (par exemple avec
l’âge) ; on corrige donc seulement la vision de près en utilisant des lentilles multifocales
(dites progressives) ; le haut de la lentille n’étant pas corrigé (vision de loin correcte)
mais le bas étant convergent (correction de la vision de près).

6.3 Systèmes centrés

6.3.1 Propriétés des systèmes centrés


2 Définition et propriétés générales : ce paragraphe décrit quelques propriétés gé-
nérales des systèmes centrés, formés d’associations d’une ou plusieurs lentilles sphé-
riques, ou d’un ou plusieurs miroirs sphériques, alignés le long du même axe de symé-
trie de révolution (axe optique).
L’ensemble est utilisé dans les conditions de Gauss et forme donc automatiquement
un dispositif stigmatique (tout point A de l’axe optique a une image A′ sur l’axe
optique) et alpanétique (tout objet AB étendu dans un plan de front possède une
image A′ B ′ étendue dans un plan de front).

Notons que tous les systèmes centrés décrits ci-après ne sont pas toujours utilisés
dans les conditions de Gauss ; il arrive par exemple qu’une lentille d’entrée de micro-
scope ou d’objectif photographique soit éclairée sous une ouverture angulaire très
importante. Cette partie du dispositif est alors adapté spécialement à son utilisa-
tion (lentille asphérique par exemple). De même, les miroirs primaires des télescopes
134 Physique, MP, MP*

peuvent être de forme parabolique et non sphérique, pour assurer, dans le cas par-
ticulier de l’observation à l’infini, un stigmatisme meilleur que celui des conditions
de Gauss.

2 Relations de conjugaison et de grandissement : le programme ne prévoit la connais-


sance générale d’aucune relation de conjugaison ou de grandissement pour un système
comportant plus d’une lentille ou d’un miroir ; nous établirons donc seulement ici cer-
taines propriétés générales à titre documentaire.
Toutefois, on notera que l’invariant de Lagrange et Helmholtz se généralise par asso-
ciativité à un système comportant un ou plusieurs miroirs sphériques ; en notant n le
nombre de réflexions, on en déduit (si les milieux extrêmes sont identiques) :

n réflexions ⇒ Gγ = (−1)n (6.15)

2 Caractérisation des objets et des images : certains systèmes optiques font des
images d’objets situés à distance finie (objets proches), d’autres d’objets qu’on doit
considérer comme situés à l’infini (objets terrestres lointains, objets astronomiques).
Les images formées seront elles-mêmes situées à distance finie (par exemple si elles
doivent être projetées sur un écran, ou sur le plan d’une surface photosensible), ou à
très grande distance (puisqu’une image à l’infini peut être observée sans accommoder,
c’est-à-dire sans effort musculaire au niveau de l’œil).
Le tableau 6.1 présente des exemples d’appareils correspondant aux quatre couples
possibles de position des objets et des images.

Objet à distance finie Objet à l’infini


Image à distance finie Appareil photo, réglé à Appareil photo, réglé à
distance finie ; projecteur l’infini ; lunette ou téles-
de cinéma cope astronomique, avec
focalisation sur un capteur
CCD
Image à l’infini Microscope ; phare de si- Lunette ou télescope as-
gnalisation marine tronomique, pour observa-
tion à l’œil ; viseur de go-
niomètre pour le repérage
des angles

Table 6.1 – Exemples de dispositifs optiques

Un objet est caractérisé par sa dimension ; s’il est à distance finie, on utilise la dimen-
sion transversale AB, mais s’il est situé à une grande distance d → ∞, cette dimension
vérifie nécessairement AB → ∞.
Toutefois, on peut continuer à définir une dimension apparente, comme sur la figure
AB
6.15, au moyen du rapport θ = : deux objets A1 B1 et A2 B2 de même rapport θ
d
sembleront, pour l’observateur, de même taille.

Objets et images à l’infini


X Un objet ou une image à l’infini peut être représenté par un faisceau
parallèle ; l’angle θ fait par ce faisceau parallèle avec l’axe optique suffit à
caractériser entièrement la dimension apparente de l’objet ou de l’image.
6 : Optique géométrique 135

B1

B2

θ
A1 A2
d1 Système
d2

Figure 6.15 – Dimension apparente d’un objet

2 Grandissements, focale et puissance : compte tenu de ce qui précède, on utilisera


diverses relations pour exprimer les dimensions relatives de l’objet et de son image,
formée par un système optique. On peut distinguer quatre types de systèmes optiques,
le vocabulaire le plus courant quant aux dimensions respectives d’un objet et de son
image figurent dans le tableau 6.2.

Objet à distance finie Objet à l’infini


Grandissement linéaire Focale
A′ B ′ A′ B ′
Image à distance finie γ= f′ =
AB θ

Puissance Grandissement angulaire


θ′ θ′
Image à l’infini P= G=
AB θ

Table 6.2 – Grandissements, focale, puissance

Dans ce tableau, P porte le nom de puissance du système optique (on parle ainsi
de la puissance d’un microscope) et se mesure en m−1 (unité appelée en Optique
dioptrie, symbole δ) ; f ′ est la focale s’identifiera souvent avec la distance focale image
du système optique et se mesure en m ; on parle ainsi de la focale d’un télescope,
même s’il est formé de plusieurs miroirs ayant chacun leurs foyers.

6.3.2 Étude géométrique d’un système centré


2 Foyers : considérons un système centré, tel qu’il est représenté sur la figure 6.16 ;
on y signale la présence des dioptres d’entrée et de sortie, ainsi que les tracés de deux
rayons particuliers.

B1 (R1 ) K′

A2 Hb Fb b b
A1 F′ H′
) K
(R 2

B2

Figure 6.16 – Foyers d’un système centré


136 Physique, MP, MP*

Un rayon lumineux qui se dirige vers le système parallèlement à l’axe optique croise
ensuite celui-ci en un point de l’axe noté F ′ , qui est le foyer principal image du
système optique (sur la figure, c’est une image réelle). De même, pour émerger du
système parallèlement à l’axe optique, un rayon lumineux doit passer par le point F
avant le système : c’est son foyer principal objet (sur la figure, c’est un objet virtuel).

La définition ci-dessus permet de placer des foyers, pas de définir des focales, et
encore moins un centre optique ! Comme on le montrera, un système centré n’est
en général pas équivalent à une lentille mince unique ; en particulier, il n’a pas de
centre optique situé entre ces foyers.

2 Grandissement et plans principaux : le centre optique d’une lentille est un point O


qui présente deux propriétés :
– par définition d’un centre optique, un rayon qui passe par O ressort sans être dévié ;
on en déduit que les angles α et α′ faits par le rayon lumineux avec l’axe optique
avant et après passage par la lentille sont égaux : c’est le point tel que G = 1 (donc,
du fait de l’existence de l’invariant de Lagrange et Helmholtz, tel que γ = 1) ;
– du fait des propriétés particulières de la lentille mince, ce point O est quasiment
confondu avec les deux sommets des deux dioptres successifs qui limitent la lentille.
C’est la première propriété que nous allons chercher à généraliser, en étudiant s’il est
possible de réaliser, pour un couple (H, H ′ ) formé d’un objet H de l’axe et son image
H ′ sur l’axe, la relation γ = 1. Considérons pour cela, toujours sur la figure 6.16, un
objet A1 B1 complètement arbitraire, seule sa dimension transverse étant spécifiée ;
l’extrémité B se déplace alors de façon aléatoire sur la rayon (R1 ), qui est parallèle
à l’axe avant le passage par le système. L’image A′1 B1′ de A1 B1 se déplace alors sur
le rayon émergent correspondant, avec en général une dimension différente (et donc
γ 6= 1) sauf lorsque B1′ passe par le point unique K ′ (et A′1 passe en même temps par
le point unique H ′ , projeté de K ′ sur l’axe optique) :

Point principal image


X Pour un système optique présentant un foyer image F ′ , on peut toujours
déterminer l’unique image H ′ (sur l’axe optique) telle que γ = 1 et
cherchant l’intersection du rayon incident parallèle à l’axe avec le rayon
émergent correspondant (qui passe par F ′ ).
Le point H ′ s’appelle point principal image du système centré.

Le même raisonnement s’applique pour la détermination de l’objet H dont H ′ est


l’image ; on cherche à placer un objet arbitraire A2 B2 dont l’extrémité B2 se déplace
sur le rayon (R2 ) qui passe par F . L’image A′2 B2′ de A2 B2 n’a même dimension que
l’objet (avec donc γ = 1) que si A2 passe en H et B2 en K, déterminés comme suit :

Point principal objet


X Pour un système optique présentant un foyer objet F , on peut toujours
déterminer l’unique objet H (sur l’axe optique) tel que γ = 1 et cherchant
l’intersection du rayon incident passant par F avec le rayon émergent
correspondant (parallèle à l’axe).
Le point H s’appelle point principal objet du système centré.

Sur la figure 6.16, H ′ est l’image de H mais on a choisi, pour des raisons de lisibilité,
A1 B1 6= A2 B2 donc K ′ n’est pas l’image de K.
6 : Optique géométrique 137

2 Relations de Newton : la figure 6.17 représente un système optique centré par la


seule donnée des points H, H ′ (conjugués), F et F ′ , et des plans de front correspon-
dants (respectivement, les plans principaux objet et image et les plans focaux objet
et image). La règle précisée ci-dessus permet de construire l’image de n’importe quel
objet AB, comme sur la figure 6.17 :
• un rayon incident parallèle à l’axe croise son émergent dans le plan principal image,
A′ B ′ F ′ A′
au point I ; on en déduit γ = =− ′ ′;
AB HF
• un rayon incident passant par F croise son émergent dans le plan principal objet,
A′ B ′ HF
au point J ; on en déduit γ = =− ;
AB FA
• un rayon passant par B et H avant le système passe par H ′ et B ′ après celui-ci ;
comme γ = 1 pour le couple (H, H ′ ), on a aussi G = 1 donc α = α′ , soit encore
A′ B ′ H ′ A′
γ= = .
AB HA

B I

Fb α bH H′ b
Fb′ A′

A α

J B′

Figure 6.17 – Plans principaux et focaux et relation de Newton

Les deux premières relations de grandissement sont les relations de Newton ; elles
généralisent immédiatement celles obtenues pour les lentilles et miroirs sphériques :

HF F ′ A′
F A · F ′ A′ = HF · H ′ F ′ γ=− =− ′ ′ (6.16)
FA HF A

HF H ′ A′
La comparaison des deux dernières relations de grandissement impose − =
FA HA
HF H ′ F ′ + F ′ A′
soit − = ; on développe alors cette expression qui devient donc
FA HF
 + FA 
F A HF + H ′ F ′ = F H HF + H ′ F ′ . Comme cette relation doit être vraie pour
tout A, y compris A 6= H, on a forcément HF + H ′ F ′ = 0 :

f = HF = −H ′ F ′ = −f ′ (6.17)

La relation (6.17) définit les distances focales image f ′ et objet f ; même si on remarque
la forte analogie avec les lentilles minces, il reste la propriété générale H 6= H ′ qui
fait la différence avec le cas des lentilles pour lesquelles O = O′ .
• si H 6= H ′ , le système centré est un système épais, d’épaisseur optique (algébrique)
ē = HH ′ ; un tel système n’a pas de centre optique ;
138 Physique, MP, MP*

• si H = H ′ , le système centré est un mince, équivalent à une lentille de centre optique


H et de distance focale image (algébrique) f ′ = H ′ F ′ ; le point H = H ′ est sont
centre optique.

2 Systèmes afocaux : la construction géométrique des figure 6.16 et 6.17 n’est


possible que si le système optique étudié présente effectivement des foyers F et F ′
situés à distance finie ; il est possible que les foyers soient rejetés à l’infini, auquel cas
le système est dit afocal.
B

B′

A A′

Figure 6.18 – Système afocal

La figure 6.18 montre que, dans ce cas, un rayon incident parallèle à l’axe émerge
parallèlement à l’axe optique ; les deux foyers F et F ′ sont donc simultanément rejetés
à l’infini.
Dans un tel cas, tout objet AB donne une image A′ B ′ dont la dimension se conserve
lorsqu’on translate AB ; en effet, si l’extrémité B se déplace sur un rayon parallèle
à l’axe, alors l’extrémité B ′ se déplace sur le rayon émergent correspondant et la
dimension de A′ B ′ ne varie pas.

Systèmes afocaux
X Pour un système afocal, le grandissement linéaire γ et donc le grandis-
sement angulaire G ne dépendent pas de la position de l’objet : ce sont
des caractéristiques du système.
Si |γ| > 1, le système agrandit les images formées à distance finie des
objets situés à distance finie.
Si |γ| < 1 donc |G| < 1, le système agrandit les images formées à l’infini
des objets situés à l’infini.
6 : Optique géométrique 139

Ce qu’il faut absolument savoir

Un système optique est stigmatique si tout rayon issu de A passe par A′ après
traversée du système optique. Il y a stigmatisme si et seulement si le chemin
optique (AA′ ) d’un objet A à son image A′ vérifie (AA′ ) = constante, quel que
soit le rayon choisi de A à A′ à travers le système.
Un système optique est centré s’il présente un axe de révolution (axe optique).
Un système optique centré est aplanétique si tout objet étendu AB dans un
plan de front (plan perpendiculaire à l’axe optique) donne une image A′ B ′
étendue dans un plan de front.
Dans les conditions de Gauss (rayons faiblement inclinés sur l’axe, atteignant
les divers dioptres à des distances de l’axe faibles devant les rayons de courbure),
tout système centré est stigmatique et aplanétique.
Tout ce qui suit est décrit dans les conditions de Gauss.
Il y a aplanétisme si et seulement si nentrée ABα = (−1)n nsortie A′ B ′ α′ , où α
et α′ sont les angles faits avec l’axe optique par un même rayon, issu de A et
passant par A′ ; n est le nombre de réflexions.
A′ B ′ α′
On définit les grandissements linéaire et angulaire, γ = et G = ; alors,
AB α
n nentrée
Gγ = (−1) ou, si les milieux extrêmes sont identiques, Gγ = (−1)n .
nsortie
Pour une lentille sphérique, f ′ = OF ′ = −OF = −f est positif si la lentille
(convergente) est à bords minces, négatif si la lentille (divergente) est à bords
1 1 1 OA′
épais. Relations de Descartes : − + = ′, γ = et G = 1/γ.
OA OA ′ f OA
Pour un miroir sphérique, f ′ = SF ′ = SF = SC/2 (F est au milieu de [SC]).
1 1 1 2 SA′
Relations de Descartes + = ′ = ,γ=− et G = −1/γ.
SA SA ′ f SC SA
F ′ A′ f
Dans les deux cas (lentilles et miroirs), on a γ = − ′
= − et donc
f FA
F A · F ′ A′ = f f ′ (relations de Newton).
Cette relation se généralise à tous les systèmes centrés.
Un système afocal présente des grandissements linéaire γ et angulaire G
constants, quelle que soit la position de l’objet.
Chapitre 7

Diffraction de la Lumière

7.1 Le principe de Huygens et Fresnel

7.1.1 L’énoncé du principe


2 Historique : la première mise en évidence du phénomène de diffraction est due
à l’italien Grimaldi ; ses travaux ont été publiés en . Observant la propagation
d’un pinceau lumineux, Grimaldi remarqua que l’ombre portée dans ce faisceau par
une tige fine était plus large que ce que les calculs géométriques prévoyaient ; de plus,
cette ombre était entourée de quelques bandes colorées.
Grimaldi est l’auteur du terme diffraction, qui désigne une (( rupture )) dans la propa-
gation rectiligne des rayons lumineux. Hooke fit ensuite en Angleterre des observa-
tions analogues. Pour rendre compte de ces résultats, Newton proposa en , dans
son ouvrage, Opticks, une interprétation corpusculaire qui ne parut pas décisive. En
se basant justement sur l’existence des phénomènes de diffraction, Huygens‡ proposa
à la fin du xviie siècle une vision ondulatoire de la propagation de la lumière.
Cette théorie trouvera une forme quantitative grâce aux travaux de Fresnel‡ à la
fin du xviiie siècle ; c’est dans ce cadre que la théorie de la diffraction est exposée ici.
2 Le cadre de l’étude : nous ne considérerons ici aucun phénomène de polarisation
et nous nous placerons donc dans le cadre de l’approximation scalaire, en notant
W (M, t) l’onde lumineuse correspondante.
Nous nous placerons de plus dans le cas d’une onde monochromatique en écrivant
W (M, t) = w(M ) exp (jωt) ; la formation d’images en lumière polychromatique (en
particulier en lumière blanche) sera simplement traitée par superposition des résultats
obtenus pour plusieurs longueurs d’onde.

Le fait qu’on puisse ajouter les éclairements obtenus pour diverses longueurs d’onde,
comme s’ils se propageaient indépendamment les uns des autres, relève de l’hypo-
thèse d’incohérence de rayonnements de longueurs d’onde différentes. Cette hypo-
thèse sera justifiée ultérieurement, à l’occasion de l’étude des interférences lumi-
neuses.
Il est en principe possible de décrire complètement la propagation d’une telle onde
W (M, t) = w(M ) exp (jωt) par la résolution de l’équation de l’équation de propaga-
tion ∆w = −ω 2 /c2 w, avec dans chaque milieu homogène c = c0 /n ; cette résolution,
qui doit être complétée par la prise en compte de conditions aux limites à la surface
de chaque dioptre ou miroir, est en pratique souvent équivalente à la formulation de
la diffraction selon Huygens et Fresnel.
142 Physique, MP, MP*

2 Le principe de Huygens et Fresnel : on a vu au premier chapitre comment le


traitement des lentilles comme objets déphasants permet de décrire l’onde émergente
du plan de la lentille à partir uniquement de la répartition de l’amplitude lumineuse
w(M ) dans les différents points M de ce plan. Le principe de Huygens et Fresnel est
la généralisation de cette méthode :
Principe de Huygens et Fresnel
X L’onde lumineuse observée en un point P situé après une surface (Σ) (cf.
figure 7.1) ne dépend que de la répartition de l’amplitude lumineuse sur
les points M de (Σ). On peut considérer cette onde comme la superposi-
tion d’ondelettes (ondes sphériques émises par des sources infinitésimales
fictives sur la surface (Σ)) issues des différents points M de (Σ).
Ainsi, l’élément d’aire dΣ situé autour de M émet une ondelette d’am-
plitude dae (M ) = κwi (M )dΣ proportionnelle à dΣ et à l’amplitude lu-
mineuse wi (M ) incidente en M .
Pour obtenir l’onde observée en P , il suffit de sommer les amplitudes
complexes des ondelettes lumineuses sphériques se propageant depuis
les différents points M de (Σ) jusqu’en P ; du fait de leur propagation
de M en P , chacune de ces ondes se déphase proportionnellement au
x w (M )
i
chemin optique (M P ), soit w(P ) = κ exp [−jk0 (M P )] dΣ,
MP
M ∈(Σ)
en notant k0 = 2π/λ0 .

bM

b
b P
S b
M′

(Σ)

Figure 7.1 – Principe de Huygens et Fresnel

Dans cette expression, on ne s’intéressera en général pas à la constante de propor-


tionnalité κ. D’autre part, on notera bien que la surface (Σ), qu’on qualifiera à partir
de maintenant de pupille diffractante, n’est pas forcément une surface matérielle.

7.1.2 Expressions intégrales du principe de Huygens et Fresnel


2 Intégrale de Rayleigh-Sommerfeld : il est possible de montrer l’expression de l’onde
diffractée en P par le pupille (Σ) :
x 1 wi (M )
w(P ) = exp [−jk0 (M P )] cos αdΣ (7.1)
jλ0 M P
M ∈(Σ)

On parle ici de l’intégrale de Rayleigh‡ -Sommerfeld, dans laquelle α désigne l’angle


entre le vecteur n normal à la surface (Σ) et la direction de propagation MP. Si on
7 : Diffraction de la Lumière 143

se place dans le cas de la diffraction dans des directions faiblement inclinées sur la
normale n, on peut écrire cos α ≃ 1 et on retrouve l’expression intégrale du principe
de Huygens et Fresnel :

x wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.2)
MP
M ∈(Σ)

Nous serons amenés à étudier l’effet de pupilles partiellement transparentes ou dé-


phasantes ; on décrira ce type de pupille en considérant que chaque point M de la
pupille (Σ) transforme l’onde incidente wi (M ) en une onde d’amplitude complexe
T (M )wi (M ) ; la fonction complexe T (M ) porte le nom de transmittance complexe de
la pupille.
Le module |T (M )| de la transmittance vérifie bien sûr |T (M )| 6 1 ; si |T (M )| < 1, on
décrit une pupille partiellement transparente.
L’argument arg (T (M )) de la transmittance décrit le déphasage de la lumière lors de
la traversée de la pupille ; on notera aussi arg (T (M )) = −k0 L(M ) où L(M ) est le
chemin optique équivalent à la traversée de la pupille au point M .
Finalement, nous utiliserons l’expression intégrale du principe de Huygens et Fresnel
sous la forme :

x T (M )wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.3)
MP
M ∈(Σ)

L’ensemble de ce chapitre sera consacré aux moyens de calculer et d’interpréter cette


intégrale, en fonction notamment :
• des conditions d’éclairement de la pupille, et donc en fonction de la répartition
wi (M ) de l’amplitude complexe incidente en un point quelconque M de la pu-
pille ;
• de la forme et des dimensions de la pupille, c’est-à-dire en fonction des bornes de
l’intégrale (7.3) ;
• de la position du point P où a lieu l’observation.

2 Pupilles planes et diffraction à grande distance : dans l’expression (7.3), la position


du point d’observation P intervient de deux manières :
• l’amplitude des ondes sphériques fait intervenir un facteur de (( dilution )) de l’éner-
1
gie . On a déjà eu l’occasion de remarquer que ce terme est pratiquement
MP
constant dès que l’observation se fait à une distance suffisante de la pupille (Σ) ;
on pourra donc généralement considérer que ce terme d’amplitude est quasiment
constant sur toute l’étendue de la figure de diffraction, c’est-à-dire de la zone
éclairée par la pupille diffractante (Σ).
• la phase des ondelettes qui interfèrent en P dépend du chemin optique (M P ) ;
on a là aussi déjà eu l’occasion de remarquer qu’il n’est souvent pas légitime de
considérer que ce terme reste constant, car dans l’exponentielle exp [−jk0 (M P )],
une variation du chemin optique même de l’ordre de grandeur de la longueur
d’onde λ0 (donc quelques fractions de micromètre) se traduit par une variation
de la phase de l’ordre de grandeur de k0 λ0 = 2π.
144 Physique, MP, MP*

x X
MP bP

M b
z
(Σ) b b
O Ω

Figure 7.2 – Pupilles planes et observation dans un plan

Pour être plus précis, considérons le cas où la pupille diffractante (Σ) est un certain
plan (Oxy), tandis que l’observation se fait en un point P d’un plan (ΩXY ), parallèle
au précédent mais décalé d’une
p longueur OΩ = z (cf. figure 7.2).
On peut alors écrire M P = z 2 + (X − x)2 + (Y − y)2 ; dans toute la suite, nous
nous placerons dans le cas où la distance
 z est nettement supérieure
 à toutes les
(X − x)2 + (Y − y)2
autres ; on peut alors écrire M P ≃ z 1 + . Appelant alors d un
2z 2
majorant des grandeurs X, x, Y et y, c’est-à-dire la plus grande dimension rencontrée
sur la pupille et dans l’étude de la figure de diffraction, on pourra considérer que
M P ≃ z avec une précision acceptable si z ≫ d.
En pratique, les observations de figures de diffraction sont faites dans la plupart des
cas à une distance z ∼ 1 m au moins, tandis que la plus grande dimension d’une figure
de diffraction ou d’une pupille diffractante ne dépasse que rarement 1 cm ; ainsi, on
peut considérer que M P ≃ z à mieux que 10−4 près.
On notera donc l’intégrale donnant l’amplitude diffractée sous la forme pratique, qui
sera utilisée dans toute la suite, faisant intervenir une distance (( moyenne )) M P0 :
κ x
w(P ) ≃ T (M )wi (M ) exp [−jk0 (M P )] dΣ (7.4)
M P0
M ∈(Σ)

Remarquons encore une fois qu’une variation relative de 10−4 dans l’expression de
M P n’est, par contre, pas du tout négligeable dans l’exponentielle exp [−jk0 (M P )] ;
imaginons par exemple que (M P ) soit de l’ordre de grandeur de z = 1 m, les variations
les plus importantes attendues pour (M P ) seront de l’ordre de 10−4 m, ce qui, avec
par exemple λ0 = 500 nm, correspond à des variations maximales de la phase k0 (M P )
10−4
de l’ordre de 2π = 200×2π ! On doit donc pour l’instant conserver telle quelle
5 × 10−7
l’expression de l’exponentielle dans (7.4).
Les ordres de grandeurs cités ci-dessus correspondent au cas de la diffraction des ondes
lumineuses ; cependant, le phénomène de diffraction existe pour les ondes électroma-
gnétiques dans tous les domaines des longueurs d’onde, avec des moyens de description
identiques et souvent des approximations analogues à celles qui sont faites ici.
On utilise en pratique couramment la diffraction des rayons X pour la détermina-
tion des structures diffractantes ; toutefois, la longueur d’onde des rayons X étant
nettement plus courte que celle des ondes lumineuses visibles (de l’ordre de 10−12 m
par exemple), on s’intéresse à des objets diffractants de dimensions caractéristiques
nettement plus faibles (cristaux ou macromolécules par exemple).
2 Éclairage par une source ponctuelle : la pupille (Σ) étant éclairée par une source
ponctuelle S, on peut encore écrire l’onde wi (M ) incidente en M en fonction de
7 : Diffraction de la Lumière 145

l’onde émise en S et du terme de déphasage exp [jk0 (SM )] ; toutefois, on devrait ici
distinguer le cas des ondes planes (la source S étant rejetée à l’infini, et le module de
l’amplitude complexe de l’onde étant conservé) et celui des ondes sphériques (la source
S est à distance finie, et module de l’amplitude de l’onde décroı̂t comme 1/SM ) ;
toutefois, dans les mêmes conditions que ci-dessus, cette variation d’amplitude est
pratiquement toujours négligeable, et nous écrirons donc :

wi (M ) = w(S) exp [−jk0 (SM )] (7.5)

Dans toute la suite, on ne s’intéressera qu’au cas d’une pupille plane, dans le plan
(Oxy), éclairée à distance suffisante, et observée également à une distance suffisante
pour négliger tous les termes de dilution d’énergie dans la propagation des ondes
sphériques, ce qui mène à la forme pratique :
x
w(P ) ≃ Kw(S) T (x, y) × exp [−jk0 (SM P )] dxdy (7.6)
M ∈(Oxy)

L’expression exacte de la constante K est sans importance dans ce qui suit.

7.1.3 Optique géométrique et diffraction


2 Figure de diffraction et image géométrique : considérons le cas où la pupille est
seulement transparente, c’est-à-dire T (x, y) = 1 en tout x point de la pupille P ; dans
ce cas, l’amplitude diffractée en P est proportionnelle à exp [−jk0 (SM P )] dxdy.
M ∈P
Le calcul exact du chemin optique (SM P ) dépend du dispositif optique utilisé pour
éclairer le point P ; toutefois, si on note S ′ l’image de S par ce dispositif, on sait que
le chemin optique (SM S ′ ) est constant, c’est-à-dire indépendant du choix du point

M sur la pupille P ; on x peut noter L0 cette constante, et l’amplitude complexe en S

est w(S ) = Kw(S) exp [−jk0 L0 ] dxdy = KAw(S) exp [−jk0 L0 ], où A est l’aire
M ∈P
de la pupille P ; on a donc |w(S ′ )| = |Kw(S)| A.
L’amplitude lumineuse
en tout autre point P sera moindre
en module, puisqu’on peut
x

écrire |w(P )| = Kw(S) exp [−jk0 (SM P )] dxdy 6 |Kw(S)| A. Cette propriété

M ∈P
se généralise sous la forme suivante :

Lien entre optique géométrique et diffraction


X Le chemin optique d’un objet à son image étant constant, l’ensemble
des ondelettes réémises depuis une surface arbitraire (Σ) parviennent en
phase au point image géométrique de la source ; c’est donc en ce point
que la lumière s’accumule.
L’image définie dans le cadre de l’optique géométrique est donc en général
le point le plus lumineux de la figure de diffraction.

2 Écarts à l’optique géométrique : considérons, sur la figure 7.3, une pupille plane
diffractante P, dont on notera a une dimension caractéristique.
Sur la figure, cette pupille est éclairée en lumière parallèle, donc les différents points
de la pupille sont éclairés en phase : wi (M ) est constant pour tout point M ∈ P.
146 Physique, MP, MP*

x
α
b M2 b
a α z
b
α
a H1
vers P b
P
M1 b
δ
Figure 7.3 – Écarts à l’optique géométrique

On considère alors les ondelettes émises par divers points de P, qui interfèrent en un
point d’observation P situé à grande distance de la pupille ; pour évaluer un ordre de
grandeur, nous considérerons que ce point est pratiquement à l’infini. Ainsi, les rayons
lumineux qui éclairent P sont quasiment parallèles entre eux, définis seulement par
un angle α.
Dans l’intégrale (7.6) qui permet le calcul de l’amplitude complexe de l’onde lumineuse
en P , la seule différence entre deux ondelettes émises par deux points différents de
la source réside dans le terme exp [−jk0 (M P )]. On peut alors estimer la plus grande
valeur de l’écart de phase en comparant les chemins optiques M P pour deux points
extrêmes M1 et M2 de la pupille ; ces points dont donc distants de a (cf. figure 7.3 à
droite).
À partir du passage dans le plan H1 M2 (orthogonal à la direction du point P ), les
chemins optiques parcourus sur les deux rayons représentés sont identiques ; la seule
différence à prendre en compte est donc de l’ordre de δ = a sin α, soit aussi δ ≃ aα si
on se contente d’étudier de faibles écarts à la direction α = 0 qui est celle de l’optique
géométrique.
On pourra donc considérer deux cas :

• si k0 δ = aα ≪ 2π, toutes les ondes émises par les divers points de la pupille P
λ0
arrivent en phase en P et l’éclairement est maximal ; on peut donc dire que des
λ0
rayons tels que α ≪ éclairent le centre de la figure de diffraction ;
a
• si au contraire k0 δ est de l’ordre de 2π ou plus, les déphasages entre les rayons
émis par les divers points de la pupille P deviennent importants, la somme (7.6)
contient de beaucoup de nombres complexes largement déphasés et on verra peu
ou pas de lumière : on est donc au-delà de la tache centrale de diffraction.
Nous admettrons la généralisation de ce résultat sous la forme suivante :

Lien entre longueur d’onde et Diffraction


X La lumière est toujours concentrée au voisinage immédiat de l’image
géométrique, dans une région, appelée tache centrale de diffraction dont
la largeur angulaire, vue depuis le plan de la pupille diffractante, est de
l’ordre de grandeur de α = λ0 /a si λ0 est la longueur d’onde dans le vide
de la lumière utilisée et a une dimension caractéristique de la pupille.

Les largeurs angulaires α étant souvent faibles, on les mesure en fractions de radian
mais aussi en minutes d’arc (1′ , ou une minute d’arc, est 1/60e de degré) ou en
secondes d’arc (1′′ , ou une seconde d’arc, est 1/60e de minute). On vérifie facilement
que 1′ ∼ 0, 3 mrad et 1′′ ∼ 5 µrad.
7 : Diffraction de la Lumière 147

2 Écarts à l’optique géométrique : on peut utiliser le résultat ci-dessus pour prévoir


l’effet diffractant ou non d’une pupille, de dimension a, sur une onde lumineuse de
longueur d’onde λ0 qui éclaire cette pupille :
λ0
• si a ≫ λ0 , la largeur angulaire α = de la tache centrale de diffraction est très
a
faible et la diffraction est négligeable : l’image d’une source reste ponctuelle. On
pourra dire que la pupille est si grande (relativement à la dimension caractéris-
tique λ0 de l’onde lumineuse qui la traverse) qu’elle n’est pas vue par l’onde. Il
n’y a donc pas diffraction dans ce cas ;
λ0
• si a & λ0 , la largeur angulaire α = de la tache centrale de diffraction reste faible
a
mais significative : l’effet de la diffraction est effectivement la formation d’une
tache observable, qui dégrade la qualité des images.
La figure 7.4 montre ainsi l’observation au microscope de deux points sombres
très voisins ; la largeur finie des taches de diffraction, qui se recouvrent, fait qu’on
n’est plus sûr de distinguer deux images ponctuelles. On dira que la résolution
du microscope est ici insuffisante pour séparer les deux images.

b b b b

Les points observés Les taches de diffraction


Figure 7.4 – Observation au microscope limitée par la diffraction

• enfin, si a ≪ λ0 , la largeur angulaire de la tache de diffraction est si grande qu’on


peut considérer que la diffraction a lieu de manière isotrope, dans toutes les
directions. On peut aussi dire que la pupille est si petite qu’on peut la traiter
comme une source d’ondelettes unique, ponctuelle, émettant donc une onde
quasiment sphérique.

On prendra garde, pour évaluer l’importance ou non des phénomènes de diffraction,


aux ordres de grandeur ; les mesures optiques étant souvent très précises, un angle
d’ouverture qui pourrait a priori paraı̂tre négligeable peut ne pas l’être. Ainsi, avec
des télescopes faisant plusieurs mètres d’ouverture (a ∼ 5 m) et pour une obser-
vation en lumière visible (λ0 ∼ 500 nm), les phénomènes de diffraction participent
de façon significative à la limitation du pouvoir de résolution, bien que l’ouverture
angulaire λ0 /a = 10−7 rad = 0, 02′′ semble très faible.

2 En résumé : le caractère inévitable des phénomènes de diffraction, dont on peut


montrer qu’ils sont liés à la nature quantique de la lumière, limite le fonctionnement
de nombreux dispositifs optiques.
En particulier, la diffraction perturbera la métrologie de l’imagerie géométrique, puis-
qu’au lieu d’observer sous forme d’un point unique l’image d’un point lumineux, on
observera une tache de diffraction : la diffraction limite la résolution des systèmes
optiques, c’est-à-dire leur capacité à séparer les images de deux objets voisins.
De la même façon, la diffraction perturbera la métrologie de la spectroscopie optique,
c’est-à-dire de la mesure des longueurs d’onde. Par exemple, on s’attend, après passage
par un prisme, à séparer les faisceaux lumineux correspondant à des longueurs d’onde
différentes. Le recouvrement inévitable des images proches du à l’existence de taches
148 Physique, MP, MP*

de diffraction limitera donc la résolution des systèmes spectroscopiques, définie ici


comme leur capacité à séparer des longueurs d’ondes voisines.

7.2 Diffraction de Fraunhofer

7.2.1 Diffraction à l’infini par une pupille plane

2 Les conditions de Fraunhofer : nous étudierons essentiellement dans la suite la


diffraction par une pupille plane, éclairée par une source à l’infini, avec observation à
l’infini : on parle alors de diffraction de Fraunhofer‡ .
La pupille plane P, contenue dans le plan (Oxy), est alors (cf. figure 7.5) éclairée par
un faisceaux de rayons parallèles dirigé par le vecteur unitaire ui ; si les dimensions
de la pupille ne sont pas trop grandes, on observera des rayons diffractés dans des
directions différentes de la direction d’observation incidente.
x

b
M
b
z

M
b
ui M ′′ ud

Figure 7.5 – Diffraction de Fraunhofer

Parmi toutes les directions éclairées par les ondelettes émises par les points M , M ′ ,
etc. de P, on s’intéressera dans ce qui suit à celles qui se propagent dans une direction
commune de vecteur directeur unitaire ud ; ces diverses ondes interfèrent bien sûr
seulement à l’infini.

2 L’intégrale de Fraunhofer : dans le cas de la diffraction de Fraunhofer, l’intégrale


de diffraction (7.6) prend une forme simple car le calcul du chemin optique (SM P )
peut être effectué au moyen du schéma de la figure 7.6. Sur ce schéma, le point O est
une origine choisie arbitrairement dans le plan (Oxy) de la pupille P.
x

b
dep M
uis P
S vers
z
H K
b b
b
ui O ud

Figure 7.6 – Calcul du chemin optique dans la diffraction de Fraunhofer


7 : Diffraction de la Lumière 149

Il n’est pas nécessaire que le point origine O fasse effectivement partie de la pupille
P ; certaines droites représentées sur cette figure ne sont donc pas nécessairement
des rayons lumineux effectifs.
On peut noter (SM P ) = (SM ) + (M P ) le chemin optique de la source S au point
d’observation P . Quels que soient les dispositifs optiques placés de part et d’autre du
plan P de la pupille, on sait aussi d’après le théorème de Malus que les rayons lumineux
sont perpendiculaires aux surfaces d’onde, ou surfaces de chemin optique constant ;
ainsi, le chemin optique (SM ) est identique au chemin optique (SH) puisque M et
H sont sur la même surface d’onde.
De même, le chemin optique (M P ) est égal au chemin optique (KP ) puisque K et M
sont situés sur la même surface perpendiculaire aux rayons lumineux qui se dirigent
vers P . Finalement, on écrira (SM P ) = (SHOKP ) − (HO) − (OK).
Les chemins optiques (HO) et (OK) étant parcourus dans l’air, d’indice pris égal à
1, de part et d’autre de la pupille, on écrira ces chemins (HO) = HO = HO · ui et
(OK) = OK = OK · ud . L’utilisation de mesures algébriques permet d’étendre le cas
de la figure 7.6 à une situation différente, si le point M était au-dessous de O par
exemple.

On remarque que la méthode de calcul du chemin optique présentée ici ne fait


intervenir que les seuls phénomènes de diffraction au niveau de la pupille P ; l’emploi
du théorème de Malus permet de ne pas prendre en compte l’existence de miroirs,
lentilles, etc., dans le dispositif optique complet : ces systèmes étant par construction
stigmatiques, ils n’introduisent aucune différence de chemin optique supplémentaire.
Par construction, HM ⊥ ui , ce qui permet d’écrire (HO) = (HO − HM) · ui soit
(HO) = −OM · ui ; de même, MK ⊥ ud donc (OK) = (OK − MK) · ud = OM · ud .
Finalement, (HO)+(OK) = OM·(ud − ui ) donc (SM P ) = (SOP )−OM·(ud − ui ),
où le terme (SOP ) est une constante relativement à P , c’est-à-dire pour l’intégration
sur le plan de la pupille P.
On peut alors déterminer l’amplitude complexe de l’onde lumineuse diffractée vers le
point P , situé dans la direction de vecteur unitaire ud , par l’intégrale de Fraunhofer :

x
w(ud ) = Kw(S) exp [−jϕ0 ] T (M ) exp [jk0 OM · (ud − ui )] dxdy (7.7)
M ∈P

où la phase ϕ0 = k0 (SOP ), ne dépend que du choix de l’origine O dans le plan de P.


2 Les cosinus directeurs : on explicite souvent l’intégrale de Fraunhofer (7.7) en
faisant intervenir les coordonnées cartésiennes des vecteurs unitaires ui et ud , sous la
forme ui = αi ex + βi ey + γi ez et ud = αd ex + βd ey + γd ez ; ces coefficients portent le
nom de cosinus directeurs. Puisque OM = xex + yey , l’intégrale de Fraunhofer prend
encore la forme :

x
w(αd , βd ) = Kw(S) exp [−jϕ0 ] T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.8)
R2

où on a noté ∆α = αd − αi et ∆β = βd − βi les variations des cosinus directeurs dus à


la diffraction. On notera aussi dans l’intégrale (7.8) que le domaine d’intégration est
étendu à la totalité du plan (Oxy), ce qui impose de noter par convention T (x, y) = 0
pour tout point situé hors de la pupille P.
150 Physique, MP, MP*

7.2.2 Montages de diffraction à l’infini


Il n’existe évidemment ni source à l’infini, ni possibilité d’observer quoi que ce soit
à l’infini ; nous allons donc proposer deux montages pratiques permettant d’observer
effectivement les figures de diffraction déterminées par le calcul des intégrales de
Fraunhofer (7.7) ou (7.8).
2 Cas des angles quelconques : dans ce cas (figure 7.7), on utilise un goniomètre,
muni d’un collimateur C et d’une lunette de visée L. Un tel dispositif est adapté
à l’étude de phénomènes de diffraction pour des angles quelconques, éventuellement
grands, mais limités à un plan : le plan (Oxz) du goniomètre.

S x
b C
L

θi θd

u z
i
P ud

Figure 7.7 – Diffraction de Fraunhofer : étude sur un goniomètre

La source lumineuse utilisée est en fait placée au foyer objet S du collimateur, et


l’observation se fait à l’œil, sans accommoder, au moyen de la lunette de visée. Dans
une telle géométrie, βi = βd = 0 tandis que αi = ui ·ex = sin θi et αd = ud ·ex = sin θd :
les cosinus directeurs sont ici les sinus des angles formés par le faisceau incident et le
faisceau diffracté avec la normale au plan de la pupille. Sur la figure 7.7, on remarque
que θi < 0 et θd > 0.
À un facteur multiplicatif près, on écrira ici l’intégrale de Fraunhofer :

x  

w(θd ) ∝ T (x, y) exp j x (sin θd − sin θi ) dxdy (7.9)
λ0
R2

2 Le cas des conditions de Gauss : lorsque l’éclairage de la pupille et l’observation


de la figure de diffraction se font dans des directions voisines de la normale (Oz) au
plan de la pupille,
p les vecteurs directeurs ui et ud sont peu écartés de ez , ce qu’on
peut écrire γi = 1 − αi2 − βi2 ≃ 1 au second ordre près, ainsi d’ailleurs que γd ≃ 1.
Les rayons incident (sur la pupille) et émergent (vers le point d’observation P ) restant
alors proches de l’axe (Oz), on peut utiliser des systèmes optiques stigmatiques dans
les conditions de Gauss pour réaliser l’éclairage et l’observation, comme sur la figure
7.8 qui utilise deux lentilles convergentes.

On ne doit en aucun cas raccorder les deux schémas de la figure 7.8 en un seul ;
en effet, le schéma de gauche (pour l’éclairage) est tracé dans le plan défini par les
vecteurs ez et ui , tandis que le schéma de droite (pour l’observation) est tracé dans
le plan défini par ez et ud . Ces deux plans sont en général distincts.
La source ponctuelle S est disposée dans le plan foyer objet de la lentille d’éclairage
Le (de distance focale image fe′ ), au voisinage de son foyer principal objet Fe ; après
7 : Diffraction de la Lumière 151

S b bP

Fe C z Co F′ z
b b e b b o

ui ud

Le Lo

Figure 7.8 – Cosinus directeurs dans les conditions de Gauss

traversée de cette lentille, on obtient donc un faisceau parallèle, donc le vecteur uni-
taire ui ≃ αi ex + βi ey + ez est parallèle à la direction SCe , où Ce est le centre optique
αi βi 1
de Le . Comme SCe = fe′ ez − xS ex − yS ey , on peut écrire = = ′ , ou :
−xS −yS fe

xS yS
αi ≃ − βi ≃ − (7.10)
fe′ fe′

Ainsi, les cosinus directeurs de la direction incidente sur la pupille mesurent des gran-
deurs proportionnelles aux abscisses et ordonnées de la source dans le plan focal de
la lentille d’éclairage.
La même étude faite pour la lentille d’observation Lo , de distance focale image fo′ et
de centre optique Co , montre que le vecteur ud ≃ αd ex + βd ey + ez est parallèle à
Co P = fo′ ez + xP ex + yP ey , ce qui mène à :

xP yP
αd ≃ βd ≃ (7.11)
fo′ fo′

et les cosinus directeurs de la direction diffractée par la pupille mesurent des grandeurs
proportionnelles aux abscisses et ordonnées du point d’observation dans le plan focal
de la lentille d’observation.

Rappelons une fois encore que le calcul de chemin optique proposé à partir de la
figure 7.6 n’est pas modifié par la présence de telles lentilles ; en effet, s’agissant de
dispositifs stigmatiques pour un couple (plan à l’infini, foyer secondaire), ces lentilles
n’introduisent aucune différence de marche supplémentaire par rapport à celle qui
apparaı̂t de part et d’autre du plan de la pupille diffractante P.

Finalement, on pourra écrire ici, toujours à un facteur multiplicatif près, l’expression


de l’intégrale de Fraunhofer adaptée aux conditions de Gauss :

x      
2π xP xS yP yS
w(xP , yP ) ∝ T (x, y) exp j x + ′ +y + ′ dxdy
λ0 fo′ fe fo′ fe
R2
(7.12)
152 Physique, MP, MP*

On adopte souvent une forme simplifiée de (7.12), en considérant que la source est
disposée au foyer principal objet de Le (donc avec xS = yS = 0) ; bien que cette
approximation ne soit pas très réaliste sur le plan expérimental, elle permet de discuter
plus simplement de la forme de l’intégrale de Fraunhofer :
x  

w(xP , yP ) ∝ T (x, y) exp j (xxP + yyP ) dxdy (7.13)
λ0 fo′
R2

Dans l’écriture (7.13), on se gardera de confondre les notations (x, y), coordonnées
du point courant d’intégration, et (xP , yP ), position du point d’observation où on
calcule l’intégrale donnant l’amplitude complexe w(xP , yP ).
On peut aussi considérer que le passage de (7.12) à (7.13) est un simple changement de
f′ f′
l’origine du plan d’observation, xP 7→ x′P = xP − o′ xS et yP 7→ yP′ = yP − o′ yS . Ce
fe fe
changement a pour effet de recentrer la figure de diffraction sur l’image géométrique S ′
f′ f′
de la source S, dont les coordonnées sont évidemment xS ′ = − o′ xS et yS ′ = − o′ yS .
fe fe
2 En résumé : dans toute la suite, nous utiliserons l’expression générale :
x
w(P ) ∝ T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.14)
R2

en retenant pour expression de la variation des cosinus directeurs lors de la diffraction


l’une ou l’autre forme :

∆α = sin θd − sin θi pour de grands angles


xP xS (7.15)
∆α = + ′ dans les conditions de Gauss
fo′ fe

et les expressions analogues pour ∆β le cas échéant.

7.2.3 Propriétés générales des figures de diffraction à l’infini


2 Translation de la pupille : le déplacement de la pupille P dans son plan (Oxy)
peut être décrite par un simple changement de la fonction de transparence T (x, y). La
figure 7.9 représente ainsi deux pupilles transparentes découpées dans un plan opaque,
identiques à une translation OO′ près.
Les pupilles P et P ′ sont définies par des fonctions de transparence T (x, y) et T ′ (x′ , y ′ )
telles que T ′ (M ′ ) = T (M ) si MM′ = OO′ . Si on note OO′ = aex + bey cette trans-
lation, on en déduit que T ′ (x, y) = T (x − a, y − b) ; on peut donc relier les amplitudes
complexes diffractées par ces deux pupilles
x dans une même direction en écrivant pour
la pupille P ′ , w′ = Kw0 exp [−jϕ0 ] T ′ (x, y) exp [jk0 (x∆α + y∆β)] dxdy ; faisant le
R2
changement de variables x′ = x − a,xy ′ = y − a, on peut encore écrire cette am-
plitude w′ = Kw0 exp [−j(ϕ0 − ϕ)] T (x′ , y ′ ) exp [jk0 (x′ ∆α + y ′ ∆β)] dx′ dy ′ avec
R2
ϕ = k0 (a∆α + b∆β) ; on reconnaı̂t dans cette
x expression l’amplitude complexe diffrac-
tée par la pupille P, w = Kw0 exp [−jϕ0 ] T (x′ , y ′ ) exp [jk0 (x′ ∆α + y ′ ∆β)] dx′ dy ′ .
R2
7 : Diffraction de la Lumière 153

O′ b
b
M′ P′

O x
b
b
M P

Figure 7.9 – Translation d’une pupille dans son plan

Translation de la pupille diffractante


X La translation de la pupille diffractante dans son plan selon le vecteur
OO′ = aex + bey s’accompagne d’un simple déphasage de l’amplitude

complexe, w′ (P ) = w(P ) exp [jϕ] avec ϕ = (a∆α + b∆β) ou encore
λ0

ϕ= OO′ · (ud − ui ).
λ0
On observera donc la même intensité lumineuse en chaque point P pour
les deux pupilles, puisque l’éclairement est proportionnel à |w(P )|2 .

Un tel résultat peut a priori sembler peu naturel : on s’imagine parfois que la figure
de diffraction est translatée en même temps que la pupille. Il n’en est évidemment
rien puisque, quelle que soit la position de la pupille, la figure de diffraction est
centrée sur l’image géométrique de la source, telle qu’elle se formerait en l’absence
de toute pupille. Le déplacement de cette dernière ne peut donc évidemment pas
avoir pour effet le déplacement de la figure de diffraction.

2 Théorème de Babinet : on dira que les pupilles P et P ′ sont complémentaires si


les transmittances complexes T et T ′ associées vérifient T (M ) + T ′ (M ) = 1 pour tout
point M ∈ (Oxy). C’est par exemple le cas des deux pupilles de la figure 7.10, formées
respectivement d’un trou circulaire dans un écran opaque et d’un disque opaque sur
un écran transparent.

Figure 7.10 – Pupilles complémentaires pour le théorème de Babinet

On peut alors comparer, en un même point P de la zone d’observation, les amplitudes


complexes w(P ) et w′ (P ) diffractées par P et P ′ ; en effet, la relation (7.14) montre
154 Physique, MP, MP*

que w(P ) + w′ (P ) = w0 (P ), où l’amplitude w0 (P ) correspondrait à la diffraction


par une pupille telle que T 0 (M ) = 1, ∀M : il s’agit en fait d’un plan idéalement
transparent.
Un tel plan ne diffracte pas la lumière puisqu’il est par construction de très grandes
dimensions (en tous cas très supérieures à λ0 ) ; l’amplitude w0 (P ) est donc entièrement
concentrée au point S ′ , image géométrique de la source S. En particulier, si P 6= S ′ ,
w0 (P ) = 0 donc w(P ) = −w′ (P ) et donc |w(P )|2 = |w′ (P )|2 :

Théorème de Babinet
X En tout point de la zone d’observation, sauf au niveau de l’image géo-
métrique S ′ de la source ponctuelle qui les éclaire, deux pupilles complé-
mentaires fournissent la même figure de diffraction.

2 Diffraction et Optique de Fourier : considérons à nouveau l’expression (7.14) de


l’amplitude diffractée en un point P par
xune pupille plane, que nous écrirons sous la
forme w(P ) = Kw0 exp [−jk0 (SOP )] T (x, y) exp [jk0 (x∆α + y∆β)] dxdy. Si on
R2
note alors k0 ∆α = u et k0 ∆β = v, on remarque que l’amplitude diffractée est propor-
tionnelle à la transformée de Fourier (inverse) à deux dimensions de la transmittance,
x
qu’on définit par Tb (u, v) = 1 T (x, y) exp (j[ux + vy]) dydy en généralisation des
2π 2
R
définitions proposées dans le cadre du cours d’électronique.

Transformée de Fourier en Optique


X L’amplitude complexe diffractée à l’infini par une pupille plane est pro-
portionnelle à la transformée de Fourier Tb (u, v) de la fonction de trans-
mittance complexe.
Cette transformée de Fourier est calculée pour les variables u et v, qui

portent le nom de pulsations spatiales et sont définies par u = ∆α et
λ0

v= ∆β ; u et v mesurent l’ouverture angulaire du faisceau diffracté
λ0
de part et d’autre de la direction d’éclairement de la pupille.

On sait que les largeurs respectives des fonctions T (dans le plan des coordonnées
spatiales) et Tb (dans le plan des pulsations spatiales) varient en sens inverse :

∆x · ∆u ∼ 2π donc ∆x · ∆α ∼ λ0 (7.16)

On retrouve ainsi une généralisation de la relation déjà affirmée, liant la largeur ∆x


λ0
de la pupille et la largeur angulaire dans la direction correspondante, ∆α ∼ .
∆x
En particulier, on retiendra que si ∆x ≫ ∆y, alors ∆α ≪ ∆β : si la pupille est allongée
(le long de l’axe (Oy) ici), alors la figure de diffraction est allongée perpendiculairement
à la pupille, le long de l’axe (Ox) dans ce cas).

7.3 Calculs de figures de diffraction à l’infini

2 Notations : dans toute cette partie, nous calculerons d’abord l’amplitude complexe
diffractée à l’infini, dans une direction définie par les variations (angulaires) des cosi-
7 : Diffraction de la Lumière 155

x
nus directeurs ∆α et ∆β, w(∆α, ∆β) = Kw′0 T (x, y) exp [jk0 (x∆α + x∆β)] dxdy ;
R2
dans cette expression, on a posé w′0 = w0 exp [−jk0 (SOP )].
Ce calcul ne nous renseigne pas directement sur l’aspect de la figure de diffraction, qui
dépend de la répartition de l’éclairement, donné par E(∆α, ∆β) = |w(∆α, ∆β)|2 ; on
exprimera aussi ces éclairements en fonction de coordonnées sur l’écran d’observation,
xP yP
en utilisant les expressions ∆β = ′ et ∆α = ′ , où fe′ est la focale de projection
fe fe
et où les coordonnées (xP , yP ) dans le plan d’observation sont relatives à l’origine O,
confondue avec l’image S ′ de la source ponctuelle qui éclaire la pupille.
Enfin, nous ne considérerons dans la suite que des pupilles purement transparentes,
c’est-à-dire qui vérifient T (M ) = 1 pour M ∈ P et T (M ) = 0 sinon ; le calcul de
2
x

l’éclairement se ramène à E(xP , yP ) = |Kw′0 |2 × exp [jk0 (x∆α + x∆β)] dxdy ,
(x,y)∈P
où E(0, 0) = |Kw′0 |2 × S au centre de la figure, si S est la surface de la pupille.
Nous poserons systématiquement E(0, 0) = E0 dans ce qui suit pour l’éclairement
au centre de la figure de diffraction, ce qui permet enfin d’écrire l’éclairement en un
point de la figure d’interférence sous la forme E(xP , yP ) = E0 |s(xP , yP )|2 , où le terme
(sans dimension) s(xP , yP ) est l’amplitude complexe diffractée réduite, donnée par
1 x
s(xP , yP ) = exp [jk0 (x∆α + x∆β)] dxdy.
S
(x,y)∈P

7.3.1 Diffraction à l’infini par une pupille rectangulaire


2 La pupille étudiée : elle est représentée sur la figure 7.11 ; il s’agit d’un orifice
rectangulaire, de dimensions a > b, transparent, percé dans un plan opaque.
y

b x
bO

Figure 7.11 – Pupille rectangulaire

Le choix de l’origine O du plan de la pupille au centre de celle-ci est, comme on l’a


vu, arbitraire : une translation de cette pupille dans son plan ne modifie pas la figure
de diffraction.
2 La répartition d’éclairement : l’amplitude complexe diffractée réduite est ici don-
Z a/2 Z b/2
1
née par s(xP , yP ) = exp [jk0 x∆α] dx exp [jk0 y∆β] dy. On recon-
ab x=−a/2 y=−b/2
naı̂t ici le produit de deux intégrales analogues, dont le calcul est simple ; on écrit
Z  a/2
1 a/2 1
par exemple exp [jk0 x∆α] dx = exp [jk0 x∆α] qui se met
a x=−a/2 jk0 a∆α x=−a/2
156 Physique, MP, MP*

2j sin k0 a∆α
2
encore sous la forme ; finalement, quelques simplifications mènent à
jk0 a∆α
k0 a∆α k0 b∆β
s(xP , yP ) = sinc × sinc .
2 2
L’éclairement en un point P de la zone d’observation prend alors la forme :

πa∆α πb∆β
E = E0 × sinc2 × sinc2 (7.17)
λ0 λ0

2 La figure de diffraction : on a déjà eu l’occasion de présenter le comportement de la


fonction u 7→ sincu dans le cours d’électronique ; le tracé de la fonction u 7→ sinc2 u s’en
déduit ; il est reporté sur la figure 7.12, qui met en évidence la présence, mais aussi
l’intensité relative, des deux premiers maxima secondaires. Ceux-ci correspondant
3π 5π
approximativement à sinc2 ≃ 0, 045 et sinc2 ≃ 0, 016.
2 2
sinc2 u E(∆α)
1, 6 %

1 E0

4, 5 %

u ∆α
−2π −π π 2π − 2λa0 − λa0 λ0 2λ0
∆u = 2π a a
2λ0 /a

πa∆α
Figure 7.12 – Tracé des fonctions u 7→ sinc2 u et ∆α 7→ E(∆α) = E0 sinc2
λ0

πa∆α
La même figure fait apparaı̂tre le tracé de la fonction ∆α 7→ E(∆α) = E0 sinc2 ,
λ0
qui est la réduction à une dimension de la fonction d’éclairement E(∆α, ∆β).
Toutefois, puisqu’il s’agit d’une fonction de deux variables ∆α et ∆β, on doit en
donner une représentation tridimensionnelle ; la figure 7.13 montre la répartition de
la lumière dans le plan d’observation.
On remarquera l’absence totale de visibilité hors des axes (puisqu’alors aucune des
deux fonctions sinc2 de l’éclairement (7.17) ne prend sa valeur maximale 1) ; la figure
de diffraction prend la forme d’une croix, formée d’une tache centrale et de taches
secondaires, dont la luminosité n’est que quelques pour cent de celle du centre de la
figure (4, 5 % pour le premier maximum secondaire, 1, 6 % pour le second, etc.).
La tache centrale est, le long de chaque axe, deux fois plus large que chacune des taches
secondaires ; en valeurs angulaires, cette largeur à la base du maximum principal est
respectivement égale à 2λ0 /a ou 2λ0 /b selon l’axe étudié.
Compte tenu qu’on a choisi a > b, la figure 7.13 montre bien que la figure de diffraction
est allongée perpendiculairement à la plus grande direction de la pupille.
7 : Diffraction de la Lumière 157

∆β

2λ0
a

∆α

2λ0
b

Figure 7.13 – Figure de diffraction d’une pupille rectangulaire

S′
b b
2λ0 fo′
Sb b
b b b b
b
z
b b

fe′ fo′
P

Figure 7.14 – Montage de diffraction de Fraunhofer pour une pupille rectangulaire

La figure 7.14 récapitule les éléments du montage de diffraction par une pupille en
forme de fente rectangulaire : la source ponctuelle S donnerait, en l’absence de toute
pupille, une image S ′ au moyen des deux lentilles d’éclairage (focale fe′ ) et d’observa-
tion (focale fo′ ) ; la pupille, allongée dans une direction, donne une figure de diffraction
allongée perpendiculairement.
Dans le plan focal de la lentille d’observation, on observe donc essentiellement une
2λ0
tache centrale dont la largeur angulaire se projette dans le plan focal de la
a
2λ0 fo′
lentille d’observation en une largeur effective . Cette tache centrale est entourée
a
de taches secondaires, moins lumineuses et de largeur deux fois moindres.

2λ0 2λ0
On ne confondra pas la largeur angulaire à la base ou (selon l’axe étudié)
a b
du maximum central de diffraction avec la largeur à la base des pics secondaires, qui
λ0 λ0
ne sont égaux qu’à la moitié du précédent, ou . Le risque de confusion est
a b
d’autant plus grand qu’on s’intéresse souvent à la demi-largeur du pic central, qui
est aussi proche de sa largeur à mi-hauteur ; cette demi-largeur angulaire est bien
λ0 λ0
sûr ou selon l’axe étudié.
a b

λ0 2λ0
On ne confondra pas non plus les largeurs angulaires ou (qui sont des angles
a a
158 Physique, MP, MP*

et se mesurent en radian) avec les largeurs projetées dans le plan focal du dispositif
λ0 fo′ 2λ0 fo′
d’observation, égales respectivement à ou (qui sont des longueurs et
a a
se mesurent en mètre).

7.3.2 Diffraction à l’infini par une fente fine


2 La pupille étudiée : on s’intéresse maintenant au cas particulier d’une fente fine
très allongée, que l’on peut donc traiter comme une fente rectangulaire dans le cas
limite où a ≫ b ; ainsi, on peut réutiliser les résultats précédents en faisant a → ∞.
La figure de diffraction de la figure 7.13 se rétrécit alors sur l’axe horizontal, puisque
sa largeur angulaire le long de cet axe est de l’ordre de λ0 /a → 0. Ainsi, la figure
de diffraction se réduit à un alignement de taches le long de l’axe (Oy), qui est l’axe
perpendiculaire à la direction de la fente fine.
Sur cet axe, les largeurs de la tache centrale et des maxima secondaires, ainsi que leur
luminosité relative, sont rappelées sur la figure 7.15.

Représentation dans le plan focal d’une lentille de projection de focale fo′


1, 6 % 4, 5 % 2λ0 fo′ /b 4, 5 % 1, 6 %

λ0 fo′ /b 100 % λ0 fo′ /b


La figure est perpendiculaire à la fente diffractante

Figure 7.15 – Figure de diffraction d’une fente fine

2 Généralisation : considérons une pupille de dimension quelconque, mais dont une


dimension est nettement supérieure à l’autre. Si par exemple cette grande dimension
(la longueur ℓ de la pupille) est alignée avec l’axe (Ox), on peut affirmer, comme dans
le cas précédent, que l’ouverture angulaire le long de cet axe (Ox) sera de l’ordre de
grandeur de λ0 /ℓ, donc négligeable.

Pupilles longues
X Si une pupille plane, de normale (Oz), présente une longueur ℓ très
grande dans la direction de l’axe (Ox), aucune diffraction n’aura lieu
dans cette diffraction et la figure de diffraction sera limitée à une ligne
perpendiculaire à la pupille.

On peut donc, dans le cas des pupilles longues, faire un schéma dans le seul plan
(Oyz), qui concentre les phénomènes de diffraction ; c’est le cas de la figure 7.16.
Dans un tel cas, l’intégrale de diffraction sera écrite comme on l’a fait plus haut dans
le cas du goniomètre de la figure 7.7, donc avec βi = sin θi , βd = sin θd tandis que
Z ℓ/2
αi = αd . Le calcul intégral selon (Ox) mène donc au résultat immédiat dx = ℓ
x=−ℓ/2
et il ne reste alors qu’à étudier la diffraction dans le plan (Oyz) :

Z
w(P ) = Kℓw0 T (y) exp [jk0 y∆β] dy (7.18)
P
7 : Diffraction de la Lumière 159

y yP

b θd P
θd z

N
θi ℓ≫b

fo′

Figure 7.16 – Diffraction par une pupille longue

avec, selon que les angles de diffraction sont grands (dans le cas général) ou petits
(comme dans le cas de la figure 7.16, qui utilise une lentille et impose donc de se
placer dans les conditions de Gauss), les deux expressions possibles pour la variation
des cosinus directeurs dans le plan de la diffraction :

yP yS
∆β = sin θd − sin θi ou ∆β = + ′ (7.19)
fo′ fe

xP xS
L’expression (7.18) n’est valable que sur l’axe défini par + ′ = 0 ; pour toute
fo′ fe
autre valeur de xP , w(P ) = 0 et E(P ) = 0.

2 Élargissement de l’éclairage : dans le cas du montage de la figure 7.16, la répartition


de la lumière a lieu exclusivement dans le plan de figure : la figure de diffraction est
une ligne, parallèle à l’axe (Oy) et passant par le centre de la figure, donc par l’image
S ′ de la source ponctuelle S utilisée pour éclairer le dispositif.
Si on juxtapose à cette source S un autre point source S1 , décalé le long de l’axe (Ox),
les faisceaux issus de S et de S1 vont, indépendamment l’un de l’autre, éclairer la même
pupille P et former deux figures de diffraction juxtaposées, centrées respectivement
en S ′ et S1′ , donc parallèles l’une à l’autre.
y

b b
x ℓ S1′
S b
b b b b b
b z
S′
S1
b b

fe′ fo′
P

Figure 7.17 – Éclairage large d’une pupille étroite

La figure 7.17 montre cette situation, une pupille étroite étant éclairée par deux sources
ponctuelles S et S1 décalées parallèlement à la plus grande longueur de la pupille.
Les deux figures de diffraction sont alors décalées de la même façon, chacune étant
centrée respectivement sur l’image géométrique (respectivement S ′ ou S1′ ) de la source
ponctuelle correspondante.
160 Physique, MP, MP*

On généralise immédiatement ce résultat au cas d’une source étendue, formée non


plus d’un point source S mais d’une fente source, disposée parallèlement à la fente
diffractante : on obtient alors une figure de diffraction étalée, parallèlement aux deux
fentes précédentes, le comportement de l’éclairement en fonction de y étant inchangé.

Éclairage des pupilles fines


X Une pupille fine, étendue sur une grande longueur ℓ le long de l’axe
(Ox), ne diffracte que le long de l’axe (Oy). On peut donc l’éclairer par
une fente source, allongée parallèlement à la pupille le long de (Ox) ;
l’éclairement obtenu dans le plan focal imageZde la lentille de projection
s’écrit alors E(y) = |w(y)|2 où w(y) = K ′ w0 T (y) exp [−jk0 ∆βy] dy ;
P
cet éclairement ne dépend pas de xP et la figure d’interférences est donc
étendue parallèlement à la fente source et à la pupille diffractante.

Au contraire de l’expression (7.18), l’éclairement E(P ) est alors indépendant de xP ;


la figure de diffraction est donc invariante par translation le long de (Ox), qui est
à la fois la plus grande direction de la pupille diffractante et de la fente source qui
éclaire l’ensemble.
On peut, à titre de comparaison, tracer ensemble la figure de diffraction par une pupille
rectangulaire avec éclairage ponctuel (à gauche sur le tracé 7.18 ; il s’agit simplement
d’une reprise de la figure 7.13), puis par une pupille rectangulaire fine (largeur b selon
(Oy), grande longueur ℓ ≫ b selon (Ox)) avec éclairage ponctuel (au centre sur le
tracé 7.18) et enfin la même pupille fine mais avec un éclairage large, parallèle à la
pupille (à droite sur le tracé 7.18).

yP yP
2λ0 fo′ /b

2λ0 fo′ /b
xP

2λ0 fo′ /ℓ
ℓ≫b

Pupille rectangulaire Pupille longue ℓ ≫ b


Source ponctuelle Source étendue selon (Ox)

Figure 7.18 – Pupilles rectangulaires : figure de diffraction et conditions d’éclairage

7.3.3 Diffraction à l’infini par une pupille circulaire


2 La pupille étudiée : considérons maintenant le cas d’une pupille circulaire de centre
O et de rayon R, transparente, dans un écran opaque. Il s’agit d’une pupille à la fois
très facile à réaliser et très courante puisque la plupart des instruments d’optique sont
constitués de lentilles ou de miroirs à bords circulaires.
Nous chercherons donc à déterminer la répartition de l’amplitude diffractée par une
telle pupille dans le plan focal image d’une lentille de projection de distance focale
image fo′ ; les coordonnées du point P dans ce plan étant prises relativement à une
7 : Diffraction de la Lumière 161

origine confondue avec l’image S ′ de la source ponctuelle


 qui éclaire le système, on
x xxP yyP
aura donc w(P ) = Kw0 exp jk0 + ′ dxdy.
fo′ fo
P
y
b

b
2 R2 − x2 x

Figure 7.19 – Paramétrage pour le calcul de diffraction par une pupille circulaire

Le calcul de l’intégrale
p ci-dessus se faitpen précisant les bornes d’intégration, à savoir
(cf. figure 7.19) − R2 − x2 6 y 6 R2 − x2 puis −R 6 x√6 R ; il vient donc
Z R       R2 −x2
xxP fo′ yyP
w(P ) = Kw0 exp jk0 ′ × exp jk0 ′ √
dx ou, après
x=−R fo jk0 yP fo − R2 −x2
Z R   √
2fo′ xxP k0 R2 − x2 yP
substitution, w(P ) = Kw0 exp jk0 ′ sin dx.
k0 yP x=−R fo fo′
Cette intégrale, dont on ne sait pas donner d’expression analytique dans le cadre du
Rk0 xP
cours, peut cependant être réécrite en fonction des variables réduites u = et
fo′
Z 1  p 
Rk0 yP 4Kw0 R2
v= ′
, sous la forme w(P ) = cos (uX) sin v 1 − X 2 dX, où on
fo v 0
a posé X = x/R et en exploitant la parité du terme intégré.
Le choix de l’ordre d’intégration (y, puis x) est évidemment arbitraire ; le résultat
obtenu doit être symétrique en xP , yP . En fait, il ne dépend même pas du choix
particulier des axes (Ox) et (Oy) dans le plan de la pupille ; en effet, le dispositif
ayant la symétrie de révolution autour de (Oz), il en va de même de la figure de
diffraction.
Ainsi, l’éclairement en un point q
P de l’écran ne dépend pas de xP et de yP , mais
seulement de la distance rP = x2P + yP2 entre P et le centre de la figure. Plus
précisément, le changement de variables proposé ci-dessus montre que l’amplitude
Rk0 rP
complexe w(P ) et l’éclairement E(P ) ne dépendent en fait que de ρ = .
fo′
Nous admettrons que l’intégrale ci-dessus peut s’écrire en termes de la fonction J1 de
J1 (ρ)
Bessel‡ , sous la forme w(ρ) = 2πR2 Kw0 ; avec donc pour éclairement :
ρ
 2
J1 (ρ) 2πR
E(rP ) = 4E0 ρ= rP (7.20)
ρ λ0 fo′

Dans cette expression, le facteur 4 assure seulement que E(0) = E0 , éclairement au


centre de la figure. À partir d’expressions tabulées de la fonction de Bessel J1 , on
a représenté sur la figure 7.20 le comportement de l’éclairement E en fonction de la
distance rP au centre de la figure de diffraction.
On a en particulier fait figurer la première annulation de E(rP ), atteinte pour ρ ≃ 3, 83,
3, 83 λ0 fo′
donc encore pour rP ≃ ; cette distance correspond au rayon d’un cercle
2π R
sombre (E = 0) qui entoure une tache circulaire très lumineuse. Cette tache porte le
nom de tache d’ Airy‡ , et son rayon est donné par :
162 Physique, MP, MP*

4J12 (ρ)
E(rP )
ρ2

1 E0

1, 7 % 1, 7 % × E0

ρ rP

3, 83 7, 02 rA 1, 8 × rA

4J12 (u)
Figure 7.20 – Tracé des fonctions u 7→ et rP 7→ E(rP )
u2

λ0 fo′
rA = 0, 61 (7.21)
R

On remarque sur les tracés de la figure 7.20 que la tache d’Airy est une zone cir-
culaire entourée d’un cercle faiblement lumineux (avec une luminosité maximale de
l’ordre de grandeur de 1, 7 % de celle observée au centre de la figure) ; on peut vi-
sualiser l’existence de cet anneau sur la figure 7.21, qui représente sur un diagramme
tridimensionnel l’éclairement en fonction des coordonnées d’espace.

Figure 7.21 – Représentation de l’éclairement dans la tache d’Airy

Il est important de retenir l’expression (7.21) du rayon de la tache d’Airy ; on peut


d’ailleurs en retrouver l’ordre de grandeur en remarquant qu’une pupille circulaire
de rayon R (et donc de surface πR2 ) doit former une tache de diffraction de même
largeur angulaire qu’une pupille carrée de côté a (et donc de surface a2 ) sous réserve
que leurs surfaces soient comparables.
En imposant πR2 ∼ a2 , la largeur angulaire de la tache d’Airy à sa base (ou diamètre
λ0 2 λ0 λ0
angulaire) peut être estimée à 2 ∼ √ = 1, 13 ; cette valeur n’est pas exac-
a π R R
tement identique à celle déduite de l’étude qui précède, mais elle s’en approche assez
pour appuyer le résultat (7.21), qu’on peut d’ailleurs recopier sous la forme :
7 : Diffraction de la Lumière 163

λ0 fo′
∆α = 1, 22 rA = ∆α (7.22)
R 2

2 Application : considérons un système optique quelconque, dont le diaphragme


d’entrée est circulaire de rayon R. Les faisceaux lumineux entrant dans ce système
subissent une diffraction qui remplace chaque rayon lumineux par un faisceau élargi,
de diamètre angulaire ∆α. On considère alors que le reste du dispositif n’est pas
limitant du point de vue de la diffraction, c’est-à-dire que les diaphragmes des lentilles
ultérieures sont de diamètre supérieur au diamètre des faisceaux dans le système.
b E
pupille P θ
∆α
∆α
θ 2

∆α
b

Figure 7.22 – Résolution angulaire et tache d’Airy

Une telle ouverture angulaire ∆α ne permet pas de distinguer des objets qui éclairent
le système optique sous des angles trop proches, car alors leurs taches d’Airy se re-
couvrent ; la figure 7.22 illustre ce cas, dans le cas où les objets sont effectivement
angulairement résolus car leur écart angulaire θ est assez élevé.
On rend quantitative cette affirmation en imposant le critère de Rayleigh pour la
séparation des faisceaux issus des deux objets observés : on dit qu’il y a séparation si
l’écart θ entre les maxima est supérieur à la demi-largeur à la base de l’un d’eux :

λ0
θ > θmin = 0, 61 (7.23)
R

Cette relation constitue la justification quantitative de la figure 7.4. La résolution


angulaire ainsi déterminée, évaluée pour la longueur d’onde du maximum de sensibilité
de l’œil (λ0 ∼ 560 nm), est par exemple de l’ordre de grandeur de θmin ∼ 0, 7′′
pour R = 10 cm ; la résolution angulaire des instruments d’optique réels est toujours
moindre que cette limite théorique, du fait des autres défauts de l’appareil.
E E

∆α ∆α
La prévision théorique Le signal observé

Figure 7.23 – Un cas de non-résolution angulaire

La figure 7.23 montre un cas de non-résolution angulaire de deux images, en re-


marquant en particulier comment les bruits aléatoires enregistrés par le détecteur
164 Physique, MP, MP*

dégradent la courbe (( théorique )) en interdisant de détecter le minimum de lumière


entre les deux images si ce minimum est trop peu marqué.
Enfin, la figure 7.24 compare les photographies d’une même galaxie spirale réali-
sées avec deux télescopes, l’un (à gauche), de diamètre 50 cm ; l’autre (à droite),
de diamètre 5 m. La différence de résolution entre les deux images est parfaitement
apparente.

Figure 7.24 – Photographies d’une galaxie spirale réalisée avec deux télescopes
7 : Diffraction de la Lumière 165

Ce qu’il faut absolument savoir

Principe de Huygens et Fresnel : L’onde lumineuse observée en un point P


situé après une surface (Σ) peut être considérée comme la superposition d’on-
delettes sphériques, émises par des sources infinitésimales fictives sur la surface
(Σ). Ces ondelettes se propagent jusqu’en M  , où on peut écrire l’amplitude
x T (M )w (M ) 2π
i
complexe w(P ) = κ exp −j (M P ) dΣ, si T (M ) est la
MP λ0
M ∈(Σ)
transmittance (complexe) de la pupille en M .
Pour une pupille plane, éclairée et observée dans
 les conditions
 de Fraunhofer,
x 2π
on peut écrire w(P ) ≃ Kw(S) T (M ) exp −j (SM P ) dxdy où on peut
λ0
M ∈P
écrire (SM P ) = (SOP ) − OM · (ud − ui ) ; l’amplitude complexe diffractée en
P ne dépend alors que des variations des cosinus directeurs, ∆α = ex ·(ud − ui )
et ∆β = ey · (ud − ui ) si (Oz) est la normale
 à la pupille, avec
 l’intégrale de
x 2π
Fraunhofer w(P ) ≃ Kw0 T (x, y) exp j (x∆α + y∆β) dxdy.
λ0
M ∈P

Les variations des cosinus directeurs ∆α ou ∆β s’expriment, pour une diffrac-


tion aux grands angles, comme une différence de sinus (sin θd −sin θi ) ; pour une
utilisation dans les conditions de Gauss, on peut l’écrire en fonction de la fo-
cale f ′ du système d’observation et des coordonnées du point P d’observation,
∆α = xP /f ′ et ∆β = yP /f ′ , l’origine des coordonnées du plan d’observation
étant prise au niveau de l’image géométrique de la source (point seul éclairé en
l’absence de pupille).
Une translation de la pupille dans son plan ne s’accompagne d’aucune modi-
fication de la figure de diffraction : l’amplitude complexe subit un déphasage
global et l’éclairement est inchangé.
La diffraction par une pupille fine et allongée se fait principalement dans la
direction perpendiculaire à la plus grande dimension de la pupille.
La diffraction se traduit par un écart angulaire de part et d’autre de l’image
géométrique. Pour une pupille rectangulaire de largeur a, le diamètre angulaire
d’ouverture (largeur à la base du pic central de diffraction) est 2λ0 /a. Pour
une pupille circulaire de rayon R, le diamètre angulaire d’ouverture (diamètre
d’ouverture de la tache d’Airy) est 1, 22λ0 /R.
L’éclairement résultant de la diffraction à l’infini par une pupille rectangulaire
πa∆α πb∆β
de cotés a selon (Ox) et b selon (Oy) s’écrit E(P ) = E0 sinc2 sinc2 .
λ0 λ0
Chapitre 8

Interférences à deux ondes

8.1 Le phénomène d’interférence

8.1.1 Présentation
2 Définitions : on parle d’interférences lorsque, en présence de plusieurs faisceaux lu-
mineux éclairant la même région de l’espace, l’éclairement E (ou l’intensité lumineuse)
n’est pas identique à laX somme des éclairements correspondant aux divers faisceaux,
pris séparément : E =
6 Ei .
i
Dans ce chapitre, nous nous intéresserons essentiellement aux interférences à deux
ondes ; la différence E − (E1 + E2 ), lorsqu’elle existe, porte le nom de terme d’inter-
férence. La présence de ce terme se traduit en général par une alternance de zones
sombres et claires : on parle de franges, respectivement sombres et claires, quelle que
soit la géométrie de ces zones.
La conservation de l’énergie totale impose bien sûr que l’énergie totale, sommée sur
l’ensemble de la zone éclairée, reste égal à la somme des énergies qui seraient envoyées
indépendamment
Z Z par
Z les deux faisceaux qui interfèrent ; on peut par exemple écrire
EdS = E1 dS + E2 dS si les intégrales sont étendues à toute la zone éclairée par
l’un ou l’autre des faisceaux.
2 Historique : dès , Newton décrit des phénomènes d’interférence (les anneaux
qui portent son nom, qui apparaissent entre deux surfaces réfléchissantes très proches)
et en propose une interprétation partielle, dans le cadre de la théorie corpusculaire de
la lumière dont il est l’auteur.
L’anglais Young, dont les centres d’intérêt sont multiples, réalise une série d’expé-
riences relatives aux interférences, dont certaines sont décrites plus loin ; il suggère
alors en  une interprétation ondulatoire et propose alors une première évaluation,
essentiellement correcte, de la longueur d’onde des ondes lumineuses pour différentes
couleurs.
Enfin, les travaux de Fresnel‡ à partir de  fondent la version moderne de la
théorie ondulatoire de la lumière et permet une interprétation correcte tant des phé-
nomènes de diffraction que des phénomènes d’interférence.
Finalement, les phénomènes d’interférence ont trouvé de nombreuses applications dans
la métrologie des petites dimensions, avec notamment les travaux de Michelson ;
l’appareil développé par ce dernier et ses applications seront présentés ultérieurement.
168 Physique, MP, MP*

8.1.2 Interférences et cohérence

2 Éclairement en présence de deux ondes : nous décrirons les phénomènes d’inter-


férence dans le cadre du modèle scalaire de la lumière ; cette description est aussi
adaptée à l’étude des interférences entre ondes de nature quelconque, par exemple
entre ondes sonores, sous la seule réserve que l’amplitude w(t) étudiée en présence de
deux ondes puisse s’écrire comme la somme W (t) = W1 (t) + W2 (t) des amplitudes
dues, séparément, aux deux ondes qui interfèrent.

On remarquera bien sûr l’analogie fondamentale avec l’étude des phénomènes de


diffraction. Tandis que ceux-ci se déterminent par l’étude de la superposition li-
néaire d’une infinité d’ondes émises par des sources infiniment voisines, les phéno-
mènes d’interférence s’étudient par la somme d’un nombre plus restreint d’ampli-
tudes d’ondes lumineuses, mais on verra que les amplitudes ainsi sommées peuvent
présenter des déphasages plus conséquents. Dans les deux cas, l’ajout des amplitudes
mettra en évidence l’importance des déphasages relatifs des diverses ondes.
Le calcul de l’amplitude totale étant donc essentiellement linéaire, on pourra procéder,
pour ce calcul, par l’intermédiaire d’une notation complexe et écrire W = W 1 + W 2 .

Naturellement, on ne fera pas l’erreur d’appliquer les mêmes méthodes de super-


position linéaire à l’éclairement lumineux, qui est une grandeur quadratique et non
linéaire !
2 Temps de réponse des récepteurs : les deux amplitudes W i (i = 1 ou 2) ainsi que
leur somme W sont des grandeurs à variation très rapide dans le temps ; il en va a
priori de même de l’éclairement |W |2 qui en résulte. Rappelons par exemple ici que,
pour une onde lumineuse de longueur d’onde λ0 ∼ 500 nm, la fréquence associée est
ω c0
f= = ∼ 6 × 1014 Hz ; cette fréquence est beaucoup plus élevée que ce qui est
2π λ0
accessible aux récepteurs lumineux usuels.
Ainsi, le temps de réponse de l’œil humain peut être évalué à τ ∼ 25 ms ; un signal plus
rapide (un clignotement à 50 Hz par exemple) ne sera pas perçu. Une photodiode ou
un dispositif à transfert de charge (Charge Coupled Device ou CCD) peut suivre sans
difficulté des phénomènes un peu plus rapides, par exemple jusqu’à τ ∼ 10 ms pour
une photodiode ou τ ∼ 10 µs pour un CCD ; toutefois, ces durées restent toujours
très longues devant la période de variation de |W |2 .



On écrira alors E1 = |W 1 |2 et E2 = |W 2 |2 les éclairements apportés par les deux
faisceaux, pris séparément, tandis

que l’éclairement
observé en présence des deux
ondes simultanément est E = |W 1 + W 2 |2 ; dans ces expressions, on rappelle que la
notation hi désigne la moyenne temporelle surZ une durée caractéristique τ du récepteur
1 τ
ou de l’appareil de mesure utilisé : hf i = f (t)dt.
τ 0
La présence ou non de phénomènes d’interférence a donc pour origine la présence du
double produit dans le calcul du module carré |W 1 + W 2 |2 , après calcul de la moyenne
temporelle de ce double produit.
2 Déphasage et interférences : considérons un point M éclairé par deux faisceaux,
correspondant aux deux amplitudes complexes W 1 = w01 exp (jΦ1 (t)) et W 2 =
w02 exp (jΦ2 (t)). Dans ces expressions, les amplitudes (réelles) w01 et w02 peuvent
dépendre du point M : par exemple, si celui-ci est atteint après un trajet plus ou
moins long, ou à travers un milieu plus ou moins absorbant, on en tiendra compte
dans l’amplitude w0i .
Les phases Φi (t) dépendent évidemment aussi du point considéré ; rappelant les ex-
pressions w(M ) = w(S) exp (−jk0 (SM )) pour la relation entre l’onde en M et celle
8 : Interférences à deux ondes 169

au niveau de sa source S, ainsi que W (M ) = w(M ) exp (jωt), avec aussi ω = c0 k0 et


k0 = 2π/λ0 , on voit que les variations de la phase Φ(t) ont au moins trois origines :
– des variations temporelles rapides liées à la pulsation, donc à la longueur d’onde de
l’onde lumineuse ;
– une phase liée directement à la position de M , ou plus précisément au chemin
optique suivi par l’onde considérée depuis sa source jusqu’en M ;
– enfin, les éventuelles variations de la phase de l’onde à l’origine, lors de son émission
au niveau de cette source.
On notera donc :

Φi (t) = ωi t − (Si M ) − ϕ0i (t) (8.1)
|{z} λ0i | {z }
oscillation rapide | {z } phase à l’émission
terme de propagation

La présence du terme ϕ0i (t) mérite une explication : il s’agit d’une conséquence des
mécanismes d’émission des ondes lumineuses par les sources de lumière. Ces ondes
ne sont pas émises de façon permanente, mais sous forme de trains d’onde de durée
limitée. Un train d’onde commence à être émis lorsqu’un atome de la source, préala-
blement excité par une source d’énergie, commence à se désexciter. Il cesse d’exister
lorsque l’atome émetteur est perturbé (par exemple par un choc au sein du milieu qui
constitue la source de lumière).
Lorsque l’émission lumineuse reprend un peu plus tard, il n’existe pas de corrélation
entre la phase du nouveau train d’onde et celle du train d’onde qui l’a précédé ; ainsi, la
grandeur ϕ0i (t) varie de manière complexe au gré des émissions successives des trains
d’ondes qui se succèdent, sauf s’il existe un phénomène de synchronisation (comme
par exemple le mécanisme d’émission stimulée, dans le cas des lasers).
Il reste à évaluer la moyenne temporelle de |W 1 + W 2 |2 = (W 1 + W 2 ) (W ∗1 + W ∗2 )
qui s’écrit, après développements, |W 1 |2 + |W 2 |2 + W 1 W ∗2 + W ∗1 W 2 .

Rappelons ici quelques propriétés des nombres complexes qui seront souvent utiles
dans la suite. En plus de la relation |z|2 = zz ∗ déjà utilisée ci-dessus, rappelons
que z + z ∗ = 2 Re(z) ; en particulier, si on adopte la notation trigonométrique
z = ρ exp (iθ), alors z + z ∗ = 2ρ cos θ. De même, on montre sans difficulté que, si
z1 = ρ1 exp (iθ1 ) et z2 = ρ2 exp (iθ2 ), alors |z1 +z2 |2 = ρ21 +ρ22 +2ρ1 ρ2 cos (θ1 − θ2 )
et |z1 − z2 |2 = ρ21 + ρ22 + 2ρ1 ρ2 sin (θ1 − θ2 ).
En fonction des amplitudes et phases des deux ondes, cette grandeur s’écrit encore
2 2
w01 + w02 + 2w01 w02 cos (Φ1 (t) − Φ2 (t)) ; on reconnaı̂t ici les expressions des éclai-
2
rements Ei = w0i (sous réserve que w0i soit indépendant du temps, ce que nous
supposerons ici) ; il vient donc l’expression :

p
E(M ) = E1 (M ) + E1 (M ) + 2 E1 (M )E2 (M ) hcos (Φ1 (t) − Φ2 (t))i (8.2)
| {z }
le terme d’interférence éventuel

Notons bien que ce résultat ne s’applique que pour l’étude des interférences à deux
ondes ! Dans le cas où un plus grand nombre de termes sont à prendre en compte,
on devra procéder à l’addition des complexes W i avant de calculer la moyenne du
module du carré de cette somme de plus de deux termes. Nous verrons ultérieurement
sous quelles conditions on peut aussi dégager une expression générale, qui sera de
toutes façons différente de (8.2).
170 Physique, MP, MP*

8.1.3 Conditions de cohérence


2 Cohérence temporelle : on dira qu’il y a cohérence des deux faisceaux qui éclairent
le point M si le terme d’interférence n’est pas systématiquement nul du fait de la
moyenne temporelle
 qui le définit.
 Ce terme d’interférence
 est proportionnel
 à la
(S1 M ) (S2 M )
moyenne de cos [ω1 − ω2 ] t − 2π − − [ϕ01 (t) − ϕ02 (t)] , terme qui
λ01 λ02
varie rapidement dès lors que ω1 6= ω2 : une telle situation est en général incompatible
avec l’observation d’interférences.
Une première condition nécessaire est donc d’imposer ω1 = ω2 , c’est-à-dire aussi
λ01 = λ02 : les deux faisceaux doivent impérativement est monochromatiques, à la
même fréquence.

Notons d’abord que même deux raies de longueur d’onde très voisines, comme le
sont les composantes du doublet jaune des lampes à vapeur de sodium par exemple,
ne sauraient interférer ; avec des longueurs d’onde écartées seulement d’un millième
ω 2πc0
en valeur relative, on aura ω1 − ω2 ∼ = donc, avec λ0 ∼ 600 nm,
1 000 1 000λ0
12
un écart ω1 − ω2 de l’ordre de 3 × 10 rad · s ; il n’existe à l’heure actuelle
−1

pas de dispositif électronique assez rapide pour détecter et mesurer un signal de


fréquence aussi élevée. Il existe toutefois des exceptions, lorsque les deux faisceaux
ont initialement la même longueur d’onde mais lorsque celle-ci subit un décalage
relatif très faible (bien plus faible que le facteur 10−3 évoqué ci-dessus) du fait de
sa propagation ; c’est pas exemple le cas des interféromètres à effet Sagnac.
Sous cette première condition,
 le terme d’interférence devient  proportionnel à la va-

leur moyenne de cos [(S1 M ) − (S2 M )] + [ϕ01 (t) − ϕ02 (t)] , où on a noté λ0 la
λ0
longueur d’onde (dans le vide) unique correspondant aux deux faisceaux. Dans cette
expression, le premier terme est en général indépendant du temps ; on notera alors la
différence de marche au point M entre les deux faisceaux sous la forme :

δ(M ) = (S1 M ) − (S2 M ) (8.3)

et seules les éventuelles variations temporelles de ϕ01 (t) − ϕ02 (t) peuvent encore em-
pêcher l’observation des interférences. Pour bien comprendre l’origine des variations
temporelles de ϕ0i (t), rappelons une fois encore le mécanisme de l’émission de lumière
dans une source lumineuse. Un atome, excité par un apport d’énergie extérieur (ther-
mique, électrique, etc.) se désexcite par émission d’une onde sinusoı̈dale, jusqu’à ce
que cette émission soit interrompue, par exemple par un choc avec un autre atome.
L’onde émise a alors la forme d’une succession de trains d’onde, chacun correspondant
à une phase aléatoire.
La durée de chacun des trains d’onde, ainsi que la durée de l’intervalle qui sépare deux
trains d’onde consécutifs, est a priori aléatoire ; cependant, chacune de ces durées reste
en général du même ordre de grandeur, que nous noterons τc ou temps de cohérence.
La figure 8.1 présente la forme des trains d’onde W 1 et W 2 émis par deux sources
indépendantes, ainsi que les variations des phases associées ; on constate que, pendant
les intervalles de temps où les deux trains d’ondes W 1 et W 2 coexistent, leur déphasage
ϕ01 − ϕ02 varie très rapidement au cours du temps.
2 Condition de cohérence temporelle : sauf exception, la fréquence très élevée des
chocs dans le milieu qui constitue la source de lumière impose des variations très
rapides des deux phases ϕ01 (t) et ϕ02 (t) ; en général, leur différence varie plus vite
8 : Interférences à deux ondes 171

ϕ01 (t) − ϕ02 (t)

intervalles de
W1 (t) temps où les deux
ondes coexistent

W2 (t)

Figure 8.1 – Émission de trains d’onde successifs

que ne peuvent suivre les appareils de mesure, et en moyenne le terme d’interférence


disparaı̂t toujours.
Finalement, la seule situation permettant l’observation d’interférences correspond à
ϕ01 (t) − ϕ02 (t) constant à tout instant, c’est-à-dire à l’éclairage du point M par deux
faisceaux provenant initialement des mêmes atomes, avec en particulier une relation
de phase fixe à l’émission.

Condition de cohérence temporelle


X On ne pourra observer d’interférence en un point M que si les deux
(ou plus) faisceaux qui éclairent le point M correspondent à des sources
exactement synchrones, de même fréquence et de même phase. Il faut
pour cela que ces différents faisceaux parviennent au point M en pro-
venant initialement de la même source S, vie des trajets éventuellement
différents.

On écrit alors en général l’expression de l’éclairement sous la forme (8.4), qui porte
parfois le nom de formule fondamentale des interférences à deux ondes :

 
p 2π
E(M ) = E1 (M ) + E2 (M ) + 2 E1 (M )E2 (M ) cos δ(M ) + ∆ϕ0 (8.4)
λ0

On retranscrit parfois cette relation sous une forme faisant intervenir exclusivement
des déphasages, en fonction d’un déphasage lié à la différence de marche ∆ϕ :

2π p
∆ϕ = δ(M ) E = E1 + E2 + 2 E1 E2 cos (∆ϕ + ∆ϕ0 ) (8.5)
λ0
172 Physique, MP, MP*

Au contraire, on préfère parfois utiliser une forme faisant intervenir exclusivement des
trajets optiques, en fonction d’une différence de marche (fictive) optique δ0 :

2π p 2π
∆ϕ0 = δ0 E = E1 + E2 + 2 E1 E2 cos (δ(M ) + δ0 ) (8.6)
λ0 λ0

Signalons quelques causes qui permettent de justifier l’existence d’un terme δ0 ou


∆ϕ0 non nul, même pour un éclairage de M à partir d’une source unique : il suffit
d’interposer sur un des deux trajets de la lumière parvenant en M un dispositif dé-
phasant : lame de verre d’indice n à traverser, miroir réfléchissant avec un déphasage
la lumière qui l’éclaire, etc.

2 Trains d’onde et étalement en fréquence : dans toute la suite, nous considérerons


que les trains d’onde ont, en moyenne, la durée τc ; l’étude générale des fonctions
non périodiques menée dans le cadre de l’analyse de Fourier montre alors qu’un train
d’onde, grandeur de durée ∆t = τc , ne correspond pas à une onde strictement mono-
chromatique (qui serait un train d’onde de durée infinie) ; il s’agit en fait d’une onde
quasi monochromatique, caractérisée par son étendue ∆ω ou ∆f en pulsation ou en
fréquence de part et d’autre de la fréquence centrale des oscillations sinusoı̈dales.
1
La relation générale ∆t×∆ω ∼ 2π permet d’écrire ici ∆f ∼ : plus les trains d’onde
τc
sont de courte durée, moins la source peut être considérée comme monochromatique.
c0
On peut aussi utiliser la relation λ0 = entre longueur d’onde et fréquence pour
f
remarquer que des petites variations de fréquence et de longueur d’onde sont reliées par
c0 c0
dλ0 = − 2 df ; puisque on a montré que |df | 6 ∆f , on en déduit que |dλ0 | 6 2 ∆f :
f f
une source émettant des trains d’onde présente donc un étalement en longueur d’onde
c0 ∆f
∆λ0 donné par la relation ∆λ0 = 2 ∆f = λ20 , ce qu’on notera :
f c0

∆λ0 1
2 = (8.7)
λ0 c0 τc

On retrouve ici encore que, plus les termes τc et ∆λ0 sont grands, moins on peut
considérer que la source est monochromatique.
2 Longueur de cohérence : en réalité, l’expression (8.4) ne constitue qu’une première
approche du phénomène d’interférence. En effet, la présence de la différence de marche

δ = (S1 M )−(S2 M ) ou du déphasage ∆ϕ = δ signifie que les ondes qui sont parties
λ0
au même instant de la source lumineuse S atteignent le point M avec un décalage
|δ|
temporel τ = ; les deux ondes qu’on doit additionner au point M sont alors
c0
représentées sur la figure 8.2, où on a représenté en traits gras un train d’ondes (de
durée τc ), tel qu’il parvient en M par les voies de chemins optiques respectifs (S1 M )
et (S2 M ).
En traits plus fins, on a tracé les trains d’onde qui précèdent ou suivent celui qui nous
intéresse ; sans rapport de phase deux à deux, l’addition de ces ondes non cohérentes
ne peut donc mener à l’observation d’interférences. Les seuls intervalles de temps
où le phénomène d’interférence se produit sont alors encadrés sur la figure 8.2 ; ces
intervalles ont pour durée τc − |δ|/c0 .
8 : Interférences à deux ondes 173

W2 (t)
t

|δ|/c0
τc
W1 (t)
t

Figure 8.2 – Longueur de cohérence

Finalement, on aura pour  terme d’interférence


 une grandeur nulle pendant une durée

|δ|/c0 , et un terme cos δ + ∆ϕ0 pendant le reste τc −|δ|/c0 de la durée du trains
λ0
d’onde ; à partir de ce moment, le phénomène reprend avec les trains d’onde suivants.
Si on suppose pour simplifier que tous les trains d’onde ont (au moins en moyenne)
la même durée τc , on en conclut que l’éclairement observé en M prend la forme
p τc − |δ|/c0 2π
E = E1 + E2 + 2 E1 E2 cos δ + ∆ϕ0 si |δ|/c0 6 τc , et E = E1 + E2
τc λ0
(donc pas du tout d’interférence) si |δ|/c0 > τc .
f (δ)
1

ℓc ℓc δ

Figure 8.3 – Influence de la longueur finie des trains d’onde : tracé de f (δ)

Notant ℓc = c0 τc pour la longueur (spatiale, moyenne) d’un  train d’onde, ou longueur
p 2π
de cohérence, on pourra écrire E = E1 +E2 +2 E1 E2 f (δ) cos δ + ∆ϕ0 et déduire
λ0
ℓc − δ
du tracé 8.3 de f (δ) = une condition supplémentaire de cohérence temporelle :
ℓc

Longueur de cohérence
X On ne peut observer d’interférences que pour des différences de marche
δ inférieures (en valeur absolue) à la longueur de cohérence (ou longueur
des trains d’onde) ℓc .
Plus généralement, du fait de la longueur finie des trains d’onde, les
phénomènes d’interférence sont bien marqués pour des différences de
marche faibles, et sont de moins en moins visibles pour des différences
de marche élevées, et proches de ℓc .

Les ordres de grandeur de ℓc dépendent de la nature de la source lumineuse, et des


phénomènes qui gouvernent l’émission lumineuse au sein de celle-ci ; le tableau 8.1
présenté plus bas présente quelques ordres de grandeur pour ℓc et pour N = ℓc /λ0 ,
qui est une grandeur sans dimension qui évalue le nombre de motifs de sinusoı̈des
comprises dans un train d’ondes moyen.
174 Physique, MP, MP*

En utilisant la relation (8.7), on peut aussi écrire :

λ20
ℓc = c0 τc = (8.8)
∆λ0

∆λ0 1
On en déduit l’élargissement spectral relatif = , qui constitue une autre
λ0 N
mesure du caractère monochromatique de la source utilisée ; il figure également dans
le tableau 8.1.
Source ℓc N ∆λ0 /λ0
Laser CO2 stabilisé (infrarouge) 30 km 3 × 109 3 × 10−10
Laser Hélium–Néon 30 cm 50 000 2 × 10−5
Raie rouge de l’Hydrogène 4 mm 6 500 1, 6 × 10−4
Lumière naturelle avec filtre coloré ∼ 10 µm ∼ 25 ∼ 0, 04
Lumière blanche ∼ 0, 5 µm ∼1 ∼1

Table 8.1 – Valeurs numériques de la longueur de cohérence

La grande variété des ordres de grandeur présents dans ce tableau impose quelques
commentaires. On remarque d’abord l’excellente monochromaticité des sources laser ;
qui est bien meilleure qu’une source spectrale obtenue par exemple en isolant une raie
d’émission d’une source à Hydrogène.
Au contraire, l’emploi d’un simple filtre coloré ne permet pas de définir une source
monochromatique : si la lumière qui en est issue semble d’une teinte unique à l’œil, il
n’en est rien en réalité.
Enfin, les valeurs concernant la lumière blanche ont été évaluées en considérant qu’il
s’agit d’ondes couvrant tout l’intervalle des longueurs d’onde de λmin = 400 nm à
λmax = 800 nm ; l’intervalle correspondant ∆λ0 = λmax − λmin = 400 nm est donc
bien du même ordre de grandeur que la longueur d’onde moyenne λ0 correspondant
au domaine visible.
2 Cohérence spatiale : la condition de cohérence temporelle énoncée ci-dessus est, en
fait, extraordinairement restrictive si on la prend au sens strict : exiger qu’une source
unique S éclaire le point M par au moins deux voies différentes, c’est restreindre
l’étude des interférences aux phénomènes éclairés par un atome unique ! Comme on
va le voir, il suffit en fait d’utiliser une source de très petites dimensions, même si elle
contient bien évidemment un très grand nombre de sources ponctuelles.
Considérons en effet plusieurs atomes sources k = 1, 2, . . ., qui éclairent par deux voies
différentes le même point d’observation M . Nous admettrons aussi qu’un dispositif
approprié sélectionne une longueur d’onde unique, mais aussi que la différence de
marche δ = (SM )1 − (SM )2 est assez faible devant la longueur de cohérence de la
source.
On peut alors
X écrire l’amplitude lumineuse complexe en M sous la forme de la somme
w(M ) = wk1 (M )+wk2 (M ) où l’amplitude wki (M ) correspondant à l’atome émetteur
k  
k K 2π
numéro k et à la voie i (i = 1, 2) vérifie wi (M ) = wi (S) exp −j (SM )i .
λ0
Prenant en compte la différence des deux modules du aux différences d’éclairement
 
k
p
k
p 2π
des deux voies, on peut noter w1 (M ) = H k E1 et w2 (M ) = H k E2 exp j δ) .
λ0
8 : Interférences à deux ondes 175

Dans cette expression, le coefficient H k a un module Hk et une phase ψk , qui décrivent


respectivement la contribution de l’atome particulier étudié à l’amplitude totale de
l’onde émise et la phase à l’émission par cet atome particulier. On remarquera que le
même coefficient H k intervient pour les deux voies 1 et 2 qui éclairent le point M : un
atome k donné contribue pour la même proportion et avec la même phase à l’origine
aux ondes qui parviennent en M par ces deux voies ; à l’arrivée, le seul déphasage est
dû à la différence de marche δ.
En l’absence d’interférences, si le point M était éclairé par la seule
X voiep 1, on aurait
ainsi en présence de tous les atomes émetteurs wtotal (M ) = Hk E1 exp (jψk ) ;
2k
X p

l’éclairement correspondant serait alors Hk E1 exp (jψk ) . Dans cette somme,

k
les produits croisés exp (j [ψi − ψj ]) correspondent, pour un grand nombre d’atomes
émetteurs, à une somme nulle (somme d’un grand nombre de nombres complexes X
2
arbitrairement déphasés) ; il reste donc pour éclairement |wtotal (M )| ≃ Hk2 E1 ;
X k
puisqu’on doit obtenir ici E1 , on en déduit que Hk2 = 1.
k
On réinterprète ainsi le coefficient Hk en affirmant que l’atome numéro k contribue
H2
pour la fraction P k 2 = Hk2 à l’éclairement total.
k Hk

Considérons à nouveau la situation d’interférence, le point M étant éclairé par les


différents atomes k = 1, 2, . . . par deux voies présentant une différence de marche δ.
On peut alors réécrire l’amplitude
p complexe
 totaleen M sous la forme d’un produit
p 2π X
de deux termes w(M ) = E1 + E2 exp j δ H k que l’on écrit encore sous
λ0
k
la forme w(M ) = Σ × Σ′ .
 
p p 2π
Le premier terme est une somme Σ = E1 + E2 exp j δ de nombres complexes
λ0
présentant un déphasage fixe et constant ; typiquement, on parlera de terme d’inter-
férence correspondant à un éclairage cohérent. Il permet, lors du passage au calcul de
l’éclairement, d’obtenir la fonction d’interférences
  désormais classique à deux ondes
2
p 2π
puisque |Σ| = E1 + E2 + 2 E1 E2 cos δ .
λ0
X X
Le second terme est une somme Σ′ = Hk = Hk exp (jψk ) présentant des dé-
k k
phasages aléatoires, c’est-à-dire correspondant
2 X à plusieurs
X ondes incohérentes entre
elles. Là aussi, dans la somme Σ′ = Hk2 + 2 Hi Hj cos (ψi − ψj ), le grand
k i<j
nombre de cosinus d’angles prenant des valeurs aléatoires sera en général faible, et
même
′ 2 exactement
X nul en moyenne temporelle : il ne restera donc finalement que
Σ = 2
Hk = 1. Ce terme constant, réel, traduit simplement l’addition des éclai-
k
rements en l’absence de relation de phase entre les ondes issues d’atomes différents.
Finalement, la seule condition pour observer effectivement des franges d’interférence
avec une source formée d’un grand nombre d’atomes est la mise en facteur du terme
d’interférence Σ, qui doit être le même pour tous les atomes de la source ; il suffit
pour cela que la différence de marche δ = (SM )1 − (SM )2 soit constante pour tous
176 Physique, MP, MP*

les atomes source, donc que la position de tous ces atomes soit confondue avec un
point unique S avec une précision suffisante.

Condition de cohérence spatiale


X On ne pourra observer d’interférence en un point M que si les divers
faisceaux qui éclairent le point M sont issus de sources ponctuelles.

En pratique, il suffira bien sûr que la dimension spatiale de la source soit assez réduite
pour que la différence de marche δ = (SM )1 −(SM )2 ne change pas quand on parcourt
tous les points
de la fente source ; les variations ∆δ doivent en particulier être telles
∆δ
que
≪ π.
λ0
On mémorisera aussi les résultats obtenus ci-dessus à l’occasion du calcul de l’éclaire-
ment observé en présence d’une source étendue sous la double forme très importante :

Éclairage cohérent
X Lors de la somme de plusieurs ondes cohérentes entre elles (issues de la
même source, synchrones),
X on procède à l’addition des amplitudes com-
plexes wtotal = wi avant de calculer l’éclairement E = |wtotal |2 cor-
i
respondant ; les différentes phases intervenant dans cette somme, étant
en relation invariable au cours du temps, font en général intervenir un
terme d’interférence.

Éclairage incohérent
X Lors de la somme de plusieurs ondes incohérentes entre elles (issues de
sources différentesXou non synchrones), on procède à l’addition des éclai-
rements Etotal = Ei puisque les déphasages entre amplitudes varient
i
de manière aléatoire.

8.1.4 Franges d’interférence


2 Ordre d’interférence : nous utiliserons provisoirement l’expression
p déjà établie pour
des interférences à deux ondes, E(M ) = E1 (M )+E2 (M )+2 E1 (M )E2 (M ) cos ∆ϕ avec
δ(M )
∆ϕ = 2π , dans le cas où la longueur de cohérence est nettement plus importante
λ0
que la différence de marche δ(M ).
Si les fonctions Ei (M ) varient assez lentement, que l’éclairement présente un maximum
local à chaque fois que ∆ϕ ≡ 0[2π], et un minimum lorsque ∆ϕ ≡ π[2π] ; on parle
respectivement de franges claires et de franges sombres, et on notera :

∆ϕ = 2pπ δ(M ) = pλ0 (8.9)

où la grandeur p porte le nom d’ordre d’interférence ; cet ordre est unpentier pour
une frange claire (p ∈ Z), avec pour éclairement Emax = E1 + E2 + 2 E1 E2 ; c’est
1
un demi-entier (ce terme, en Physique, désigne un élément de + Z, ou encore
2
la moitié d’un entier
p relatif impair) pour une frange sombre, avec pour éclairement
Emin = E1 + E2 − 2 E1 E2 .
8 : Interférences à deux ondes 177

Le lien entre frange claire et ordre d’interférence entier n’est pas restreint au seul
cas des interférences à deux ondes ; on verra progressivement qu’on obtient le même
résultat dans tous les cas de systèmes interférentiels lorsque les interférences sont
la cause principale de variation de la luminosité en fonction de la position du point
d’observation M .

2 Contraste des franges : les courbes de la figure 8.4 montrent la répartition d’éclai-
rement en fonction de la différence de marche, dans les deux cas où E1 ≃ E2 (à gauche)
et E1 > E2 (à droite) ; on voit que, dans le second cas, on n’observe pas d’annulations
de l’éclairement au niveau des franges sombres ; on dira encore que le contraste des
franges est plus faible dans le second cas.

E1 ≃ E2 E E1 > E2 E

δ δ
b b b b b b
−λ0 +λ0 −λ0 +λ0

Figure 8.4 – Interférences à deux ondes et contraste

On définit de façon quantitative le contraste des franges, pour évaluer la différence


d’éclairement entre les franges claires et les franges sombres, par la relation :

Emax − Emin
C= (8.10)
Emax + Emin

C’est une grandeur sans dimension, positive par construction, et qui peut atteindre
au maximum la valeur C = 1 lorsque Emin = 0. En particulier, dans lepcas des
interférences à deux ondes décrites ci-dessus,
√ on a vu que Emax = E1 + E2 + 2 E1 E2 et
p 2 E1 E2
Emin = E1 +E2 −2 E1 E2 donc C = : le contraste ne garde sa valeur maximale
E1 + E2
C = 1 que si E1 = E2 ; il s’annule seulement si E1 = 0 ou E2 = 0.
2 Fonction de visibilité : on a vu que la prise en compte de la longueur de cohérence
finie des trains d’onde qui interfèrent permet
 d’expliciter
 l’éclairement sous la forme
p ℓc − |δ| 2π
E(δ) = E1 + E2 + 2 E1 E2 cos δ + ∆ϕ0 ; plus généralement, nous ren-
ℓc λ0
contrerons souvent des dispositifs d’interférence à deux ondes permettant d’expliciter
l’éclairement sous la forme :
  

E(δ) = E0 1 + V (δ) cos δ + ∆ϕ0 (8.11)
λ0

Dans ce cas, la fonction V (δ) porte √ le nom de fonction de visibilité ; dans le cas
2 E1 E2 ℓc − |δ|
précédent, on a par exemple V (δ) = .
E1 + E2 ℓc
Nous donnerons une interprétation générale  de (8.11) dans le cas où V varie plus

lentement que le terme d’interférence cos δ + ∆ϕ0 ; on peut alors représenter
λ0
l’allure des fonctions V (δ) et E(δ), à la même échelle, selon la figure 8.5.
178 Physique, MP, MP*

V (δ) E

λ0 δ

Figure 8.5 – Fonction de visibilité et franges

On constate alors que le terme interférentiel oscille rapidement de −1 à +1, tandis


que l’éclairement oscille entre Emin = E0 (1 − |V (δ)|) et Emax = E0 (1 + |V (δ)|) ; on
identifie donc ici un contraste des franges, liée directement à la fonction de visbilité,
par la relation :

Emax − Emin
C= = |V (δ)| (8.12)
Emax + Emin

Notons ici que la fonction de visibilité peut changer de signe ; une zone où V (δ) < 0
est caractérisée par le phénomène d’inversion du contraste : dans ces zones, les
franges claires remplacent les franges sombres, et réciproquement.

8.1.5 Nature des franges


2 Sources secondaires : puisqu’on a vu que les interférences ne peuvent être observées
que si une source unique S0 , ponctuelle et monochromatique, éclaire le même point
M , l’existence de la différence de marche δ = (S1 M ) − (S2 M ) ne s’explique que par
l’existence de deux trajets différents pour éclairer le point M ; une telle situation est
par exemple représentée sur la figure 8.6, dans ce qu’on appellera dans la suite la
géométrie d’Young.
b
S1

M
b

b
S0
S2
b

Figure 8.6 – Sources secondaires

Cette géométrie d’Young est caractérisée par l’existence de deux points de passage
obligés des rayons lumineux, les sources secondaires S1 et S2 , à partir desquels on peut
éclairer plusieurs points M . La différence de marche entre les faisceaux qui interfèrent
en M peut alors s’écrire δtotal = (S0 S1 M ) − (S0 S2 M ), somme de deux termes :
– la différence δavant = (S0 S1 )−(S0 S2 ), qui est indépendante de M , peut s’interpréter
comme une différence de phase à l’émission par les sources secondaires, fictives,
placées en S1 et S2 .
8 : Interférences à deux ondes 179

On pourra en fait traiter S1 et S2 comme s’il s’agissait de sources synchrones avec



un décalage de phase constant à l’émission, donné par ϕ0,1 − ϕ0,2 = δavant .
λ0
– la différence δaprès = (S1 M ) − (S2 M ), qui dépend de la position de M , et dont
le calcul sera purement géométrique, car nous supposerons toujours que les trajets
S1 M et S2 M sont purement rectilignes dans le vide ou, le cas échéant, des trajets
simples à travers des dispositifs optiques focalisants (des lentilles par exemple).
2 Franges rectilignes : nous adopterons la géométrie de la figure 8.7 ; la distance entre
les sources secondaires est notée a et l’observation sera réalisée en un point quelconque
M , éclairé par les deux sources secondaires S1 et S2 . On choisit un système d’axes de
sorte que les coordonnées de S1 et S2 sont respectivement (a/2, 0, 0) et (−a/2, 0, 0) ;
les coordonnées de M seront notées (x, y, z). De plus, on supposera ici que δavant = 0.
x p = −3
E
M b
p = −2
S1 S1 M
b
p = −1
a
O z
b bΩ

b p = +1
S2 S2 M
p = +2
D
p = +3

Figure 8.7 – Franges d’interférence et géométrie de Young

La différence de marche s’écrit alors δ(M ) = S1 M − S2 M et une frange d’ordre


p (claire si p est entier, sombre si p est demi-entier) a pour équation intrinsèque
S1 M − S2 M = pλ0 ; on reconnaı̂t l’équation d’une famille d’hyperboloı̈des de foyers
S1 et S2 , représentes ci-dessus pour diverses valeurs de p.
x
p = −3
p = −2
p = −1
Ω y
p=0
p = +1
p = +2
p = +3

Figure 8.8 – Forme des franges sur l’écran (Ωxy)

La forme exacte des franges observées sur un écran dépend de la position de cet écran ;
sur la figure 8.7, l’écran E est disposé parallèlement à l’axe S2 S1 et l’intersection des
franges claires avec l’écran d’observation prend alors la forme d’un réseau de courbes,
comme celles de la figure 8.8.
Nous nous placerons dans la suite dans le cas où la distance D entre les sources
et l’écran est beaucoup plus grande que toutes les autres dimensions mises en jeu :
180 Physique, MP, MP*

D ≫ x, y, a. Les franges de la figure 8.8 sont alors très peu courbées au voisinage du
centre de la figure ; on peut en première approximation traiter ces courbes comme
des droites. On peut d’ailleurs obtenir une équation cartésienne
r de ces droites en
a 2
effectuant un développement limité des longueurs S1 M = x− + y 2 + D2 et
r  2 
a 2 2 2
1 2 2 a2
S2 M = x+ + y + D , sous la forme S1 M ≃ D + x + y − ax +
2   2D 4
2
1 a
et S2 M ≃ D + x2 + y 2 + ax + , d’où enfin l’expression importante :
2D 4
ax
δaprès = S1 M − S2 M ≃ − (8.13)
D

ax λ0 D
Une frange δ = δavant − = pλ0 est donc une droite, d’équation xp = x0 − p ,
D a
où on a noté x0 = −Dδavant /a l’abscisse de la frange d’ordre zéro, qui porte aussi
souvent le nom de frange centrale.
On observe ainsi un réseau de franges rectilignes parallèles et équidistantes, la distance
de deux franges consécutives portant le nom d’interfrange i, avec :

λ0 D
i= (8.14)
a

La figure 8.9 montre l’aspect de telles franges ; on y constate aussi la perte progressive
de contraste de part et d’autre de la frange centrale.

abscisse x
sur l’écran
i

Figure 8.9 – Franges rectilignes dans un dispositif de Young

Remarquons que la relation (8.14) impose, pour une observation facile, une distance
a faible entre sources secondaires ; ainsi, avec un écran situé à D = 1 m des sources
secondaires et un éclairage monochromatique à la longueur d’onde λ0 = 500 nm
(dans le domaine visible), un interfrange i = 0, 5 mm sera obtenu avec une distance
des sources secondaires a = 1 mm.
On observera de telles franges rectilignes et équidistantes avec divers dispositifs pra-
tiques présentés plus loin : trous et fentes de Young, miroirs de Fresnel, coin d’air.
2 Franges circulaires : considérons maintenant le cas où l’écran d’observation E est
disposé perpendiculairement à l’axe S1 S2 , comme on le voit sur la figure 8.10.
Dans une telle géométrie, les franges d’interférence sont des intersections de courbes
(hyperboloı̈des) présentant l’axe de symétrie de révolution avec un écran qui présente
la même symétrie de révolution ; il s’agit donc nécessairement de cercles d’axe (Ox).
8 : Interférences à deux ondes 181

x
Mb
E

D
S1
b
z

S2 b

Figure 8.10 – Franges circulaires d’interférence à deux ondes

Sans donner d’équation algébrique générale de ces franges circulaires, nous noterons
seulement, par exemple en observant la figure 8.11, que ces franges ne sont en général
pas équidistantes ; on ne définira donc ici pas d’interfrange.
y

Figure 8.11 – Franges circulaires non équidistantes

On observera de telles franges circulaires, non équidistantes, avec divers dispositifs


pratiques présentés plus loin : bilentilles de Meslin, lame d’air, dispositif de Newton ;
l’étude générale de ces franges circulaires ne figure pas au programme.
On aura encore l’occasion d’étudier, dans un chapitre ultérieur, le dispositif interfé-
rentiel de Michelson ; celui-ci, qui permet des mesures de grande précision, permet
selon le réglage choisi de faire apparaı̂tre des franges rectilignes ou circulaires.

8.1.6 Observation à l’infini


2 Principe : on remplace souvent l’observation à grande distance D par une ob-
servation à l’infini, c’est-à-dire en pratique dans le plan focal image d’une lentille de
projection de distance focale image f ′ .
Nous traiterons ici le cas d’un dispositif à deux sources secondaires ponctuelles S1 et
S2 , cohérentes, distantes de a, dans les deux situations géométriques déjà décrites :
l’écran peut être parallèle à l’axe S1 S2 (avec formation de franges rectilignes) ou
perpendiculaire à cet axe (avec formation de franges circulaires).
2 Écran parallèle à l’axe S1 S2 : le schéma de principe est celui de la figure 8.12.
On n’a représenté, parmi tous les rayons issus de S1 et S2 , que deux d’entre eux ;
parallèles, ils convergent donc à l’infini ou, en pratique, après traversée de la lentille,
au point M situé dans le plan focal de celle-ci.
Le stigmatisme de la lentille, supposée utilisée dans le cadre des conditions de Gauss,
assure que le chemin optique (S1 K1 M ) est identique au chemin optique (HK2 M ),
puisque S1 et H sont dans un même plan perpendiculaire au faisceau parallèle dont
M est l’image.
182 Physique, MP, MP*

x
K1
S1 b

α bM
α b x z
F′
a
b b K2
S2
H
f′

Figure 8.12 – Franges rectilignes à l’infini avec deux sources ponctuelles

On justifie aussi parfois cette propriété en évoquant le principe du retour inverse de


la lumière : en inversant le sens de parcours des rayons lumineux, l’image de M est
un faisceau parallèle dont S1 H est un plan de phase ; ainsi, (M S1 ) = (M H).
La différence de chemin optique se réduit alors à δ = (S1 M ) − (S2 M ) = −S2 H ;
considérant le triangle S1 S2 H, on a encore S2 H = a sin α où le rayon de construction
(fictif) passant par M et le centre optique de la lentille impose x = f ′ tan α.
Enfin, la lentille étant utilisée dans les conditions de Gauss, sin α ∼ tan α d’où l’ex-
pression de la différence de marche δ = −ax/f ′ .

Le calcul qui précède ne doit en aucun cas être remplacé par le raisonnement inexact
suivant : les distances S1 K1 et S2 K2 étant égales, on pourrait être tenté d’affirmer
que δ = K1 M − K2 M . Ce résultat est manifestement faux sur la figure (il fournirait
ici δ > 0, ce qui n’est pas le cas) pour la raison suivante : K1 et K2 ne sont pas
des points, mais des zones de traversée de la lentille ; celle-ci, convergente, est plus
épaisse au voisinage de son centre et la traversée en K2 correspond à un chemin
optique supérieur à celui associé à la traversée en K1 . Il n’est ni utile ni simple de
chercher à exprimer cette différence d’épaisseur et on n’utilisera pas cette méthode.
Finalement, la comparaison de ce résultat avec (8.13) montre que les franges restent
rectilignes et équidistantes, d’interfrange i obtenu en faisant D −→ f ′ :

ax λ0 f ′
δ = S1 M − S2 M ≃ − i= (8.15)
f′ a

2 Écran perpendiculaire à l’axe S1 S2 : le schéma de principe est maintenant celui


de la figure 8.13 ; on n’a, là aussi, représenté que les rayons qui interfèrent au point
M du plan focal image de la lentille de projection.
Les mêmes raisonnements que ci-dessusp permettent décrire δ = S1 M − S2 M = a cos α
avec r = f ′ tan α ; la notation r = x2 + y 2 est celle des coordonnées polaires, car la
figure 8.13 est invariante de révolution autour de l’axe (Oz), de même que les franges
qui sont donc circulaires de centre F ′ .
Le stigmatisme de la lentille n’étant assuré que pour des petits angles, |α| ≪ π et on
peut encore écrire :
 
r2
δ = a cos α ≃ a 1 − ′2 (8.16)
2f
8 : Interférences à deux ondes 183

bM
H
b r
b b α α b
z
S1 S2 F′

Figure 8.13 – Franges circulaires à l’infini avec deux sources ponctuelles

En particulier, le rayon rp de la frange circulaire d’ordre p est donné par :

s  
′ pλ0
δ = pλ0 rp = f 2 1 − (8.17)
a

On remarque les propriétés qui découlent immédiatement de cette relation :


– rp n’est pas une fonction affine de p donc les franges circulaires consécutives de
même nature ne sont pas équidistantes : il n’existe pas d’interfrange. On vérifie
cette propriété dans le cas de la figure 8.11 ;
– le rayon rp décroı̂t quand p augmente : l’ordre est maximal au centre ;
a
– l’ordre au centre de la figure est p(r = 0) = > 0 ; le centre des cercles concen-
λ0
triques formés par ces anneaux n’est pas une (( frange centrale )) au sens des in-
terférences ; cet ordre au centre est même en général très élevé, avec par exemple
a = 0, 1 mm et λ0 = 500 nm, on trouve p(r = 0) = 200 (avec ces valeurs numé-
riques, le centre de la figure est brillant, mais ce cas est accidentel).

8.2 Dispositifs d’interférence à deux ondes

Il ne s’agit en aucun cas d’une présentation exhaustive de tous les dispositifs inter-
férentiels possibles, mais seulement d’une présentation rapide de quelques unes des
réalisations les plus fréquemment rencontrées.
Les seuls dispositifs interférentiels à deux ondes dont la connaissance détaillée est
exigée par le programme sont les dispositifs à trous (ou fentes) de Young et l’appareil
de Michelson, qui sera présenté dans un chapitre ultérieur.

8.2.1 Dispositifs à division du front d’onde


puis recombinaison
division du front

2 Définition : on appelle division du front d’onde


l’opération consistant à séparer en deux l’onde lumi-
M
neuse unique, issue d’une source lumineuse, par un ap- b
pareil présentant deux parties ou deux zones distinctes,
avant de recombiner les deux faisceaux au niveau du
point M où l’observation sera réalisée. Le schéma de
principe qui décrit cette opération est présenté ci-contre.
184 Physique, MP, MP*

2 Trous ou fentes de Young : le dispositif des trous de Young est présenté sur la figure
8.14 ; il est formé de deux trous T1 et T2 , en général circulaires, de faible dimension,
éclairés par une source ponctuelle S.

bM
T1

S z
b

zone
d’interférences
T2
E

Figure 8.14 – Dispositif des trous de Young

Du fait de leur petitesse, les deux trous diffractent la lumière incidente et peuvent
être considérés comme des sources secondaires émettant deux faisceaux dont la largeur
angulaire est liée à la dimension des trous.
Un tel dispositif présente exactement la géométrie nécessaire pour observer des franges
quasi-rectilignes, équidistantes, sur un écran E disposé à grande distance des deux
trous, parallèlement au plan (Oxy) dans lequel les deux trous sont percés.
On verra au chapitre suivant comment le dispositif peut être modifié, sans perdre la
forme et la disposition des franges, mais pour augmenter leur luminosité :
– en remplaçant les trous par des fentes fines, longues, perpendiculaires à la direction
T1 T2 : on parle alors de dispositif des fentes de Young ;
– en remplaçant l’observation directe sur un écran par l’emploi d’une lentille de pro-
jection, l’observation étant alors réalisée dans le plan focal image de cette lentille ;
on parle alors d’observation à l’infini des franges rectilignes.
2 Miroirs de Fresnel : le dispositif est représenté sur la figure 8.15 ; une source
ponctuelle S est disposée à la distance d de l’arête O de deux miroirs plans faisant un
angle α, en principe de l’ordre de 10−2 à 10−3 rad, très exagéré sur la figure.

S
b

u
b
S1 O
α
β
b

S2

Figure 8.15 – Miroirs de Fresnel


8 : Interférences à deux ondes 185

Un obstacle approprié empêche la source S d’éclairer directement la zone d’observa-


tion ; on n’observera donc en sortie d’un tel dispositif que les deux faisceaux issus de
S et s’étant réfléchis sur les deux miroirs. Ces deux faisceaux semblent provenir des
deux images S1 et S2 de S, symétriques de S relativement aux deux miroirs.
Le dispositif est donc équivalent aux deux sources secondaires S1 et S2 , qui forment
avec O un triangle isocèle de sommet O et d’angle β, avec donc une distance entre
β
sources secondaires a = S1 S2 = 2d sin .
2
L’emploi des relations de Descartes montre immédiatement que SOS \1 = 2u tandis que
\ \
SOS2 = 2u + 2α, d’où on déduit immédiatement que β = S1 OS2 = 2α. Finalement,
au vu de la faible valeur de l’angle α, on peut écrire a = 2d sin α = 2dα.
Le dispositif des miroirs de Fresnel est en général réalisé avec d de l’ordre de la dizaine
de centimètres ; l’angle α étant réglable, on peut aisément obtenir des valeurs de a
variables de zéro à quelques millimètres. Il est en général bien plus lumineux que
le dispositif de Young, puisqu’il n’implique pas la diffraction par des trous de faible
dimension.

On peut imaginer n’utiliser qu’un seul miroir, et employer S et S1 comme sources


secondaires ; toutefois, un tel dispositif (miroir unique de Lloyd) ne donne pas for-
cément d’interférences du fait du caractère non polarisé de la lumière naturelle et
de la présence d’un déphasage entre les deux composantes rectilignes de la polari-
sation naturelle ; on peut alors montrer que les deux systèmes de franges associés
aux deux composantes orthogonales de la lumière naturelle sont exactement décalés
d’un demi-interfrange, ce qui conduit à la disparition des franges.

2 Bilentilles de Meslin : le dispositif (son étude générale est hors programme) est
formé d’une lentille convergente sciée en deux parties qui sont décalées, conformé-
ment à la figure 8.16 ; les deux faisceaux se recouvrent dans une zone d’interférence
restreinte, située entre S1 et S2 ; c’est donc dans cette région qu’on doit disposer
l’écran E.
L1
E

Sb S1 S2
b b
b
M

L2

Figure 8.16 – Bilentilles de Meslin

Pour déterminer la différence de chemin optique δ en M entre les deux faisceaux,


on écrira d’abord (S1 M ) = (SS1 ) + S1 M et (S2 M ) = (SS2 ) − S1 M ; on peut alors
remarquer que les chemins optiques (SS1 ) et (SS2 ), entre un objet et son image,
ne dépendent pas du rayon particulier choisi ; en particulier, ces deux grandeurs ne
dépendent pas de M et on écrira donc δ = S1 M + S2 M + Cte.

Au contraire des dispositifs précédents, on aura donc une différence de marche


géométrique donnée par la somme S1 M +S2 M et non pas la différence S1 M −S2 M ;
186 Physique, MP, MP*

on peut interpréter cette propriété en remarquant que S2 est une source secondaire
virtuelle (non atteinte par le rayon lumineux) ; S1 est une source secondaire réelle.
Les franges sont alors des surfaces telles que S1 M + S2 M , donc des ellipsoı̈des de
révolution autour de l’axe passant par leurs foyers S1 et S2 ; leur intersection avec
l’écran E est donc formée de demi-cercles d’axe confondu avec S1 S2 .
2 Biprisme de Fresnel : on peut encore proposer un dispositif interférentiel équivalent
aux précédents au moyen d’un biprisme, formé de deux prismes de verre de petit angle
A accolés par la base. Ce dispositif est représenté sur la figure 8.17.
Un prisme n’étant en général pas un dispositif stigmatique pour un point source situé
à distance finie, cet appareil n’est pas équivalent aux dispositifs de Young, sauf dans
le cas de la figure 8.17 où la source est rejetée à l’infini. Le faisceau incident parallèle
fournit alors, en sortie de l’appareil, deux faisceaux parallèles déviés en sens contraire
formant un angle 2α, si α est la déviation due à un des prismes.

S1

α
α

S2

Figure 8.17 – Biprisme de Fresnel

Il existe alors une région de l’espace (en gris sur la figure) où interfèrent deux ondes
planes, cohérentes entre elles mais dont les directions de propagation font un angle 2α ;
on peut considérer que deux sources secondaires S1 et S2 , situées à très grande distance
a
D et décalées d’une très grande longueur a, avec 2α ≃ , éclairent cette région. On
D
observera donc des franges rectilignes, parallèles et équidistantes, perpendiculaires au
plan de la figure 8.17, avec pour interfrange i = λ0 D/a (selon la relation général pour
un dispositif d’Young à grande distance) donc i ≃ λ0 /2α.

Une étude exacte des interférences entre deux ondes planes est proposée plus loin,
dans le cadre du dispositif dit du coin d’air ; on montrera à ce moment que l’expres-
sion exacte de l’interfrange est i = λ0 /2 sin α.

8.2.2 Dispositifs à division d’amplitude

2 Définition : on appelle division d’am-


des deux ondes

plitude l’opération consistant à produire


recombinaison

deux ondes lumineuses à partir d’une onde M


division b
unique, lors de la traversée d’un dispositif
partiellement transparent ou partiellement d’amplitude
réfléchissant. On doit, pour observer les in-
terférences, compléter le dispositif par un
appareil dirigeant les deux ondes ainsi pro-
duites vers le point M où l’observation sera réalisée.
Le schéma de principe d’une telle opération est représenté ci-contre.
8 : Interférences à deux ondes 187

2 Lame à division d’amplitude : La réalisation d’un dispositif à division d’amplitude


fait en général appel à de fines lames de verre ; dans ce chapitre, nous les traiterons
comme une surface unique dont l’épaisseur est donc négligée, ainsi que tout déphasage
apporté par la lame. Nous reprendrons la description de ces lames de manière plus
satisfaisante lors de l’étude de l’interféromètre de Michelson.
Un telle surface assure une transmission partielle de l’onde (avec un coefficient de
transmission t) et une réflexion partielle de l’onde (avec un coefficient de réflexion
r). Si on note w0 l’amplitude (réelle) de l’onde incidente sur la lame, les ondes réflé-
chie et transmise auront pour amplitudes respectives rw0 et tw0 . Si la lame n’a fait
l’objet d’aucun traitement particulier, on a en général t ≫ r : une lame de verre est
essentiellement transparente.

On notera que, si la lame n’est pas absorbante, la conservation de l’énergie (propor-


tionnelle au carré de l’amplitude lumineuse) impose r2 + t2 = 1.
Il est toutefois possible de réaliser un dépôt métallique sur une des faces de la lame,
qui se comporte alors partiellement comme un miroir ; si r = t, la lame est dite
semi-réfléchissante.
Nous décrirons ici deux dispositifs interférentiels formés de deux lames essentiellement
transparentes : les lame d’air et coin d’air. L’interféromètre de Michelson, qui sera
étudié ultérieurement, fait appel pour sa réalisation à deux lames, dont l’une est
semi-réfléchissante et l’autre est totalement transparente.
2 Dispositif interférentiel à lame d’air : on réalise une lame d’air en disposant,
sur la trajet d’une onde lumineuse, deux dispositifs partiellement réfléchissants (par
exemple, deux fines lamelles de verre) ; la figure 8.18 représente (à gauche) une telle
lame à faces parallèles, et un des rayons qui l’éclaire, sous l’incidence i.
w0 w1 w2 w3

i b
i S
d1 e
d2
lame 1
lame L1 d1 lame 2
S1 b d2
b
2e
lame L2 S2

Figure 8.18 – Lame d’air à faces parallèles et sources secondaires

Les ondes successivement réfléchies par le dispositif ont pour amplitudes réelles res-
pectives w1 = rw0 (après une réflexion), w2 = rt2 w0 (après une réflexion et deux
transmissions), w3 = r4 t2 w0 et plus généralement wn = r2(n−1) t2 w0 pour les ondes
suivantes (n > 3).
Comme r ≪ t ≃ 1, w1 ≃ w2 tandis que wn ≪ . . . ≪ w3 ≪ w2 : il s’agit, en
première approximation, d’interférences à deux ondes (d’amplitudes pratiquement
égales w1 ≃ w2 ).
Si on éclaire le dispositif au moyen d’une source ponctuelle unique S (cf. figure 8.18
à droite), les rayons émergents semblent provenir des deux images de S par réflexion
sur les deux lames ; ces sources secondaires S1 et S2 sont distantes de 2e, si e est la
distance qui sépare les deux lames.
L’ensemble du dispositif est alors équivalent à un dispositif d’Young, l’observation
étant en général réalisée sur un écran parallèle aux lames ; on se trouve dans le cas de
la figure 8.10 et les franges sont circulaires, comme par exemple sur la figure 8.11.
188 Physique, MP, MP*

2 Franges circulaires d’une lame d’air : pour déterminer la nature des franges formées
par un dispositif à lame d’air, on va montrer qu’il n’est en fait pas nécessaire de
connaı̂tre la disposition ni même la nature précise de la source qui éclaire la lame
d’air : il suffit que cette source éclaire la lame sous plusieurs incidences i.

K
i b i

b
i b
H Q
e
P
b

Figure 8.19 – Calcul de la différence de marche pour une lame d’air

Sur la figure 8.19, le point H représente le dernier point commun aux deux ondes ; en
ce point, ces deux ondes sont en phase. Si l’observation est faite à l’infini, on constate
sur la figure que les deux ondes parcourent des trajets différents pour atteindre le
plan KQ, orthogonal au faisceau de sortie ; l’une parcourt seulement la distance HK,
tandis que l’autre doit parcourir la distance HP Q. Si on néglige tout déphasage lors
des réflexions et transmissions, on peut écrire δ = HP Q − HK = 2HP − HK.
On exprime alors aisément ces différentes longueurs en fonction de l’épaisseur e de la
e sin2 i
lame d’air : HP = puis HQ = 2e tan i donc HK = HQ sin i = 2e . Il reste
cos i cos i
2e 
donc δ = 1 − sin2 i , soit enfin :
cos i

δ = 2e cos i (8.18)

Ce résultat n’est évidemment rien d’autre que celui déjà obtenu en (8.16) ; on en dduit
immédiatement les propriétés des franges circulaires obtenues en projection dans le
plan focal de la lentille représentée sur la figure 8.20. Les franges réalisées avec une
lame d’air ainsi projetées à l’infini portent le nom d’anneaux de Haidinger, ou franges
d’égale inclinaison.
Fb′ Mb
Écran
i
f′
Lentille de projection

Lame d’air

Figure 8.20 – Anneaux de Haidinger

En particulier, le rayon rp de la frange d’ordre p estp donné par δ = pλ0 donc, dans
les conditions de stigmatisme de la lentille, rp = f ′ 2 − pλ0 /e.
2 Coin d’air : on passe aisément du dispositif de la lame d’air à celui du coin d’air
en rompant la symétrie de révolution (qui assurait la formation de franges coniques)
8 : Interférences à deux ondes 189

si les deux lames L1 et L2 ne sont plus parallèles, mais forment un dièdre de petit
angle α ; cette situation est alors représentée sur la figure 8.21, tracée dans un plan
perpendiculaire à l’axe du dièdre, qui est aussi l’axe (Oz) formé de l’intersection des
deux lames.
y fr a
ng
es

e1
u b
u e2

ond
M ond u+α
x Y
O b
u′
u′ α
X

Figure 8.21 – Coin d’air et franges de Fizeau

Dans les mêmes conditions de transparence que pour l’étude de la lame d’air, on peut
considérer que le système forme, par réflexion, des interférences à deux ondes de même
amplitude (réelle) w1 ≃ w2 = w.
Si le dispositif est éclairé par une source ponctuelle unique S, on peut comme pré-
cédemment remplacer celle-ci par les deux sources secondaires S1 et S2 formées des
deux images de S par réflexion sur les deux lames. Le coin d’air est alors strictement
équivalent à un dispositif de miroirs de Fresnel.

2 Coin d’air en éclairage parallèle : nous allons étudier en détail le cas où le coin
d’air est éclairé par une source à l’infini, c’est-à-dire par une onde plane entièrement
définie par son angle d’incidence u. On a supposé sur la figure 8.21 que cette onde
se propage dans le plan perpendiculaire à l’arête du dièdre formé par les deux lames
réfléchissantes formant le coin d’air.
On étudie, après réflexion sur ces deux lames, les deux ondes, de même amplitude,
formées par réflexion ; ces ondes sont en phase en leur seul point commun O (si
on néglige tout déphasage du aux transmissions et aux réflexions) et on peut donc
exprimer les amplitudes complexes associées sous la forme wi = w exp (−iki · r), les

vecteurs d’onde k1 et k2 ayant même amplitude k0 = , mais ils sont dirigés,
λ0
conformément à la figure 8.21 par les lois de Snell-Descartes, en fonction de l’angle
d’incidence u sur la première lame et de l’angle d’incidence u′ = u + α sur la seconde.
   
2π sin u x
On peut en particulier écrire les phases de ces deux ondes ϕ1 = ·
    λ0 cos u y
2π sin(u′ + α) x
et ϕ2 = · , en utilisant la base proposée sur la figure 8.21. Le
λ0 cos(u′ + α) y
déphasage des deux ondes en un point M quelconque, de coordonnées (x, y, z) s’écrit

alors ϕ2 − ϕ1 = δ, en fonction de la différence de marche δ donnée, après quelques
λ0
transformations trigonométriques, par δ = 2 sin α (x cos(u + α) − y sin(u + α)).
pλ0
Une frange d’ordre p est donc un plan d’équation x cos(u+α)−y sin(u+α) = ;
2 sin α
ces plans sont dirigés par le vecteur unitaire eY = sin(u+α)ex +cos(u+α)ey : ils sont
donc parallèles entre eux. Certains de ces plans figurent, en pointillés, sur le schéma
du dispositif. Si on place un écran perpendiculairement à ces franges (donc dirigé par
(eX , ez )), on observera des franges rectilignes.
190 Physique, MP, MP*

Dans le système d’axes Y, X adapté à l’étude de ces franges, leur équation peut s’écrire
δ = 2 sin αX ; ces franges sont alors équidistantes, la frange d’ordre p se projetant sur
cet écran selon la droite d’équation xp = pλ0 .
L’interfrange est alors la grandeur constante i = xp+1 − xp soit :

λ0
i= (8.19)
2 sin α

Notons qu’on n’observera de franges bien visibles que si l’interfrange est assez grand ;
ainsi, pour obtenir un interfrange de i = 0, 1 mm avec λ0 = 500 nm, il faudra choisir
α = 2, 5 mrad.
L’angle u est aussi faible en général et eX ≃ ex donc δ ≃ 2xα ≃ 2x tan α ; il s’agit
simplement de l’expression δ ≃ 2e(x) où on a noté e(x) l’épaisseur du coin d’air à
l’abscisse x. Cette expression s’interprète ainsi : l’onde 2 doit, en plus du trajet de
l’onde 1, faire un aller et retour entre les deux lames du coin d’air, ce qui correspond
à une différence de marche égale au trajet aller et retour 2e(x).
Pour cette raison, ces franges portent aussi le nom de franges d’égale épaisseur ; on
parle encore de franges de Fizeau.
2 Anneaux de Newton : on peut généraliser l’étude ci-dessus en réalisant des inter-
férences entre deux ondes subissant deux réflexions sur deux surfaces voisines, comme
par exemple les deux faces d’une lame mince d’huile à la surface de l’eau, ou bien
les deux faces d’un coin formé par un miroir et la face inférieure d’une lentille plan-
convexe (figure 8.22). On forme alors des franges de Newton.

r
lentille
lame d’huile

Figure 8.22 – Franges de Newton

Dans les deux cas, si on se limite aux faibles incidences et à des lames peu inclinées, on
formera des franges d’égale épaisseur. Pour une lame d’huile, δ = 2ne où n est l’indice
optique de l’huile et e l’épaisseur en un point donné du film d’huile forme ; dans le
second cas, δ = 2e(r) car on forme une lame d’air (indice égal à 1) dont l’épaisseur
présente la symétrie de révolution et ne dépend donc que de la distance r à l’axe de
symétrie.
Une frange correspond donc à une courbe d’épaisseur constante, donc à une ligne de
niveau de la fonction e(M ) au point M où on forme les franges.
Dans le cas du dispositif à symétrie de révolution, ces franges sont donc des cercles
concentriques qui portent le nom d’anneaux de Newton. Dans le cas des interférences
formées en présence d’une lame d’huile (ou plus généralement d’une fine lame de
liquide), on peut disposer ainsi d’une méthode de mesure de l’épaisseur du film liquide.
8 : Interférences à deux ondes 191

Ce qu’il faut absolument savoir

Les interférences à deux ondes (ou plus) peuvent être réalisées par division du
front d’onde ou par division d’amplitude, pour former des sources secondaires
cohérentes : elles doivent être synchrones et de petite dimension.
En présence de sources cohérentes, on procède à l’addition des amplitudes com-
plexes ; dans le cas contraire, on procède à l’addition des éclairements :
X 2
X
wtotal = wi E = |wtotal | E= Ei
i i
| {z } | {z }
cohérence incohérence
p
Avec deux ondes monochromatiques, E = E1 + E2 + 2 E1 E2 cos ∆ϕ avec pour

déphasage ∆ϕ = δ ; la différence de marche δ peut avoir une composante
λ0
optique (déphasage des sources secondaires) et une composante géométrique
S2 M − S1 M .
Plus généralement, on définit le contraste entre franges claires et sombres en
Emax − Emin
un point du champ d’interférence par C = ; dans le cas (fréquent)
 Emax + Emin 

où on peut écrire E(M ) = E0 1 + V (M ) cos δ(M ) et si la fonction de
λ0
visibilité V (M ) varie lentement, alors C = |V (M )|.
b
Si deux sources secondaires S1 et S2 sont distantes de a, bM
S1 b
l’observation réalisée sur un écran parallèle à S1 S2 situé b
à grande distance D des sources (géométrie de Young) a b
D b
montre des franges rectilignes, perpendiculaires à S1 S2 , S2 b b i
équidistantes de i = λ0 D/a puisque δ = ±ax/D. b

b
On peut réaliser la même observation à l’infini en utili- bM
S1 b
sant une lentille de projection de focale f ′ ; on observe b
alors des franges rectilignes, perpendiculaires à S1 S2 , a b
b
équidistantes de i = λ0 f ′ /a puisque δ = ±ax/f ′ . S2 b f′ b i
b
Pour montrer ce résultat, on utilise le stigmatisme de le lentille.

Si deux sources secondaires S1 et S2 sont distantes


de a, l’observation réalisée sur un écran perpendicu- S1
laire à S1 S2 situé dans le plan focal image d’une len- b b
α
′ S2
tille convergente de focale f montre des franges circu- a
laires, centrées sur l’axe S1 S2 , non équidistantes, avec
δ = ±a cos α et r ≃ f ′ α. Les franges sont des anneaux d’égale inclinaison.
Pour montrer ce résultat, on utilise le stigmatisme de le lentille.
Chapitre 9

Réseaux de diffraction

9.1 Les fentes de Young

9.1.1 Diffraction par deux fentes


2 Le dispositif des fentes de Young : reprenons l’étude des interférences à l’infini par
un dispositif formé de deux fentes identiques, de même largeur b, de grande longueur
ℓ, dont les axes sont distants de a > b (cf. figure 9.1).
y

f1′ x f2′

z
b b b b b

Figure 9.1 – Le dispositif des fentes de Young

Ces deux fentes sont percées dans un écran opaque éclairé par une onde monochro-
matique l’aspect de cette pupille est représenté sur la figure 9.2.

a

Figure 9.2 – Les fentes de Young

Cette onde est issue d’une source ponctuelle S disposée au foyer objet d’une lentille
194 Physique, MP, MP*

convergente de focale f1′ ; l’observation est réalisée dans un écran disposé dans le
plan focal image d’une autre lentille convergente de focale f2′ . Les deux lentilles sont
utilisées dans les conditions de Gauss.
2 Calcul de l’amplitude diffractée : en utilisant le système d’axes orthonormé de la
figure 9.1, l’amplitude diffractée dans la direction définie par les cosinus directeurs
(α, β) par la pupille double que forment les fentes de Young s’écrit sous la forme
x 2π
w(α, β) = Kw0 exp j (xα + yβ) dxdy, où λ0 désigne la longueur d’onde
λ0
M ∈(Σ)
utilisée. L’intégrale porte sur tous les points M de coordonnées (x, y) appartenant
 à la

ℓ ℓ
pupille (Σ). Cette intégrale porte donc sur tous les couples (x, y) tels que y ∈ − ;
    2 2
a b a b [ a b a b
tandis que x ∈ − − ; − + + − ;+ + .
2 2 2 2 2 2 2 2
On peut donc mettre calculer cette intégrale comme le produit de deux termes fonc-
tions séparément de α et de β, sous la forme w(α, β) = Kw0 A(α) × B(β), où on a
Z +ℓ/2  
2π πβℓ
posé B(β) = exp βy dy soit B(β) = ℓ × sinc .
−ℓ/2 λ0 λ0
B(β) est un terme classique de diffraction par une pupille longue ; compte tenu de
la grande valeur de ℓ, la largeur angulaire dans la direction de l’axe (Oy) est limitée
λ0
et de l’ordre de grandeur de , c’est-à-dire qu’elle est très faible : il n’y a pas de

diffraction dans la direction de la plus grande longueur de la pupille.
Le terme A(α) étant une intégrale portant sur la réunion de deux intervalles disjoints,
il s’agit d’une somme de deux intégrales analogues A(α) = f+a/2 (α) + f−a/2 (α), où
Z d+b/2  

on a choisi de poser fd (α) = exp j αx dx.
d−b/2 λ0
Le changement de variables x′ = x − d permet de calculer immédiatement ces deux
  Z +b/2  
2π 2π ′
intégrales sous la forme fd (α) = exp j αd exp j αx dx′ soit finale-
λ0 −b/2 λ0
 
2π παb
ment fd (α) = b exp j αd sinc .
λ0 λ0     
πβℓ π π
Finalement, w(α, β) = KB(β)w0 asinc exp j αa + exp −j αa ; on re-
λ0 λ0 λ0
παb
connaı̂t dans cette expression la mise en facteur de wdiff (α, β) = Kw0 aB(β)sinc
λ0
correspondant à la figure de diffraction commune des deux fentes, et d’un terme
∩(φ/2) = exp (jφ/2) + exp (−jφ/2), qui décrit une propriété déjà citée : la translation
π
d’une pupille dans son plan se traduit par un simple déphasage ±φ/2 = ± αa de
λ0
l’amplitude diffractée.
2 Éclairement et terme d’interférences : dans l’éclairement |w(α, β)|2 , on met en
παb πβℓ
facteur l’éclairement Ediff (α, β) = K 2 |w0 |2 a2 ℓ2 sinc2 sinc2 qui serait produit
λ0 λ0
par une pupille diffractante unique (quelle que soit sa position dans le plan de la
pupille) pour écrire E(α, β) = Ediff (α, β) × ∩2 (φ/2) ; le terme ∩2 (φ/2) décrit donc le
phénomène d’interférences à deux ondes.
φ φ
On peut en effet écrire ∩(φ/2) = 2 cos donc ∩2 (φ/2) = 4 cos2 ; on reconnaı̂t ici un
2 2
terme classique d’interférences à deux ondes puisque ∩2 (φ/2) = 2 (1 + cos φ). Ainsi,
9 : Réseaux de diffraction 195

l’éclairement total envoyé par l’ensemble des deux pupilles dans la direction de cosinus
directeurs (α, β) s’écrit :
 
2πδ
E(α, β) = 2Ediff (α, β) 1 + cos (9.1)
λ0

avec pour différence de marche δ entre les ondes émises par les deux pupilles l’expres-
sion, déjà établie dans le cadre du formalisme simplifié du chapitre précédent, δ = aα.
X Y
On peut d’ailleurs aussi écrire α = ′ et β = ′ , en fonction des coordonnées (X, Y )
f2 f2
du point d’observation sur l’écran ; on a donc encore :
 
πℓY 2 πbX 2π aX
E(X, Y ) = 2E0 sinc2 sinc 1 + cos (9.2)
λ0 f2′ λ0 f2′ λ0 f2′

9.1.2 Interprétation de la figure de diffraction

2 Étude de l’éclairement : comme on l’a indiqué ci-dessus, la répartition de lumière


le long de l’axe (OY ) est essentiellement centrée en Y = 0, à part une tache de
λ0 λ0 f2′
diffraction de faible demi-largeur à la base (en termes angulaires) ou (en
ℓ ℓ
termes de longueur). On s’intéressera donc à l’expression
 de l’éclairement
 sur l’axe
2 πbX 2π aX
(OX), sous la forme E(X, Y = 0) = 2E0 sinc 1 + cos .
λ0 f2′ λ0 f2′
Il s’agit d’un produit de deux fonctions de X, dont les dimensions caractéristiques
λ0 f2′
des variations sur l’axe (OX) sont respectivement ∆X = (pour le terme de

b
λ0 f2
diffraction) et i = (pour le terme d’interférences). Puisque a > b, on peut
a
affirmer que ∆X > i et même en général ∆X ≫ i si les fentes sont assez fines : le
terme de diffraction est donc une fonction à variation lente, dont on peut considérer
qu’elle sert d’enveloppe de la fonction d’interférences à variations plus rapides.
E
i

∆X ∆X

Figure 9.3 – Éclairement par un système de deux fentes fines

La figure 9.3 représente le tracé de cette fonction. On y voit l’effet du phénomène de


diffraction : les franges sont moins lumineuses sur les bords de la figure de diffraction,
la frange centrale étant la plus lumineuse des franges brillantes.
πbX
Les franges brillantes correspondent à l’éclairement Emax = 4E0 sinc2 tandis que
λ0 f2′
les franges sombres correspondent à Emax = 0 ; les franges gardent donc un contraste
196 Physique, MP, MP*

Emax − Emin
maximal théorique C = = 1. Notons qu’en pratique le contraste observé
Emax + Emin
sera toujours plus faible en présence d’éclairements parasites, l’éclairement minimal
sur l’écran n’étant jamais nul.
Toutefois, la figure 9.3 montre bien que les franges d’ordre élevé sont moins visibles,
car moins lumineuses, que les franges voisines du centre de la figure ; un défaut de
contraste relatif peut ici être évoqué pour expliquer l’aspect attendu sur l’écran, où
on ne verra nettement qu’un petit nombre de franges.

9.2 Les réseaux de diffraction

9.2.1 Définitions
2 Réseau de diffraction par transmission : on peut décrire un réseau par transmission
comme la généralisation du dispositif précédent dans le cas où le nombre de fentes
N est supérieur à 2 : on réalise un réseau de diffraction par transmission en réalisant
une pupille percé d’un nombre, en général assez grand, de fentes fines, parallèles et
équidistantes. La figure 9.4 représente une telle pupille.
a a a b b b

Figure 9.4 – Réseau de diffraction par transmission

Nous considérerons dans toute la suite que ces fentes sont équidistantes ; la distance
de deux fentes consécutives est le pas du réseau a. Ces fentes seront aussi en général
considérées comme très fines, de largeur commune b ≪ a, et de grande longueur ℓ ≫ a.
Un tel réseau est en général réalisé par gravure dans un écran opaque ; le pas a des
réseaux est de l’ordre de grandeur de quelques micromètres ou, ce qui revient au
même, le nombre de traits par unité de longueur 1/a est en général de l’ordre de
quelques centaines à quelques milliers de traits par millimètre.
Les réseaux usuels ayant une largeur utile de l’ordre de quelques centimètres, le nombre
N de traits du réseau éclairé peut atteindre quelques milliers.
2 Réseaux : plus généralement, nous appellerons réseaux une pupille de diffraction
présentant une fonction de transparence périodique. Si la période spatiale n’est réalisée
que le long d’un seul axe (Ox), on parle de réseau unidimensionnel et la période
spatiale, toujours notée a, garde le nom de pas du réseau.
On rencontre aussi des réseaux à double périodicité spatiale, ou des réseaux tridi-
mensionnels ; en particulier, une structure cristalline peut être considérée comme un
réseau tridimensionnel.
Notons encore que les réseaux ne sont pas seulement utilisés dans le domaine de la
lumière visible ; en particulier, on réalise fréquemment l’étude de la diffraction par des
réseaux atomiques ou moléculaires en utilisant des rayons X ; on verra en effet que
des longueurs d’ondes plus courtes (en particulier, du même ordre de grandeur que
9 : Réseaux de diffraction 197

la période a du réseau) sont mieux adaptées à l’étude des propriétés des réseaux de
diffraction.

Revenant au domaine optique, on peut proposer divers exemples de réseaux effec-


tivement utilisés, à commencer par des réseaux utilisés en réflexion ; la figure 9.5
indique schématiquement la forme de tels réseaux, composés d’une juxtaposition de
miroirs. Dans le premier cas (réseau plan par réflexion, en haut sur la figure), le réseau
est formé d’un grand nombre de miroirs plans, coplanaires, très fins, avec la même
géométrie que celle d’un réseau plan.
a a a b b b

miroirs
miroirs
a a a α

Figure 9.5 – Réseaux par réflexion, plan (en haut) et réseau de Michelson (en bas)

Dans le second cas (réseau de Michelson‡ , ou réseau en échelon), les miroirs sont
toujours régulièrement disposés avec le pas a, mais ils sont inclinés d’un angle α sur
la direction moyenne du réseau (α est en général de l’ordre de quelques dizaines de
degrés). Un tel réseau peut être utilisé avec des miroirs plus larges ; il correspond en
général à des phénomènes plus lumineux. Par contre, sa réalisation est plus délicate
que celle d’un réseau plan ; il est donc en général produit avec des valeurs de N plus
faibles (quelques centaines par exemple).

Nous rencontrerons encore de nombreux types de réseaux, en particulier les réseaux


de phase (constitués par une variation périodique de l’indice optique n d’un milieu
transparent, ou encore par une variation périodique de l’épaisseur d’une lame de
verre) ; dans chaque cas, le seul caractère périodique de la fonction de transmittance du
réseau, considéré comme une pupille diffractante, permet de déterminer des propriétés
générales communes à tous les réseaux.

2 Interférences à ondes multiples : les réseaux permettent de généraliser la notion


d’interférences à deux ondes au cas des interférences à N ondes, ou N > 2 peut
en général être très élevé. La condition de formation d’une frange brillante derrière
un tel dispositif est en général beaucoup plus contraignante que dans le seul cas de
deux ondes : on doit en effet exiger que le déphasage de deux ondes émises par deux
traits consécutifs du réseau soient en phase (déphasées de 2pπ, avec p ∈ Z) avec une
précision δϕ beaucoup plus importante que pour les interférences à deux ondes.
En effet, une erreur δϕ dans la réalisation de cette condition de déphasage entre
deux traits consécutifs impose un déphasage régulièrement croissant entre les traits
successifs du réseau. La figure 9.6 montre une interprétation géométrique, dans le plan
198 Physique, MP, MP*

complexe, de la somme de cinq nombres complexes peu déphasés, plus de la somme


de cinq nombres complexes plus fortement déphasés.

Déphasage faible Déphasage élevé

me

me
som

som
Figure 9.6 – Somme de cinq nombres complexes régulièrement déphasés

On constate bien que, plus le déphasage de deux de ces cinq complexes consécutifs est
important, plus leur somme est faible. L’effet est d’autant plus marqué que N est élevé
et, si δϕ s’éloigne un tant soit peu de zéro, on aura donc affaire à des interférences
destructives et à une frange sombre.
Notons cependant que la condition d’interférence constructive se détermine de la même
façon, quel que soit le nombre de franges ; on imposera à la différence de marche δ entre
deux ondes issues de deux traits consécutifs d’être un multiple entier de la longueur
d’onde, δ = pλ0 .
On peut résumer ces deux propriétés, qui ne sont d’ailleurs pas spécifiques aux seuls
dispositifs à réseaux, en notant que la largeur des franges brillantes dépend de N ,
tandis que leur disposition n’en dépend pas :

Finesse des franges


X Dans un dispositif interférentiel à ondes multiples, la condition d’in-
terférence constructive doit être assurée plus précisément que dans un
dispositif à deux ondes ; les franges brillantes sont donc d’autant plus
fines que N est plus élevé.
La mesure de la position de ces franges brillantes est donc plus précise.
Pour assurer la conservation de l’énergie totale transmise ou réfléchie par
le dispositif, les franges brillantes sont aussi beaucoup plus brillantes que
dans un dispositif à deux ondes : on observera des points (ou des traits)
très lumineux sur un fond très sombre.

Position des franges


X Dans un dispositif interférentiel à ondes multiples, la disposition des
franges brillantes ne dépend pas du nombre N d’ondes qui interfèrent ;
on la détermine par application de la relation δ = pλ0 , comme dans le
cas des interférences à deux ondes.
Dans le cas des réseaux, le nombre entier p et la p-ième frange brillante
qui lui est associée portent le nom d’ordre du réseau.

9.2.2 Ordres du réseau

2 Éclairage et observation à l’infini : nous nous placerons systématiquement dans ce


cas dans la suite : le réseau périodique est une pupille plane P confondue avec le plan
(Oxy). La propriété (transmission, réflexion ou déphasage) qui caractérise ce réseau
9 : Réseaux de diffraction 199

sera supposée périodique de période a le long de l’axe (Ox) et nous supposerons que
la dimension ℓ du réseau le long de l’axe (Oy) est suffisamment grande pour que tout
effet de diffraction soit négligeable le long de cet axe.
La diffraction se fait donc uniquement dans le plan Π = (Oxz) perpendiculaire à la
plus grande dimension des traits du réseau ; dans ce plan, on éclaire le réseau par une
onde plane, monochromatique de longueur d’onde λ0 , dirigée par le vecteur unitaire
ui = αi ex + γi ez ; toutefois, nous ne supposerons pas forcément que |αi | ≪ 1.
La figure 9.7 représente donc les conditions usuelles d’éclairement et d’observation
pour un réseau plan, où on notera αi = sin θi et α = sin θ les cosinus directeurs des
directions d’éclairement et d’observation. Sur cette figure, θ > 0 mais θi < 0.

Π +
b
λ0 b
b
b θ
θi z
b
b
a b
a b
b

Figure 9.7 – Éclairage et observation à l’infini pour un réseau plan

En pratique, les angles θi et θ peuvent atteindre des valeurs allant jusqu’à ±60◦ . On
peut justifier ce fait en évaluant rapidement un ordre de grandeur : avec un pas du
réseau de l’ordre de a ∼ 1 µm, la largeur individuelle b de chaque trait d’un réseau
λ0
par transmission vérifie b ≪ 1 µm, donc l’ouverture en cosinus directeur ∆α = de
b
la figure de diffraction vérifie, pour λ0 ∼ 500 nm, la relation ∆α ≫ 0, 5.

On ne doit pas confondre ouverture en cosinus directeurs et ouverture angulaire ; en


effet, la relation α = sin θ montre que ∆α = ∆(sin θ) ∼ cos θ∆θ ; il n’y a que dans
les conditions de Gauss que ces deux notions coı̈ncident.
Avec une valeur de ∆α aussi élevée, le réseau diffracte dans toutes les directions, et
pas seulement pour les angles faibles ; les réseaux ne sont pas nécessairement éclairés
dans les conditions de Gauss.

Notons que, si le réseau n’est pas en général utilisé dans les conditions de Gauss, la
lentille utilisée pour réaliser le faisceau incident est, elle, utilisée dans ces conditions
paraxiales ; la figure 9.7 plus bas montre cette lentille, utilisée au voisinage de son
axe optique. Il en va en général de même du dispositif (viseur, lentille) utilisé pour
étudier le faisceau émergent dans la direction θp de l’ordre p.

Notons encore que la figure 9.7 est entièrement tracée dans le plan perpendiculaire à
la plus grande dimension des traits du réseau ; on a en effet déjà vu que la diffraction
hors de ce plan est négligeable.
2 Ordres du réseau : sur la figure 9.7, on observe la diffraction à l’infini par une
juxtaposition de motifs identiques (des fentes fines par exemple) décalés de a ; la
condition de formation d’interférences constructives (franges brillantes) est comme
toujours δ = pλ0 , où p ∈ Z est l’ordre du réseau, tandis que la figure classique 9.8
200 Physique, MP, MP*

rappelle le principe de la détermination de la différence de marche entre les ondes


issues de la source, passant par deux traits consécutifs T et T ′ du réseau, jusqu’à un
plan orthogonal au faisceau observé.
x

θi T′b θ +
b
b
ǫ
a z

|ǫ| ≪ π θi θ K
b
b b
(conditions de Gauss)
H T

Figure 9.8 – Calcul de la différence de marche (transmission)

On sait en effet qu’un dispositif d’observation, stigmatique, formera à l’infini une


image en ajoutant les amplitudes complexes correspondant à tous ces rayons, sans
introduire de différence de marche supplémentaire. Les rayons, qui étaient en phase
dans le plan de phase HT ′ de l’onde incidente, se retrouvent ainsi déphasés au niveau
de l’observation, la différence de marche étant δ = HT K, avec HT = −a sin θi et
T K = a sin θ :

δréseau par transmission = a (sin θ − sin θi ) (9.3)

et la position angulaire θp de l’ordre p du réseau est donnée par la relation de Bragg‡ :

λ0
Réseau par transmission : sin θp − sin θi = p p∈Z (9.4)
a

2 Réseau par réflexion : le calcul de la différence de marche dans le cas d’un réseau
par réflexion se fait de manière tout à fait analogue, dans le cadre de la figure 9.9 ; on
notera sur cette que θi < 0 et θ > 0.
Dans ce cadre, la différence de marche prend la forme δ = T ′ K−T H, avec les distances
T ′ K = a sin θ et T H = −a sin θi , d’où la relation :

δréseau par réflexion = a (sin θ + sin θi ) (9.5)

et la position angulaire θp de l’ordre p du réseau :

λ0
Réseau par réflexion : sin θp + sin θi = p p∈Z (9.6)
a

2 Orientation des angles : les relations (9.3) et (9.5) sont évidemment changées en
leurs opposées si on change l’orientation des angles ; celle-ci étant conventionnelle,
9 : Réseaux de diffraction 201

θi T′b +

θ K b
θ a z
θi
b b
H T

Figure 9.9 – Calcul de la différence de marche (transmission)

le phénomène physique observé est bien sûr inchangé, car la transformation p 7→ −p


dans les relations de Bragg (9.4) et (9.6) ne change pas la nature brillante de la frange.
Il importe donc seulement de savoir retrouver simplement le signe relatif des deux
cosinus directeurs sin θ et sin θi , qu’on peut facilement retrouver en considérant le cas
de l’ordre zéro, direction particulière correspondant à l’absence de toute différence de
marche, et qui est donc celle de l’optique géométrique, en l’absence de diffraction.
réseau

Transmission réseau Réflexion

θi θi
b b
θ θ

p = 0 ⇔ |θ| = |θi | p = 0 ⇔ |θ| = |θi |


δ = ±a (| sin θ| − | sin θi |)

δ = ±a (sin θ − sin θi ) δ = ±a (sin θ + sin θi )

Figure 9.10 – Ordre zéro et orientation des angles

La figure 9.10 montre le rayon non dévié correspondant à l’ordre zéro dans les deux cas
(réseaux par réflexion et par transmission) et indique comment retrouver simplement
le signe qui figure dans les expressions de la différence de marche et de la relation de
Bragg, indépendamment du choix d’orientation (ou non) des angles.
La relation encadrée sur la figure 9.10 s’applique, seule, dans tous les cas (et en
particulier aux angles non orientés). On retiendra donc :

Relation de Bragg
X La position angulaire θp du p-ième ordre d’un réseau plan de pas a est
donnée par la relation δ = pλ0 .
La différence de marche δ entre deux rayons passant par deux traits
consécutifs du réseau s’écrit δ = ±a (|sin θ| − |sin θi |) ; on vérifie toujours
que δ = 0 correspond à la direction donnée par les prévisions de l’optique
géométrique, en l’absence de tout phénomène de diffraction.
202 Physique, MP, MP*

Dans la suite, on développera systématiquement l’étude des réseaux plans par trans-
mission ; les résultats obtenus s’adaptent aisément aux autres cas.
2 Aspect et visibilité des ordres : compte tenu de la grande finesse attendue pour
des franges d’interférence à ondes multiples, les maxima de lumière correspondant
à un ordre p donné sont angulairement définis avec une grande précision ; la figure
9.11 montre qualitativement la différence entre des interférences à deux ondes et des
interférences à ondes multiples.
E

Interférences
Interférences à N ondes
à deux ondes

b b b
δ
−λ0 0 λ0
Figure 9.11 – Finesse des franges à ondes multiples

Alors que dans le premier cas on voit une alternance de franges sombres et claires, le
second montre des franges brillantes très fines sur un fond sombre. La conservation
de l’énergie totale montre que, pour conserver l’aire totale sous la courbe lorsque ses
maxima s’affinent (zone grisée sur la figure 9.11), l’amplitude de ces maxima doit
s’élever en même temps que leur largeur décroı̂t.
Toutefois, toutes les franges ne sont pas forcément observables, puisque l’observation
pλ0
de l’ordre p de position angulaire θp sonnée par sin θp = sin θi + (dans le cas
a
d’un réseau par transmission) impose forcément une limite à la valeur de p puisque
|sin θp | 6 1.
À titre d’exemple, considérons le cas où a = 2 µm et λ0 = 500 nm ; on aura ainsi
λ0
= 0, 25. Dans le cas d’un éclairage en incidence normale (sin θi = 0), on pourra
a
ainsi observer a priori les ordres −4 à +4 puisque sin θp = 0, 25 × p ; toutefois, les
ordres ±4, émergents en incidence rasante, ne sont jamais observables. On observera
ainsi les sept maxima correspondant à p = 0, ±1, ±2 et ±3. Les valeurs de sin θp étant
en progression arithmétique, celles de θp ne le sont pas et la figure 9.12 (à gauche)
montre la position de ces sept ordres visibles, telle qu’elle apparaı̂t sur un goniomètre.

Ces ordres apparaissent sous la forme de points si la source est ponctuelle. Toutefois,
comme dans le cas des fentes de Young, on peut allonger la source perpendiculairement
à la figure (c’est-à-dire parallèlement aux traits du réseau) pour faire apparaı̂tre ces
ordres sous la forme de traits lumineux parallèles à l’axe du goniomètre.
La même figure 9.12 représente (à droite) la disposition des ordres observables pour
une incidence non nulle sur le même réseau.
2 Juxtaposition des ordres : lorsque plusieurs longueurs d’onde sont présentes dans le
spectre de la source qui éclaire le réseau, elles correspondent à des sources incohérentes
entre elles et les divers faisceaux émergents se superposent puisqu’on doit additionner
les éclairements correspondant à des sources incohérentes.
Un réseau disperse ainsi, pour un ordre p donné, les diverses composantes monochro-
matiques de la lumière qui l’éclaire, entre deux valeurs extrêmes sin θpmin et sin θpmax
9 : Réseaux de diffraction 203

p=4

p=6
b b

5
=

=
p

p
2b
4b
p= p=

réseau

réseau
p=1b p=3b
p=0b p=2b
p=1
p= b b
p = −1 p=
incidence normale −2 b incidence 30◦ 0
b
p

p
=

=
p = −4

p = −2


b b
3

1
Figure 9.12 – Ordres d’un réseau, 1/a = 500 traits par mm, λ0 = 500 nm

lorsque λ0 varie de λmin à λmax ; ce caractère dispersif d’un réseau constitue la base
de certaines applications des réseaux, la réalisation de spectromètres.
Dans les mêmes conventions que celles de la figure 9.12, on a représenté sur la figure
9.13 l’étalement angulaire des faisceaux émergents d’un réseau avec a = 2 µm, éclairé
en incidence normale par un faisceau de lumière polychromatique, lorsque λ0 varie de
pλ0
λmin = 400 nm à λmax = 750 nm, en appliquant la relation sin θ(λ0 ) = .
a
3
p=

2
p=
réseau

1
p=
p=0
p=

p= 1
−2
p=
−3

Figure 9.13 – 1/a = 500 traits par mm, 400 nm 6 λ0 6 750 nm

On constate que, pour les ordres ±3, |θ±3 | s’étend de 36, 9◦ jusqu’au delà de l’émer-
gence rasante, tandis que pour l’ordre ±2, |θ±2 | s’étend de 23, 6◦ à 48, 6◦ . De même,
les ordres ±4 (non représentés ci-dessus) débutent à 53, 1◦ . Il y a donc superposition
des ordres à partir de l’ordre 2 : une raie lumineuse observée dans certains intervalles
angulaires peut a priori appartenir à deux ordres différents (ou plus), ce qui en rend
l’analyse plus difficile.
Cette circonstance, ajoutée à la diminution de la luminosité diffractée pour les grands
angles, limite en pratique l’observation aux ordres ±1 ou ±2, au moins dans le cas
204 Physique, MP, MP*

des réseaux plans.

9.2.3 Fonction réseau


2 Calcul de l’amplitude diffractée : pour améliorer la description de l’onde diffractée
par un réseau, et préciser la forme de la répartition d’éclairement évoquée sur la
figure 9.11, on va déterminer l’amplitude diffractée par un tel réseau, en appliquant
le principe de Huygens etZ Fresnel à une
 structure diffractante
 périodique.

On a ainsi w(θ) = KwS t(x) exp j x (sin θ − sin θi ) dx, l’intégrale portant sur
P λ0
N[
−1
une pupille P à transparence périodique, c’est-à-dire sur la réunion P = Pn de
n=0
N pupilles identiques à un décalage près. On peut donc écrire cette intégrale sur une
NX−1
réunion d’intervalles disjoints sous forme de la somme w(θ) = wn (θ), où on a
  n=0

Z
posé wn (θ) = KwS t(x) exp j x (sin θ − sin θi ) dx.
x∈Pn λ0
Les N pupilles Pn étant régulièrement décalées de a, le changement de variables
x 7→ x′ = x − na transforme l’intervalle d’intégration
 Pn en P0 , ce qu’on écrit sous la
2π ′
Z

forme wn (θ) = KwS t(x + na) exp j (x + na) (sin θ − sin θi ) dx′ .
x ∈P0
′ λ 0
′ ′
Le caractère a-périodique de la fonction de transmittance  impose t(x + na) = t(x ) ; il

vient donc encore la mise en facteur wn (θ) = w0 (θ) exp j na (sin θ − sin θi ) où on
 λ0 
2π ′
Z
reconnaı̂t dans w0 (θ) = KwS ′
t(x ) exp j x (sin θ − sin θi ) dx′ l’amplitude
x′ ∈P0 λ0
complexe diffractée par le trait (( origine )) du réseau : on retrouve le fait qu’un déca-
lage de la pupille s’accompagne d’un simple déphasage. On généralise immédiatement
ce résultat sous la forme :
Calcul de l’amplitude émise par un réseau
X Dans un réseau formé de N motifs identiques mais décalés, l’amplitude
envoyée par le réseau dans la direction u s’écrit :
N
X −1 N
X −1
w(u) = wn (u) = w0 (u) exp (jnϕ)
n=0 n=0

où ϕ désigne le déphasage, dans la direction u, entre deux ondes émises


par deux motifs consécutifs du réseau.


Dans le cas des réseaux plans, ϕ = a (sin θ − sin θi ).
λ0
N
X −1
2 Fonction réseau : il reste ci-dessus à déterminer la somme R = exp (jnϕ).
n=0
S’agissant de la somme d’une série géométrique, elle s’écrit immédiatement
 sous la
1 − exp (jN ϕ) ψ ψ
forme R = . Notant alors l’identité 1 − exp (jψ) = 2j exp j sin ,
1 − exp (jϕ)
  2 2
N −1 sin(N ϕ/2)
on en déduit R = exp j ϕ .
2 sin(ϕ/2)
9 : Réseaux de diffraction 205

Finalement, l’éclairement observé derrière un réseau se mettra systématiquement sous


la forme :

sin2 (N ϕ/2)
Eréseau = Eun seul trait × RN (ϕ) RN (ϕ) = (9.7)
sin2 (ϕ/2)

ce qui définit au passage la fonction réseau RN pour un réseau à N traits.

2 Étude de la fonction réseau : l’étude générale de la fonction RN est indis-


pensable pour préciser la répartition de la lumière diffractée par un réseau. On
peut commencer par décrire rapidement les deux cas simples N = 2 et N = 3,
2
pour lesquels on a R2 (ϕ) = |1 + exp (jϕ)| donc R2 (ϕ) = 2(1 + cos ϕ) ainsi que
2
R3 (ϕ) = |1 + exp (jϕ) + exp (2jϕ)| donc R3 (ϕ) = (1 + 2 cos ϕ)2 ; les tracés corres-
pondants, sur la figure 9.14, montrent les propriétés importantes suivantes :
– les maxima principaux de la fonction réseau sont atteints pour ϕ = 2pπ, p ∈ Z ;
– l’amplitude de ces maxima, donnée par la limite lim RN (ϕ), est égale à N 2 ;
ϕ→0
– lorsque N augmente, ces maxima sont plus intenses et plus fins ;
– lorsque N > 2, la fonction réseau présente un certain nombre de maxima secon-
daires, d’amplitude (relativement au maximum principal) faible.
RN
9
b

4 b

ϕ
b b b
−2π 0 2π

Figure 9.14 – Fonctions réseau pour N = 2 et N = 3

Ces propriétés se généralisent au cas N > 3 ; en effet, on peut alors considérer la


fonction de réseau comme le produit RN (ϕ) = f (ϕ)×gN (ϕ) de la fonction à variations
Nϕ  ϕ −1
rapides gN (ϕ) = sin2 par la fonction à variations lentes f (ϕ) = sin2 .
2 2

Ces deux fonctions sont périodiques, de périodes respectives et 2π ; elles sont
N
représentées dans le cas N = 6 sur la figure 9.15.
Le produit de ces deux fonctions, c’est-à-dire la fonction réseau RN , est évidemment
2π-périodique, ce qui autorise l’étude simplifiée de la figure 9.16, toujours tracé dans
le cas N = 6.
π
On remarque que, sauf pour q = 0, les points d’abscisse ϕq = (2q+1) correspondent
N
à des maxima de la fonction gN (ϕ), donc à un point de de contact de la fonction
avec son enveloppe g(ϕ) ; ces points de contact sont pratiquement confondus avec des
maxima locaux de la fonction de réseau.
On peut évaluer l’amplitude d’un de ces maxima secondaires en remarquant que
 −1
(2p + 1)π
gN (ϕp ) = 1 donc RN (ϕp ) = f (ϕN ) = sin2 ; le plus élevé de ces
2N

maxima secondaires correspond à p = 1 donc ϕ1 = et son amplitude peut être
N
206 Physique, MP, MP*

g6 (ϕ)
f (ϕ)

ϕ
b b b b b
−2π 2π 0 2π 2π

N N

Figure 9.15 – Numérateur et dénominateur de la fonction réseau pour N = 6


R6

b
N2

N 2 × 4, 5 % 3π
ϕ=
N

b b ϕ
b b b b b
−2π 2π 0 2π 2π

N N

Figure 9.16 – Fonction réseau pour N = 6

−1
4N 2 N2

2 3π
donc évaluée, si N est assez élevé, à RN (ϕ1 ) = sin ∼ ∼ , soit
2N 9π 2 22
seulement 4, 5 % du maximum principal voisin.
Nous retiendrons les propriétés générales suivantes :
Propriétés de la fonction réseau
sin2 (N ϕ/2)
X La fonction RN (ϕ) =
sin2 (ϕ/2)
présente les propriétés suivantes :
Elle est paire et 2π-périodique ; ses maxima principaux, atteints pour
ϕ = 2pπ avec p ∈ Z, sont d’amplitude égale à RN (2pπ) = N 2 .
Elle présente, entre deux maxima principaux, N − 1 annulations et N − 2
maxima secondaires ; ceux-ci représentent au plus 4, 5 % de l’amplitude
des maxima principaux ; la demi-largeur à la base d’un maximum prin-
cipal quelconque est égale à ∆ϕ = 2π/N .

2 Finesse des franges : revenant à la différence de marche δ = a (sin θ − sin θi ) pour



un réseau, et compte tenu que ϕ = δ, on a représenté sur la figure 9.17 la fonction
λ0
d’éclairement pour un réseau éclairé en incidence normale (θi = 0), dans le cas où
a = 5λ0 (soit par exemple λ0 = 500 nm et a = 2, 5 µm) en fonction de θ.
Le tracé, réalisé avec N = 20 seulement, montre que les maxima secondaires sont en
pratique inobservables ; on y voit apparaı̂tre (en pointillés) la mise en facteur du terme
9 : Réseaux de diffraction 207

 
2 b sin θ 2π
E(θ) = E0 sinc RN a sin θ
λ0 λ0
p = −1 p=1
p = −2 p=2

p = −3 p=3

p = −4 2∆θ p=4

θ
b b b b b
◦ ◦
−40 −20 0 20◦ 40◦

Figure 9.17 – Aspect de l’éclairement diffracté par un réseau en incidence normale

de diffraction commun qui sert d’enveloppe des franges et montre une diminution
régulière de la luminosité des franges sur les bords de la figure : les franges d’ordre
élevé ne seront jamais observables.
Les maxima de lumière correspondant aux ordres visibles sont par contre toujours
très fins ; on peut en particulier définir et déterminer la demi-largeur à la base ∆θ
d’un de ces maxima en considérant que ∆θ est la petite variation de θ qui mène de
la valeur θp du maximum d’ordre p à la première annulation de la fonction de réseau
voisine de θp , pour θ = θp ± ∆θ.
λ0 a
On aura ainsi sin θp = p tandis que 2π sin(θp + ∆θ) = 2pπ + ∆ϕ ou encore
a λ0
a 2π
2π sin(θp + ∆θ) = 2pπ + ; un développement limité au premier ordre mène alors
λ0 N
a 2π λ0 λ0 1
à 2π cos θp ∆θ = ou ∆θ = = p .
λ0 N N a cos θp a N 1 − p2 λ20 /a2
On remarquera que ce calcul s’applique encore en incidence oblique, puisqu’il consiste
à rajouter le terme constant −a sin θi qui disparaı̂t dans l’évaluation du terme dif-
férentiel ∆θ ; on pourra donc être amené à retrouver l’expression générale (dont la
connaissance n’est pas exigible) :

λ0
∆θ = (9.8)
N a cos θp

10−2
Dans le cas de la figure 9.17, a = 5λ0 et N = 20 donc ∆θ = p soit
1 − p2 /25
∆θ ∼ 10−2 rad ; dans le cas d’un réseau réel, N est plutôt de l’ordre de plusieurs
centaines et la largeur angulaire d’un ordre (ou d’un maximum principal) est de
l’ordre de moins d’un milliradian, ce qui correspond à une tache de largeur inférieure
à 1 mm au foyer d’une lentille de projection de 1 m de focale.

9.3 Applications des réseaux

9.3.1 Métrologie des longueurs d’onde


2 Dispersion par un réseau : considérons un réseau plan, éclairé sous l’incidence θi ;
on a vu que l’amplitude diffractée par le réseau se concentre dans des maxima très fins,
208 Physique, MP, MP*

λ0
dont les positions angulaires sont données par la relation sin θp = sin θi + p . Pour
a
un réseau et un ordre donnés, une variation δλ0 de longueur d’onde s’accompagne
donc d’une variation δθ de l’angle d’observation du maximum.
Un réseau est donc (comme un prisme) un dispositif dispersif ; on définit la dispersion
Dp par un réseau utilisé dans l’ordre p de sorte que δθ = Dp δλ0 , donc par la relation :

dθp p
Dp = = (9.9)
dλ0 a cos θp

a a
Comme = q est une fonction croissante de |p|, on aura
cos θp 2
1 − (sin θi + pλ0 /a)
donc intérêt à utiliser l’ordre le plus élevé possible pour obtenir une dispersion élevée,
ce choix pouvant être contrarié par deux inconvénients des ordres élevés :
– la diminution de la luminosité des ordres élevés, du fait de l’enveloppe globale de
diffraction ;
– l’éventualité de la superposition des ordres, qui rend délicate l’interprétation des
raies observées pour les ordres élevés.
2 Spectrosopes à réseau : la réalisation d’un spectroscope à réseau pour la mesure
des longueurs d’onde consiste donc simplement à réaliser une structure diffractante
périodique de période a connue, avant de l’utiliser sur un goniomètre comme dans le
cas des figures 9.12 par exemple.
La mesure de l’angle d’émergence θp et de l’angle d’incidence θi permet donc, si a et
l’ordre p choisi pour l’observation sont connus, d’en déduire une mesure de la longueur
d’onde du rayonnement utilisé, par application de la relation de Bragg (9.4).
λ0
2 Domaine d’utilisation : puisque sin θp = sin θi + p , la condition nécessaire pour
a
l’obtention d’ordres observables est que λ0 et a doivent rester du même ordre de
grandeur, ou plus précisément a & λ0 . En effet :
– si a < λ0 , on aura toujours |p|λ0 /a > |p| > 1 et pratiquement aucun ordre ne sera
observable (sauf l’ordre zéro, qui n’est pas dispersif) ;
– si a ≫ λ0 , la dispersion Dp sera toujours très faible et la mesure des longueurs
d’onde sera très peu précise.
Par exemple, pour la détermination d’une longueur d’onde du domaine visible, on uti-
lisera des réseaux tels que a > 1 µm, où 1/a < 1 000 traits par millimètre. Des valeurs
de a plus faibles correspondent à des mesures possibles dans le domaine ultraviolet.
Les fabricants de réseaux, utilisant notamment des techniques dérivées de l’hologra-
phie, proposent régulièrement pour ces usages des réseaux de diffraction comportant
jusqu’à 5 000 traits par millimètre ou plus.
Pour la détermination de longueurs d’onde plus courtes (par exemple dans le domaine
des rayons X, avec λ ∼ 10−10 m), on peut remplacer les réseaux gravés par des
machines par des structures cristallines, le rôle des traits du réseau étant rempli par
les plans réticulaires du cristal (plans d’alignement des atomes). La distance entre
plans réticulaires est alors de l’ordre de grandeur des paramètres de maille, soit par
exemple a ∼ 200 pm = 2 × 10−10 m.
2 Résolution spectrale : rappelons ici que la résolution d’un appareil de mesure est,
en général, la plus petite variation de la grandeur mesurée repérable par l’appareil.
Dans le cas d’un réseau utilisé pour la mesure des longueurs d’onde, cette résolution
9 : Réseaux de diffraction 209

est évaluée par le plus petit écart δλ0 provoquant une déviation δθ repérable, compte
tenu de l’ensemble des limitations de mesure des angles.
Nous ne prendrons ici en compte que la seule limitation intrinsèque d’un spectroscope,
due au phénomène de diffraction lui-même. La figure 9.18 illustre la répartition de
lumière attendue par un réseau observé dans l’ordre p s’il est éclairé par deux raies
de longueurs d’onde λ0 et λ0 + δλ0 ; du fait de l’incohérence de ces deux raies, on
observera comme éclairement la somme des deux éclairements dus aux deux raies.
E E Dp δλ0

λ0 λ0 + δλ0 λ0 λ0 + δλ0

∆θ

θ θ

Deux raies non résolues Raies juste résolues

Figure 9.18 – Résolution de deux raies par un réseau

Sur cette figure 9.18, le tracé de gauche correspond à deux raies non résolues car
angulairement trop proches ; à l’observation, on croı̂t voir une raie unique (traits
pleins) là où on a en fait la somme de deux éclairements correspondant à deux raies
insuffisamment décalées en longueur d’onde.
Au contraire, le tracé de droite correspond au cas de deux raies résolues : on voir
nettement apparaı̂tre un minimum local entre les deux maxima d’éclairement voisins.
On définit la limite de résolution en appliquant le critère de Rayleigh déjà employé
pour l’étude de la résolution spatiale pour la formation des images : on dira que les
raies sont résolues si l’écart angulaire δθ = Dp δλ0 qui les sépare est supérieur à la
demi-largeur à la base ∆θ commune aux deux pics que l’on cherche à distinguer.
p λ0
Cette condition s’écrit donc δλ0 > , compte tenu de (9.9) et (9.8) ; il
a cos θp N a cos θp
existe donc un écart de longueur d’onde minimal résolu, tel que δλ0 > δλmin constitue
le critère de résolution.
On définit habituellement le pouvoir de résolution du réseau par la grandeur sans
dimension :

λ0
R= = pN (9.10)
δλmin

Ainsi, pour atteindre une résolution élevée, on doit utiliser un réseau comportant un
nombre élevé de traits, dans l’ordre le plus élevé possible.
Avec de simples réseaux par transmission, on peut atteindre N de l’ordre de plusieurs
centaines et R de l’ordre de quelques milliers, ce qui permet de séparer deux raies
distantes, en longueur d’onde, d’un millième en valeur relative ; c’est par exemple le
cas des deux raies du doublet D du sodium ; avec λ1 = 589, 0 nm et λ2 = 589, 6 nm,
210 Physique, MP, MP*

ces raies sont résolues par la plupart des réseaux usuels, sauf si d’autres défauts de
réalisation optiques du spectroscope viennent dégrader la résolution.
Pour atteindre des résolutions plus élevées, on doit changer la technologie de réalisa-
tion des réseaux ; on verra par exemple en exercice comment l’utilisation de réseaux
non plans (réseau de Michelson par exemple) permet d’augmenter fortement la valeur
du pouvoir de résolution R = pN .
2 Applications à l’astronomie : Fraunhofer‡ fur le premier à fabriquer, en , un
réseau constitué de fils fins équidistants tendus entre deux supports. Au moyen d’un
tel réseau, il décomposa la lumière solaire et découvre dans le spectre correspondant
500 raies sombres qui portent aujourd’hui le nom de raies de Fraunhofer.
Bunsen et Kirchhoff donnèrent vers  l’interprétation correcte des raies de
Fraunhofer : il s’agit de raies correspondant à l’absorption de la lumière par les
gaz contenus dans la partie la plus froide de l’atmosphère solaire. La comparaison
des longueurs d’onde correspondant à ces raies d’absorption permit de déterminer la
composition chimique de l’atmosphère solaire.
La généralisation de la méthode à l’étude de spectres d’étoiles ou de galaxies plus
lointaines montre en général un décalage vers le rouge des raies d’absorption par
rapport à leur valeur mesurée pour les mêmes éléments au laboratoire. On interprète
ce décalage par un effet Doppler du à l’éloignement des sources stellaires, dans le
cadre de l’expansion de l’univers consécutive à l’explosion primordiale (ou Big Bang).

La mesure de ce décalage vers le rouge permet une mesure directe de la vitesse de


récession des étoiles et galaxies lointaines et, donc, une validation des modèles cosmo-
logiques.

9.3.2 Métrologie des longueurs


2 Diffraction par les cristaux : on peut, à l’inverse de la réalisation des spectroscopes,
utiliser des faisceaux d’ondes de longueur d’onde λ0 connue pour en déduire une me-
sure du pas a d’un réseau par observation de la figure de diffraction. Cette technique
est particulièrement utilisée pour la détermination des structures cristallines, considé-
rées comme des associations de réseaux bidimensionnels formés de plans réticulaires,
plans d’alignement des atomes dans un cristal.
La figure 9.19 montre la disposition de certains plans réticulaires dans un cristal ; un
faisceau cohérent de rayons X éclaire ce cristal et on étudie les interférences formées, à
l’infini, par les faisceaux diffractés par des plans réticulaires successifs en fonction des
angles d’incidence et de réflexion θ supposés égaux (on néglige donc ici la diffraction
en se plaçant dans le cadre des lois de Snell-Descartes).
En notant a la distance entre les plans réticulaires indiqués sur le schéma, la différence
de marche entre deux rayons réfléchis sur des plans réticulaires consécutifs devient
a cos2 θ
δ = (HIJ) − (HK), avec HI = IJ = et HK = HJ cos θ = 2a . Il vient
sin θ sin θ
donc δ = 2a sin θ. La condition de maximum d’interférences conduit à la relation de
Bragg généralisée à cette géométrie, 2a sin θp = pλ0 .
Le choix des plans réticulaires est toutefois largement arbitraire ; la même figure 9.19
montre un autre réseau de plans réticulaires, caractérisé par le pas a′ . Finalement, du
fait de la présence de très nombreux ensembles de plans réticulaires, dont l’orientation
relative dans l’espace peut être assez variée, on obtient une figure de diffraction formée
de nombreux pics étroits, répartis dans les diverses directions de l’espace autour de
9 : Réseaux de diffraction 211

Π
θ θ
H
J
I

a
a′

Figure 9.19 – Diffraction par des plans réticulaires d’un cristal

l’ordre zéro. La figure 9.20 montre une telle figure de diffraction, dans le cas d’un
cristal à symétrie cubique.

Figure 9.20 – Diffraction des rayons X par un cristal

La comparaison de la figure observée avec un modèle de répartition des atomes sur


les nœuds du réseau cristallin permet de déterminer tous les paramètres géométriques
de la maille cristalline, si on connaı̂t la longueur d’onde λ0 du faisceau de rayons X
utilisé.
2 Généralisation : la méthode proposée ci-dessus se généralise à toutes sortes de
molécules, dont on étudie la diffraction par des faisceaux de rayons X pour en déter-
miner la répartition des atomes dans l’espace, où même plus précisément la densité
volumique de répartition électronique dans la molécule.
Pour cet usage, des sources de rayons X intenses sont utilisées (rayonnement syn-
chrotron dû à l’accélération des électrons dans un accélérateur circulaire d’électrons)
et des méthodes numériques performantes permettent de remonter de l’observation
de la figure de diffraction par une molécule cristallisée à l’intégralité de la structure
géométrique de celle-ci.
Ces méthodes sont notamment utilisées dans le domaine de la biochimie pour déter-
miner la structure tridimensionnelle de molécules d’intérêt biologique : protéines et
enzymes, ADN, etc.
212 Physique, MP, MP*

Ce qu’il faut absolument savoir

Un réseau est un dispositif diffractant à transparence périodique ; la période a


de la fonction de transmittance est le pas du réseau. Les traits du réseau étant
très longs, la diffraction n’a lieu que dans le plan perpendiculaire à ces traits.
b
b
b
θi b θ
b
b
a b
réseau
La différence de marche observée à l’infini entre deux rayons diffractés par
deux traits consécutifs est δ = a (sin θ ∓ sin θi ) ; les signes doivent être choisis
en fonction des orientations conventionnelles des angles mais on doit toujours
vérifier que δ = 0 pour les rayons non diffractés (c’est-à-dire, la direction de
l’optique géométrique).
La position des maxima principaux (ordres du réseau) est indépendante du
nombre N de traits ; elle est donnée par la relation de Bragg, δ = pλ0 donc
sin θp = ± sin θi + pλ0 /a. Ces maxima sont très fins si N est élevé.
La condition | sin θp | < 1 limite le nombre d’ordres observables.
dθp p
Un réseau est un système dispersif, avec Dp = = .
dλ0 a cos θp
N
X −1
L’amplitude totale diffractée par un réseau est wtotal = w0 exp (−jnϕ) avec
n=0
ϕ = 2πδ/λ0 ; il y a mise en facteur du terme de diffraction w0 commun aux N
traits identiques du réseau.
sin2 (N ϕ/2)
L’éclairement total diffracté par un réseau est Etotal = Eun trait ; la
sin2 (ϕ/2)
fonction de réseau qui apparaı̂t ici présente des maxima principaux d’amplitude
N 2 pour ϕ = 2pπ, séparés par N − 2 maxima secondaires peu sensibles ; la
demi-largeur à la base des maxima principaux est 2π/N . Dans le tracé de cette
fonction d’éclairement, Eun trait est une enveloppe de diffraction.
E

p = δ/λ0
b b b b b
−2 −1 0 1 2
Un réseau peut être utilisé pour la mesure des longueurs a ou des longueurs
d’onde λ0 ; la résolution des mesures augmente avec l’ordre p et avec le nombre
N de traits éclairés.
Pour un spectroscope, le critère de Rayleigh permet d’évaluer la résolution
δλmin selon R = λ0 /δλmin = pN .
Pour la mesure d’une longueur a, on doit choisir une longueur d’onde λ0 . a.
Chapitre 10

Interférences localisées

10.1 L’interféromètre de Michelson

10.1.1 Historique
2 Le problème de l’éther : lors de la publication du Treatise on Electricity and Magne-
tism par Maxwell en , l’ouvrage prédisait la possibilité de propagation d’ondes
électromagnétiques. La vérification expérimentale, apportée peu de temps après par
Hertz, posa un problème de cohérence avec la théorie mécanique : les équations de

Maxwell prévoyaient en effet une célérité de propagation c0 = 1/ ε0 µ0 , valeur uni-
verselle qui ne pouvait donc être réalisée que dans un seul référentiel galiléen : les lois
d’addition des vitesses imposaient un changement de la vitesse de propagation par
changement de référentiel galiléen.
Les physiciens furent donc amenés à admettre l’existence d’un référentiel galiléen
particulier, unique système de référence relativement auquel les équations de l’élec-
tromagnétisme devaient s’appliquer ; on appela ce référentiel éther absolu.
Dans un autre référentiel galiléen R′ , en translation à la vitesse v relativement à l’éther
absolu R, la vitesse d’une onde électromagnétique devait donc devenir c′ = c + v, si
c = c0 u est la vitesse de l’onde électromagnétique se propageant dans la direction u
du référentiel R. Dans la suite, R′ est le référentiel terrestre et les mesures proposées
devaient donc mettre en évidence la vitesse de déplacement de la Terre par rapport à
l’éther absolu.
2 L’expérience de Michelson et Morley : la mise en évidence de ce référentiel de l’éther
absolu fut l’objet de nombreuses expériences, parfois très fines, et toutes infructueuses ;
toutefois, l’une des plus célèbres de ces expériences a conduit à la construction d’un
appareil qui reste d’un usage très étendu aujourd’hui.
Il s’agit de l’expérience menée en  par Michelson‡ et Morley, destinée à mettre
en évidence le mouvement de la Terre relativement à l’éther absolu au moyen d’une
méthode interférométrique. En assimilant a priori l’éther absolu au référentiel de
repos du système solaire, les expérimentateurs s’attendaient à une variation périodique
annuelle du système de franges formé.
Le principe de l’expérience est décrit sur le schéma de la figure 10.1 : une source
émet en A deux ondes synchrones à angle droit. Deux miroirs orthogonaux M1 et
M2 renvoient ces ondes vers le point A où on étudie leur déphasage par une méthode
interférentielle ; si les trajets AM1 et AM2 sont identiques, le déphasage est entière-
ment dû au fait que l’ensemble de l’appareil se déplace (avec la Terre) à la vitesse
214 Physique, MP, MP*

v relativement à l’éther absolu : v est ainsi la vitesse d’entraı̂nement du référentiel


terrestre R′ relativement à l’éther absolu R.
b y
M2 R 2
c0
c

x
v
v

A R1 M1
b b

Figure 10.1 – Expérience de Michelson et Morley

L’une de ces ondes est émise parallèlement à l’axe (Ox) qui est celui de la vitesse v ; le
parcours de A jusqu’au point R1 de réflexion sur un miroir M1 se fait donc à la vitesse
c0 + v par rapport à R′ , tandis que le trajet de retour R1 A se fait à la vitesse
 c0 −2 v.
ℓ ℓ 2ℓ v
Le temps de parcours aller et retour est donc τ1 = + ≃ 1+ 2
c0 + v c0 − v c0 c0
car v ≪ c0 , si ℓ désigne la distance AM1 .
L’autre onde est émise perpendiculairement à cette direction, et l’ondevoyage donc  à
v2
q
′ 2 2
la vitesse cey = c0 u + vex dans R , ce qui impose c = c0 − v ≃ c0 1 − 2 . Le
2c0
temps de trajet aller
 et retour est donc, si la distance AM2 est aussi égale à ℓ, donné
v2

2ℓ 2ℓ
par τ2 = ≃ 1+ 2 .
c c0 2c0

Finalement, l’écart de phase à l’arrivée est de l’ordre de Φ = ω (τ1 − τ2 ) soit Φ = ∆
λ0
où la différence de marche équivalente est donnée par ∆ = ℓv 2 /c20 . En réalisant un
appareil avec des bras de l’ordre de ℓ ∼ 10 m, et v étant de l’ordre de grandeur de la
vitesse de la Terre sur son orbite (v ∼ 30 km · s−1 ), la différence de marche attendue
∆ 0, 1
était de l’ordre de ∆ ∼ 100 nm, soit un ordre d’interférence p = = = 0, 2
λ0 0, 5
dans le domaine visible.
Après trois mois sur son orbite, la vitesse v de la Terre devant tourner de π/2, on s’at-
tendait à voir permuter les rôles des deux bras AM1 et AM2 ; la variation périodique
du système de franges devait être parfaitement décelable, les franges se déplaçant de
manière sinusoı̈dale dans le plan d’observation, de part et d’autre de leur position
moyenne, avec une amplitude totale de déplacement de 0, 4 frange.
Le résultat nul de l’expérience de Michelson et Morley, même après avoir augmenté
la longueur ℓ des bras de l’interféromètre jusqu’à plus de 30 mètres, a amené les
physiciens à réviser certaines notions théoriques fondamentales. On peut citer ici les
travaux du physicien Lorentz et du français Poincaré.
L’interprétation aujourd’hui communément admise du résultat nul de l’expérience de
Michelson et Morley fut donnée en  par Einstein, sous la nom de théorie de
la Relativité restreinte, basée sur le fait désormais expérimental que la célérité de la
lumière dans le vide c0 est un invariant par changement de référentiel galiléen.
10 : Interférences localisées 215

2 La théorie de la relativité : dans le cadre de la théorie de la relativité, on considère


que les bases de la Mécanique sont fausses en présence de mouvements à grande
vitesse : le temps ne s’coule plus identiquement dans deux référentiels R et R′ en
translation l’un par rapport à l’autre. Les lois de composition des positions (x 7→ x′ )
et des instants (t 7→ t′ ) doivent à la fois conserver la forme limite non relativiste à
basse vitesse (t′ ∼ t et x′ ∼ x − vt) et consacrer l’invariance de c0 par changement de
référentiel galiléen. Toute autre connaissance sur cette théorie est hors programme, et
les développements présentés ci-après ne sont proposés qu’à titre documentaire.
Ainsi, si un signal lumineux est émis à l’instant 0 au point origine O (quand ce point
est donc commun aux deux référentiels R et R′ ) le long de leur axe commun (Ox), ce
rayon lumineux sera perçu à l’abscisse x et à l’instant t = x/c0 dans R, et à l’abscisse
x′ à l’instant t′ = x′ /c0 dans R′ .
On montre que la seule transformation linéaire qui assure cette conservation est la
transformation de Lorentz, donnée par les relations (10.1) ; dans ces équations, on
vérifie par exemple facilement que, si x = c0 t, alors x′ = c0 t′ .

x − vt t − vx/c20
x′ = p t′ = p (10.1)
1 − v 2 /c20 1 − v 2 /c20

Les conséquences de la théorie de la Relativité et de la transformation de Lorentz


sont immenses : en plus de décrire l’écoulement du temps comme un phénomène
relatif à l’observateur et non pas absolu, elle a imposé un remaniement complet de la
Mécanique puisque ses fondements les plus élémentaires, comme la loi d’addition des
vitesses, cessent d’être valables.
dx dx′
Ainsi, les vitesses et ′ d’un même mobile relativement à R et R′ vérifient elles
dt dt
la relation d’addition modifiée :

dx′ dx/dt − v
= (10.2)
dt′ 1 − vdx/c20 dt

dx′ dx
au lieu de la loi d’addition des vitesses = − v (vitesse relative = vitesse
dt′ dt
absolue − vitesse d’entraı̂nement) de la mécanique classique. Notons en particulier
dx dx′
que, si = ±c0 avec η = ±1, alors = ±c0 également : la loi d’addition des
dt dt′
vitesses généralisée laisse, comme prévu, invariante la norme et le sens de la célérité
des ondes lumineuses par changement de référentiel galiléen.

10.1.2 Constitution de l’interféromètre


2 Séparation du faisceau : l’aspect fondamental de la réalisation de l’appareil de
Michelson est la production de deux faisceaux cohérents se propageant à angle droit,
ce qui fait de l’appareil de Michelson un dispositif à division d’amplitude. On utilise
pour cette division une lame semi-réfléchissante (ou lame séparatrice) Sp disposée à
45◦ du faisceau incident, selon la figure 10.2.
Le système semi-réfléchissant est en général réalisé au moyen d’une lame de verre à
faces parallèles, de faible épaisseur h, traitée sur une de ses faces au moyen d’un fin
dépôt métallique pour être semi-réfléchissante. Le schéma est proposé dans le cas où
c’est la première face qui est ainsi traitée, mais on rencontre aussi l’autre cas.
216 Physique, MP, MP*

Sp

α
α

α
Séparation du faisceau Réalisation de la lame Sp

Figure 10.2 – Lame semi-réfléchissante de l’interféromètre de Michelson

L’application des lois de Snell-Descartes montre immédiatement qu’en cas d’incidence


sous l’angle α, un des faisceaux n’est pas dévié tandis que l’autre subit une déviation
D = π − 2α ; si α est de l’ordre de π/4, on produit bien deux faisceaux presque
orthogonaux.

2 Éclairage des miroirs de l’interféromètre : on complète la lame semi-réfléchissante


Sp au moyen de deux miroirs, dont nous supposerons provisoirement qu’ils sont or-
thogonaux entre eux et aux axes (Ox) et (Oy) d’un système de coordonnées cartésien
dont la lame Sp forme la première bissectrice ; par contre, le faisceau incident sur le
système pourra être incliné sur (Ox) d’un angle i, comme le montre la figure 10.3.
y

M2
Sp M1
3π/2
x
i

Figure 10.3 – Éclairage des miroirs de l’interféromètre de Michelson

On considère alors la progression des divers faisceaux sauf ceux qui sont renvoyés en
direction de la source lors de la seconde réflexion sur la lame semi-réfléchissante ; ces
rayons ont, sur la lame semi-réfléchissante, des angles d’incidence α = π/4 ± i et
subissent donc :
– pour le rayon qui se réfléchit en M1 , une transmission sans dérivation par Sp, une
réflexion sur M1 avec déviation de π−2i, et enfin une réflexion sur Sp avec déviation
de π/2 + 2i ;
– pour le rayon qui se réfléchit en M2 , une réflexion sur Sp avec déviation de π/2 + 2i,
une réflexion sur M2 avec déviation de π − 2i, et enfin une transmission par Sp sans
déviation.
Comme le montre la figure 10.3, les deux faisceaux sortent alors de l’interféromètre
parallèlement entre eux, et perpendiculairement au faisceau d’entrée (avec donc une
déviation totale égale à 3π/2).
10 : Interférences localisées 217

2 Lame compensatrice : l’étude de la propagation des faisceaux de rayons dans l’in-


terféromètre montre que chacun d’eux rencontre deux fois la lame semi-réfléchissante,
une fois pour une réflexion et une fois pour une transmission. La figure 10.4 (à gauche)
montre ces trajets dans le cas d’un angle d’incidence i quasiment nul ; les trajets aller
(avant réflexion sur les miroirs M1 et M2 ) et retour (après réflexion) sont décalés pour
plus de lisibilité.
Cp

Sp

Figure 10.4 – Lame semi-réfléchissante et compensation

Les faisceaux qui se réfléchissent sur M1 traversent trois fois la lame, tandis que ceux
qui se réfléchissent sur M2 ne la traversent qu’une fois. Cette différence introduit donc
une différence de marche δlame = 2n(λ0 )h(i), où h(i) est l’épaisseur de lame traversée
(qui dépend de l’incidence i) et n(λ0 ) est l’indice optique de la lame (qui dépend de
la longueur d’onde utilisée).
Pour éviter de devoir prendre en compte ce terme, dont les variations en fonction de
i et λ0 sont complexes, on utilise une lame compensatrice, exactement identique à la
lame séparatrice et disposée parallèlement à celle-ci, mais qui n’a pas subi de trai-
tement semi-réfléchissant ; la figure 10.4 (à droite) montre clairement qu’en présence
de cette lame, chacun des faisceaux traverse exactement trois fois la même épaisseur
du même matériau, supprimant par là même toute différence de marche au niveau de
l’ensemble formé des lames séparatrice Sp et compensatrice Cp.

Si la lame semi-réfléchissante est métallisée sur sa face arrière (c’est-à-dire du côté


de M1 et non pas de M2 ), la lame compensatrice Cp doit être disposée sur le trajet
entre Sp et M1 au lieu d’être disposée entre Sp et M2 comme sur les schémas
ci-dessus. Naturellement, quel que soit le choix du constructeur d’un interféromètre
de Michelson, la disposition de la lame Cp du bon côté de Sp est assurée.

2 Miroir fixe, miroir mobile : en l’absence de toute différence de marche au niveau


de l’ensemble séparateur compensateur, seuls les trajets depuis la lame jusqu’au deux
miroirs M1 et M2 sont éventuellement différents ; ces deux miroirs présentent :
– tous les deux, un réglage d’inclinaison, destiné à assurer avec la plus grande précision
possible l’orthogonalité du miroir et de son axe ; si ce réglage est bien réalisé, M1
est perpendiculaire à (Ox), M2 est perpendiculaire à (Oy) et les deux miroirs sont
dits orthogonaux ;
– pour un seul d’entre eux (le miroir M1 dans la suite), un réglage de translation
permettant de déplacer le miroir, sur un chariot mobile, le long de l’axe (Ox). Le
déplacement du miroir s’appelle chariotage ; réglé au moyen d’une vis micromé-
trique, il peut être contrôlé avec une grande précision (de l’ordre d’une fraction de
micromètre) ou être imposé à vitesse constante au moyen d’un moteur.
218 Physique, MP, MP*

y
M2

Cp
Le M1
d2 Sp
S x
b

d1
VA
Lo Chariotage

Figure 10.5 – Schéma complet de l’appareil

On complète enfin le schéma de principe (figure 10.5) de l’interféromètre en ajoutant


un verre de protection anticalorique V A à l’entrée, protégeant les lames et miroirs
d’une élévation de température due à la source S, disposée éventuellement derrière
une lentille d’éclairage Le ; on utilise aussi en général une lentille de projection Lo
pour l’observation des franges.
On notera enfin d1 et d2 les distances des deux miroirs M1 et M2 au point d’intersec-
tion des faisceaux entrant et sortant de l’appareil (en incidence normale, c’est-à-dire
quand ces faisceaux sont alignés avec les axes (Ox) et (Oy).
La photographie de la figure 10.6 montre un des appareils utilisés au Laboratoire ; les
deux miroirs et les lames séparatrice et compensatrice y figurent, ainsi que les trajets
des rayons lumineux dans l’interféromètre.

Figure 10.6 – Un interféromètre de Michelson de laboratoire

10.1.3 Réglages de l’interféromètre


2 Dépliement des faisceaux : on a vu plus haut que l’ensemble des lames sépara-
trice et compensatrice est conçu pour assurer la séparation des deux faisceaux et une
déviation globale de 3π/2, sans introduire de différence de marche supplémentaire.
10 : Interférences localisées 219

En réalité, en fonction de la nature du traitement semi-réfléchissant disposé sur


la lame séparatrice, une différence de marche globale de λ0 /2 (correspondant à
un changement de signe ou à un déphasage de π) peut apparaı̂tre entre les deux
faisceaux ; l’effet de cette différence de marche est l’interversion des franges claires
et sombres et sera facilement pris en compte en fin de calculs le cas échéant. Nous
l’oublierons donc provisoirement dans les calculs qui suivent.
Ainsi, les deux faisceaux émergent de l’appareil parallèlement et au voisinage de l’axe
(Oy) ; on peut rendre compte de l’ensemble des propriétés géométriques et optiques de
ces deux faisceaux en les dépliant au niveau des réflexions sur l’ensemble séparateur-
compensateur, comme le montre la figure 10.7 à gauche.

M2
M1 M2′ M1

Figure 10.7 – Dépliement des faisceaux dans l’interféromètre de Michelson

Dans toute la suite, on remplacera donc le miroir fixe M2 par son symétrique M2′
relativement à la lame séparatrice, et on oubliera toutes les réflexions sur cette lame
séparatrice, conformément à la figure 10.7, à droite.
2 Réglage en lame d’air : lorsque les miroirs M1 et M2 sont rigoureusement per-
pendiculaires, ou encore quand M1 et M2′ sont rigoureusement parallèles, on dit que
l’interféromètre est réglé en lame d’air ; on emploie aussi parfois le vocabulaire abusif
(( réglage en miroirs parallèles )). Les miroirs M1 et M2′ forment alors une lame d’air
fictive d’épaisseur e = d1 − d2 .

On notera, ici et dans toute la suite, que e est une grandeur algébrique ; e est positif
si le miroir M1 est charioté au-delà de la position de M2′ , et négatif sinon. La position
e = 0, pour laquelle M1 et M2′ se superposent exactement, porte le nom de contact
optique.
Dans un réglage en lame d’air, on a déjà eu l’occasion de déterminer la différence de
marche entre les deux rayons, parallèles entre eux, issus de la lame ; la figure 10.8
rappelle le principe de ce calcul de δ au point de convergence P des deux faisceaux,
situé dans le plan focal image de la lentille de projection Lo .
Considérons ainsi un rayon lumineux quelconque incident sous l’angle i en direction
des deux miroirs de l’interféromètre ; on notera S l’intersection de ce rayon avec l’axe
(Ox). Les rayons réfléchis sur les miroirs M1 et M2′ croisent le même axe aux points
S1 et S2 , symétriques de S par rapport à M1 et M2′ ; ces deux points sont distants de
2e et peuvent être considérés comme des sources secondaires en phase avec le point
(commun aux deux faisceaux) S. En partant des deux sources secondaires S1 et S2 ,
on voit donc que la seule différence de marche est δ = S1 H.
Finalement, δ = (SM1 P ) − (SM2 P ) = S1 H = 2e cos i ; l’angle i correspond à la
r
distance r = F ′ P selon la relation tan i = ′ ; l’ensemble du schéma est invariant de
fo
220 Physique, MP, MP*

M2′ M1

b
P i Sb bH i x
F′ b i b b
S2 S1

fo′ e 2e

Figure 10.8 – Différence de marche et réglage en lame d’air

révolution autour de l’axe (Ox) et les franges sont donc circulaires d’axe (Ox). On
retiendra l’expression de la différence de marche et du rayon de la frange d’ordre p :

rp
δ = 2e cos ip = pλ0 tan ip = (10.3)
fo′

!
rp i2p
Dans les conditions de Gauss, on peut écrire ip ≃ ′ et δ ≃ 2e 1 − , d’où
fo 2
l’expression approchée :
r
pλ0
rp = fo′ 2− (10.4)
e

La relation (10.3), avec 0 6 ip < π/2, montre que p et e sont de même signe ; comme le
rayon des franges ne dépend que du rapport p/e, nous nous contenterons ici d’étudier
les conséquences de (10.4) si e > 0 et p > 0.
D’après cette relation, rp est une fonction décroissante, non linéaire de p ; la valeur
minimale rp = 0 correspond donc à la valeur maximale pmax = 2e/λ0 atteinte au
centre de la figure et qui correspond à un trajet aller et retour de longueur 2e entre
les deux miroirs.
Enfin, pour p > 0 fixé, rp est une fonction croissante de e ; le cas particulier remar-
quable e = 0 correspond à δ = 0 en tout point de l’écran.
On retiendra l’ensemble de des résultats sous la forme suivante, détaillant les proprié-
tés des franges d’égale inclinaison ou anneaux de Haidinger :

Anneaux d’égale inclinaison


X Dans le réglage en miroirs parallèles, l’interféromètre de Michelson pro-
duit, à l’infini, des anneaux concentriques non équidistants.
L’ordre des franges est maximal au centre et correspond à δcentre = 2e ;
l’ordre décroı̂t sur les bords de la figure.
Au contact optique (e = 0), l’éclairement est uniformément lumineux ;
lorsqu’on s’en éloigne, e augmente à partir de zéro et les anneaux
semblent sortir du centre (rp croı̂t à p fixé).

La photographie de la figure 10.9 représente les franges d’une lame d’air réalisées avec
un interféromètre de Michelson éclairé par une source spectrale (lampe à vapeurs de
Mercure).
10 : Interférences localisées 221

Figure 10.9 – Anneaux de Haidinger, lampe au Mercure

La présence de nombreux anneaux visibles montre que les valeurs de i ne sont pas
limitées aux conditions de Gauss ; bien au contraire, on atteint facilement quelques
dizaines de degrés pour la valeur maximale de i. La source qui éclaire l’interféromètre
est donc large ; le problème du défaut de cohérence spatiale de cette source est abordé
au § 10.2.1.
2 Applications à la métrologie : la relation (10.3) permet de relier une mesure de
rayon d’un anneau clair (p ∈ Z) ou sombre (p + 1/2 ∈ Z) à une mesure de la longueur
e ou de la longueur d’onde λ0 .
Toutefois, la valeur exacte de l’ordre d’interférence p est en général inconnue ; on doit
donc effectuer au moins deux mesures de rayons, par exemple consécutifs (p2 = p1 − 1
si p1 est l’anneau interne et p2 le rayon externe) ou, pour améliorer la précision,
séparés par m rayons intermédiaires (avec dans ce cas p2 = p1 − m − 1).
cos ip2 − cos ip1
On élimine alors p1 et p2 en écrivant m + 1 = 2e , ce qui permet de
λ0
mesurer e si on connaı̂t λ0 , ou au contraire de mesurer λ0 si on connaı̂t e.
La mesure des longueurs correspondant par exemple à un déplacement donné e des
miroirs depuis le contact optique est une application en métrologie des longueurs ; un
interféromètre de Michelson peut ainsi réaliser des étalons de longueur ou, comme on
le verra en exercice, des mesures d’épaisseur de diverses lames.
La mesure des longueurs d’onde peut s’étendre, comme on le verra plus bas, à la
détermination du spectre de luminance d’une source non monochromatique.
2 Réglage en coin d’air : considérons maintenant un appareil de Michelson réglé
au voisinage immédiat du contact optique, c’est-à-dire pour d1 = d2 . Tout défaut de
réglage du parallélisme des miroirs M1 et M2′ (qu’il soit involontaire ou délibéré) mène
à la formation d’un coin d’air, comme celui qui est représenté sur la figure 10.10.
Les rayons lumineux incidents sur le miroir M1 sous l’incidence i sont dirigés par le

vecteur d’onde k = (cos iex − sin iey ) ; après réflexion sur ce miroir, ils sont dirigés
λ0

par le vecteur d’onde k1 = − (cos iex + sin iey ).
λ0
De même, l’angle d’incidence sur le miroir M2′ est i′ = i + α, si α est l’angle dièdre
formé par M1 et M2′ ; on en déduit que le faisceau réfléchi sur M2′ fait l’angle 2α + i

avec l’axe (Ox), donc qu’il est dirigé par k2 = − (cos(i + 2α)ex + sin(i + 2α)ey ).
λ0
Ainsi, l’onde lumineuse totale observée en un point M (x, y, z) est-elle donnée par
w = w0 [exp (−jk1 · r) + exp (−jk2 · r)] ; la différence de phase correspondante est
222 Physique, MP, MP*

M1 y
α
i
k i
x
i′

k1
e(y)
k2 M2′

Figure 10.10 – Réglage de l’interféromètre en coin d’air


donc ∆ϕ = (k1 − k2 ) · r = δ, et on déduit donc le calcul de la différence de marche
λ0

δ de celui de la différence k1 − k2 = 2 sin α (− sin(i + α)ex + cos(i + α)ey ).
λ0
Finalement, δ(M ) = 2 sin α [cos(i + α)y − sin(i + α)x] ; en particulier, lorsque l’ob-
servation est effectuée sur le plan du miroir M1 , x = 0 et on obtient l’expression
approchée valable pour les petits angles :

δ ≃ 2 sin αy ≃ 2αy ≃ 2e(y) (10.5)

puisque e(y) = tan αy est l’épaisseur du coin d’air à l’abscisse y ; on interprète bien
sûr ce résultat comme l’existence d’un aller en retour supplémentaire entre les lames
du coin d’air. Ainsi, les franges, données par l’équation δ = pλ0 , sont rectilignes,
d’équation yp = pλ0 /2α, parallèles à l’arête des miroirs M1 et M2′ , et équidistantes
d’interfrange λ0 /2α.

Figure 10.11 – Franges du coin d’air, éclairage en lumière blanche

La photographie de la figure 10.11 représente les franges du coin d’air réalisées avec
un interféromètre de Michelson éclairé en lumière blanche. Le problème du défaut de
cohérence temporelle de la source est abordé plus bas, voir le § 10.2.2.

10.2 Cohérence et contraste

10.2.1 Cohérence spatiale et localisation


2 Anneaux de Haidinger : pour obtenir des anneaux bien visibles comme ceux de
la photographie 10.9, il faut éclairer l’interféromètre de Michelson avec une source
angulairement large, comme le montre la figure 10.12.
10 : Interférences localisées 223

2imax x

2imax
plus grand anneau visible

Figure 10.12 – Élargissement spatial de la source et anneaux de Haidinger

Ainsi, pour observer un anneau de rayon maximal rmax ∼ 30 cm au foyer d’une


lentille de focale fo′ ∼ 1 m, on doit avoir tan imax = rmax /fo′ donc imax ∼ 17◦ ; avec
une ouverture angulaire totale de 34◦ , la source est dite angulairement large.
En pratique, on peut utiliser comme source une lampe disposée directement devant
l’interféromètre ; une telle source ne peut évidemment pas être considérée comme
ponctuelle et ne vérifie donc pas le critère de cohérence spatiale.
Pourtant, les anneaux restent bien visibles si on les observe uniquement dans le plan
focal de la lentille de projection : c’est le phénomène de localisation.
Localisation des franges
X Dans le cas de certains dispositifs interférentiels, l’utilisation d’une source
spatialement étendue, donc incohérente, provoque en général la perte des
franges (par chute du contraste) en tout point de l’espace sauf sur une
surface bien spécifique, la zone de localisation des franges.

Avec un interféromètre à franges localisées, on peut utiliser une source étendue (donc
très lumineuse) à condition de ne réaliser l’observation que sur la surface de localisa-
tion. C’est le cas de l’interféromètre de Michelson réglé en lame d’air :
Localisation des anneaux de Haidinger
X Les anneaux de Haidinger (franges d’égale inclinaison d’une lame d’air)
sont localisés à l’infini, c’est-à-dire en pratique dans le plan focal image
de la lentille de projection.

Pour donner une interprétation simple de la localisation des franges de Haidinger, on


peut remarquer que la différence de marche δ en un point de l’écran d’observation
ne dépend que de la position de ce point, puisque δ = 2e cos i où r = fo′ tan i ; deux
éléments incohérents de la source de lumière large disposée devant l’interféromètre
éclairent des directions i et i′ différentes, et par conséquent ces faisceaux incohérents
ne se recoupent géométriquement pas sur la surface de localisation.
Au contraire, pour que deux rayons parviennent au même point de la surface de
localisation, il est nécessaire qu’ils soient issus de la source sous la même incidence i :
chaque point de la surface de localisation n’est atteint que par deux rayons issus de
la même partie de la source : de tels rayons restent exactement cohérents.
Nous pouvons éventuellement retenir la justification suivante de la localisation des
franges de la lame d’air : chaque point de la surface de localisation est l’intersection
224 Physique, MP, MP*

de deux rayons lumineux issus, avant traversée de l’interféromètre, de la division


d’amplitude d’un rayon unique issu de la source. Ces deux rayons lumineux émergent
parallèlement entre eux et leur intersection est située à l’infini, ainsi donc que la
surface de localisation.
2 Franges de Fizeau : on a vu plus haut que les franges d’interférence d’un coin d’air
sont donnés par la relation δ(x, y) = 2 sin α [cos(i + α)y − sin(i + α)x] pour un coin
d’air d’angle dièdre α, si le miroir M1 est éclairé sous l’incidence i. Nous supposerons
comme ci-dessus que diverses valeurs de i correspondent à des éléments incohérents
de la source, spatialement large, qui éclaire l’interféromètre.
On constate bien sûr que l’élargissement spatial de la source pose en général un
problème de cohérence : pour un point (x, y) et un coin d’air α fixés, la différence
de marche varie lorsque i varie ; on superposera donc au même point des franges
claires (pour certaines valeurs de i) et des franges sombres (pour d’autres valeurs de
i). Globalement, les franges risquent d’être peu contrastées, voire invisibles.
Le seul cas où les franges restent visibles correspond à une différence de marche qui
∂δ
dépend très peu de i ; on cherchera donc à imposer = 0 pour des valeurs de i situées
∂i
de part et d’autre de zéro, ce qui correspond à la condition 0 = sin(i+α)x+cos(i+α)y
pour i = 0, on encore y = −x tan α.
Comme le montre la figure 10.10, il s’agit de l’équation du plan formé par le miroir
M2′ ; on a ainsi montré que les franges de Fizeau sont (au second ordre près en i)
localisées sur M2′ si le miroir M1 est éclairé au voisinage de l’incidence normale.
Le rôle des deux miroirs peut être permuté : si on éclaire M2 au voisinage de l’incidence
normale, les franges sont localisées sur la surface de M1 . En pratique, l’angle entre
les deux miroirs est trop faible pour qu’il soit possible de faire la différence entre les
deux situations ; on retiendra :
Localisation des franges de Fizeau
X Les franges de Fizeau (franges d’égale épaisseur d’un coin d’air) sont
localisés sur la surface des miroirs.

Pour donner une interprétation simple de la localisation des franges de Fizeau, on peut
là encore remarquer que la surface de localisation est formée des points sur lesquels
les parcours des deux rayons traversant les deux bras de l’interféromètre se séparent ;
chaque point de la surface de localisation est, ici encore, l’intersection de deux rayons
lumineux issus, avant traversée de l’interféromètre, de la division d’amplitude d’un
rayon unique issu de la source.
2 Généralisation : les résultats obtenus ci-dessus se généralisent, mais aucune pro-
priété générale n’est au programme. Rappelons donc simplement ici qu’avec tout dis-
positif interférentiel classique, l’élargissement spatial de la source de lumière provoque
en général une diminution du contraste des franges.
Toutefois, certains dispositifs à division du front d’onde présentent la propriété de
localisation des franges : cette perte de contraste est nulle ou très faible pour les points
d’une certaine surface, formée des intersections, après traversée de l’interféromètre,
de deux rayons lumineux issus, avant celui-ci, de la division d’amplitude d’un même
rayon issu de la source.
Il n’y a localisation que si cette propriété définit une surface unique dans l’espace ;
c’est en particulier le cas de l’interféromètre de Michelson, qu’il soit utilisé en lame
d’air (localisation à l’infini) ou en coin d’air (localisation sur les miroirs).
10 : Interférences localisées 225

10.2.2 Cohérence temporelle et luminance spectrale


2 Luminance spectrale : considérons un système interférentiel à deux ondes éclairé,
d’abord, par une source monochromatique de nombre d’onde σ0 = 1/λ0 . En un point
où la différence de marche des deux ondes qui interfèrent est δ, l’éclairement produit
est E = 2E0 [1 + cos (2πσ0 δ)] ; dans cette expression, E0 est l’éclairement uniforme
attendu en présence d’une seule des deux voies de l’interféromètre.
En présence de plusieurs longueurs d’onde dans la source, on sait que l’incohérence
des émissions non synchrones impose de déterminer l’éclairement total en sommant
X
les éclairements correspondant à des nombres d’onde différents : Etotal = Eσi .
σi
Si les longueurs d’onde présentes sont assez nombreuses pour être décrites par une
modélisation continue, on remplacera cette somme par l’expression :

dE0
Z
E(δ) = 2 [1 + cos (2πσδ)] dσ (10.6)

dE0
Dans cette relation, × dσ désigne l’éclairement qui serait envoyé sur l’écran par

une seule voie de l’interféromètre si on limitait les nombres d’onde à un intervalle de
dE0
largeur dσ ; la grandeur porte donc le nom de luminance spectrale de la source.

La luminance spectrale est donc une mesure du caractère plus ou moins monochro-
matique d’une source lumineuse ; c’est une fonction très étroite centrée en σ0 dans le
cas d’une source quasi-monochromatique (figure 10.13 à gauche) ou au contraire une
fonction très large dans le cas d’une source de lumière blanche (figure 10.13 à droite).
dE/dσ dE/dσ

b
σ b b
σ
σ0 σmin σmax

Figure 10.13 – Exemples de luminances spectrales

D’une manière générale, la largeur ∆σ de la luminance spectrale caractérise le degré


de cohérence temporelle de la source : plus ∆σ est élevé, moins la source est cohérente.
2 Cohérence temporelle et contraste : le Zcalcul de l’intégrale (10.6) est souvent
dE0
possible explicitement. Le premier terme 2 dσ = 2Etotal est simplement une

constante (relativement à δ) qui mesure le double de l’éclairement total envoyé par la
source en présence seulement d’un des bras de l’interféromètre.
dE0
Z
Le second terme 2 cos (2πσδ) dσ est proportionnel à la partie réelle de la trans-

dE0
formée de Fourier de la fonction de luminance spectrale , calculée pour la variable
  Z +∞ dσ
dE0 1 dE0
x = 2πδ, dont on rappelle que TF =√ exp (−jxσ) dσ.
dσ 2π σ=−∞ dσ
226 Physique, MP, MP*

Le calcul de ce terme est possible explicitement dans le cas d’une luminance spectrale
simple, comme celle d’une raie de nombre d’onde moyen σ0 et de largeur spectrale
∆σ, dont la luminance spectrale est représentée sur la figure 10.14 à gauche.
dE/dσ V (δ)
K

σ0 σ −1/∆σ 1/∆σ δ
b b b

∆σ 2/∆σ

Figure 10.14 – Exemple de calcul de contraste dans le cas d’une raie de largeur ∆σ

dE0 dE0
Z Z
On a alors aisément 2 dσ = 2K∆σ tandis que 2 cos (2πσδ) dσ s’écrit
dσ dσ
Z σ0 +∆σ/2       
2K ∆σ ∆σ
2K cos (2πσδ) dσ = sin 2πδ σ0 + − sin 2πδ σ0 −
σZ
0 −∆σ/2
2πδ 2 2
dE0
soit 2 cos (2πσδ) dσ = 2K∆σ cos (2πσ0 δ) V (δ), après quelques transformations

trigonométriques, et où on a choisi de poser V (δ) = sinc (π∆σδ). On reconnaı̂t alors
dans l’expression de l’éclairement E(δ) = 2K∆σ (1 + V (δ) cos (2πσ0 δ)) une fonction
de visibilité V (δ), représentée sur la figure 10.14 à droite.
dE
La relation générale entre largeurs de la fonction de départ et sa transformée de

Fourier V (δ) apparaı̂t sur la figure 10.14 : plus la raie étudiée est monochromatique
(∆σ étroit), plus la fonction de contraste est large et donc plus le nombre de franges
visibles est élevé.
On peut généraliser le résultat qui précède à toutes les formes de luminance spectrale,
en montrant dans le cadre général des transformées de Fourier que :

E(δ) = 2Etotal [1 + V (δ) cos (2πσ0 δ)] (10.7)

où σ0 est un certain nombre d’onde central, et V (δ) s’identifie en général à une fonction
de visibilité, associée à un contraste des franges C(δ) = |V (δ)|.
La largeur ∆x de la fonction V (x) et celle ∆σ de la luminance spectrale vérifient,
comme pour toute transformée de Fourier, ∆x × ∆σ = 2π ; puisque x = 2πδ, on en
déduit que la largeur ∆δ de la fonction de visibilité, c’est-à-dire l’étendue des valeurs
de la différence de marche δ pour lesquelles le contraste reste suffisant pour que les
franges soient visibles, vérifie :

1
∆δ = δmax − δmin ∼ (10.8)
∆σ0

Ainsi, plus la source est monochromatique, plus on pourra observer un nombre de


franges important. Si on se souvient que δ = pλ0 = p/σ0 , on peut réécrire cette
expression en terme de nombre de franges visibles :
10 : Interférences localisées 227

σ0
∆p = pmax − pmin ∼ (10.9)
∆σ0

λ0 σ0
On peut aussi écrire ≃ ; avec une largeur spectrale relative de un millième,
∆λ0 ∆σ0
λ0
∼ 103 et on peut espérer une fonction de visibilité étalée sur un millier de
∆λ0
franges ; c’est le cas du doublet de raies D du sodium (raies jaune-orangées), dont le
traitement détaillé est présenté ci-après.
2 Exemple : le doublet de raies D du sodium : en première approximation, ce
doublet est formé d’un système bichromatique à deux raies, de longueurs d’onde
λ1 = 589, 0 nm et λ2 = 589, 6 nm. On pose encore σ1 = 1/λ1 , σ2 = 1/λ2 , et on
σ1 + σ2
définit σ0 = et ∆σ0 = σ1 − σ2 .
2
Les deux raies du doublet étant de même intensité, on peut calculer l’éclairement
total produit par un interféromètre éclairé par une lampe à vapeurs de sodium sous
la forme E = E1 + E2 , avec Ei = 2E0 [1 + cos (2πσi δ)] ; après un calcul immédiat, il
vient E = 4E0 [1 + V (δ) cos (2πσ0 δ)] où on a choisi de poser V (δ) = cos (π∆σ0 δ),
reconnaissant une fonction à variation lente du fait de la faible valeur de ∆σ.
Comme précédemment, plus l’écart ∆σ0 est faible, plus la raie bichromatique pourra
être assimilée à une raie monochromatique, et plus la fonction de visibilité aura une
grande étendue en termes de valeurs de δ. On reconnaı̂t toutefois une propriété par-
ticulière des sources bichromatiques : la fonction de visibilité est périodique. Ceci
signifie qu’après la disparition des franges, obtenue pour certaines valeurs de δ qui
annule V (δ), les franges réapparaissent avec changement de signe de V (δ), donc avec
inversion du contraste.
La présence des inversions périodiques du contraste est une propriété caractéristique
des interférences avec des sources bichromatiques ; on peut en comprendre l’origine
physique en traçant, sur la même figure 10.15 les figures d’interférence qui seraient
obtenues séparément pour les longueurs d’ondes λ1 et λ2 (le tracé n’est pas à l’échelle).
E1 + E2
retour du contraste
perte de contraste

δ
E1 et E2
b b b

b b b

Figure 10.15 – Brouillage des franges et source bichromatique

Sur cette figure, on voit clairement que le contraste est maximal pour δ = 0 puisque
les deux fonctions E1 et E2 prennent leur maxima aux mêmes points ; par la suite, les
deux systèmes de franges se décalent progressivement jusqu’à observer l’annulation du
228 Physique, MP, MP*

contraste lorsque le décalage des deux systèmes de frange atteint exactement un demi-
interfrange. Sur la figure, des points marquent des maxima de lumière correspondant
aux deux raies de longueurs d’onde λ1 et λ2 ; on voit qu’ils s’alignent dans les zones
de maximum de contraste, et qu’ils sont exactement en opposition dans les zones de
perte de contraste.
Le décalage des systèmes de franges reprend ensuite jusqu’à ce que les systèmes de
franges se retrouvent en phase pour restaurer le contraste, et ainsi de suite.
Revenant à l’expression de l’éclairement produit derrière l’interféromètre de Michelson
éclairé avec une source à vapeurs de sodium, on peut poser λ0 = 1/σ0 ≃ 589, 3 nm et
∆λ0 ∆σ0
définir la largeur spectrale ∆λ0 en longueur d’onde par = , ce qui permet
    λ0  σ 0
2π π∆λ0 p
d’écrire E = 4E0 1 + V (δ) cos δ et V (p) = cos puisque δ = pλ0 .
λ0 λ0
Le tracé 10.16 de la répartition d’éclairement V (δ) montre que V (p) est une fonction
π∆λ0 p π
de visibilité, avec des annulations périodiques du contraste pour ≡ [π].
λ0 2
E
4E0 (1 + V (p))
4E0 (1 − V (p))

p
b
λ0 /2∆λ0

Figure 10.16 – Éclairement par une source bichromatique

Le nombre de franges visibles entre deux annulations du contraste est donc de l’ordre
λ0
de ∆p = , comme affirmé dans le cas général. Ce tracé n’est pas à l’échelle dans
∆λ0
le cas d’une source à vapeurs de sodium.
On peut visualiser l’effet de cette perte périodique du contraste en observant les
photographies de la figure 10.17, prises justement en éclairant un interféromètre de
Michelson réglé en lame d’air au moyen d’une lampe à valeurs de sodium ; on y voit,
de gauche à droite, une chute régulière du contraste des franges.
Dans le cas de la troisième figure, les franges sont pratiquement invisibles, la fonction
de visibilité étant trop faible.

Figure 10.17 – Contraste des anneaux de Haidinger avec une lampe au sodium

Ces développements mènent à une méthode immédiate de mesure d’un élargissement


spectral dans le cas d’une source bichromatique : on enregistre l’éclairement au centre
10 : Interférences localisées 229

(i = 0 donc δ = 2e) de la figure d’interférences en réalisant une variation lente de e


au moyen d’un moteur. Le tracé obtenu est le même que celui de la figure 10.16, et
permet une mesure de λ0 et de ∆λ.
2 L’interféromètre de Michelson, analyseur de luminance spectrale : On peut enfin
généraliser la méthode ci-dessus pour analyser la luminance spectrale d’une source
quelconque. En effet, on a vu que l’éclairement E(δ) est la somme d’un terme constant
2E0 et d’un terme variable en fonction de δ, proportionnel à la transformée de Fourier
de la luminance spectrale recherchée.
On procède donc en plusieurs temps, conformément au schéma 10.18 :
– enregistrement de la fonction E(δ) en plaçant un détecteur au centre de la figure
en anneaux et en assurant une translation régulière à la vitesse V du miroir M1 au
moyen d’un moteur ;
– dans le signal enregistré, suppression de la partie continue au moyen d’un filtre
passe-haut ;
– du signal restant, on calcule numériquement la transformée de Fourier inverse au
moyen d’un logiciel FFT par exemple ;
– la grandeur obtenue est la luminance spectrale de la source.

source Mesure de Passe-haut


Michelson E en i = 0, puis FFT :
dE/dσ e=Vt
δ = 2V t −→ dE/dσ

Figure 10.18 – Interféromètre de Michelson et transformée de Fourier


230 Physique, MP, MP*

Ce qu’il faut absolument savoir

L’interféromètre de Michelson utilise une lame séparatrice (semi-réfléchissante


à 45◦ du faisceau d’entrée) pour diviser l’amplitude et éclairer deux miroirs
presque orthogonaux. Une lame compensatrice assure l’absence de toute diffé-
rence de marche à la séparation du faisceau, sauf éventuellement un déphasage
de π (δ ′ = λ0 /2) pour certaines réalisations de la couche semi-réfléchissante.

En réglage en miroirs (( parallèles )) (en fait orthogonaux), l’interféromètre


réalise une lame d’air et produit des franges d’égale inclinaison, avec δ = 2e cos i
où e est l’intervalle entre les miroirs.
L’angle i est relié au rayon rp des anneaux de Haidinger observés pau foyer d’une
lentille d’observation de focale fo′ par rp = fo′ tan i soit rp ≃ fo′ 2 − pλ0 /e.
Ces anneaux ne sont pas équidistants ; l’ordre est maximal au centre et décroı̂t
sur les bords.
Les anneaux sont localisés à l’infini : le contraste des franges reste élevé, même
en présence d’une source spatialement étendue.
Lorsque e = 0 (contact optique), l’éclairement est uniforme ; lorsqu’on chariote
pour s’éloigner du contact optique, les anneaux se resserrent (diminution de
la distance entre anneaux consécutifs) et semblent sortir depuis le centre de la
figure (p est fixé pour un anneau donc i augmente si e augmente).
Avec un moteur, l’enregistrement au centre de la figure d’interférences (i = 0 et
e = V t) permet de mesurer la luminance spectrale de la source en recherchant
la transformée de Fourier inverse de la partie variable du signal.

En réglage en coin d’air (miroirs inclinés d’un angle α), on observe des franges
d’égale épaisseur, avec δ ≃ 2e(M ) où e(M ) = y tan α est l’épaisseur du coin
d’air au point M , d’abscisse y mesurée depuis l’axe dièdre du coin d’air.
Ces franges de Fizeau sont rectilignes et équidistantes, avec pour équation
2y tan α = pλ0 donc d’interfrange i ≃ λ0 /2α.
Ces franges sont localisées sur la surface des miroirs : le contraste des franges
reste élevé, même en présence d’une source spatialement étendue.
Chapitre 11

Thermodynamique classique

11.1 Systèmes thermodynamiques

11.1.1 Physique statistique


2 Systèmes thermodynamiques : l’histoire de la Thermodynamique est liée à la
réalisation et à l’amélioration des machines thermiques, et en particulier des moteurs ;
toutefois, et notamment depuis les travaux de Boltzmann‡ , on la considère comme
la branche de la Physique décrivant les propriétés statistiques des systèmes formés
d’un grand nombre N de particules.
Pour les systèmes thermodynamiques usuels, N est en général de l’ordre de grandeur
du nombre d’Avogadro NA = 6, 02 × 1023 mol−1 ; on préfère souvent décrire de tels
systèmes thermodynamiques par l’intermédiaire de la quantité de matière n = N/Na
(appelée improprement nombre de moles), à moins qu’on ne préfère utiliser la masse
m = nM, la grandeur M désignant la masse molaire moyenne du système.
2 Notions de physique statistique : devant l’impossibilité matérielle de décrire les
systèmes thermodynamiques par l’intermédiaire des N jeux de caractéristiques des
particules d’un système thermodynamique (coordonnées xi , yi et zi , vitesse vi , etc.),
on se contente de décrire un système thermodynamique par des grandeurs de nature
moyenne.
Ainsi, on s’intéressera aux échanges énergétiques d’un système de particules en dé-
crivant l’énergie cinétique moyenne hec i d’une des particules du système (Σ) ; cette
moyenne doit se comprendre en général comme une valeur moyenne pour l’ensemble
N
1 X1
des particules du système (Σ) à un instant donné, soit hec i = mi vi2 pour un
N i=1 2
ensemble de N particules ponctuelles.
On pourrait toutefois aussi définir une autre notion de valeur moyenne, pour une des
particules prises au hasard dans le système (Σ) et en étudiant la moyenne des valeurs
de la grandeur physique (par exemple, ec ) au cours d’une durée assez longue, selon
1 t0 +τ
Z
l’expression ec = lim ec (t)dt ; dans cette définition, τ sera en pratique seule-
τ →∞ τ t
0
ment pris nettement supérieur aux plus petites durées des mesures macroscopiques.
On pourra alors définir des états d’équilibre thermodynamique, pour lesquels les gran-
deurs thermodynamiques ne varient pas au cours du temps, c’est-à-dire pour lesquels
une grandeur moyenne observable f ne dépend pas de l’instant t0 où elle est mesurée.
Dans la plupart des cas, cette moyenne individuelle au cours du temps f coı̈ncide alors
234 Physique, MP, MP*

avec la moyenne instantanée sur l’ensemble des particules du système hf i ; on parlera


indifféremment de grandeur moyenne, sans préciser la nature de cette moyenne.
On adoptera en général une notation macroscopique pour ces grandeurs moyennes,
préférant utiliser par exemple Ec = N ec , énergie cinétique totale du système, que
son équivalent microscopique ec . Dans le cas des grandeurs extensives (leur définition
est rappelée plus loin), on remplacera usuellement la grandeur extensive X par les
grandeurs massique x = X/m, volumique xV = X/V ou molaire xm = X/n associées,
avec en particulier les notations du tableau 11.1.

Grandeur physique Symbole Symbole Symbole Symbole


(massique) (molaire) (volumique)
Énergie E e
Énergie interne U u um
Enthalpie H h hm
Enthalpie libre G g µ
Entropie S s sm
Masse m 1 M ρ
Pression p non défini, p est intensive
Quantité de matière n 1/M 1 1/vm
Température T non défini, T est intensive
Volume V 1/ρ vm 1

Table 11.1 – Les notations des variables de la Thermodynamique

Certaines grandeurs ne sont pas relatives au volume d’un système, mais à la surface
de l’interface entre deux systèmes ; elles concernent donc les échanges entre deux
systèmes. Chaque grandeur X est transportée d’un flux de X par unité de temps.
Les grandeurs surfaciques associées à ces flux sont en général qualifiées de densités de
courant : on parle ainsi de densité de courant de masse, d’énergie ou d’entropie, comme
on parle de densité de courant électrique. Ces densités de courant sont éventuellement
des grandeurs vectorielles, la direction et le sens du vecteur étant ceux des échanges
réalisés. Les notations et unités correspondantes sont indiquées dans le tableau 11.2.

Grandeur transportée Flux associé Courant associé


Charge électrique q, C Courant électrique I, A jq , A · m−2
Masse m, kg Débit de masse Dm , kg · s−1 jm , kg · s−1 · m−2
Travail W, J Puissance utile Putile , W
Transfert thermique Q, J Puissance thermique Ptherm , W jt , W · m−2
Énergie rayonnée Puissance rayonnée R, W · m−2

Table 11.2 – Grandeurs échangées, flux et densités de courant

2 Échelles microscopique, mésoscopique et macroscopique : la physique statistique


fait le lien entre l’échelle microscopique, où on doit adopter une description individuelle
des particules comportant un système quelconque, et l’échelle macroscopique, qui est
celle de nos observations, et où seules subsistent des variables moyennées sur un très
grand nombre de particules.
On peut aussi, pour l’étude des milieux continus (fluides et solides déformables), défi-
nir une échelle intermédiaire, dite mésoscopique ; il s’agit de dimensions telles qu’elles
peuvent être considérées comme des infiniment petits à l’échelle macroscopique, tout
en continuant à contenir des nombres de particules suffisamment importants pour
11 : Thermodynamique classique 235

faire l’objet d’une description continue, la notion de moyenne statistique y conservant


tout son sens.
Ainsi, nous parlerons par exemple d’élément de volume dV pour un cube mésosco-
pique : il continue à faire l’objet d’un traitement statistique et on y définit les gran-
deurs thermodynamiques moyennes (pression p, température T , etc.) mais l’échelle
correspondante est trop faible à notre échelle pour qu’on puisse distinguer des va-
riations locales de ces grandeurs : par définition, p et T sont donc uniformes dans
un élément mésoscopique et on assimilera ces élément à un point à l’échelle de nos
observations macroscopiques.
Les dimensions choisies pour déterminer l’échelle mésoscopique dépendent de la na-
ture des phénomènes étudiés ; ainsi, dans une expérience de laboratoire, un volume
de l’ordre de 1 mm3 sera un bon choix d’échelle mésoscopique puisque les plus pe-
tites dimensions des capteurs de pression ou de température seront de l’ordre du
millimètre. Le nombre de particules correspondant pour un gaz parfait dans les
conditions normales (0 ◦ C, 1 bar) de température et de pression est de l’ordre de
NA × 1 mm3 /22, 7 L · mol−1 ∼ 3 × 1016 ≫ 1.

On doit se méfier de toute application numérique basée sur cette valeur numérique
du volume molaire des gaz ; rappelons qu’elle ne s’applique que dans le modèle du
RT
gaz parfait, sur la base de la relation vm = ; le choix des conditions normales
p
(T = 273 K, p = 1 bar) mène à l’application numérique vm = 22, 7 L · mol−1 . La

valeur numérique vm = 22, 4 L · mol−1 , encore souvent rencontrée, correspond à

p = 1, 013 bar, pression atmosphérique moyenne au niveau de la mer.
Par contre, dans le domaine météorologique par exemple, on effectue les calculs de
dynamique des fluides en considérant des éléments de volume de l’ordre du kilomètre
cube ou plus, simplement parce que choisir une dimension trop faible dépasserait
les capacités de calcul des systèmes informatiques
Z utilisés. Dans ce cas, on appellera
1
pression dans ce volume la moyenne pm = pdV ; c’est la moyenne qu’un expé-
V
rimentateur obtiendrait en explorant l’espace occupé par cet élément mésoscopique
en effectuant plusieurs mesures réparties dans tout cet espace de l’ordre du kilomètre
cube.
Dans toute la suite, nous considérerons les systèmes thermodynamiques comme des
milieux continus ; dire par exemple qu’une grandeur physique g(r) y est homogène
voudra simplement dire que, jusqu’à l’échelle mésoscopique, il n’est pas possible d’ob-
server des variations spatiales de g(r). Naturellement, une telle affirmation est néces-
sairement inexacte à l’échelle microscopique.
2 Vocabulaire de description des systèmes thermodynamiques : un système thermo-
dynamique (Σ) est en général défini en extension, par une limite non nécessairement
matérielle. Si ce système peut échanger de la matière avec l’extérieur, il est dit ouvert,
et fermé dans le cas contraire.
Un système qui ne peut réaliser aucun échange (ni de matière, ni d’énergie) avec l’ex-
térieur est dit isolé. On peut en général compléter fictivement tout système (Σ), pour
en faire un système fermé, en lui adjoignant l’ensemble des parties de son environne-
ment avec lesquels des échanges de matière ou d’énergie ont lieu. L’ensemble fermé
ainsi défini porte parfois le nom d’univers.
Un système thermodynamique est dit homogène si toute grandeur physique mesurable
est homogène, c’est-à-dire présente la même valeur en tout point du système, au moins
236 Physique, MP, MP*

jusqu’à l’échelle mésoscopique. On peut par exemple souvent considérer un fluide


comme homogène si ses dimensions sont assez faibles ; sinon, la variation de pression
avec l’altitude par exemple ne peut plus être négligée, en particulier dans le cas des
fluides.
Dans un système hétérogène, on préférera donc une description locale du système,
définissant par exemple sa masse volumique ρ, son volume molaire vm ou son volume
massique 1/ρ en tout point ; l’utilisation de grandeurs intégrales comme le volume
total V ou la masse totale m n’a de sens que pour des systèmes homogènes.
On appellera phase tout sous-système macroscopique dont les propriétés physiques
varient de façon continue en fonction des coordonnées d’espace ; les surfaces de dis-
continuité forment les limites d’une phase.
On pourra ainsi distinguer dans un système thermodynamique une phase gazeuse (en
général homogène sous réserve de la limitation de son extension spatiale), une ou
plusieurs phases liquides (en cas de non miscibilité par exemple) et une ou plusieurs
phases solides (la miscibilité à l’état solide est exceptionnelle).
Un système thermodynamique est à l’équilibre si toutes les grandeurs locales mesu-
rables sont indépendantes du temps, au moins à l’échelle des mesures effectuées ; cet
équilibre peut d’ailleurs être métastable et le système évolue alors très lentement mais
on n’exclut pas de le traiter comme s’il était à l’équilibre pendant des durées assez
brèves devant les temps caractéristiques de son évolution.

11.1.2 Variables thermodynamiques


2 Variables extensives : une variable thermodynamique X est dite extensive si elle
est proportionnelle à la quantité de matière du système pour laquelle on la définit.
Elle peut alors être exprimée en termes de somme d’une grandeur locale massique
(notée en général x) ou volumique (notée xv ) :
Z Z
X= xv (M )dτ = x(M )dm (11.1)
M ∈(Σ) M ∈(Σ)

Z
En particulier, la masse est une grandeur extensive avec M = ρ(M )dτ mais
Z M ∈(Σ)

aussi M = dm, donc dm = ρ(M )dτ , ce qui impose la relation entre grandeurs
M ∈(Σ)
volumiques et massiques :

xv (M ) = ρ(M )x(M ) (11.2)

Le volume, la charge électrique, les grandeurs énergétiques (énergie E, énergie interne


U , enthalpie H et l’enthalpie libre G qui sera définie ultérieurement) et l’entropie S
sont des grandeurs extensives.
Dans certains cas, on définit aussi des grandeurs molaires, notées par exemple xm ,
par la relation (si M est la masse molaire du système étudié) :

xm (M ) = Mx(M ) (11.3)
11 : Thermodynamique classique 237

2 Variables intensives : une variable thermodynamique Y est dite intensive (ou


locale) si elle est indépendante de la quantité de matière pour laquelle on la définit.
En plus de la pression p et de la température T , les grandeurs volumiques, massiques
et molaires associées à une variable extensive sont des grandeurs intensives.
Dans un système inhomogène, une grandeur intensive est une fonction du point M
considéré ; on notera par exemple Y = Y (M ).
2 Paramètres de contrainte : l’évolution d’un système thermodynamique est en
général contrôlé par les systèmes extérieurs qui agissent à sa frontière.
On connaı̂t en particulier des évolutions mécaniques, sous la contrainte d’une pression
extérieure imposée : on dit alors que la valeur pext de cette pression extérieure est un
paramètre de contrainte.
De même, des évolutions thermiques se font sous la contrainte d’une température
extérieure imposée : on dit aussi que la valeur Text de cette température extérieure
est un paramètre de contrainte.
Plus généralement, on dira qu’une grandeur Yext est un paramètre de contrainte si :
– la valeur Yext est imposée à l’extérieur de la surface qui limite le système thermo-
dynamique (Σ) étudié ;
– la grandeur Y correspondante, définie pour le système thermodynamique (Σ) étudié,
doit vérifier Y = Yext pour assurer l’équilibre.
On définit alors les évolutions mono-Y (respectivement monobares, monothermes,
etc.) qui font passer le système étudié d’un état d’équilibre avec l’extérieur à un autre ;
ainsi, la variable extensive Y part d’une valeur initiale égale à la valeur contrainte Yext
pour atteindre une valeur finale qui reprend la même valeur, sans que Y reste constant
durant cette évolution.

Prenant l’exemple d’une évolution monobare et monotherme du fait d’un contact


mécanique et thermique avec l’atmosphère, on écrira donc pi = pf = pext pour les
pressions initiale et finale, et Ti = Tf = Text pour les températures initiale et finale
en tout point du système (Σ) étudié. Par contre, les états intermédiaires peuvent être
beaucoup plus complexes, et en particulier p et T ne sont pas forcément homogènes
dans (Σ) au cours de l’évolution : on ne pourra donc pas forcément définir une
pression ou une température du système durant une telle transformation.
Le cas particulier des transformations iso-Y (isobare, isotherme, etc.) correspond évi-
demment à Y = Yext = constante pendant toute l’évolution. Ainsi par exemple, à
tout instant d’une transformation isobare, on peut définir et mesure une pression uni-
forme (indépendante du point de mesure) dans tout le système et cette pression est
constante (indépendante du temps) pendant la transformation.

11.1.3 Transport de grandeurs extensives


2 Courant de transport : pour rendre quantitative la notion de transport d’une
grandeur extensive (masse, énergie, etc.) associée à un déplacement de matière à
travers la surface fermée (S) extérieure du système thermodynamique (Σ), considérons
(cf. figure 11.1) un élément dS de cette surface, orienté vers l’extérieur de (Σ) et de
(S).
La quantité de la grandeur X qui sera transportée pendant la durée dt à travers cet
élément de surface vers l’extérieur de (Σ) est celle qui se trouve derrière la surface dS,
à une distance de celle-ci au plus égale à dℓ = vdt, où v est la vitesse de la matière
dont le déplacement assure le transport de X ; cette vitesse est mesurée relativement
à un référentiel dans lequel la surface de contrôle (S) est fixe. Cette condition définit
un cylindre de base dS et de hauteur vdt.
238 Physique, MP, MP*

(Σ)

vdt

n
θ

dS

Figure 11.1 – Transport d’une grandeur extensive à travers la surface d’un système

La hauteur de ce cylindre, mesurée perpendiculairement à l’élément de surface dS,


est dℓ cos θ = v · ndt ; remarquons que cette notation en termes de produit scalaire
définit une hauteur positive dans le cas où la matière sort effectivement de (Σ), et
négative dans le cas contraire : on calcule donc ici une grandeur algébrique, orientée
positivement dans le sens des débits sortants.

Signalons dès maintenant une différence essentielle de convention entre ces débits
de grandeurs extensives, comptés positivement s’ils sortent du système thermody-
namique étudié, et l’usage thermodynamique, qui consiste à compter positivement
ce qui est fourni au système (Σ). On ne s’étonnera donc pas de l’intervention sys-
tématique d’un signe − dans les relations qui utilisent la notion de débit.

Règles d’orientation
X En Physique en général, toute surface fermée sera (sauf mention expresse
du contraire) orientée par convention vers l’extérieur du système.
En Thermodynamique au moins, tous les échanges algébriques seront
(sauf mention expresse du contraire) comptés positivement s’ils sont re-
çus par le système étudié.
Le volume de ce cylindre élémentaire est donc égal à dτ = dS × dℓ cos θ, qu’on écrira
aussi dτ = (v · n) dSdt ; la quantité de X sortant de (Σ) par ce mode de transport est
donc d2 Xconvecté = xV dτ = xV (v · n) dSdt, où on emploie ici le terme de convection
pour tout transport associé à un déplacement de matière.
On retiendra donc l’expression du flux de X convecté par unité de temps à travers la
totalité surface (S) extérieure à (Σ) :
¯
dX ¯¯
I
= jX · ndS jX = xV v (11.4)
dt ¯convecté (S)

On définit ainsi une densité surfacique de courant de X, notée jX ; cette grandeur se


mesure dans l’unité de X par unité de temps et de surface. L’intégrale (11.4) est le
flux de cette densité surfacique de courant à travers la surface sortante de (Σ).
On aura en particulier pour les débits de masse et de charge sortants de la surface
entourant (Σ) les expressions, écrites en fonction de la masse volumique ρ et de charge
volumique ρc (parfois appelée densité volumique de charge) :
I I
Dm = ρv · ndS Dq = j · ndS avec j = ρc v (11.5)
(S) (S)
11 : Thermodynamique classique 239

Le débit de charge Dq sortant de la surface (S) se mesure dans l’unité [Dq ] = [j] × [S]
soit [Dq ] = [ρc ] × [v] × [S] = C · m−3 × m · s−1 × m2 soit [Dq ] = C · s−1 = A ; il s’agit
évidemment de ce qu’en électrocinétique on appelle le courant électrique sortant de
(S), en on retiendra la relation essentielle dans le domaine de l’Électromagnétisme :
I
Isortant de (S) = j · ndS avec j = ρc v (11.6)
(S)

Le vecteur ρv est la densité volumique de courant de masse ; il s’exprime en kilo-


gramme par seconde et par mètre carré. De même, le vecteur j = ρc v porte le nom
usuel de densité volumique de courant électrique même s’il s’exprime en ampère par
mètre carré ; l’origine de cette nomenclature trompeuse est la répartition continue en
volume des charges dans le modèle employé.
2 Théorème d’Ostrogradski : la sortie effective d’une grandeur X en dehors du
volume intérieur au système (Σ) dépend de la géométrie du vecteur v ; en particulier,
on observera une sortie importante de X en dehors des zones d’où le vecteur v diverge
manifestement.
La figure 11.2 montre deux géométries bien différentes du vecteur v. À gauche, des
lignes de champ presque parallèles entraı̂nent la compensation des flux sortant et en-
trant d’une surface fermée (S) : la divergence est faible ou nulle. À droite au contraire,
le champ est localement divergent et le flux sortant est élevé, positif.

(S) (S)

|div v| ∼ 0 div v > 0

Figure 11.2 – Géométries non divergente et divergente d’un champ de vecteurs

Pour donner un contenu quantitatif à ce caractère divergent, considérons, dans le cas


des coordonnées cartésiennes, un élément de volume dτ = dx dy dz, représenté sur la
figure 11.3 en projection dans le seul plan (Oxy).
y
j(x + dx)
j(x)
b b
jx (x) jx (x + dx)

(Σ′ ) (Σ)
xb x + dx x
b

Figure 11.3 – Caractère divergent d’un vecteur

Sur cette figure, on a représenté un vecteur quelconque j en deux points de la surface


(S) qui entoure le volume élémentaire dτ ; le vecteur j peut par exemple être une den-
240 Physique, MP, MP*

sité de courant d’une grandeur X sortant du système thermodynamique infinitésimal


de volume dτ .
Pour modéliser le fait, visible sur la figure 11.3, qu’il sort vers la droite plus de
X par la surface dS = dydz et d’abscisse x + dx qu’il n’en rentre à l’abscisse x
à travers la même surface, nous écrirons le débit sortant de X sous forme de la
différence DX = j(x + dx)dS · ex − j(x)dS · ex + P C, où la notation +P C indique
qu’il faut sommer, par permutation circulaire des indices x, y, z, deux autres termes
correspondant aux deux autres paires de surfaces limitant le système étudié. Ces débits
font donc intervenir les projections jx (x) et jx (x + dx) du vecteur j perpendiculaires
aux deux surfaces étudiées.
Avec des notations un peu plus générales, on notera encore le flux de j sortant de ce
∂jx
I
volume élémentaire sous la forme j · ndS = dx dS + P C, soit, compte tenu de
∂x
∂jx ∂jx
I
l’expression de dτ , j · ndS = dxdydz + P C = dτ + P C.
∂x ∂x
Si on ne se contente pas d’un volume élémentaire, on peut généraliser ce résultat
par juxtaposition d’un nombre quelconque de volumes élémentaires ; en effet, le flux
sortant de l’ensemble formé, sur la figure 11.3, de la réunion (Σ) ∪ (Σ′ ) est la somme
des flux sortants de (Σ) et de (Σ′ ), l’aire commune correspondant à une annulation
de deux flux sortants identiques mais comptés en sens inverse.
Pour une surface finie, on écrira donc le théorème d’Ostrogradski :
I Z
W · ndS = div Wdτ (11.7)
(S) (V )

Dans l’expression (11.7), la notation W désigne un vecteur quelconque ; la première


intégrale est le flux sortant de W à travers la surface fermée (S) orientée vers l’exté-
rieur ; la seconde intégrale porte sur la totalité du volume intérieur à (S), et la grandeur
div W, qui porte le nom de divergence du vecteur W (de composantes cartésiennes
W = Wx ex + Wy ey + Wz ez ) s’exprime en coordonnées cartésiennes selon :

∂Wx ∂Wy ∂Wz


div W = + + (11.8)
∂x ∂y ∂z

2 Divergence d’un vecteur : la relation (11.7) constitue la définition intrinsèque


d’un opérateur différentiel, l’opérateur divergence, dont la relation (11.8) ne constitue
qu’une des formes pratiques.
Cet opérateur différentiel construit, à partir d’un vecteur variable W, une grandeur
scalaire (c’est-à-dire un nombre), qui s’exprime dans l’unité de W divisée par l’unité
de longueur.
On remarquera les analogies avec l’opérateur gradient, défini par une relation intrin-
sèque liée à la variation infinitésimale df d’une grandeur scalaire : df = grad f · dr ;
on en connaı̂t alors diverses expressions, notamment dans le système de coordonnées
∂f ∂f ∂f
cartésien : grad f = ex + ey + ez .
∂x ∂y ∂z
Les analogies ne doivent pas faire oublier une différence essentielle : la divergence
div W est un scalaire défini à partir d’un vecteur W, alors que le gradient grad f
est un vecteur défini à partir d’un scalaire f . En particulier, les notations grad W
et div f n’ont aucun sens.
11 : Thermodynamique classique 241

On utilise aussi, dans le seul cas des coordonnées cartésiennes, un moyen mnémo-
technique pour mémoriser les expressions des opérateurs gradient et divergence, en
définissant le vecteur symbolique nabla par la relation :

∂ ∂ ∂
∇= ex + ey + ez (11.9)
∂x ∂y ∂z

ce qui permet d’écrire grad f = ∇ × f et div W = ∇ · W.


Comme pour le gradient, il est possible d’obtenir pour la divergence des expressions
dans n’importe quel système de coordonnées orthogonal, soit à partir de l’expression
(11.7) du théorème d’Ostrogradski, soit à partir d’un simple changement de variables.
Le calcul en est un peu fastidieux et les résultats seront seulement indiqués, sans
qu’il soit en général nécessaire de les mémoriser. En coordonnées cylindriques (r, θ, z),
1 ∂ 1 ∂Wθ ∂Wz
div W = (rWr ) + + , tandis qu’en coordonnées sphériques (r, θ, ϕ),
r ∂r r ∂θ ∂z
1 ∂ ¡ 2 ¢ 1 ∂ 1 ∂Wϕ
div W = 2 r Wr + (sin θWθ ) + .
r ∂r r sin θ ∂θ r sin θ ∂ϕ
∂f 1 ∂f ∂f
La comparaison avec les expressions cylindrique grad f = er + eθ + ez et
∂r r ∂θ ∂z
∂f 1 ∂f 1 ∂f
sphérique grad f = er + eθ + eϕ de l’opérateur gradient montre
∂r r ∂θ r sin θ ∂ϕ
que, en dehors du système cartésien, il n’existe pas de vecteur nabla permettant un
moyen mnémotechnique unique.

Comme tout opérateur différentiel, on peut attribuer des propriétés simples à la


dérivée d’un produit ; ainsi, le lecteur vérifiera sans difficultés, par exemple en co-
ordonnées cartésiennes, les relations générales grad (f g) = f grad g + g grad f et
div (f W) = f div W + W · grad f .
Enfin, à partir de deux dérivées premières, on peut calculer une dérivée seconde ; on
vérifie de même sans difficultés la relation :

div grad f = ∆ f (11.10)

qui fournit une définition intrinsèque de l’opérateur laplacien, rencontré à l’occasion de


l’étude des ondes, et qu’on peut ainsi généraliser au cas des
µ systèmes de coordonnées
1 ∂2f ∂2f

1 ∂ ∂f
cylindrique et sphérique, respectivement en ∆ f = ρ + 2 2
+ et
ρ ∂ρ ∂ρ ρ ∂ϕ ∂z 2
∂2f
µ ¶ µ ¶
1 ∂ ∂f 1 ∂ ∂f 1
∆f = 2 r2 + 2 sin θ + 2 2 .
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
Notons que le vecteur grad div W peut aussi être défini à partir d’un vecteur W,
mais qu’il ne constitue pas une généralisation de l’opérateur laplacien au cas des
fonctions vectorielles ; lorsque cette généralisation sera proposée, on vérifiera immé-
diatement que grad div W 6= ∆ W.
2 Équations de continuité : on peut immédiatement appliquer le théorème d’Ostro-
gradski à l’étude des grandeurs conservées, comme la masse M (ou la charge électrique
q). En effet, le débit de masse Dm sortant d’une surface fermée (S) est égal à la dimi-
nution de la masse M du système thermodynamique (Σ) formé de l’intérieur (V ) de
dM
(S) ; on aura donc = −Dm , où le signe − est associé aux choix conventionnels
dt
déjà évoqués plus haut.
242 Physique, MP, MP*

Z
Comme M (t) = ρ(M, t)dτ , on peut évoquer le théorème de dérivation sous le
M ∈(V )
signe somme des intégrales dépendantZd’un paramètre pour écrire la variation de la
dM ∂ρ(M, t)
masse M se (Σ) sous la forme = dτ .
dt M ∈(V ) ∂t
Enfin, on peut utiliser
I le théorème d’Ostrogradski
Z pour transformer l’intégrale de flux
qui définit Dm = ρv · ndS selon Dm = div (ρv) dτ .
(S) M ∈(V )
∂ρ
Z Z
L’égalité dτ = − div (ρv) dτ devant être vérifiée pour tout volume (V ),
(V ) ∂t (V )
fini ou infinitésimal, on en déduit la loi de conservation (locale) de la masse, connue
en général sous la nom d’équation de continuité :

∂ρ
div (ρv) + =0 (11.11)
∂t

Le même raisonnement permet d’imposer en tout point et à tout instant une relation
locale de conservation de la charge électrique, liant la charge volumique ρc et la densité
volumique de courant j = ρc v, sous la forme identique :

∂ρc
div j + =0 (11.12)
∂t

Plus généralement, nous identifierons souvent les équations analogues à (11.11) ou


(11.12) en termes de conservation ou d’absence de conservation ; ainsi, une grandeur
∂xV
X qui vérifie div (xV v) + = f (M, t) 6= 0 ne se conserve pas, le terme f (M, t)
∂t
étant lié à la création ou à la destruction locale de X.
Ainsi, l’énergie d’une onde électromagnétique se propageant dans un milieu conduc-
teur ne se conserve pas : il y a perte d’énergie par effet Joule et dans ce cas on montrera
f (M, t) < 0. De même, l’entropie d’un fluide en évolution irréversible ne se conserve
pas non plus : il y a création d’entropie et dans ce cas on montrerait f (M, t) > 0.

11.1.4 Température et pression


2 Température : deux systèmes thermodynamiques sont en équilibre thermique si
la mise en contact énergétique sans échange de volume ni de matière ne s’accompagne
d’aucun transfert énergétique. Lorsqu’au contraire un échange énergétique a lieu, on
dit que le système qui cède de l’énergie à l’autre est le plus chaud.
Une grandeur thermométrique est une grandeur physique ϑ qui repère l’équilibre ther-
mique, c’est-à-dire qui vérifie ϑ1 = ϑ2 pour deux systèmes (Σ1 ) et (Σ2 ) en équilibre
thermique, et ϑ1 > ϑ2 si (Σ1 ) est plus chaud que (Σ2 ). On peut construire de nom-
breuses grandeurs thermométriques : résistance électrique d’un conducteur ohmique,
volume d’une colonne de liquide, etc.
À partir d’une grandeur thermométrique quelconque ϑ, on construit une température
centigrade θ à partir d’une transformation linéaire qui impose les valeurs 0 et 100
pour deux points fixes, la glace fondante (gf) et l’eau bouillante (eb) sous la pression
ϑ − ϑgf
standard de 1 bar. On écrira ainsi θ = 100 ; cette grandeur est dite repérée
ϑeb − ϑgf
11 : Thermodynamique classique 243

et non mesurée car le produit, par exemple, de deux températures centigrades, est
dépourvu de sens physique.
Une température centigrade se désigne en degrés (0 ◦ , 25 ◦ , etc.). Dans le seul cas où
la grandeur thermométrique est la dilatation d’un gaz parfait (ϑ = pV /n), on utilise
la notation degrés Celsius (0 ◦ C, 25 ◦ C, etc.).
La notation T est réservée à cette grandeur thermométrique particulière (on parle de
température du gaz parfait), ou à son équivalent légal (on parle de température ther-
modynamique). Les définitions de ces deux grandeurs thermodynamiques équivalentes
seront rappelées plus loin.
2 Pression : la pression est liée à la force de contact exercée par un fluide au repos
sur tout élément de surface dS plongé dans ce fluide ; cette force est normale à la
surface dS et s’écrit dffluide→surface = +pndS, si n est la normale à dS, dirigée vers
l’extérieur du fluide.
L’unité de mesure des pressions est le pascal (newton par mètre carré) mais on utilisera
systématiquement le bar, défini par 1 bar = 105 Pa ; en particulier, on réserve le nom
de pression standard à la valeur p◦ = 1 bar.
La force de pression totale exercée sur le fluide au repos contenu dans un volume
(V ) s’écrit donc,
I compte tenu du principe des actions réciproques, sous la forme
fext→(V ) = − pndS, où l’intégrale porte sur la surface (S) qui entoure (V ) ; cette
surface est orientée vers l’extérieur.
2 Théorème du gradient : pour calculer l’intégrale qui définit la force de pression
totale, on peut adapter le théorème d’Ostrogradski (11.7) en choisissant pour fonc-
tion W la grandeur W = pex ou, plus IgénéralementZpour une fonction scalaire f
quelconque, W = f ex ; il vient alors ex · f ndS = div (f ex ) dτ ; le caractère
(S) (V )
uniforme du vecteur ex a permis sa mise en facteur dans la première intégrale.
∂f
L’application de la relation (11.8) montre alors immédiatement que div (f ex ) = ;
∂x
∂f
I Z
on en déduit que le vecteur f ndS a pour projection dτ sur ex . En per-
(S) (V ) ∂x
mutant circulairement les indices x, y, z, on en déduit le théorème du gradient, qu’on
doit considérer comme une forme particulière du théorème d’Ostrogradski :
I Z
f ndS = grad f dτ (11.13)
(S) (V )

En particulier, la somme des forces de pression exercées sur un fluide au repos prend
la forme :
I Z
fext→(V ) = − pndS = − grad pdτ (11.14)
(S) (V )

−grad p est donc la densité volumique de force équivalente aux forces de pression.
Si le fluide est au repos sous la seule action des forces de pression et de pesanteur,
donc la densité volumique est ρg, on pourraZécrire la condition
Z d’équilibre mécanique
du volume (V ) du fluide sous la forme − grad pdτ + ρgdτ = 0 et, cette
(V ) (V )
244 Physique, MP, MP*

condition devant s’appliquer à tout volume (V ), on en déduit la condition d’équilibre


hydrostatique d’un fluide :

grad p = ρg (11.15)

On pourra souvent considérer que les gaz sont soumis à une pression uniforme puisque
leur masse volumique est souvent faible ; ainsi, avec de l’air dans les conditions nor-
males, ρ ∼ 1, 3 kg · m−3 et, à la surface de la Terre, kgrad pk ∼ 1, 3 × 10−4 bar · m−1 .
Une telle approximation est plus rarement raisonnable dans le cas des liquides ; ainsi,
pour l’eau on a en général ρ ∼ 1 000 kg · m−3 donc kgrad pk ∼ 0, 098 bar · m−1 : un
déplacement vertical de 10, 2 m suffit à faire varier la pression d’un bar.

11.1.5 Équation d’état


2 Coefficients thermoélastiques : l’étude historique des propriétés des fluides est
marquée par les lois de Boyle-Mariotte et de Charles, relatives respectivement aux
variations de volume et de température d’un gaz donc on fait varier la pression. Plus
généralement, en fixant pour un fluide la quantité de matière n étudiée, on étudie les
relations entre les trois variables pression p, température θ et volume V en fixant un
des termes pour étudier les relations entre les deux autres.
On définit ainsi trois coefficients thermoélastiques ; le premier (coefficient de dila-
tation isobare), noté α, décrit les variations relatives de volume d’un gaz chauffé à
1 V′−V
pression constante. En pratique, on mesure α = ou, dans le cas d’une li-
V θ′ − θ
mite à faible taux d’accroissement, et en utilisant provisoirement la notation T pour
la température :
µ ¶
1 ∂V
α= (11.16)
V ∂T p,n

Le second coefficient (coefficient de compressibilité isotherme), noté χT , décrit les


variations relatives de pression d’un gaz dont on fait varier le volume à tempéra-
ture constante. Une diminution de volume s’accompagnant d’une augmentation de
pression, on le définit logiquement, dans les mêmes conventions, par :
µ ¶
1 ∂V
χT = − (11.17)
V ∂p T,n

On définit parfois un troisième coefficient pour les variations isochores de pression


1
lorsque la température varie, par β = (∂p/∂T )V . La réalisation des mesures iso-
p
chores est délicate et on lui préfère la détermination de α et χT , sachant de plus
que, pour les systèmes simples (pour lesquels il n’existe pas d’autre variable que p,
V , T et n), on peut montrer la relation β = α/pχT .
m
Pour un système à n constant, on peut aussi écrire V = où la masse m est une
ρ
d(m/ρ) dρ
constante. Remarquant alors que = − , on retiendra les deux définitions
m/ρ ρ
souvent plus commodes de ces coefficients thermoélastiques :
11 : Thermodynamique classique 245

µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− χT = (11.18)
ρ ∂T p ρ ∂p T

2 Équation d’état : l’existence d’une relation liant, pour un système fluide et fermé,
le volume V (ou la masse volumique ρ) aux pression p et température T découle de
l’existence des coefficients thermoélastiques : on peut en effet tracer, de proche en
proche, une surface définie par l’équations ρ = ρ(T, p) à partir
µ ¶de la µdonnée ¶ de ses
∂ρ ∂ρ
deux tangentes (cf. figure 11.4), donc de ses deux dérivées et .
∂p T ∂T p
ρ
p = Cte T = Cte

pente +ρχT

p
pente −ρα T

Figure 11.4 – Interprétation géométrique de l’équation d’état

L’expression obtenue, qu’on puisse l’expliciter ou qu’on doive la conserver sous forme
graphique ou numérique, porte le nom d’équation d’état. On en généralise la notion
sous la forme suivante :
Équation d’état et variables d’état
X On appelle variables d’état le plus petit ensemble de variables macro-
scopiques nécessaire et suffisant pour la description complète des états
d’équilibre d’un système thermodynamique.
Dans tout état d’équilibre, ces variables d’état vérifient une relation au
moins implicite, qui porte le nom d’équation d’état.

2 Macroétat et microétat : un état d’équilibre thermodynamique est une notion


macroscopique, définie par un nombre très restreint de paramètres, également ma-
croscopiques ; dans le cas des systèmes simples, ces paramètres sont par exemple la
quantité de matière n, la masse volumique ρ, la pression p et la température T .
De façon tout à fait évidente, la donnée d’un quadruplet M = (n, ρ, p, T ) ne suffit
évidemment pas à définir de manière unique l’état microscopique des N particules du
système, qui sont par exemple caractérisées par leurs positions ri = (xi , yi , zi ) et leurs
vitesses vi = (ẋi , ẏi , żi ).
La connaissance de ces 6N nombres, si elle était possible, définirait un microétat
µ = (xi , . . . , yi , . . . , zi , . . . , ẋi , . . . , ẏi , . . . , żi , . . .) ; chaque microétat se résume, lorsque
le processus statistique des mesures macroscopiques est effectué, en un macroétat
M = (n, ρ, p, T ) mais il est évident que chaque macroétat peut être réalisé à partir
d’un très grand nombre de microétats différents.
Nous noterons Ω(M) le nombre de microétats µ possibles mais différents qu’on ne
peut distinguer à l’échelle macroscopique ; la valeur de Ω(M) est une mesure du défaut
246 Physique, MP, MP*

d’information statistique sur la réalité de l’état microscopique pour un observateur


qui ne dispose que de l’information macroscopique.
On emploie parfois pour désigner Ω(M) le terme de désordre, terme évidemment im-
propre et qu’il faut donc analyser avec précautions. On pourra par exemple dire qu’un
fluide est moins ordonné qu’un solide car, dans le cas d’un solide, la connaissance des
positions des atomes est plus précise (du fait de la nature cristalline du solide par
exemple) que pour un fluide, pour un même ordre de grandeur des paramètres ma-
croscopiques. De même, un gaz est moins ordonné qu’un liquide puisque la distance
moyenne entre molécules y varie de façon plus importante, diminuant la connaissance
a priori sur les propriétés du microétat µ pour un macroétat M donné.

11.1.6 Les gaz parfaits


2 Propriétés thermoélastiques : l’étude expérimentale des coefficients de dilatation
α des gaz en fonction des paramètres thermodynamiques mène à l’expression appro-
1
chée α = , valable pour tous les gaz au moins à basse pression, si θ est une
θ + θ0
température centigrade ; la constante universelle θ0 ≃ 273 ◦ C mène à la définition
d’une température absolue T = θ + θ0 ; il s’agit d’une grandeur mesurable (par l’in-
termédiaire de la mesure de α) et pas seulement repérable. Cette loi porte le nom
historique de loi de Charles et Gay-Lussac. µ ¶
1 ∂V 1
L’intégration de l’équation différentielle (pour p fixé) = mène à la
V ∂T p T
relation V = K(p)T , où la constante d’intégration K(p) dépend de p.
1
De même, la loi de Boyle et Mariotte conduit à la loi expérimentale approchée χT = ,
p
qui s’applique là aussi de manière approchée pour tous µ les¶ gaz au moins à faible
1 ∂V 1
pression ; on peut écrire cette équation sous la forme = − , ce qui impose
V ∂p T p
1 dK 1 A
= − donc encore K(p) = , où A est une vraie constante.
K(p) dp p p
On peut réécrire cette équation pV = AT ou, prenant en compte le caractère extensif
de V , pV = nRT où R est une constante intensive.
La loi d’Avogadro et Ampère précise la constante R en montrant que c’est une
constante universelle, indépendante de la nature du gaz étudié si on en considère
la limite aux basses pressions. On définit ainsi les gaz parfaits :
Gaz parfaits
X On appelle gaz parfait le comportement limite à très basse pression de
tous les gaz réels. Ce sont des systèmes caractérisés par les seules va-
riables d’état p, V , T et n, avec pour équation d’état pV = nRT .
On appelle aussi thermomètre à gaz parfait le thermomètre construit sur la grandeur
pV
thermométrique ϑ = lim ; la grandeur centigrade associée est nommée tempéra-
p→0 n
pV
ture Celsius. La température absolue T = lim est alors entièrement définie par
p→0 nR
un seul choix conventionnel, qui est celui de la valeur de R ou, si on préfère, celui de
la température d’un point de référence.
2 Équation d’état des gaz parfaits : en choisissant conventionnellement T = 273, 16 K
pour la température du point triple de l’eau (équilibre de l’eau pure sous les trois
11 : Thermodynamique classique 247

phases vapeur, liquide et solide), le système international d’unités fixe la constante


des gaz parfaits à la valeur numérique R = 8, 31 J · K−1 · mol−1 .
On peut aussi réécrire la même équation des gaz parfaits en termes de grandeurs
n m 1
extensives, en remarquant que = , si M est la masse molaire du gaz étudié ;
V V M
on écrira donc indifféremment :

pV = nRT ⇔ pM = ρRT (11.19)

Enfin, on utilise aussi une écriture massique en notant r = R/M la constante massique
des gaz parfaits, ce qui permet de noter :

pV = nRT ⇔ pv = rT ou p = ρrT (11.20)

où on a noté v = 1/ρ le volume massique du fluide. Dans le cas de l’air considéré
comme un gaz parfait, M = 29 g · mol−1 donc r = 287 J · kg−1 · K−1 .

11.2 Le premier principe

11.2.1 Énergie interne


2 Définition : au niveau microscopique, on peut toujours considérer que toutes les
interactions entre particules sont conservatives, et donc qu’il y a conservation globale
de l’énergie d’un système isolé. Les termes dissipatifs (frottements par exemple) ne
sont qu’une apparence macroscopique, liée au manque d’information sur la nature des
transferts d’énergie ; ainsi, si un piston frotte sur des parois et s’échauffe, il y a en
réalité conservation de l’énergie globale, les (( pertes par frottement )) étant simple-
ment transférées au niveau de l’augmentation d’agitation moléculaire des particules
constituant les systèmes qui s’échauffent.
L’énergie mécanique totale d’un système thermodynamique (Σ) formé de N particules
est défini, en mécanique classique et dans un référentiel (que nous supposerons ici
N
X 1
galiléen) R par E = Ec + Ep , avec pour énergie cinétique Ec = mi vi2 et pour
i=1
2
PN ¡
énergie potentielle Ep = i=1 eext int
¢
p,i + ep,i ; dans ces expressions, mi et vi désignent
la masse et la vitesse de la i-ème particule, qui interagit d’une part avec les N − 1
autres particules du système (énergie potentielle eint
p,i ) et d’autre part avec l’extérieur
du système (parois, force de gravitation, etc. ; énergie potentielle eext
p,i ).

Le théorème de Koenig permet alors de relier l’énergie cinétique totale Ec à l’énergie


potentielle Ec∗ du même système dans le référentiel barycentrique R∗ et à la vitesse vG
N
1 2
X
du centre d’inertie G de (Σ) relativement à R, selon Ec = Ec∗ + mvG où m = mi
2 i=1
est la masse totale de (Σ).
On choisit alors de décomposer l’énergie mécanique totale E en deux termes, l’un
relatif aux interactions internes du système dans le référentiel barycentrique, là où (Σ)
est globalement au repos, et l’autre relatif aux mouvements et interactions d’ensemble
du système :
248 Physique, MP, MP*

N µ ¶
1 1
mi vi∗ 2
X
2
E = U + mvG + Epext U= + eint
p,i (11.21)
2 i=1
2

Cette expression définit l’énergie interne U du système (Σ) ; le terme cinétique bary-
1
centrique mi vi∗ 2 dans cette expression qualifie l’agitation thermique, c’est-à-dire des
2
XN
mouvements en général désordonnés et de valeur moyenne vi∗ nulle, par construc-
i=1
tion même du référentiel barycentrique.
Les deux termes complémentaires dans l’expression de E décrivent d’une part l’énergie
1 2
cinétique mvG associée à une translation globale du système, par exemple lorsqu’il
2
N
X
est en écoulement, et ses interactions avec l’extérieur, décrites par Epext = eext
p,i .
i=1
Dans le cas où un système est globalement au repos et si ses interactions avec l’extérieur
sont négligeables (par exemple, si le système ne monte ni ne descend dans le champ
de pesanteur), l’énergie mécanique se réduit à l’énergie interne.
2 Modèle cinétique des gaz parfaits monoatomiques : considérons, comme modèle du
gaz parfait monoatomique, un ensemble de N particules ponctuelles, sans interactions
entre elles ou avec l’extérieur sauf aux instants des chocs des particules entre elles
ou sur les parois du système. Nous étudierons le mouvement du système dans son
référentiel barycentrique, supposé galiléen, de manière à évaluer son énergie interne
U , qui n’est alors rien d’autre que la somme de l’énergie cinétique des N particules
qui le composent.
Le système évoluant dans un espace borné (de volume V ), toutes les positions r∗i
des particules du système (dans le référentiel barycentrique) évoluent entre certaines
limites, et nous supposerons qu’il en va de même des vitesses vi∗ dans le même ré-
férentiel. On va s’intéresser aux corrélations entre mouvements en positions, décrites
X N
par le terme f (t) = mi r∗i · vi∗ .
i=1

Au vu des hypothèses précédentes, f (t) reste borné, mais évolue a priori très rapi-
dement au cours du temps, au rythme des mouvements et chocs des particules. Par
df 1 t0 +τ df
Z
contre, la moyenne de sa dérivée sur une durée τ vérifie = dt donc
dt τ t0 dt
df f (t0 + τ ) − f (t0 ) df
= ; si τ est assez grand, → 0.
dt τ dt
Si la durée τ représente l’ordre de grandeur d’une mesure macroscopique des propriétés
du système, on pourra considérer que τ est toujours nettement supérieur à toutes
les durées caractéristiques d’évolution de f (t) ; cette hypothèse revient à négliger, à
l’échelle macroscopique, les fluctuations des grandeurs statistiques du fait du grand
df
nombre de particules étudiées. Dans cette hypothèse, nous écrirons = 0.
dt
N N
df dv∗
mi vi∗ 2 +
X X
On peut alors calculer = r∗i · Fi , où Fi = mi i représente la
dt i=1 i=1
dt
force subie, à l’instant considéré, par la i-ème particule. Si on néglige les fluctuations
11 : Thermodynamique classique 249

temporelles des propriétés du système, son énergie interne se réduit à la moyenne


N N
1X 1X ∗
temporelle U = mi vi∗ 2 ; on en déduit aussitôt que U = − r · Fi .
2 i=1 2 i=1 i

Le terme Fi est, en dehors de toute interaction, nul lors de tout déplacement de


la particule i, sauf lorsque celle-ci subit un choc. S’il s’agit d’un choc entre deux
particules i et j à l’intérieur du système, r∗i = r∗j à la position du choc, tandis que
le principe des actions réciproques impose Fi = −Fj ; les termes de choc à l’intérieur
XN
du gaz s’éliminent donc automatiquement dans la somme r∗i · Fi . Il n’en va pas
i=1
de même lors des chocs sur les parois, les forces Fi étant alors toutes dirigées dans le
même sens, de la paroi vers l’intérieur du gaz.
Considérons alors les termes associés aux chocs qui se produisent, à un certain instant,
en un point r de la paroi du système. On peut alors écrire la contribution à l’énergie
1 X
interne de ces chocs sous la forme dU = − r · Fj , la somme portant ici seulement
2 j
sur les particules j qui subissent un choc sur l’élément dS de paroi. Orientant cet
élément
Pde paroi, d’aire dS et de normale n, vers l’extérieur du gaz, on peut alors
écrire j Fj = −pndS, par définition même de la pression p du gaz.
p
Il reste donc dU = r·ndS et, si on suppose le système à l’équilibre thermodynamique,
2
p
I
donc si sa pression p est uniforme, U = r·ndS, l’intégrale portant sur la surface
2 (S)
fermée (S) des parois qui limitent (Σ). L’application du théorèmeZ d’Ostrogradski
p
permet de transformer ce flux en une intégrale de volume, U = div rdτ . Un
2 (Σ)
calcul immédiat (par exemple en coordonnées cartésiennes) fournissant div r = 3, il
3
vient finalement U = pV .
2
La comparaison de cette propriété avec la définition de la température T du gaz parfait
3
impose U = nRT ; on retiendra donc dans ce cas l’expression valable pour les seuls
2
gaz parfaits monoatomiques :

3
UGPM (T ) = nRT (11.22)
2

2 Les lois de Joule : il est possible d’établir une généralisation de cette propriété
dans le cadre du théorème d’équipartition, qui affirme que les moyennes de termes
d’énergie quadratique ont tous même valeur ; cette propriété s’applique par exemple
1 1
aux énergies de translation mi vi2 ou de rotation Ji ωi2 , etc.
2 2
Un gaz parfait peut présenter seulement trois degrés de liberté associés aux trois
composantes de la vitesse vi (c’est le cas des gaz monoatomiques) mais il peut en
présenter d’autres, selon que des termes de rotation ou de vibration sont présents ; le
nombre δ de degrés de liberté de rotation dépend de la nature des molécules du gaz, et
de sa température qui permet ou non l’apparition de degrés de liberté supplémentaires,
liés aux mouvements de rotation ou de déformation des molécules.
250 Physique, MP, MP*

δ(T )
Nous retiendrons donc l’expression U (T ) = nRT , où l’étude de δ(T ) est en
2
général difficile et ne peut se faire de manière satisfaisante que dans le cadre de
l’étude quantique des oscillations moléculaires. En pratique, on se contente d’affirmer
les lois de Joule :

Première loi de Joule


X Pour un gaz parfait, l’énergie interne U (T ) n’est fonction que de la tem-
pérature T .

Du fait de l’équation d’état pV = nRT , l’expression de l’enthalpie H = U + pV


(nous rappellerons plus loin la justification de cette définition de H) devient aussi
H = U (T ) + nRT , donc :

Seconde loi de Joule


X Pour un gaz parfait, l’enthalpie H(T ) n’est fonction que de la tempéra-
ture T .

11.2.2 Travail, transfert thermique


2 Travail ; transfert thermique : les évolutions d’un système thermodynamique
(Σ) sont régies par le théorème de l’énergie mécanique dE = δWmacro + δWmicro ,
la variation de l’énergie mécanique totale du système étant la somme des travaux
(correspondant à des forces non prises en compte dans l’énergie potentielle extérieure)
reçus par le système ; on a distingué dans ces travaux ceux qui sont associés à des
évolutions de variables macroscopiques de ceux qui ne le sont pas.
On peut expliciter la différence entre ces deux types de travaux reçus en remarquant
N
X
que, dans l’expression général δWtotal = Fi ·dri , certaines forces ont une expression
i=1
macroscopique et un sens identique pour toutes les particules ; c’est par exemple le
cas des forces de pression exercées par un piston, ou des forces électriques exercées
par le champ E qui règne dans un conducteur électrique.
Dans le cas de ces forces macroscopiquement organisées, on peut espérer une mise en
N
X
facteur de la forme F · dri , et si un déplacement globale des particules est associé
i=1
à ces forces, on aura bien la possibilité d’exprimer le travail correspondant en fonction
de paramètres macroscopiques. Notant par exemple dri = drglobal + dri,agitation , on
XN
pourra par exemple identifier δWmacro = F · drglobal car dri,agitation = 0.
i=1

Le terme δWmacro prend en Thermodynamique le nom de travail reçu par le système


(Σ) et il sera simplement noté δW dans la suite.
Tous les autres termes, liés à des variables ne présentant pas de moyenne macrosco-
pique sensible, c’est-à-dire liés à des déplacements ou à des forces microscopiquement
dispersés, seront notés δWmicro ou δQ ; on les appelle transfert thermique reçu par le
système (Σ), où éventuellement chaleur reçue par (Σ).
L’énoncé du théorème de l’énergie mécanique pour une transformation infinitésimale
prend donc la forme :
11 : Thermodynamique classique 251

µ ¶
1 2
dE = d U + mvG + Epext = δW + δQ (11.23)
2

et on note l’intégrale de cette expression pour une transformation finie sous la forme :
µ ¶
1 2
∆E = ∆ U + mvG + Epext = W + Q (11.24)
2

Rappelons ici que les notations df et ∆f s’appliquent à des fonctions dépendant


seulement de l’état initial et final, tandis que l’emploi des formes δW et δQ ou
encore W et Q a pour but de rappeler que ces grandeurs dépendent aussi en général
de la nature de la transformation subie par (Σ). L’emploi incorrect de notations
inadaptées, comme dW au lieu de δW , ou encore ∆W au lieu de W , est une faute
grave (mais hélas courante) en Thermodynamique.

2 Lien avec les paramètres de contrainte : considérons un système déformable, c’est-


à-dire limité par une surface qui évolue au cours du temps (cf. figure 11.5). Les forces
de pression exercées sur cette surface ont donc la possibilité d’exercer un travail.

b
d S2 pext
dr
b

Figure 11.5 – Travail des forces de pression

Au cours d’un déplacement dr, les forces de pression extérieur exercées sur le système
exercent un travail (résistant si dr est de même sens que la normale n) donné par
dδW = −pext d2 Sn · dr sur l’aire élémentaire d2 S de la surface extérieure du sys-
tème (on remarquera les notations différentielles d pour le déplacement et d2 pour la
surface ; elles ont pour seul but de signaler que ces deux différentielles n’ont rien en
commun).
Puisqu’on reconnaı̂t dans d2 Sn · dr l’augmentation (algébrique) de volume dV (on
pourrait également la noter dτ ou encore d3 V ) correspondant à la surface élémentaire
d2 S, on peut écrire le travail fourni par les forces de pression au système (Σ) sous la
forme de l’intégrale de surface :
I
δW = −pext dV (11.25)
(S)

Dans le seul cas particulier où la pression extérieure a même valeur en tout point de la
surface (S) qui limite le système thermodynamique, cette expression prend la forme :

δW = −pext dV (11.26)
252 Physique, MP, MP*

Plus généralement, le travail reçu par un système thermodynamique de la part de


l’extérieur se met souvent sous la forme δW = Yext dX, où X est une variable extensive
d’état du système (Σ), et Y un paramètre intensif dont la valeur à l’extérieur du
système Yext constitue un paramètre de contrainte. On peut citer le travail des forces
électriques (en convention des récepteurs) δW = eext dq, le travail d’une force de
traction δW = Fext dℓ, etc.
Le couple de variables (Y, X) porte le nom de variables conjuguées. On notera que,
dans le cas des forces de pression, les variables conjuguées sont (−p, V ).
2 Cas de l’équilibre local : on s’intéresse souvent aux transformations au cours
desquelles les paramètres de contrainte extérieurs imposés au système sont en perma-
nence égaux aux paramètres intérieurs au système au niveau de la frontière, du fait
de l’équilibre local du système avec son environnement.
Ainsi, l’équilibre mécanique local impose p = pext en tout point de la surface (S)
entourant le système (Σ) étudié ; un équilibre thermique local imposerait de même
T = Text en tout point de (S). Remarquons que cette notion n’impose absolument
pas que la pression p ou la température T corresponde à un équilibre en tout point
intérieur au système (Σ) ; celui-ci peut même subir, loin à l’intérieur de la surface (S),
des évolutions complexes ne permettant pas de définir une pression ou une température
unique en chaque point.
La description proposée ici s’applique donc bien aux machines thermiques en écoule-
ment (turbines, etc.) pour lesquelles le régime d’écoulement est celui de l’équilibre à
la surface extérieure du système, mais pas forcément à l’intérieur.
Dans ce cas, le travail des forces de pression peut s’écrire :
I
Équilibre mécanique local : δW = − p d3 V (11.27)
(S)

avec d3 V = d2 Sn · dr ; cette intégrale doit être évaluée en prenant en compte les


valeurs de la pression aux divers points de la surface (S) qui limite le système étudié :
la pression n’est a priori pas uniforme.
Si p est uniforme, on obtient l’expression plus simple :

Équilibre mécanique local, p uniforme : δW = −p dV (11.28)

Si au contraire p n’est pas uniforme, on


I peut se rappeler que, selon (11.4), le flux des
grandeurs convectées s’exprime selon xV v · ndS ; si on s’intéresse à un système
(S)
fermé, ses limites se déplacent en même temps que le mouvement d’ensemble du fluide
3 2
et dr = vdt
I donc d V = d Sv·ndt et le travail (11.27) s’écrit comme un flux convecté,
δW = − p (v · n) d2 S × dt.
(S)

On définira alors la puissance mécanique reçue par le système en équilibre mécanique


δW
local de la part des forces de pression par la relation Pp,éq.local = , ce qui permet
dt
d’y reconnaı̂tre l’opposé d’un flux convecté, la grandeur volumique xV étant la pression
p et donc la grandeur massique associée x étant le quotient p/ρ. On obtient donc les
deux expressions équivalentes de la puissance des forces de pression dans le cas d’un
système en équilibre local :
11 : Thermodynamique classique 253

p
I I
Pp,éq.local = − p (v · n) dS = − dDm (11.29)
(S) (S) ρ

en fonction du débit de masse dDm sortant de la surface dS. Rappelons ici que le
débit de masse est défini pour la totalité du système par la relation (11.5).
2 Évolutions quasi-statiques : on donne parfois ce nom aux transformations d’un
système pour lequel les paramètres de contrainte extérieurs sont en permanence égaux
aux paramètres correspondants, en tout point intérieur au système. Le système est
alors en équilibre en tout point, et l’évolution du système est donc infiniment lente.
Une transformation quasi-statique est donc forcément aussi un équilibre local, et la
relation (11.28) s’applique, on écrira alors δWqs = −pdV . Toutefois, pour des raisons
qui apparaı̂tront progressivement par la suite, nous préférerons l’expression réversi-
bilité mécanique pour décrire le caractère quasi-statique d’une transformation. On
réécrira donc l’expression (11.28) sous la forme :

δWrév.méca = −p dV (11.30)

11.2.3 Énoncé du principe


2 Le premier principe : la relation dE = δW + δQ (qui devient dU = δW + δQ si
on peut négliger l’énergie cinétique globale de translation et l’énergie potentielle du
système) ne constitue rien d’autre qu’une application statistique immédiate d’une loi
microscopique (le théorème de l’énergie mécanique) à un système thermodynamique.
1 2
Dans cette expression, l’énergie mécanique E = U + mvG + Epext sont a priori fonc-
2
tion du microétat µ, c’est-à-dire de l’ensemble des coordonnées et des vitesses des
N particules du système (Σ) étudié. Nous admettrons donc le premier principe qui
affirme que, si deux microétats µ1 et µ2 correspondent aux mêmes valeurs macrosco-
piques des variables d’état (V , p, T , etc.), donc au même macroétat M, alors l’énergie
E et l’énergie interne U reprennent la même valeur, bien que les deux situations
microscopiques puissent être totalement différentes.

Premier principe de la Thermodynamique


X Les valeurs de l’énergie interne U et de l’énergie mécanique E d’un sys-
tème thermodynamique sont des fonctions d’état extensives, c’est-à-dire
que leurs valeurs ne dépendent que des variables d’état macroscopiques
du système ; U et E varient de plus proportionnellement à la quantité
de matière n.

En particulier dans le cas d’un système simple (décrit par les seules variables p, V , T
et n), et fermé (à quantité de matière n constante), l’existence d’une relation d’état
(liant p, V et T ) permet d’écrire U = U (T, V ) par exemple.
2 Détente de Joule, Gay–Lussac : l’établissement des fonctions U (T, V ) peut se faire
sur la base de l’étude expérimentale de cette détente dans le vide, réalisée conformé-
ment à la figure 11.6 ; le fluide étudié est séparé d’un espace vide par une paroi. Cette
paroi peut être supprimée sans apport de travail mécanique (il s’agit par exemple
d’une feuille de plastique que l’on brise) ce qui amène le fluide à occuper un volume
final V ′ > V après la détente.
254 Physique, MP, MP*

vide

fluide, V , T

Figure 11.6 – Détente de Joule, Gay–Lussac

En l’absence de tout travail mécanique, W = 0 (les parois extérieures étant indéfor-


mables, aucune force ne peut exercer de travail) ; de plus, si les parois de l’ensemble
sont bien isolées thermiquement (on parle de parois adiabatiques, Q = 0 donc ∆U = 0
si on néglige les variations d’énergie potentielle (par exemple de pesanteur) lors de la
détente.
Finalement, la relation U (V, T ) = U (V ′ , T ′ ) et la mesure de T ′ permet de déterminer
expérimentalement les variations de U en fonction du volume V et de la température
T . En particulier, l’étude de cette détente dans le cas des gaz réels sous faible pression
mène à T ′ ≃ T quel que soit V ′ . On retrouve ici l’expression de la première loi de
Joule, U n’étant fonction que de T pour un gaz parfait ; si U est maintenu constant,
il en va de même de T .
La méthode permet, dans le cadre de mesures précises, d’évaluer l’écart de compor-
tement entre gaz réels et gaz parfaits ; on peut en particulier proposer, sur la base de
transformations de ce type, des équations d’état alternatives pour le comportement
des fluides réels. L’équation d’état des gaz de Van der Waals en est un exemple :

n2 a
µ ¶ µ ¶
a
p+ 2 (vm − b) = RT p+ 2 (V − nb) = nRT (11.31)
vm V

2 Calorimétrie : l’existence de la fonction,


µ ¶ au moinsµ implicite,
¶ U (T, V ) des deux
∂U ∂U
variables V et T permet d’écrire dU = dT + dV ; comme les trans-
∂T V ∂V T
formations quasi-statiques d’un système simple homogène (donc à pression uniforme)
vérifient de plus δWrév.méca = −pdV , on en déduit qu’on peut de plus écrire :

δQrév.méca = CV dT + ℓdV (11.32)

où on a défini les coefficients calorimétriques


µ ¶CV et ℓ, qui sont à leur tour des fonctions
∂U
d’état, avec pour expressions ℓ = p + et :
∂V T

µ ¶
∂U
CV = (11.33)
∂T V
11 : Thermodynamique classique 255

Le coefficient CV porte le nom de capacité thermique isochore ; c’est une grandeur


extensive à laquelle on associe les grandeurs massique cV et molaire cV,m . Le coefficient
ℓ porte le nom de chaleur latente d’augmentation de volume ; c’est une grandeur
intensive, dont l’étude générale est hors programme.
Certains problèmes de Thermodynamique formelle portent sur l’étude générale des
propriétés des coefficients CV et ℓ, à partir des expressions analytiques des deux
principes, sous la forme du théorème de Schwartz pour l’égalité des dérivées secondes
∂ ∂U ∂ ∂U
partielles croisées de fonctions de deux variables, à savoir = ou encore
∂T ∂V ∂V ∂T
∂(ℓ − p) ∂CV
= pour ce qui concerne le premier principe. Ce type de problème est
∂T ∂V
a priori hors programme.
2 Enthalpie : considérons le cas d’une transformation monobare, pour laquelle on
peut écrire δW = −pext dV si le système n’est soumis qu’aux forces de pression. On
peut alors écrire δQ = dU + pext dV = dH ∗ où on a défini le potentiel enthalpique
H ∗ = U + pext V , en profitant de la circonstance pext = Cte ; ce n’est pas une fonction
d’état puisqu’il dépend de l’extérieur du système étudié.
Toutefois, pour une transformation complète, la relation Q = ∆H ∗ qui en découle
s’écrit aussi Q = ∆H où on a défini la fonction d’état enthalpie H = U + pV ; en
effet, les valeurs initiale et finale de p lors d’une évolution monobare sont égales à
pext . Finalement, la relation :

Qmonobare = ∆H (11.34)

se compare utilement sur le plan théorique à Qisochore = ∆U , tout en ayant une


importance pratique bien supérieure, du fait du caractère courant des transformations
monobares. On peut aussi écrire dH = dU + pdV + V dp ou, pour une transformation
quasi-statique d’un système simple homogène, δQqs = dH − V dp, ce qui permet de
définir une deuxième série de coefficients calorimériques :

δQrév.méca = Cp dT + kdp (11.35)

µ ¶
∂H
qui sont encore des fonctions d’état, avec pour expressions k = −V + et :
∂p T
µ ¶
∂H
Cp = (11.36)
∂T p

Cp porte le nom de capacité thermique isobare ; c’est une grandeur extensive à laquelle
on associe les grandeurs massique cp et molaire cp,m .
Le coefficient k porte le nom de chaleur latente d’augmentation de pression ; c’est
une grandeur intensive, régie là aussi par
µ des relations
¶ issuesµ de
¶ l’étude formelle de
∂(k + V ) ∂Cp
la fonction H(p, T ), avec en particulier = . L’étude générale
∂T p ∂p T
de k et de ces relations est hors programme ; elles n’apportent d’ailleurs rien d’autre
que les mêmes relations que celles fournies à partir de l’étude du coefficient ℓ puisque
le passage U → H, très utile sur le plan pratique, ne constitue qu’un changement de
variable sur le plan mathématique.
On définit enfin le rapport (intensif) des capacités thermiques :
256 Physique, MP, MP*

Cp cp
γ= = (11.37)
CV cV

On peut en général montrer que, pour des raisons de stabilité thermodynamique, tout
système macroscopique à l’équilibre vérifie Cp > 0, CV > 0 et γ > 1 soit Cp > CV .
2 Le cas des gaz parfaits : l’application des deux lois de Joule montre
µ ¶que U et
∂U
H ne dépendent que de T , on en déduit immédiatement les relations = 0 et
µ ¶ ∂V T
∂H
= 0 ou encore ℓ = p et k = −V ; on réécrira ces résultats :
∂p T


dU
 U = U (T ) CV (T ) = δQqs = CV dT + pdV


dT

GP : (11.38)

 dH
 H = H(T )
 Cp (T ) = δQqs = Cp dT − V dp
dT

Comme de plus H − U = nRT , on en déduit immédiatement la relation de Mayer,


Cp − CV = nR ; on peut donc exprimer Cp et CV en fonction de n, R et γ soit, sous
forme massique :

γ(T )r r
GP : cp (T ) = cv (T ) = (11.39)
γ(T ) − 1 γ(T ) − 1

où on rappelle l’expression r = R/M de la constante massique des gaz parfaits pour
une masse molaire M.
Dans le cas des gaz monoatomiques, on a vu qu’en présence des seuls trois degrés de
liberté de translation on peut écrire u(T ) = 3/2rT donc cV = 3r/2, cp = 5r/2 et
γGP monoat. = 5/3 ≃ 1, 67. Dans le cas des gaz polyatomiques, γ(T ) dépend en général
explicitement de la température ; toutefois, dans le domaine, souvent assez vaste, où
on peut ne prendre en compte que les cinq degrés de liberté de translation et rotation
des molécules diatomiques, on aura u(T ) ≃ 5/2rT donc γGP diat. ≃ 7/5 ≃ 1, 40.
2 Le cas des phases condensées : les liquides et solides présentant en général des
volumes faibles devant ceux des gaz, le terme pV et ses variations sont souvent nu-
mériquement négligeables devant les variations de U et donc de H, ce qui permet
d’écrire, par exemple en notations massiques :

uph. cond. ≃ hph. cond. cp ≃ cV (11.40)

et on utilisera souvent la notation c pour désigner indifféremment les capacités ther-


miques massiques isochore et isobare.

11.3 Le second principe

11.3.1 Évolutions spontanées

2 Évolutions spontanées : considérons le système thermodynamique fermé et isolé


représenté sur la figure 11.7, formé de deux compartiments séparés par un piston ;
11 : Thermodynamique classique 257

les deux fluides situés de part et d’autre du piston sont caractérisés par les énergies
internes U1 et U2 , les températures T1 et T2 , les pressions p1 et p2 et les quantités de
matière n1 et n2 .

U1 , T1 , p1 , n1 U2 , T2 , p2 , n2

Figure 11.7 – Un système fermé et isolé à deux compartiments

Ce système n’est en général ni à l’équilibre thermique (si T1 6= T2 ) ni à l’équilibre


mécanique (si p1 6= p2 ) ; il peut donc évoluer par transfert thermique (sauf si le piston
est isolé) ou par déplacement du piston (sauf s’il est fixé).
Toutes les évolutions de ce système doivent assurer la conservation des grandeurs
extensives U1 + U2 , n1 + n2 et V1 + V2 ; toutefois, cette loi de conservation n’est pas
suffisante pour prévoir le sens effectif de l’évolution.
Si on suppose par exemple que T1 > T2 dans l’état initial, on constate toujours
que l’évolution se fait (pour un piston fixe mais perméable aux échanges thermiques,
c’est-à-dire diathermane) de sorte que l’équilibre thermique se fasse progressivement :
après une évolution de durée quelconque, T1′ < T1 et T2′ > T2 mais aussi U1′ < U1 et
U2′ > U2 : le transfert d’énergie s’est fait du système le plus chaud vers le plus froid.
Lorsque l’évolution est terminée, T1′ = T2′ et l’équilibre thermique est réalisé.
Pourtant, la seule loi de conservation n’est pas suffisante pour prévoir ce sens d’évolu-
tion puisque les transformations (U1 , U2 ) → (U1′ , U2′ ) et (U1′ , U2′ ) → (U1 , U2 ) vérifient
toutes les deux les lois de conservation. L’une des transformations est effectivement
observable, l’autre pas.
Il s’agit d’un effet purement statistique puisqu’on pourrait observer formellement l’in-
version du sens de n’importe quelle transformation par changement du sens d’écou-
lement du temps ; il suffirait en principe de figer le système, de changer le sens de
chaque vitesse de chaque particule sans la déplacer, pour observer le retour vers l’état
initial au bout de la même durée que celle de la transformation directe.
C’est seulement la très faible probabilité de réaliser de telles conditions initiales (( exac-
tement inversées )) qui garantit qu’on n’observe jamais certaines transformations mais
toujours leurs inverses. On dira donc que les évolutions spontanées des systèmes ther-
modynamiques se font dans un sens toujours prévisible, mais qui ne peut être prévu
à partir des seules lois de conservation (dont fait partie le premier principe de la
Thermodynamique).
2 Réversibilité : les transformations réelles, comme celles auxquelles on peut s’at-
tendre si on libère les contraintes mécaniques ou thermiques au niveau du piston de la
figure 11.7, se font en général dans un sens unique et prévisible : il s’agit de transfor-
mations irréversibles. Toute transformation causée par un déséquilibre (mécanique,
thermique, etc.) est nécessairement irréversible.
Au contraire, on parlera de transformations réversibles pour désigner la limite (théo-
rique) de transformations pouvant s’effectuer indifféremment dans un sens ou dans
un autre ; une première condition nécessaire pour qu’une telle réversibilité puisse se
258 Physique, MP, MP*

manifester est que la transformation doit parcourir une suite continue d’états d’équi-
libre : une transformation réversible est forcément mécaniquement réversible, ou si on
préfère forcément quasi-statique.
Cette condition n’est cependant pas suffisante ; on peut par exemple imaginer que le
piston de la figure 11.7 soit soumis à des forces de frottement, même pour une trans-
formation très lente. Dans ce cas, le piston restera immobile tant que |p2 − p1 | S 6 f ,
si S est la surface du piston et f la norme maximale de la force de frottement. Ainsi, le
piston se déplacera vers la droite si p1 > p2 + f /s, et vers la gauche si p1 < p2 − f /S ;
le changement de sens de l’évolution exige ainsi une variation finie ∆p1 = 2f /S de la
pression. On généralise cet exemple en définissant de manière générale les transfor-
mations réversibles :
Transformations réversibles
X Une évolution d’un système thermodynamique est dite réversible si elle
est constituée d’une suite continue d’états d’équilibre (transformation
quasi-statique, parcourue de manière infiniment lente) dont on peut
changer le sens d’évolution par une modification infinitésimale des para-
mètres de contrainte.

11.3.2 Énoncé du principe


2 Sens d’évolution lors des transformations spontanées : pour rendre compte de
l’existence de transformations spontanées, donc irréversibles, se produisant dans un
sens prévisible, nous allons affirmer le second principe de la Thermodynamique sous
une forme analogue à l’énoncé du premier principe, c’est-à-dire en recherchant une
fonction d’état extensive.
Pour rendre compte du rôle fondamental du caractère statistique de l’irréversibilité,
on précise son lien avec les échanges d’énergie microscopiques (transferts thermiques
δQ), alors que les échanges d’énergie liés à des variables macroscopiques (transferts
de travail δW ) ne sont pas des causes d’irréversibilité. On cherche donc une fonction
d’état S qui, au contraire de U , n’est pas invariante par changement de sens des
évolutions irréversibles ; ce n’est donc pas une grandeur conservée. Nous adoptons la
formulation axiomatique suivante :

Second principe de la Thermodynamique


X Tout système thermodynamique est caractérisé par une fonction d’état
extensive appelée entropie S, qui vérifie les trois propriétés :
• Lors d’une évolution spontanée (irréversible) d’un système thermody-
namique, les variations de S ont une double origine :

dS = δStransféré + δScréé

Dans cette expression, δScréé > 0 par convention tandis que δStransféré est
lié seulement aux transferts thermiques et en particulier δStransféré = 0
pour une transformation adiabatique (δQ = 0).
• S est une fonction croissante de la température à volume fixé.

On remarquera bien que, conformément aux conventions générales de la Thermody-


namique, le terme transféré utilisé pour δStransféré désigne l’entropie transférée vers
le système depuis l’extérieur de celui-ci, lors des transferts thermiques algébrisés de
la même manière.
11 : Thermodynamique classique 259

On remarquera les notations différentielles dS, δStransféré et δScréé ; elles signalent


que S est une fonction d’état, mais que ses variations se décomposent en deux termes,
transféré et créé, qui dépendent du choix de chemin utilisé pour transformer le système
d’un état initial donné à un état final donné ; les termes transféré et créé ne sont pas
des fonctions d’état. Pour la même raison, on écrira ∆S = Stransféré + Scréé pour une
transformation finie.
De cet énoncé, on peut tirer quelques conséquences immédiates :
• une transformation réversible pouvant être effectuée indifféremment dans un sens ou
dans l’autre avec dans chaque cas création d’entropie, on aura à la fois Scréé > 0

pour la transformation directe, et Scréé = −Scréé > 0 pour la transformation
réversible
inverse ; finalement Scréé = 0 : une transformation réversible ne crée pas
d’entropie, elle en transfert seulement ;
• pour une transformation adiabatique (en particulier pour un système isolé) Stransféré
est obligatoirement nul : ∆Sadiabatique = Scréé > 0 et ∆Sisolé = Scréé > 0 ;
• dans les deux inégalités ci-dessus, le cas de l’égalité à zéro correspond aux trans-
formations réversibles et les cas de l’inégalité stricte aux transformations ré-
versibles ; en particulier, S augmente toujours lors d’une évolution spontanée
(irréversible) d’un système isolé : dSisolé > 0 ;
• au contraire, S reste constante lors d’une évolution réversible d’un système isolé ou
au moins thermiquement isolé : une adiabatique réversible est une isentropique.

La propriété (dSisolé > 0) ne doit surtout pas être généralisée : l’entropie S d’un
système n’augmente pas forcément si le système n’est pas isolé car tout dépend
alors du sens des évolutions imposées par les contraintes extérieures au système.

2 Pression et température thermodynamique : l’entropie S étant une fonction d’état,


on peut, pour un système fermé simple, la considérer comme une fonction de deux
quelconques des variables d’état d’un tel
µ système
¶ ; nous choisirons
µ ¶ de définir les gran-
1 ∂S ∂S
deurs T̄ et p̄ par les relations = et p̄ = T̄ , considérant ainsi
T̄ ∂U V ∂V U
S somme une fonction des variables U et V , et définissant au passage la pression
thermodynamique p̄ et la température thermodynamique T̄ .
Nous montrerons ultérieurement que T̄ = T et p̄ = p, mais jusqu’à cette démonstration
nous conserverons provisoirement les écritures p̄ et T̄ , pour écrire les deux formes de
l’identité thermodynamique :

dU + p̄dV
dS = ou dU = T̄ dS − p̄dV (11.41)

2 Pression cinétique et pression thermodynamique : considérons une transformation


adiabatique réversible ; on sait alors d’une part que dS = 0 (par définition même de
S) et d’autre part que dU = δW = −pdV (puisqu’une transformation réversible est
aussi mécaniquement réversible, c’est-à-dire quasi-statique), ce qui permet d’affirmer
que p̄ = p.
La pression cinétique peut donc être identifiée à la pression thermodynamique, ce que
nous ferons systématiquement dans la suite en adoptant la notation unique :
µ ¶
∂U
p=− (11.42)
∂S V
260 Physique, MP, MP*

2 Entropie transférée : considérons maintenant le cas d’un système non isolé, mais
échangeant de l’énergie avec un thermostat (E) de température fixée T̄E . La réunion
du système (Σ) et du thermostat (E) formant un système isolé, on pourra écrire
dSΣ + dSE > 0, l’égalité désignant le cas des seules transformations réversibles.
Un thermostat est, par définition, un système dont la quantité de matière est suffisante
pour que, quelles que soient ses évolutions, sa température reste quasiment constante
tandis qu’il n’échange de l’énergie que sous forme thermique. Du fait de sa très grande
extension, toute évolution d’un thermostat est réversible ; on peut donc écrire δWE ≃ 0
donc dVE ≃ 0 soit encore dUE = T̄E dSE .
L’ensemble formé de (Σ) et (E) est isolé donc l’application du premier principe mène
à dUΣ +dUE = 0 ; ces deux termes mesurent d’ailleurs le transfert thermique δQΣ reçu
par le système (Σ) de la part du thermostat (E) sous la forme δQ = dUΣ = −dUE . On
δQΣ
peut donc écrire le second principe sous la forme dSΣ − > 0. Cette somme me-
T̄E
surant le degré d’irréversibilité de l’évolution envisagée, on l’identifie immédiatement
à l’entropie créée par l’évolution. Finalement, avec des notations plus générales :

δQ
δStransféré = (11.43)
T̄ext

Dans le cas d’un système effectuant une évolution finie en contact avec un ou plusieurs
thermostats, on peut encore écrire ∆S = Stransféré + Scréé
Z , où Scréé > 0 est la création
δQ
totale d’entropie due à cette évolution, et Stransféré = . Dans le cas particulier
T̄ext
d’une évolution cyclique, l’état final et l’état initial sont identiques donc ∆S = 0 et
la relation prend le nom d’inégalité de Clausius :

δQ
I
∆Scycle = 0 ⇒ = −Scréé 6 0 (11.44)
T̄ext

11.3.3 Calculs d’entropie


2 Principe : le calcul de l’entropie de peut s’effectuer qu’à une constante additive
arbitraire près, puisque S n’est définie que par ses variations. Le choix de l’origine
des entropies est donc toujours conventionnel. On calculera donc toujours S − S0
pour la différence entre l’entropie d’un état E et l’entropie de référence S0 d’un état
de référence S0 , en imaginant un chemin réversible menant de E à E0 ; en effet, les
variations d’une fonction d’état ne dépendent pas du chemin particulier choisi pour
réaliser l’évolution, mais seulement des états extrêmes.
Lors d’une telle évolution réversible, l’équilibre thermique impose à tout instant de
l’évolution T̄ = T̄ext et, puisque δScréé = 0, on peut écrire :

E0
δQrév
Z
S − S0 = (11.45)
E T̄

2 Cas des gaz parfaits : dans le cas des gaz parfaits, on a vu qu’il est possible d’écrire
deux expressions de δQ selon (11.38) ; on aura alors, en fonction des variables T̄ et V
11 : Thermodynamique classique 261

CV (T̄ ) nR
d’abord, δQrév = CV (T̄ )dT̄ +pdV donc dS = dT̄ + dV ; l’intégration depuis
T̄ V
l’état de référence (V0 , T̄0 ) jusqu’à un état arbitraire (V, T̄ ) se fait en deux temps, par
variations réversibles successives de T̄ (à V constant) puis de V (à T constant), pour
Z T̄
CV (T̄ ) V
obtenir S − S0 = dT + nR ln . Dans le cas particulier (fréquent) où γ
T̄0 T V 0
est constant, on peut réécrire cette expression :

· ¸
1 T̄ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.46)
γ − 1 T̄0 V0

Le même calcul, mené à partir de δQrév = Cp (T̄ )dT̄ − V dp, mène par des voies
Z T̄
Cp (T̄ ) p
analogues à l’expression S − S0 = dT − nR ln ou, si γ est constant :
T̄0 T p 0

· ¸
γ T̄ p
γ = Cte ⇒ SGP − S0 = nR ln − ln (11.47)
γ − 1 T̄0 p0

Enfin, l’emploi de la relation T = pV /nR permet de montrer aisément la troisième


forme pratique de l’entropie des gaz parfaits si γ est constant :

· ¸
1 p γ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.48)
γ − 1 p0 γ − 1 V0

pV γ
La dernière expression (11.48) peut être recopiée SGP − S0 = CV ln . Une évo-
p0 V0γ
lution adiabatique réversible (donc isentropique) vérifie donc une des trois relations
de Laplace T̄ × V γ−1 = Cte, T̄ γ × p1−γ = Cte′ ou p × V γ = Cte′′ .

On retiendra les quatre conditions nécessaires à l’application d’une des relations de


Laplace : on doit étudier un gaz parfait, en évolution adiabatique et réversible au
cours de laquelle γ reste constant.

2 Généralisation : les calculs d’entropie pour un système quelconque peuvent se


faire en imaginant une évolution réversible menant de l’état initial à l’état final, avant
Z f Z f
δQrév
d’écrire Sf − Si = dS = .
i i T

On peut aussi utiliser les identités thermodynamiques, comme (11.41) ou celle qu’on
en déduit en écrivant H = U + pV donc dH = dU + pdV + V dp ; on obtient alors le
couple d’identités commodes pour le calcul de dS donc de Sf − Si :

dU = T̄ dS − pdV dH = T̄ dS + V dp (11.49)
262 Physique, MP, MP*

11.4 Machines thermiques

11.4.1 Cycles dithermes


2 Nomenclature : une machine thermique (Σ) effectue un cycle ditherme si elle
effectue des transformations cycliques en contact énergétique avec seulement deux
thermostats (ou sources thermiques) aux températures T̄1 et T̄2 , supposées constantes
au moins au cours d’un cycle. Dans la suite, nous supposerons T̄1 > T̄2 ; le transfert
reçu par la machine (Σ) sera noté Q1 (de la part de la source chaude) et Q2 (de la
part de la source froide) ; en plus, la machine (Σ) reçoit un travail W au cours du
même cycle.

Les grandeurs W , Q1 et Q2 sont évidemment algébriques. Elles permettent une clas-


sification des machines cycliques dithermes, parmi lesquelles nous ne retiendrons que
celles qui présentent une utilité concrète.

Si W < 0, Q1 > 0 et Q2 < 0, la machine reçoit de l’énergie thermique d’une source


chaude (par exemple la combustion d’un carburant), en cède à une source froide (au
niveau d’un système de refroidissement) et sous forme mécanique à l’extérieur ; c’est
−W
un moteur thermique ditherme, de rendement η = ;
Q1
Si W > 0, Q1 < 0 et Q2 > 0, la machine utilise un travail (mécanique ou électrique)
pour inverser le sens naturel des échanges thermiques entre les deux thermostats,
prélevant de la chaleur à la source la plus froide pour en céder à la plus chaude. Selon
le cas, on parle :
– de réfrigérateur ou de climatiseur ditherme, si le but de l’opération est de refroidir
Q2
la source froide ; dans ce cas, on définit l’efficacité de l’appareil par ǫR = ;
W
– de pompe à chaleur ditherme, si le but de l’opération est de réchauffer la source
−Q1
chaude ; dans ce cas, on définit l’efficacité de l’appareil par ǫP = .
W
2 Théorèmes de Carnot : pour un cycle ditherme, on peut écrire l’expression du
premier principe pour un cycle de la machine (Σ) sous la forme ∆Ucycle = 0 donc
encore W + Q1 + Q2 = 0, tandis que le second principe s’exprime par l’inégalité de
Q1 Q2
Clausius + 6 0 ; on en déduit sans difficulté les valeurs maximales possibles
T1 T2
pour les rendement ou efficacité des machines ditherme, sous la triple forme :

T̄2 T̄2 T̄1


η 6 η∗ = 1 − ǫR 6 ǫ∗R = ǫP 6 ǫ∗P = (11.50)
T̄1 T̄1 − T̄2 T̄1 − T̄2

Dans chaque cas, la transformation (( idéale )) correspondant au rendement ou à l’effi-


cacité maximal est une transformation réversible, qui porte le nom de cycle de Carnot.
Dans un tel cycle, les évolutions se font soit en contact avec une des deux sources
thermiques T̄i (et la réversibilité impose alors à la transformation d’être isotherme :
T̄ = T̄i ) soit avec changement de température (et la réversibilité impose alors à la
transformation d’être adiabatique). Un cycle de Carnot minimal est donc formé de
deux transformations isothermes réversibles complété de deux transformations adia-
batiques réversibles.
11 : Thermodynamique classique 263

Les cycles de Carnot ne constituent qu’une idéalisation correspondant à un fonction-


nement infiniment lent ; ils n’ont donc pas de réalisation pratique et les cycles réels
sont toujours moins performants que les cycles de Carnot. Profitons seulement pour
rappeler, à l’occasion de cette définition, l’énorme erreur qui consisterait à confondre
évolutions adiabatique ou isotherme : pour réaliser une évolution isotherme, on doit
imposer le contact thermique avec un thermostat et une telle évolution ne peut
jamais être celle d’un système isolé.

2 Température du gaz parfait et température thermodynamique : on peut représenter


un cycle de Carnot dans le cas d’un machine formée d’un gaz parfait ; en effet, γ > 1
et les courbes adiabatiques d’équation p × V γ = Cte ont en tout point une pente
plus élevée que les isothermes. L’allure, hors échelle, de ce cycle dans le diagramme
de Clapeyron p = p(V ) est reportéI sur la figure 11.8. Le sens ABCDA des évolutions
y est choisi de sorte que W = − pdV < 0 et il s’agit donc d’un moteur.

p
ibsoth
C e rme r
éversi
ble, T¯
= T¯1
ad

bD
ia b

ad
at
iq u

ia b
e

at
ré

iq u
v.

b v.
ré

B isother bA
m e rév., T¯
= T¯2 V

Figure 11.8 – Moteur de Carnot d’un gaz parfait

Même si ce schéma représente le summum de l’idéalisation (il n’existe ni gaz parfaits


ni cycles de Carnot. . . ), on peut en déduire une propriété importante en effectuant
un calcul direct du rendement, sans application du second principe. On peut en effet
Q2
écrire W +Q1 +Q2 = 0 donc −η +1+ = 0 ; les transferts thermiques Qi le long des
Q1
isothermes T̄i peuvent être Zcalculés selon dU = 0 = δW +δQ (pour une transformation
isotherme) donc Qi = − pi dVi ; utilisant la définition de la température du gaz
pi V i VC VA
parfait Ti = , on en déduit Q1 = nRT1 ln et Q2 = nRT2 ln .
nR VD VB
Enfin, une transformation adiabatique vérifie, toujours en fonction de la température
nR nR nRT
du gaz parfait, dU = δW ou encore dT = −pdV soit dT = − dV
γ−1 γ−1 V
γ−1
qui s’intègre en T × V = Cte, relation obtenue sans utilisation de la température
VC VA T2
thermodynamique. On a donc ln = − ln donc enfin η = 1 − .
VD VB T1
T2 T̄2
La comparaison des deux expressions du rendement du cycle moteur impose = ,
T1 T̄1
ce qui impose l’égalité des températures T et T̄ sous réserve d’un choix commun de
l’origine des températures, avec par exemple la valeur Tpt = T̄pt = 273, 16 K pour le
point triple de l’eau.
264 Physique, MP, MP*

Dans toute la suite, nous noterons T la température définie indifféremment par les
deux expressions, correspondant au thermomètre à gaz parfait et à la définition ther-
modynamique :
µ ¶ µ ¶
pV ∂U
T = lim = (11.51)
gaz,p→0 nR ∂S V

11.4.2 Systèmes ouverts


2 Expression générale du premier principe : on considère le système thermodyna-
mique (Σ) délimité par la surface géométriquement fermée mais non nécessairement
matérielle (S) ; l’exemple de la figure 11.9 représente un système comportant une zone
d’entrée et deux zones de sortie à travers lesquelles s’écoulent des débits de matière,
comptés positivement dans le sens de la sortie, avec donc Dm1 < 0, Dm2 > 0 et
Dm3 > 0.

2
Dm
(S)

D m1

δQ Dm
3

Figure 11.9 – Système ouvert en écoulement

Considérons alors le système formé des N particules qui, à l’instant t, sont contenues
à l’intérieur de la surface (S) ; à cet instant, leur énergie peut être notée ES (t). À
l’instant t + dt, certaines de ces particules sont encore à l’intérieur de la surface (S)
et l’énergie de ces particules est E(S) (t + dt) ; d’autres sont sorties de cette surface et
leur énergie, comptée algébriquement, est celle I sortie entre t et t + dt, égale donc à
l’énergie convectée DE × dt soit, suivant (11.4), eV v · ndS × dt, où on peut aussi
(S) µ ¶
1
écrire la densité volumique d’énergie totale eV sous la forme eV = ρ u + v 2 + eext p ,
2
fonction des grandeurs massiques u et eext p .

Le premier principe de la Thermodynamique permet alors d’évaluer la variation


d’énergie de ce système, fermé car comportant un nombre fixe de particules, sous
la forme dE = E(S) (t + dt) + DE dt" − E(S) (t) = δW + δQ, où #on remarque que
∂e
Z Z I
E(S) (t) = e(t)dm et donc dE = dm + eV v · ndS dt = δW + δQ.
(V ) (V ) ∂t (S)

Utilisantµl’expression dD¶m = ρvI· ndSµ du débit massique


¶ à travers dS, on écrit encore
∂ 1 2 1 2 δW δQ
Z
ext ext
u + v + ep dτ + u + v + ep dDm = + .
(V ) ∂t 2 (S) 2 dt dt
Dans cette expression, δQ = Ptherm dt où Ptherm est la puissance thermique transférée
au système (S) à travers ses parois, tandis que le travail δW fait apparaı̂tre le travail
(11.29) des forces de pression, plus le travail mécanique (( utile )), autre que des forces
11 : Thermodynamique classique 265

p
I
de pression. Le travail des forces de pression est une intégrale de surface − dDm ,
(S) ρ
p
qui se regroupe avec l’énergie interne massique puisque u + = h ; quant au travail
ρ
mécanique utile, fourni par exemple par les pièces mécaniques mobiles situées dans la
machine, on l’écrira δWutile = Putile dt. On regroupe enfin l’ensemble de ces expressions
sous la forme générale :
µ ¶
∂E 1
I
+ h + v 2 + eext
p dDm = Putile + Ptherm (11.52)
∂t (S) 2

en accompagnant cette expression de la loi de conservation de la matière :

∂M
I
+ dDm = 0 dDm = ρv · ndS (11.53)
∂t (S)

2 Cas des écoulements permanents : dans ce cas particulier important, on pourra


∂E ∂M
écrire = 0 et = 0 ; de plus, les intégrales de surface de (11.52) et (11.53) sont
∂t ∂t
en fait des sommes portant sur un petit nombre d’éléments de surface parcourus de
flux de masse algébriques, comme sur la figure 11.9 qui en comporte trois.
Le premier principe et la loi de conservation de la masse deviennent alors :

µ ¶
X 1 X
Dm,i hi + vi2 + eext
p,i = Putile + Ptherm Dm,i = 0 (11.54)
i
2 i

On peut par exemple considérer le cas particulier de la détente de Joule-Thomson,


réalisée en régime permanent dans un système calorifugé (donc Ptherm = 0) sans
aucune pièce mécanique mobile (donc Putile = 0), avec une zone d’entrée (débit de
masse Dm,1 = −Dm < 0) et une zone de sortie (débit de masse Dm,2 = +Dm > 0).
1 1 2
On obtient alors la relation h1 + v12 + eext ext
p,1 = h2 + v2 + ep,2 .
2 2
Si on peut négliger les variations d’énergie cinétique et potentielle, on en déduit encore
h1 = h2 : la détente de Joule-Thomson à faible vitesse et sans variation d’altitude est
en général isenthalpique. Dans le cas d’un gaz parfait, elle est donc aussi isotherme.
266 Physique, MP, MP*

Ce qu’il faut absolument savoir

µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− et χT = . Dans le champ de pesanteur, grad p = ρg.
ρ ∂T p ρ ∂p T

Pour tous les gaz réels, on a le comportement limite à basse pression pM = ρRT
ou p = ρrT : c’est le gaz parfait avec α = 1/T et χT = 1/p.
Les variables extensives X sont définies
Z par une intégrale dans le volume inté-
rieur à la surface de contrôle, X = xdm avec dm = ρdτ .
(Σ)

Le débit de X sortant
I de (Σ) est un flux à travers la surface (S) fermée qui
limite (Σ), DX = jX ·n→ext dS, avec jX = ρxv. Le théorème d’Ostrogradski
I (S) Z
affirme W · n→ext dS = div Wdτ .
(S) (Σ)
∂ρ
Pour une grandeur conservée (masse, charge électrique, etc.), div (ρv)+ = 0.
∂t
Le premier principe affirme l’existence d’une fonction d’état extensive U telle
1 2
que la somme E = U + mvG +Epext vérifie le théorème de l’énergie mécanique,
2
dE = δW + δQ ou encore ∆E = W + Q. On a en général δW = −pext dV , en
en particulier δW = −pdV en cas de réversibilité mécanique.
µ ¶ µ ¶
∂U ∂H
On définit aussi H = U + pV , CV = et Cp = et γ = Cp /CV .
∂T V ∂T p
Dans le cas d’un
µ système ouvert¶ en écoulement, ce principe prend la forme
∂E X 1 2 ext
+ Dmi hi + vi + Ep,i = Putile + Ptherm .
∂t 2
Le second principe affirme l’existence d’une fonction d’état extensive S, non
conservée, dont les variations comportent un terme d’échange et un terme de
création : dS = δStransféré + δScréé ou ∆S = Stransféré + Scréé , avec δScréé > 0,
δQ
l’égalité correspondant aux transformations réversibles, et δStransféré = .
Tsource
On peut calculer S en utilisant dU = T dS − pdV ou dH = T dS + V dp. On
peut aussi imaginer un chemin réversible menant de l’état initial à l’état final
Z f
δQrév
et écrire Sf − Si = .
i T
δQi
I
Pour une transformation cyclique polytherme, = −Scréé 6 0 (inégalité
Ti
de Clausius) ; on en déduit les théorèmes de Carnot (rendement et efficacités
limites pour les cycles dithermes moteur, réfrigérateur et pompe à chaleur).
∂u ∂h
Pour un gaz parfait, cV = et cp = (Joule) et cp − cV = R (Mayer)
∂T ∂T
pV γ
donc cp = γR/(γ − 1) et cv = R/(γ − 1). On a aussi S − S0 = CV ln si
p0 V0γ
γ = Cte. Relations de Laplace, pV γ = Cte, T V γ−1 = Cte′ et p1−γ T γ = Cte′′
sous 4 conditions (GP, adiabatique, réversible, γ constant).
Chapitre 12

Thermochimie

Ce chapitre est consacré aux applications du premier principe de la Thermodynamique


aux évolutions de systèmes formés d’un mélange de plusieurs espèces, en particulier
dans le cas des réactions chimiques : on parle de Thermochimie.

12.1 Description énergétique d’un mélange

12.1.1 Description d’un mélange


2 Mélange et variables de Gibbs : un mélange est un système thermodynamique
formé d’au moins deux types d’entités microscopiques (molécules, ions) différentes.
Ce mélange peut être obtenu à partir de ses constituants par la simple ouverture
de robinets : c’est l’opération de mixage, qui aboutit au mélange, résultat de cette
évolution évidemment irréversible. La figure 12.1 représente un dispositif de mixage
permettant de former, à volume total constant, le mélange de deux constituants A1 et
A2 pris initialement sous la même température et sous la même pression ; on généralise
immédiatement le procédé au cas de plus de deux constituants.

R
gaz 1 gaz 2
n1 , T , p, V1 n2 , T , p, V2

Figure 12.1 – Mixage à volume total constant

L’opération de mixage de la figure 12.1 est supposée réalisée à volume extérieur


constant (on néglige ici le volume dégagé par l’ouverture du robinet R) et à travers des
parois calorifugées : le système ne reçoit donc ni travail ni transfert thermique exté-
rieur et le mixage se fait à énergie interne constante, ∆U = 0 donc Umélange = U1 +U2 .
Par contre, l’opération de mixage est a priori irréversible ; s’agissant d’une transfor-
mation adiabatique, on peut en déduire que ∆S > 0. Les conséquences du second
principe sur une telle opération étant plus complexes que celles du premier principe,
on les étudiera ultérieurement.
268 Physique, MP, MP*

2 Mélange idéal de gaz parfaits : on dit que le résultat du mixage réalisé sur la
figure 12.1 est un mélange idéal de gaz parfaits si :
• les deux gaz A1 et A2 formaient, avant le mélange, deux gaz parfaits ;
• le résultat de l’opération de mixage est aussi un gaz parfait ;
• après mixage, la pression p et la température T du mélange ont même valeur
qu’avant le mixage.
n1 n2
Dans ce mélange, on note x1 = et x2 = les fractions molaires des
n1 + n2 n1 + n2
deux constituants du mélange, ainsi que p1 = x1 p et p2 = x2 p les pressions partielles
n1 RT
de ces deux constituants. En remarquant par exemple que p1 = , on remarque
V
que p1 et p2 sont les pressions qu’exerceraient les gaz A1 et A2 s’ils occupaient, seuls, le
volume total V du mélange à la température T . Plus généralement, nous retiendrons :
 X
 xi = 1
n(Ai ) 
i
pi = xi p où xi = donc X (12.1)
ntotal 
 pi = p
i

X
La relation p = pi porte parfois le nom (historique) de loi de Dalton.
i

12.1.2 Propriétés énergétiques des mélanges


2 Mélange idéal de gaz parfaits : après l’opération de mixage de la figure 12.1,
∆U = 0 ; comme d’autre part p n’a pas varié, et puisque Vmélange = V1 + V2 , on peut
écrire Hmélange = Umélange + p(V1 + V2 ) tandis que H1 = U1 + pV1 et H2 = U2 + pV2 ,
d’où enfin :
X X
Hmélange = Hi Umélange = Ui (12.2)
i i

2 Lien avec le modèle microscopique du gaz parfait : dans le cadre de ce modèle,


faisons l’hypothèse supplémentaire que les molécules des gaz A1 et A2 , qui sont sans
interactions intermoléculaires avant le mixage, le restent après celui-ci. Alors, ces
molécules, ponctuelles, forment par construction un gaz parfait : c’est la première des
conditions qui définit un mélange idéal.
3 3
On a alors, dans le cadre de ce modèle, U1 = n1 RT et U2 = n2 RT , on déduit de
2 2
3
∆U = 0 que Umélange = U1 + U2 = nRTmélange . Comme enfin n = n1 + n2 , on doit
2
donc avoir Tmélange = T ; c’est la deuxième de ces conditions.
Enfin, les équations d’état pV1 = n1 RT , pV2 = n2 RT et pmélange (V1 + V2 ) = nRT dé-
duites du modèle cinétique du gaz parfait imposent bien pmélange = p ; cette troisième
condition étant vérifiée, tout mélange de deux gaz parfaits sans interaction est, dans
le cadre du modèle du gaz parfait, un mélange idéal.
On peut encore dire que l’environnement des molécules individuelles du gaz n’a changé
que par l’augmentation du volume ; l’équilibre thermique avec les parois impose tou-
1 3
jours la même énergie cinétique moyenne mi u∗i 2 = kB T pour toutes les molécules
2 2
12 : Thermochimie 269

(mi = m1 ou m2 ) ; par contre, le volume du gaz ayant augmenté, la pression exercée


N1
par l’ensemble des molécules du gaz A1 a chuté de p = kB T avant le mixage à
V1
N1
p1 = kB T < p après celui-ci ; c’est la présence des deux gaz A1 et A2 qui assure la
V
constance de la pression totale p = p1 + p2 .
Nous verrons ultérieurement comment l’augmentation du volume offert aux molécules
de chaque constituant du gaz explique aussi la forte augmentation d’entropie qui
accompagne ce mixage irréversible.
2 Généralisation : lors du mélange idéal de deux (ou plusieurs) gaz parfaits, T ne
varie pas, donc H ne varie pas, tout comme U ; on peut donc écrire les relations :

X X
Hmélange idéal (T ) = ni hi,m (T ) Umélange idéal (T ) = ni ui,m (T ) (12.3)
i i

où ui,m et hi,m représente l’énergie interne molaire et l’enthalpie molaire du i-ème
constituant du mélange, calculée comme si ce constituant était seul dans les mêmes
conditions de température.
2 Mélange réel : dans le cas d’un mélange réel de gaz, l’enthalpie du mélange comme
les enthalpies molaires des divers constituants dépendent un peu de la pression ; nous
poserons donc, pour un mélange quelconque :
X
Umélange (T, p, ni ) = ni ui,m (T, pi ) + ∆Umixage (12.4)
i

ainsi que la relation en théorie équivalente mais en général plus utile en pratique :
X
Hmélange (T, p, ni ) = ni hi,m (T, pi ) + ∆Hmixage (12.5)
i

Dans cette équation, les ui,m (T, pi ) et hi,m (T, pi ) sont les énergies internes et enthal-
pies molaires des constituants Ai du mélange, déterminées pour des corps purs, à la
température T du mélange et déterminées comme si la pression du corps pur était
précisément la pression partielle qu’il exerce dans le mélange.
Les grandeurs ∆Umixage et ∆Hmixage désignent donc les variations d’énergie interne et
d’enthalpie lors de l’opération de mixage. Nous les négligerons souvent dans la suite.

12.2 La réaction chimique

12.2.1 Description des réactions chimiques


2 Stœchiométrie : une réaction chimique est une transformation qui s’accompagne
d’une réorganisation des liaisons interatomiques, mais avec conservation de la ma-
tière : le nombre et la liste des atomes sont inchangés, alors que certains édifices
polyatomiques (molécules, ions, etc.) disparaissent et d’autres apparaissent. Toute ré-
action chimique est donc d’abord décrite par son bilan, faisant apparaı̂tre les relations
stœchiométriques entre quantités de réactifs disparus et quantités de produits formés.
On notera en général ce bilan :
270 Physique, MP, MP*


X X νréactifs < 0
νi Ai ⇋ 0 ou bien νi Ai = 0 avec (12.6)
νproduits > 0
i i

Le choix des coefficients stœchiométriques est relativement arbitraires puisqu’on


peut tous les multiplier par une même constante sans changer la signification du
bilan (12.6) ; on prend souvent un jeu d’entiers minimal mais même cette convention
de lève pas l’indétermination (on peut changer tous les signes et permuter le rôle
des réactifs et des produits). Toutes les grandeurs extensives étant liées au choix de
la stœchiométrie, on prendra garde à ne pas modifier le choix initial des coefficients
stœchiométriques une fois qu’il a été effectué.
Notons que certaines transformations physiques peuvent être décrites dans le voca-
bulaire des réactions chimiques ; on peut ainsi formellement décrire l’ébullition d’une
espèce A comme la transformation Aliquide ⇋ Avapeur , avec les coefficients stœchiomé-
triques νliquide = −1 et νvapeur = +1.

2 Avancement : la conservation des espèces exige que la variation dni de la quantité


de matière ni de l’espèce Ai vérifie la relation générale :

dni
= dξ ∀i (12.7)
νi

ce qui définit une caractéristique quantitative unique de l’état d’avancement de la


réaction chimique, appelé avancement ξ. C’est une grandeur extensive, mesurée en
mol, qui est définie seulement à une constante près ; on choisit souvent ξ = 0 au
moment où la réaction débute, avec les quantités de matière ni (0) = ni0 , ce qui
permet d’écrire :

ni (t) − ni0
= ξ(t) ∀i (12.8)
νi

à un instant t quelconque au cours de la réaction. Notons qu’avec un tel choix d’origine


ξ(t) peut parfaitement être négatif ; par contre, on doit évidemment avoir ni (t) > 0
pour tout i.

Si à partir d’un certain moment ni (t) = 0, on dit que l’équilibre chimique est rompu
par disparition du réactif limitant Ai .

Si au cours du temps ξ(t) augmente, on dit que l’équilibre chimique progresse (ou
progresse dans le sens ) ; si au contraire ξ(t) diminue, l’équilibre chimique régresse
(ou progresse dans le sens ) ; enfin, si ξ(t) reste constant sans que l’équilibre soit
rompu, on dira que l’état d’équilibre est atteint.

L’évolution vers cet état d’équilibre est, rappelons le, régie par les lois de la cinétique
chimique, en termes de vitesse de réaction. On définit celle-ci par la relation générale :

1 dξ 1 d [Ai ]
v= = (12.9)
V dt νi dt
12 : Thermochimie 271

2 Évolution des grandeurs extensives : considérons une grandeur extensive quel-


conque X définie pour le système thermodynamique constitué des ni moles des es-
pèces Ai (plus les éventuelles espèces chimiques ne participant pas au bilan : solvant,
etc.). La grandeur X est a priori fonction de la composition chimique du système,
donc des variables ni , mais aussi de la température T et de la pression p ; on écrira
donc X = X(T, p, ni ).
Les évolutionsde Xdépendent  desvariations de la température et de la pression, donc
∂X ∂X
des dérivées et ; ces deux dérivées, calculées à composition
∂T p,ni ∂p T,ni
chimique constante, relèvent de l’étude des systèmes fermés et ne sont pas liées à
l’évolution de la réaction.
Par contre, au fur et à mesure de cette évolution, les quantités de matière ni évoluent
toutes selon dni = νi dξ, et la fonction X évolue
 aussi ; la relation
  générale(différen-

∂X ∂X ∂X
tielle totale d’une fonction d’état) dX = dT + dp + dξ
∂T p,ξ ∂p T,ξ ∂ξ T,p
 
∂X
devient ici dX = dξ à T et p constants.
∂ξ T,p
 
X ∂X
La même expression de dX s’écrit aussi dX = dni si on consi-
i
∂ni T,p,nj (j6=i)
dère X comme une fonction
 des variables T , p et nj ; puisque dni = νi dξ, on en déduit
∂X X  ∂X 
= νi . L’ensemble des variations de X de nature pro-
∂ξ T,p i
∂ni T,p,nj (j6=i)
prement chimique est lié à la valeur de cette dérivée partielle, que l’on appellera
(( grandeur de réaction )).
On utilise pour cette dérivée deux notations, la seconde (qui peut prêter à confusion)
porte le nom de notation de Lewis :
 
∂X
= ∆r X(T, p, ξ) (12.10)
∂ξ T,p

Comme on l’a noté explicitement dans l’écriture (12.10), la grandeur de réaction est
en général une fonction de T , de p, et de la composition chimique du système donc,
pour un état initial donné, de l’avancement ξ de la réaction.
 
∂H
On définit ainsi l’enthalpie de réaction ∆r H = , l’énergie de réaction
∂ξ T,p
   
∂U ∂S
∆r U = ou l’entropie de réaction ∆r S = .
∂ξ T,p ∂ξ T,p
2 Variation des grandeurs extensives : considérons une réaction chimique évoluant
d’un état initial ξ = 0 jusqu’à un certain état final ξ = ξf , qui peut être l’équi-
libre chimique, ou sa rupture en présence d’un réactif limitant, ou encore un arrêt
provoqué par l’opérateur (trempe par refroidissement brutal, etc.) La grandeur ther-
modynamique extensive X varie alors, entre l’état initial et l’état final, d’une grandeur
∆X = Xf − Xi .

Malgré la similitude des notations, on ne doit en aucun cas confondre ∆X et ∆r X.


Le premier terme ∆X est une variation, extensive, de la fonction d’état ; elle ne
272 Physique, MP, MP*

 ∂X dans l’unité de X, par


dépend que de l’état initial et de l’état final. ∆X se mesure
exemple ∆H se mesure en J. Au contraire, ∆r X = est une grandeur
∂ξ T,p
instantanée, intensive, qui dépend de l’instant particulier en cours d’évolution. ∆r X
se mesure dans l’unité de X divisée par l’unité de quantité de matière, par exemple
∆r H se mesure en J · mol−1 .
Lors d’une réaction menée à température etpression
 constantes, on peut évaluer la
Z f Z f
∂X
variation de la grandeur X selon ∆X = dξ = ∆r X(T, p, ξ)dξ.
i ∂ξ T,p i

2 Cas des mélanges quasi-idéaux : la relation (12.5) Xmontre, si on peut négliger


l’enthalpie de mixage, la relation Hmélange (T, p, ni ) ≃ ni hi,m (T, pi ) ; cette rela-
i
tion est d’ailleurs exacte dans le cas d’un mélange idéal.
 Le milieuXréactionnel étant
∂H dni
précisément un mélange, on peut, dans ce cas, écrire ≃ hi,m (T, pi ).
∂ξ T,p i

D’autre part, la relation (12.7) montre que toutes les variations des quantités de
dni
matière ni sont reliées par = νi , d’où encore :

 
∂H X
mélanges quasi-idéaux : ∆r H = ≃ νi hi,m (T, pi ) (12.11)
∂ξ T,p i

Cette dérivée étant


 ici indépendante de ξ, l’intégration est immédiate pour trouver
Z ξ
∂H
∆H = dξ ′ lors d’une évolution monotherme et monobare entre l’état
0 ∂ξ ′ T,p
initial (T, p, ξ = 0) et l’état final (T, p, ξ) étudié, il vient :
 
∂H
mélanges quasi-idéaux : ∆H ≃ ξ × ∆r H = ξ × (12.12)
∂ξ T,p

12.2.2 Chaleurs de réaction


2 Chaleurs monobares : considérons un système thermodynamique en évolution
monobare. On sait que, si ce système est fermé, le premier principe s’écrit Qp = ∆H ;
cette grandeur est le transfert thermique reçu par le système au cours de la réaction.
Si la réaction est menée de plus à la température constante T (ou si au moins la
température finale est égale à la température initiale), cette grandeur Qp = ∆H
porte aussi le nom de chaleur de réaction monobare.
Si Qp = ∆H < 0, cela signifie que le système a du recevoir Qp < 0, c’est-à-dire
encore fournir à l’extérieur −Qp > 0 pour conserver une température constante. Cet
excès d’énergie qui a du être évacué pour éviter une augmentation de la température
provient bien sûr du déroulement de la réaction chimique, et on dira :

Réactions exothermiques et endothermiques


X Si Qp = ∆H < 0 lors d’une réaction monobare monotherme, la réaction
est dite exothermique.
Si Qp = ∆H > 0 lors d’une réaction monobare monotherme, la réaction
est dite endothermique.
12 : Thermochimie 273

Enfin, si Qp = ∆H = 0 lors d’une réaction monobare monotherme, la réaction est


dite athermique ; cette situation ne peut être qu’exceptionnelle ou approchée.
On traite souvent le cas des réactions monobares car il est le plus facile à réaliser ; il
suffit par exemple que le réacteur soit, en fin comme en début de réaction, soumis à la
pression atmosphérique. Toutefois, on connaı̂t aussi des réactions menées en réacteurs
fermés indilatables, c’est-à-dire dans des conditions isochores.
2 Chaleurs isochores : considérons maintenant un système thermodynamique en
évolution isochore ; on sait que le premier principe s’écrit alors QV = ∆U . Si la
réaction est menée de plus à la température constante T , cette grandeur QV = ∆U
porte aussi le nom de chaleur de réaction isochore.
Comme précédemment, on pourra classer les réactions chimiques en fonction du signe
de QV = ∆U ; toutefois, la classification a moins d’importance en pratique que celle
basée sur le signe de Qp = ∆H :
• si QV = ∆U < 0 lors d’une réaction isochore monotherme, la réaction est dite
exo-énergétique ;
• si QV = ∆U > 0 lors d’une réaction isochore monotherme, la réaction est dite
endo-énergétique ;

2 Lien entre les chaleurs de réaction : puisque H = U + pV , on peut encore


écrire ∆H = ∆U + ∆(pV ) pour n’importe quelle transformation. On peut toutefois
remarquer que, le volume des phases condensées (solides et liquides) étant en général
négligeables, il n’y a de différence significative entre U et H que pour les seules phases
gazeuses. On peut donc proposer une comparaison entre ∆H, variation d’enthalpie
lors de la réaction monobare monotherme, et ∆U , variation d’énergie interne lors de la
réaction isochore monotherme, si l’état initial et l’état final ont la même composition.

∆H ′ = ∆U + (p′ − p)V
iso-V , mono-T État final ξ
p′ , T, V
État initial ξ = 0
p, T, V
État final ξ
∆H p, T, V ′ ∆HT
mono-p et T iso-composition

Figure 12.2 – Lien entre les chaleurs de réaction

Sur la figure 12.2, la réaction isochore monotherme est caractérisée par QV = ∆U


et donc par ∆H = ∆U + (p′ − p)V puisque, à volume et composition constantes,
la pression peut varier. La réaction monobare monotherme est, elle, caractérisée par
Qp = ∆H. On peut compléter un cycle de transformations en envisageant une com-
pression ou une détente isotherme, à composition constante, caractérisée par la varia-
tion d’enthalpie ∆HT .
Si le système à l’état final est formé d’un gaz parfait, ∆HT = 0 à cause de la seconde
loi de Joule ; sinon, on considère en général en première approximation que ∆HT
est négligeable devant les diverses grandeurs de réaction, ce qui permet d’écrire enfin
∆H ≃ ∆U + (p′ − p)V .
274 Physique, MP, MP*

Comme ce volume V est en général essentiellement celui des phases gazeuses, on peut
encore écrire pV ≃ ngaz ′ gaz
initial RT et p V ≃ nfinal RT , en assimilant les gaz du milieu
réactionnel à des gaz parfaits ; il vient donc :

Qp = ∆H ≃ QV + ∆ngaz RT = ∆U + ∆ngaz RT (12.13)

si les chaleurs de réaction isobare Qp et isochore Qp sont évaluées à la même tempé-


rature T , et si ∆ngaz est la variation de la quantité de matière des gaz au cours de la
réaction chimique.
Prenons l’exemple de la réaction de combustion totale de l’acétylène C2 H2 , réalisée en
phase gazeuse dans l’air, de bilan 2C2 H2 + 5O2 ⇋ 4CO2 + 2H2 O. Cette réaction étant
pratiquement totale, on l’étudie dans l’air à partir de 2 mol d’acétylène et 30 mol d’air
représentant 6 mol d’oxygène, pour obtenir en fin de réaction 1 mol d’oxygène, 4 mol
de dioxyde de carbone et 2 mol de vapeur d’eau (l’azote de l’air n’est pas concerné
par le bilan). On a donc ici ∆ngaz = −1 mol. Si on réalise la réaction à 298 K, il vient
∆ngaz RT = −2, 5 kJ, écart très faible entre Qp et QV puisqu’on peut estimer à cette
température Qp ≃ −2, 51 × 103 kJ ≃ QV pour cette réaction qui est donc à la fois
fortement exothermique et exo-énergétique.

12.3 Tables thermodynamiques

12.3.1 Réaction de référence


2 Importance : la détermination de ∆H = Qp ou de ∆U = QV se fait en général à
partir de tables thermodynamiques relatives aux réactifs et produits pris séparément.
L’existence de telles tables découle essentiellement de la loi de Hess, dont la formula-
tion historique (qui date de ) est la suivante : (( la chaleur dégagée ou absorbée
par une réaction chimique est la même, que la réaction procède en une seule étape ou
en plusieurs étapes successives )) ; on parle encore de loi de sommation constante des
chaleurs de réaction.
La décomposition en processus consécutifs évoquée ci-dessus prend, pour ce qui nous
concerne, la forme de l’étude des réactions de référence, et en particulier des réac-
tions de formation ; comme nous le verrons, l’importance de ces définitions dépasse
largement le cadre de la seule Thermochimie.
2 Conditions standard : on parle de conditions standard pour un corps pur pris
isolément (et non pas dans un mélange) sous la pression standard p◦ = 1 bar.
On notera que la notion de condition standard ne fait pas mention d’une valeur
particulière de la température. Les choix couramment faits (T = 273 K = 0 ◦ C, ou
encore T = 298 K = 25 ◦ C) ne sont que des choix usuels qui n’ont pas de caractère
obligatoire. On parlera donc éventuellement de conditions standard à la température
T pour préciser que le ou les corps étudiés le sont à cette température.
Lorsqu’on parle d’un ensemble d’espèces chimiques Ai prises dans les conditions stan-
dard, il faut comprendre qu’il s’agit de la réunion (( par la pensée )) de corps purs,
isolés, pris chacun dans l’état standard.
X
2 La réaction de référence : considérons une réaction chimique de bilan Ai ⇋ 0,
i
menée à partir de conditions initiales quelconques, et en particulier à partir d’un
mélange pouvant contenir des réactifs (coefficients stœchiométriques νr < 0) mais
12 : Thermochimie 275

aussi des produits (coefficients stœchiométriques νp > 0) en proportion quelconque.


Si cette réaction est menée à la température T , on lui associe la réaction de référence,
transformation fictive pour laquelle :
• l’état initial est constitué des seuls réactifs, pris dans leur état standard (purs, isolés,
sous p◦ = 1 bar), en proportions stœchiométriques (donc avec les quantités de
matière nr = |νr |) ;
• l’état final est constitué des seuls produits, pris dans leur état standard (purs, isolés,
sous p◦ = 1 bar), en proportions stœchiométriques (donc avec les quantités de
matière np = νp ) ;
• l’état initial comme l’état final sont définis à la même température T .

Pour réaliser cette transformation, on doit donc (cf. figure 12.3 dans le cas de la
réaction Fe3 O4solide + COgaz ⇋ 3FeOsolide + CO2gaz ), à partir de l’état initial, réaliser
le mélange, s’assurer que la réaction est bien totale, puis séparer les produits d’arrivée
et les ramener à la température de départ, sous la pression standard. Il n’est pas
toujours simple de réaliser cette transformation en pratique mais nous l’utiliserons
essentiellement pour des raisons théoriques.

Fe3 O4 CO Réaction de référence FeO CO2


1 mol 1 mol T = Cte, p = p ◦ 3 mol 1 mol

réaction réelle totale


mélange séparation

Figure 12.3 – Réaction standard pour la réduction de Fe3 O4 en FeO

La réaction de référence porte aussi le nom de réaction standard associée à la réaction


chimique réelle étudiée.

2 Grandeurs extensives standard : pour la réaction de référence, on définit les


grandeurs standard de réaction par la relation ∆r X ◦ (T ) = Xfinal − Xinitial , les états
initial et final étant ceux de la réaction standard. Par construction, ces grandeurs ne
dépendent que de T puisque la pression est ici fixée à p◦ et les états initial et final
parfaitement définis.

Les quantités de matière dans l’état initial et final étant les nombres purs νi (et non
pas des quantités de matière en mol), il est logique d’exprimer l’unité de ∆r X ◦ (T )
dans l’unité de X divisée par l’unité de quantité de matière ; on peut aussi dire que
∆r X ◦ (T ) est une grandeur intensive puisque rapportée à des quantités de matière
conventionnelles, et non pas à des quantités de matière réelles.

Ce caractère intensif ne doit pas faire oublier que, par définition même de la réaction
standard, ∆r X ◦ (T ) dépend de la définition des coefficients stœchiométriques ; ainsi,
1 3
si on étudie la synthèse de l’ammoniac par mole d’ammoniac N2 + H2 ⇋ NH3 ,
2 2
on trouve ∆r H ◦ (298 K) = −46 kJ · mol−1 , tandis que si on choisit un systèmes
de coefficients stœchiométriques entiers minimal, N2 + 3H2 ⇋ 2NH3 , on trouve
∆r H ◦ (298 K) = −92 kJ · mol−1 .
276 Physique, MP, MP*

On définit ainsi l’énergie de réaction standard ∆r U ◦ (T ), l’enthalpie de réaction stan-


dard ∆r H ◦ (T ) (ces deux grandeurs s’expriment en J · mol−1 , ou plus couramment en
kJ · mol−1 ) et l’entropie de réaction standard ∆r S ◦ (T ) (exprimée en J · K−1 · mol−1 ).

L’oubli du facteur 103 dans la conversion des kJ · mol−1 en J · mol−1 est une cause
d’erreur un peu ridicule mais hélas fréquente.
Comme nous le verrons progressivement ici et plus tard lors de l’étude des lois de
l’équilibre chimique, les grandeurs de réaction de référence ∆r X ◦ (T ) peuvent faire
l’objet d’une mesure expérimentale.

12.3.2 Calcul des chaleurs de réaction


2 Réaction réelle et réaction de référence : supposant qu’on sache déterminer
∆r H ◦ (T ) pour une réaction de référence menée à la température T , on peut se de-
mander comment relier cette grandeur à la chaleur de réaction réelle Qp = ∆H pour
le même bilan, dans le cas de la réaction chimique réelle, monobare et monotherme.
X
Les relations ∆H ≃ ξ∆r H et ∆r H = νi hi,m résultent d’une double approxi-
i
mation : négliger l’enthalpie de mixage et considérer le mélange comme idéal pour
pouvoir affirmer l’additivité de l’enthalpie dans un mélange. Dans le cas de la réac-
tion de référence, ces deux approximations ne sont plus nécessaires :
• dans la réaction de référence, il n’y a jamais de mélange car les réactifs comme les
produits sont séparés ;
• dans la réaction de référence, il y exactement addition des enthalpies puisque le
système initial comme le système final sont des juxtapositions d’espèces séparées.
Enfin, lors de la réaction de référence, les proportions étant stœchiométriques en début
comme en fin de réaction, la relation ni = ni0 +νi ξ montre que l’état initial correspond
bien sûr à ξ = 0 (ni = ni0 pour les réactifs) et l’état final correspond à ξ = 1 (ni = νi
pour les produits). Dans ce cadre, on a exactement :

X
∆r H ◦ (T ) = νi hi,m (T, pi ) (12.14)
i

2 Calcul des chaleurs de réaction : la comparaison de (12.11), (12.12) et (12.14) per-


met d’écrire en général l’expression de la chaleur de réaction monobare monotherme :

Qp = ∆H ≃ ξ × ∆r H ◦ (T ) (12.15)

On remarque que, dans cette approximation, la chaleur de réaction isobare ne dépend


pas de la pression, le calcul de ∆r H ◦ (T ) étant par hypothèse effectué à p = p◦ = 1 bar.
La figure 12.4 illustre les approximations effectuées pour le calcul de Qp proposé en
(12.15) : on néglige les enthalpies de mixage et on suppose l’addition des enthalpies
des espèces isolées pour déterminer l’enthalpie du mélange. La figure est tracée dans
le cas d’une transformation exothermique (Qp < 0) ; le mixage initial et final (qui
permettrait de passer des réactifs ou produits séparés au mélange effectif formant le
milieu réactionnel) sont aussi supposés exothermiques.
12 : Thermochimie 277

H m désigne un mixage
b
idéa

ξfinal × ∆r H ◦
m lisa
b tion
:Q
≃ξ

∆r H ◦
p
Qp = ∆r H ∆r H
0
tran
s form
atio b
n ré
elle, m
Qp b
b ξ
b b b
0 ξfinal 1

Figure 12.4 – Approximations pour le calcul de Qp

12.3.3 Réaction de formation

2 État standard d’un élément : considérons un réactif (ou un produit) formé d’un
corps composé comme l’oxyde de fer Fe3 O4 envisagé plus haut. Il s’agit d’un corps
composé puisque l’espèce est formée de deux éléments chimiques, l’élément fer et
l’élément oxygène.

On appelle état standard d’un élément à la température T la forme la plus stable de


cet élément à la température T et sous la pression standard p◦ . Par exemple, l’état
standard de l’élément oxygène à 298 K est le gaz O2gaz (et non pas le gaz moléculaire
O, l’ozone O3 ou le dioxygène liquide) ; de même, l’état standard de l’élément fer à la
même température est le fer solide Fesolide .

2 La réaction de formation : on appelle réaction de formation d’une espèce chimique


donnée, à la température T , la réaction de référence conduisant à cette espèce à partir
des corps simples (éléments pris dans leur état standard). Le tableau 12.1 propose
quelques exemples de réactions de formation.

Espèce chimique Réaction de formation associée


Fe3 O4 solide 3Fesolide + 2O2 gaz ⇋ Fe3 O4 solide
1
FeOsolide Fesolide + O2gaz ⇋ FeOsolide
2
1
H2 Oliquide H2gaz + O2gaz ⇋ H2 Oliquide
2
1
H2 Ogaz H2 gaz + O2 gaz ⇋ H2 Ogaz
2
Hgliquide Hgliquide ⇋ Hgliquide

Table 12.1 – Réactions de formation à 298 K (soit 25 ◦ C)

On remarque (par exemple dans le cas de la dernière ligne du tableau 12.1) que,
si l’espèce étudiée est précisément la forme stable d’un corps simple, la réaction de
formation se réduit à l’identité.

On appelle alors grandeur de formation d’une espèce chimique la grandeur Xf◦ (T )


égale à la variation de la grandeur X lors de la réaction de formation de cette espèce :
Xf◦ (T ) = ∆r X ◦ (T, réaction de formation). Il s’agit, par construction, d’une fonction
seulement de la température ; des tables thermodynamiques permettent de déterminer
ces grandeurs de formation, au moins à une certaine température.
278 Physique, MP, MP*

Le tableau 12.2 propose un extrait de telles tables thermodynamiques, présentant des


valeurs d’enthalpies de formation pour certaines espèces chimiques.

Espèce Hf◦ (298 K), kJ · mol−1 Espèce Hf◦ (298 K), kJ · mol−1
AgClsolide −127, 1 AgClgaz 97, 23
Cl2gaz Cl aq −167, 5
O2 gaz O3 gaz 142, 3
H2 Ogaz −241, 9 H2 Oliquide −286, 0
NH4 aq −132, 8 H aq 0

Table 12.2 – Enthalpies de formation

On notera :
• que l’enthalpie de formation de deux espèces dans deux états physiques différents
est en général différente ;
• que certaines valeurs sont absentes ; il s’agit en fait de valeurs nulles correspondant
à des espèces formées d’un corps simple dans son état standard ;
• que l’ordre de grandeur est en général quelques dizaines ou centaines de kilojoule
par mole ; un signe négatif accompagne la plupart des enthalpies de formation
des espèces stables.
On remarque aussi que ces enthalpies de formation sont définies pour des espèces
ioniques en solution aqueuse ; comme la formation d’une telle espèce isolée n’est pas
possible (un réacteur restant électriquement neutre au cours de la réaction), ces gran-
deurs font l’objet d’une convention supplémentaire : l’enthalpie de formation de l’ion
H aq est nulle à toute température.
On appelle ainsi enthalpie de formation de Cl aq l’enthalpie de référence associée à
la réaction de formation de H , Cl en phase aqueuse ; de proche en proche, on peut
ensuite mesurer l’enthalpie de formation de NH  
4 , Cl pour en déduire celle de NH4 aq
(qui figure d’ailleurs dans le tableau 12.2), etc.
2 La loi de Hess : considérons par exemple la réaction de référence décrite sur la
figure 12.3, pour le bilan Fe3 O4 + CO ⇋ 3FeO + CO2 . L’état initial comme l’état final
de cette réaction de référence sont formés de trois moles d’élément fer, cinq moles
d’élément oxygène et une mole d’élément carbone ; on peut donc les former (au sens
des réactions de formation envisagées plus haut) à partir des mêmes états standard
de ces éléments, selon la figure 12.5.

Fe3 O4 CO Réaction de référence FeO CO2


1 mol 1 mol T = Cte, p = p ◦ 3 mol 1 mol

(Fr ) (Fp )
Fesolide O2gaz Cgraphite
5
3 mol mol 1 mol
2

Figure 12.5 – Réactions de formation pour la réduction de Fe3 O4 en FeO

Sur cette figure, (Fr ) désigne la somme des réactions de formation des réactifs, pour
lesquelles la variation d’enthalpie peut s’écrire ∆HF r = Hf◦ (Fe3 O4 ) + Hf◦ (CO), et (Fp )
12 : Thermochimie 279

désigne la somme des réactions de formation des produits, pour lesquelles la variation
d’enthalpie est ∆HF p = 3Hf◦ (FeO) + Hf◦ (CO2 ). Toutes ces enthalpies de formation
sont bien sûr supposées déterminées à la même température T , qui est celle de la
réaction de référence.
L’enthalpie étant une fonction d’état, on peut évaluer la même variation d’enthalpie
sur deux chemins différents, ce qui conduit à ∆HF p = ∆HF r +∆r H ◦ , ce qui constitue
la loi de Hess :
Loi de Hess
X L’enthalpie standard d’une réaction (à la température T ) est la somme
(affectée des coefficients stœchiométriques) des enthalpies de formation
des produits, diminuée de la somme (également affectée des coefficients
stœchiométriques)
X X des enthalpies de formation des réactifs : ∆r H ◦ (T ) =
Hf◦ (T ) − Hf◦ (T ).
produits réactifs

Ainsi généralisée à n’importe quelle réaction chimique (puisque le raisonnement ci-


dessus s’appuie seulement sur la conservation des espèces dans le bilan d’une réaction),
on peut aussi l’écrire plus formellement :
X X
À T donné : ∆r H ◦ = νi Hf◦ (Ai ) pour νi Ai ⇋ 0 (12.16)
i i

en tirant avantage de l’expression algébrique des coefficients stœchiométriques νi , avec


νi < 0 pour les réactifs et νi > 0 pour les produits.
On peut donc déterminer ∆r H ◦ (T ) pour n’importe quelle réaction, et par là même les
chaleurs de réaction Qp ≃ ξ∆r H ◦ (T ) et Qv ≃ Qp − ∆ngaz RT , à partir de la connais-
sance de tables thermodynamiques relatives aux espèces chimiques individuelles qui
figurent au bilan.
La seule restriction à la généralité de la méthode est la nécessité de disposer de
tables calculées ou mesurées à la même température T que celle pour laquelle on
étudie la réaction chimique. Toutefois, comme on va le voir, il existe aussi des tables
thermodynamiques de correction de la température, basées sur les lois de Kirchhoff
de la Thermochimie.

12.3.4 Lois de Kirchhoff


2 Enthalpie et capacité thermique : les variations d’enthalpie  d’un  système quel-
∂H
conque avec la température sont régies par l’expression Cp = ; cette dérivée
∂T p
doit être calculée à p constant, c’est-à-dire exactement dans les conditions de la réac-
tion de référence, effectuée à p = p◦ . La figure 12.6 présente le cas de la réduction de
l’oxyde mixte Fe3 O4 effectuée à deux températures T et T ′ > T .
On peut ainsi compléter un cycle en ajoutant, à la réaction de référence menée à T
ou à T ′ , le chauffage isobare des réactifs de T à T ′ , et le refroidissement isobare des
produits de T ′ à T . Ces deux transformations étant celles de réactifs séparés, on a
exactement addition des variations d’enthalpie associées, ce qui s’écrit par exemple
Z T′
pour le chauffage isobare ∆Hchauffage = Cp (θ, p◦ )dθ où la capacité thermique
T
étudiée Cp est celle d’une mole de Fe3 O4 et de une mole de CO à la température θ ;
280 Physique, MP, MP*

Fe3 O4 CO Réaction de référence FeO CO2



1 mol à T 1 mol à T ′ ′
T = Cte, p = p ◦ 3 mol à T ′ 1 mol à T ′

Chauffage Refroidissement
isobare isobare

Fe3 O4 CO T = Cte, p = p◦ FeO CO2


1 mol à T 1 mol à T Réaction de référence 3 mol à T 1 mol à T

Figure 12.6 – Changement de température de réduction de Fe3 O4 en FeO

Z T′
on écrit bien sûr de même ∆Hrefroidissement = − Cp′ (θ, p◦ )dθ où Cp′ concerne trois
T
moles de Fe et une mole de CO2 .
Finalement, ∆r H ◦ (T ) = ∆Hchauffage + ∆r H ◦ (T ′ ) + ∆Hrefroidissement s’écrit encore
Z T′
∆r H ◦ (T ′ ) − ∆r H ◦ (T ) =
 ′
Cp − Cp dθ, faisant apparaı̂tre la grandeur ∆r Cp◦ (θ),

T
qu’on peut indifféremment définir comme la somme des capacités thermiques des
produits diminuée de cette des réactifs (tous pris dans les conditions standard et
dans les proportions stœchiométriques), ou encore comme la variation de capacité
thermique lors de la réaction de référence :

X X X
∆r Cp◦ (T ) = Cp − Cp = νi c◦p,m (Ai , T ) (12.17)
produits réactifs i

Cette grandeur permet d’établir les lois de variation de l’enthalpie de réaction, en


généralisant la relation établie plus haut dans un cas particulier, selon :

Z T′
∆r H ◦ (T ′ ) = ∆r H ◦ (T ′ ) + ∆r Cp◦ (θ)dθ (12.18)
T

On utilisera aussi sa forme locale, dite première loi de Kirchhoff, obtenue en écrivant
T ′ = T + dT :

d
∆r H ◦ (T ) = ∆r Cp◦ (T ) (12.19)
dT

2 Tables de correction de température : la lecture des tables thermodynamiques se


fait donc toujours en deux temps :
• d’abord, la lecture des tables des enthalpies de formation des réactifs et produits
Hf◦ (T ) à la température T imposée par la table thermodynamique ;
• ensuite, la lecture dans ces mêmes tables des valeurs des fonctions c◦p (T ), ou éven-
tuellement des grandeurs constantes c◦p , permet le calcul de l’intégrale (12.18).
12 : Thermochimie 281

Les capacités thermiques sont données soit sous forme numérique, soit sous forme
de fonctions d’interpolation données en fonction de la température T . La table 12.3
montre la forme prise par les tables thermodynamiques indiquant les enthalpies de
formation et capacités thermiques, dans le cas où celles-ci sont constantes.
Dans d’autres cas, on donne les capacités thermiques sous la forme de polynômes
d’interpolation, par exemple c◦p (T ) = α + βT + γT 2 , ce qui permet le calcul explicite
de l’intégrale (12.18) si on connaı̂t les valeurs numériques de α, β et γ.

Espèce Hf◦ (298 K), kJ · mol−1 c◦p , J · K−1 · mol−1


Alsolide 24, 4
Algaz 329, 7
Al3 −531, 6
Al2 O3solide −1 676 79, 1
Cgraphite 8, 5
Cdiamant 1, 9 6, 1
Fesolide 25, 1
FeOsolide −266, 4 48, 1
Fe2 O3solide −824, 6 103, 9
Fe3 O4solide −1 119 143, 5

Table 12.3 – Enthalpies de formation et capacités thermiques

2 Approximation d’Ellingham : on constate dans la table 12.3 l’absence de certaines


valeurs ; on les considère comme nulles, ce qui revient à négliger les variations de
∆r H ◦ (T ) avec la température. Plus généralement, dans le cas où ∆r Cp◦ est inconnu,
nul ou négligeable, on considère que ∆r H ◦ est constant :

Approximation d’Ellingham
X On dit qu’une réaction est traitée dans le cadre de l’approximation d’El-
lingham si on néglige ∆r Cp◦ ou, ce qui revient au même, si on considère
que ∆r H ◦ est une constante indépendante de la température.

2 Cas d’un changement d’état : considérons le cas d’une même réaction chimique
étudiée à deux températures situées de part et d’autre de la température de change-
ment d’état T ∗ d’un des réactifs ; on peut par exemple étudier la réaction de formation
1
de l’eau H2 gaz + O2 gaz ⇋ H2 O ; pour T < T ∗ on considérera la formation de H2 Oliquide
2
et pour T > T ∗ celle de H2 Ogaz , avec dans ce cas T ∗ = 373, 15 K puisque les réactions
standard sont étudiées sous p◦ = 1 bar.
Dans ce cas, on doit tenir compte du changement d’état, associé à la variation d’en-
thalpie molaire L∗ (T ∗ ) = ∆H, qui est aussi la différence ∆H = Hf◦ (T ∗+ ) − Hf◦ (T ∗− ) ;
finalement, on écrira par exemple :

Z T∗ Z T′
Hf◦ (T ′ ) − Hf◦ (T ) = c◦p (θ)dθ + L∗ (T ∗ ) + c◦p (θ)dθ (12.20)
T T∗

où on remarquera que, dans les deux intégrales, les valeurs de cp sont différentes et
concernent respectivement deux phases différentes, par exemple vapeur pour θ > T ∗
et liquide pour θ < T ∗ .
282 Physique, MP, MP*

12.4 Applications des lois de la Thermochimie

12.4.1 Emploi des chaleurs de réaction


2 Température de flamme adiabatique : il s’agit de la première application classique
des résultats établis plus haut : on étudie une réaction monobare, menée dans des
conditions adiabatiques ; si cette réaction est exothermique, le dégagement énergétique
qui l’accompagne impose une augmentation de la température du milieu (réactifs,
produits, solvants et gaz inertes). On s’intéresse en général à la détermination de la
température atteinte en fin de réaction.
On étudie alors l’évolution décrite sur la figure 12.7 ; la transformation réelle qui mène
des réactifs (et espèces inertes) aux produits est monobare et adiabatique, donc isen-
thalpique (∆H = 0) ; on cherche alors à relier la température finale (ou température
de flamme adiabatique) Tf à la température initiale Ti .

∆H = 0 produits + inertes
p◦ , T f

réactifs + inertes
p◦ , T i chauffage

produits + inertes
∆H = Qp p◦ , T i

Figure 12.7 – Température de flamme adiabatique

On peut aussi considérer cette transformation comme la composée d’une transforma-


tion monobare, monotherme avec la même composition finale (et donc ∆H = Qp ou
∆H ≃ ξf × ∆r H ◦ (Ti ) ou ξf est l’avancement en fin de réaction) suivie d’un chauffage
Z Tf
isobare du mélange final de Ti à Tf ; on écrira donc 0 = Qp + Cp (T )dT , ce qui
Ti
constitue une équation pour l’inconnue Tf si Cp (T ) désigne la capacité thermique du
mélange en fin de réaction.

On ne confondra surtout pas Cp (T ) défini ici pour un mélange à composition donnée,


incluant les gaz inertes et autres espèces hors bilan, avec la grandeur ∆r Cp◦ (T ),
relative à une réaction de référence et aux seules proportions stœchiométriques.
On remarque bien sûr que Cp (T ) > 0 donc Tf > Ti pour les réactions exothermiques
pour lesquelles Qp < 0.
2 Pression d’explosion adiabatique : le même type de raisonnement permet d’étudier
les réactions isochores, aboutissant en général à une forte augmentation de tempéra-
ture, donc de pression. Cette augmentation est liée à la valeur fortement positive de
QV , donc au caractère exo-énergétique de la réaction.
La pression atteinte dans un réacteur isochore en fin de réaction adiabatique (donc
∆U = 0) porte le nom de pression d’explosion adiabatique.

12.4.2 Énergies de liaison


2 Définition : l’énergie de liaison de la liaison AB dans une molécule diatomique
AB est la variation d’énergie interne El = ∆r U ◦ , extrapolée à T = 0 K de la réaction
12 : Thermochimie 283

de dissociation ABgaz ⇋ Agaz + Bgaz .


On assimile en général cette énergie à l’enthalpie de la même réaction ∆r H ◦ ; dans
tous les cas, cette grandeur est positive ce qui signifie qu’il faut en général fournir
de l’énergie pour rompre la liaison. L’ordre de grandeur de l’énergie de liaison est en
général la centaine de kilojoules par mole.
2 Généralisation : on peut considérer l’énergie de liaison comme l’inverse d’une
réaction de formation de l’espèce AB à partir de ses atomes séparés ; plus générale-
ment, on peut montrer que l’enthalpie de formation d’une molécule quelconque est
approximativement la somme d’énergies de liaison relatives aux diverses liaisons qui
composent la molécule.
Ainsi, pour la réaction 3C + 8H ⇋ CH3 − CH2 − CH3 , on peut écrire l’enthalpie stan-
dard de réaction ∆r H ◦ = −8El (C − H)−3El (C − C) puisque la formation de cette mo-
lécule exige la formation de huit liaisons carbone-hydrogène et trois liaisons carbone-
carbone. Cette relation n’est qu’approximative puisque les diverses liaisons ne sont
pas forcément équivalentes, du fait par exemple de leur localisation différente dans la
molécule formée.
284 Physique, MP, MP*

Ce qu’il faut absolument savoir

Un mélange idéal de gaz parfaits réalisé à pression constante est aussi réalisé
à T , U et H constants. Dans ce mélange idéal, on définit les fractions molaires
xi = ni /ntotal et les pressions partielles pi = xi p.
X
Pour une réaction chimique quelconque νi Ai ⇋ 0, on définit l’avance-
i
ment 
par 
dn([A]i ) = νi dξ. Pour toute grandeur extensive, on note alors

∆r = : c’est la notation de Lewis.
∂ξ T,p
Les chaleurs de réaction sont données par Qp ≃ ξ∆r H ◦ (T ) pour une réaction
monobare monotherme et Qv ≃ Qp − ∆ngaz RT pour une réaction isochore
monotherme.
L’enthalpie standard de réaction ∆r H ◦ est relative à la réaction de référence :
réactifs et produits sont les corps purs pris dans leur état standard (p◦ = 1 bar).
On détermine les enthalpies
X standard de réaction par application de la loi de
◦ ◦
Hess, ∆r H (T ) = νi Hf (Ai , T ) en fonction des enthalpies de formation des
i
réactifs et produits Ai à la même température T .
On peut relier les enthalpies de réaction à deux températures différentes en
d
utilisant la forme différentielle de la loi de Kirchhoff, ∆r H ◦ (T ) = ∆r Cp◦ (T ).
dT
Lors de l’intégration de cette loi, on ajoutera l’enthalpie molaire de change-
ment d’état si l’intervalle d’intégration comprend la température de changement
Z T∗ Z T′
◦ ′ ◦ ◦ ∗
d’état : ∆r H (T ) = ∆r H (T ) + ∆r Cp (θ)dθ + L∗ (T ) + ∆r Cp◦ (θ)dθ.
T T∗

Une combustion adiabatique monobare (température de flamme) est caractéri-


sée par ∆H = 0 ; une réaction adiabatique isochore (pression d’explosion) est
caractérisée par ∆U = 0.
Chapitre 13

La conduction thermique

13.1 Les transferts thermiques

13.1.1 Les modes de transfert thermique


2 Importance des transferts thermiques : les expressions du premier comme du second
principe de la Thermodynamique reposent sur l’existence et les propriétés du transfert
thermique δQ ou Q reçu par un système thermodynamique (Σ) ; ce chapitre décrit
l’origine microscopique des transferts thermiques, et les moyens qui permettent de les
calculer. Ces transferts thermiques se font par trois modes : conduction, convection
et rayonnement.
2 Conduction thermique : le mode de transfert qui apparaı̂t toujours au sein d’un
milieu continu (solide ou fluide) thermiquement inhomogène est la conduction ther-
mique. Il s’agit de transferts thermiques de proche en proche, par chocs microscopiques
entre particules d’énergie cinétique moyenne différente. La conduction thermique sera
associée à un courant local d’échanges thermiques causés par l’existence d’un gradient
de la température dans le milieu continu étudié.
La figure 13.1 représente l’origine microscopique de ce courant ; la présence de par-
ticules en moyenne plus énergétiques à l’abscisse x impose, du fait des mouvements
aléatoires, un transport de ces particules vers l’abscisse x + dx d’où, au contraire, ne
partent que des molécules en moyenne moins énergétiques. Notons que la répartition
des vitesses est en fait supposée isotrope en tout point du matériau (il s’agit de l’agi-
tation thermique) ; les seules vitesses représentées sur la figure 13.1 sont celles qui
sont à peu près alignées avec (Ox).

b b b b
b b b b
grad T b Φc
b
b
b
bb bb

x x + dx
b b

Figure 13.1 – Un modèle microscopique de conduction thermique

Globalement, le transport d’énergie se fait dans le sens des x croissants puisque T (x) >
T (x + dx) est associé à un flux thermique algébrique de conduction Φc > 0 ; nous
verrons ultérieurement que Φc est proportionnel à −grad T .
286 Physique, MP, MP*

2 Convection thermique : le terme convection désigne, en général, le transport d’une


quantité physique lié à un transfert de masse observable à l’échelle macroscopique.
On peut étudier divers phénomènes de convection, le transport d’énergie cinétique
d’agitation thermique n’en étant qu’un des aspects.
L’étude détaillée de la convection n’est pas au programme, pas plus que les équations
de la dynamique des fluides. Nous n’étudierons cette année que le couplage entre les
flux thermiques conductifs et l’existence de phénomènes de convection à la frontière
de systèmes thermodynamiques fluides et solides (parois, canalisations). On parlera
systématiquement de transfert pariétal (à travers des parois).

Zone de transports convectifs

Φp Φp Φp Φp Φp Φp Φp Φp
Zone de transports conductifs

Figure 13.2 – Transfert thermique pariétal

La figure 13.2 précise la géométrie d’un tel transfert pariétal, entre un milieu solide
(où le transport thermique est régi par les phénomènes conductifs) et un fluide en
écoulement (où les phénomènes conductifs et convectifs coexistent). Cette figure est
représentée dans le cas où le flux thermique pariétal est dirigé du solide vers le fluide,
par exemple s’il s’agit d’un refroidissement de solide par circulation de fluide. Le
transport convectif dans le fluide sert ensuite à évacuer le flux thermique Φp ainsi
transporté à travers la paroi.
2 Rayonnement thermique : il constitue le troisième mode de transfert thermique ;
il ne nécessite pas de support matériel car il s’agit d’un transport énergétique par
une onde électromagnétique qui, comme on le verra par la suite, est susceptible de se
propager dans le vide tout comme dans certains milieux matériels, dits transparents.

Rayt visible
Rayt infrarouge

Mars
Le Soleil

Terre

Figure 13.3 – Équilibre radiatif des planètes et du Soleil

Contrairement à l’étude des phénomènes optiques, le rayonnement thermique ne nous


intéresse pas pour ses directions de propagation, qui résultent de phénomènes collectifs
et sont donc souvent mal définies ; on ne se préoccupera que de l’énergie transférée. On
peut par exemple rendre compte, dans le cadre de l’étude du rayonnement thermique,
de la température d’équilibre des planètes, en fonction du rayonnement qu’elles re-
çoivent de la part du Soleil, et du rayonnement infrarouge qu’elles émettent à leur
13 : La conduction thermique 287

tour (figure 13.3) : plus les planètes sont éloignées du Soleil, moins elles reçoivent de
rayonnement et plus leur température d’équilibre est basse.

Plus généralement, les transferts thermiques radiatifs sont les seuls présents dans le
vide. Leur étude détaillée (en liaison avec la température de l’émetteur mais aussi
avec la répartition spectrale du rayonnement) est reportée à un chapitre ultérieur.

13.1.2 Historique : transferts thermiques conductifs et radiatifs

2 Chaleur et température : la controverse concernant la nature de la chaleur et des


transferts thermiques dura jusqu’au milieu du xixe siècle. Aujourd’hui encore règne la
confusion dans certains des esprits ; ainsi, si on pose la main sur le front d’un malade
pour savoir s’il a de la température, on répète cette confusion :
– on évalue le transfert thermique Q à l’interface de la main et du front, alors qu’on
parle de la température T ;
– le verbe (( avoir )) est adapté à une grandeur extensive comme l’énergie interne U
ou le transfert thermique Q, mais pas à une grandeur extensive ; T est une variable
d’état qui devrait être associée au verbe (( être )).

L’expression (( transfert thermique )) a récemment été introduite pour remplacer le


terme (( chaleur )), source de possibles confusions entre les notions de transfert ther-
mique (extensif, lié à une transformation) et de température (intensif, lié à un état).

Sur le plan historique, la confusion a été levée de façon explicite pour la première fois
vers  par le physicien britannique Black ; il nommait alors intensity of heat la
température et quantity of heat le transfert thermique.

2 Transferts thermiques : vers , Fourier‡ , reprenant des travaux antérieurs,


décida de faire complètement abstraction de la nature de la chaleur, pour se concen-
trer sur l’étude de sa transmission. Fourier supposa que la chaleur se transmet des
zones chaudes vers les zones froides perpendiculairement aux surfaces isothermes et
proportionnellement aux écarts de température existants.

Fourier aboutit ainsi à la première étude quantitative d’un mode de transfert ther-
mique, la conduction ; c’est aussi le premier que nous étudierons en détail. La réso-
lution de l’équation aux dérivées partielles obtenue amena Fourier à développer les
notions de séries et transformées (intégrales) de Fourier.

L’étude des transferts thermiques par rayonnement débute seulement à la fin du xixe
siècle, avec notamment les travaux du physicien autrichien Stefan‡ ; en  il montre
ainsi que l’intensité du rayonnement thermique du corps chauffé à la température T
est proportionnelle à T 4 . En , son élève Boltzmann‡ établit pour la première
fois les bases théoriques de cette propriété.

En , l’allemand Wien‡ étudie la répartition spectrale du rayonnement émis par


un corps chauffé, et établit en particulier la loi du déplacement : la longueur d’onde
du maximum d’émission d’un corps chauffé à la température T varie comme 1/T .

Ce n’est enfin qu’en  que l’allemand Planck‡ établit une loi générale expliquant
notamment les lois de Stefan-Boltzmann et de Wien, fondée sur l’étude statistique
des particules quantiques que sont les photons, constituants du rayonnement élec-
tromagnétique. Les travaux de Planck ont trouvé leur réinterprétation en mécanique
quantique générale dans le cadre de la théorie statistique de Bose et Einstein.
288 Physique, MP, MP*

13.1.3 Le cadre de notre étude


2 Les systèmes étudiés : nous étudions ici un ensemble de systèmes thermodyna-
miques qui ne se trouvent pas à l’équilibre thermique : La température d’un système
particulier (Σ) n’est donc pas partout égale à la température du ou des autres systèmes
avec lesquels (Σ) est en contact ou en relation ; rappelons ici qu’il peut y avoir des
relations énergétiques à distance, sans contact, par l’intermédiaire du rayonnement
électromagnétique.
Nous allons donc chercher à relier ces inhomogénéités de température avec les trans-
ferts thermiques qui se feront en général des zones les plus chaudes vers les plus
froides ; ce chapitre est en particulier consacré à l’étude de ces transferts en volume,
au sein de l’intérieur des systèmes, par conduction.
2 Température du système : dans le système thermodynamique (Σ) (donc macro-
scopique) étudié, la température T (r, t) dépend du point r dans ce système et de
l’instant t. Le système servant de base à notre étude sera donc l’élément de volume
dτ , infinitésimal à notre échelle, et cependant macroscopique, c’est-à-dire contenant
un nombre dN de particules très élevé, même si la quantité de matière (nombre de
moles) dn correspondante est très faible ; on choisira ce volume de dimensions assez
faibles pour qu’on puisse y considérer la température comme uniforme. Rappelons ici
que l’échelle de dimensions correspondante est l’échelle mésoscopique, intermédiaire
entre les échelle microscopique (dimensions moléculaires) et macroscopique (échelle
du laboratoire) : microscopique ≪ mésoscopique ≪ macroscopique.
Nous rencontrerons des situations simples où la température T (r, t) est une fonction
continue de l’espace, mais aussi des modélisations extrêmes où cette température subit
des variations très rapides sur de faibles dimensions. On traitera parfois ces cas comme
des zones de discontinuité de la température, au niveau d’une paroi par exemple : la
température d’un fluide circulant dans une canalisation peut varier sur une petite
échelle au voisinage de cette canalisation.

13.1.4 Bilans thermiques


2 Bilan thermique pour un système ouvert : rappelons ici que, si (Σ) est le sys-
tème thermodynamique ouvert défini comme l’intérieur de la surface de contrôle (S),
l’application du premier principe pour ce système prend la forme :

∂E
I
h + eext ρv · ndS = Putile + Ptherm
¡ ¢
+ (13.1)
∂t (S)

où l’énergie
Z mécanique totale E du système s’écrit comme une intégrale de volume,
E= ρedτ où on a choisi de noter e = u+eext la densité massique d’énergie totale,
(Σ)
somme de l’énergie interne massique u et des termes massiques d’énergie extérieure,
1
cinétique et potentielle, eext = v 2 + ep ext.
2
La même relation fait intervenir un débit sortant, correspondant à la somme de l’en-
thalpie, de l’énergie cinétique et de l’énergie potentielle sortantes ; rappelons ici que
h désigne l’enthalpie massique du fluide en écoulement.
Enfin, dans cette même relation (13.1), Putile est la puissance mécanique utile et Ptherm
la puissance thermique reçue par le système.
13 : La conduction thermique 289

Le premier principe (13.1) se ramène seulement à un bilan thermique si tous les termes
énergétiques d’origine mécanique (c’est-à-dire, non thermique) sont nuls :
• le travail mécanique utile est nul, Putile = 0, par exemple en l’absence de toute pièce
mobile en contact avec le système (Σ) ;
• l’énergie potentielle extérieure eext
p est constante ou nulle, par exemple si on peut
négliger le travail des forces de pesanteur ;
• l’énergie cinétique macroscopique massique v 2 /2 est nulle ou ses variations négli-
geables ; ce sera notamment le cas lors de l’étude d’un système au repos ou à
faible vitesse d’écoulement.
Dans ce cas, le bilan thermique prend la forme :

dU
= −ΦH + Ptherm (13.2)
dt

I
où on a choisi de noter ΦH = ρhv · ndS le flux d’enthalpie sortant de la surface de
(S)
contrôle (S), en fonction de la densité volumique de courant d’enthalpie jH = ρhv ;
en effet, h désigne ici l’enthalpie massique donc hV = ρh est l’enthalpie volumique et
on reconnaı̂t bien dans jH et ΦH les expressions générales des densités volumique de
courant et débit sortant associés à la grandeur extensive H.

2 Notion de flux thermique : lorsque les transferts thermiques reçus par le système
(Σ) se font effectivement à travers la surface (S) qui entoure (Σ), on cherchera à
exprimer la puissance thermique Ptherm reçue par (Σ) par analogie avec X(13.2), c’est-
à-dire sous la forme d’un flux entrant ; on écrira alors Ptherm = − Φk , l’indice
k
k désignant
I la nature du transfert thermique étudié. On cherchera alors à exprimer
Φk = jk dS, en définissant un flux thermique sortant de (S) et son vecteur densité
(S)
volumique, de projection jk = jk · n sur la normale sortante.

Notre programme porte essentiellement sur la modélisation des densités volumiques de


courants thermiques jk associés aux trois types de transferts thermiques, conduction,
convection (dans le cas très restreint des transferts pariétaux) et rayonnement ; on
notera bien sûr Φc , Φp et Φr les flux thermiques associés.

¶ de l’énergie interne : on détermine la variation de U en rappelant que


2 Variation
µ
∂u
cV = définit la capacité thermique isochore massique ; elle permet d’écrire,
∂T V Z
lors d’une évolution à volume constant dU = cV dm (T (r, t + dt) − T (r, t)) donc
(Σ)
dU ∂T
Z
aussi = ρcV dt.
dT (Σ) ∂t

Plus généralement, pour un milieu continu quelconque (solide, liquide ou gaz) su-
bissant une transformation également quelconque, nous écrirons indifféremment dans
dU ∂T
Z
toute la suite = ρc dt, où c porte le nom de capacité thermique massique
dT (Σ) ∂t
dans les conditions de la transformation.
290 Physique, MP, MP*

Rappelons ici encore que la relation H = U + pV montre que H ≃ U pour les


phases condensées, de volume faible, ou de volume faiblement variable ; dans ce cas,
la distinction entre cp et cv n’a plus de raison d’être ; on notera cp ≃ cv ≃ c, où
la capacité thermique massique c est pratiquement indépendante de la nature de la
transformation subie par le système.

2 Bilan thermique général : en présence de phénomènes conductifs, convectifs,


pariétaux et radiatifs, le bilan thermique le plus général pour un système (Σ) (ne
recevant pas de travail utile, et dont l’énergie mécanique macroscopique ne varie pas)
prend la forme générale :

∂T
Z
ρc dτ = −ΦH − Φc − Φp − Φr (13.3)
(Σ) ∂t

où on a choisi de noter Φc + Φp + Φr = −Ptherm le flux thermique sortant de la


surface de contrôle (S) qui définit le système thermodynamique (Σ) étudié ; les indices
serviront à distinguer flux conductif Φc , flux pariétal Φp et flux radiatif Φr .

Insistons sur l’importance des signes − dans cette relation : lorsqu’il existe un flux
énergétique sortant, qu’il s’agisse d’un flux
I thermique conductif, pariétal ou radiatif
ou d’un flux d’enthalpie convecté ΦH = jH · ndS, l’énergie interne du système
(S)
thermodynamique diminue.
On peut encore modifier l’équation (13.3) ci-dessus pour tenir compte de sources ther-
miques réparties en volume dans le système (V ) étudié, comme par exemple l’existence
d’une réaction chimique exothermique, la désintégration radioactive ou l’effet Joule
dans un milieu conducteur. On ajoutera alors au second membre la puissance Plocal
localement dégagée à l’intérieur de ce système pour obtenir la forme définitive du
premier principe dans le cas des bilans thermiques :

∂T
Z
ρc dτ = Plocal − ΦH − Φc − Φp − Φr (13.4)
(Σ) ∂t

Pour les systèmes fermés, il n’y a pas de débit de grandeurs extensives à travers la
surface (S) qui définit le système, donc ΦH = 0 : les termes convectifs sont négligés.
Ce sera le cas de la plupart des systèmes que nous étudierons cette année.
2 Terme de création locale : le terme Plocal est bien sûr souvent nul ; toutefois,
lorsqu’il est présent, il est en général susceptible d’une modélisation simple. Consi-
dérons par exemple un cylindre conducteur du courant électrique, de section S et de
1
longueur dℓ, donc de résistance dR = dℓ si γ est la conductivité du milieu étudié.
γS
On en déduit la puissance dissipée par effet Joule sous la forme dPlocal = dRi2 , si on
note i le courant qui traverse la section S du conducteur.
µ ¶2
1 i
Finalement, dPlocal = dτ , où dτ = Sdℓ est l’élément de volume du conduc-
γ S
teur, et où i/S est une grandeur locale intensive, la densité de courant électrique. Plus
généralement, nous écrirons toujours :
Z
Plocal = plocal dτ (13.5)
(Σ)
13 : La conduction thermique 291

pour la création thermique locale, avec une densité volumique (intensive) plocal ; cette
grandeur se mesure en watt par mètre cube, et dépend du phénomène modélisé.

13.2 Lois phénoménologiques des transferts thermiques

13.2.1 La loi de Fourier


2 Transferts thermiques conductifs : dans un milieu où existent des inhomogénéi-
tés locales de température, les chocs microscopiques entre particules animées d’un
mouvement d’agitation thermique important (provenant des zones chaudes) et par-
ticules animées d’une agitation thermique moindre (provenant des zones froides) se
traduisent par des transferts thermiques en volume, au sein du matériau.
Considérons une surface infinitésimale orientée dS = dSn ; nous définirons le flux
thermique conductif comme la quantité dΦc d’énergie transitant, par conduction ther-
mique, à travers dS, par unité de temps, dans le sens de n. Ce flux est, pour des raisons
d’extensivité, défini comme tous les flux de grandeurs extensives par la relation :

dΦc = jc · ndS (13.6)

On fait ainsi apparaı̂tre un vecteur densité volumique de courant thermique de conduc-


tion jc (r, t), champ fonction à la fois du point et du temps.
Notons que dΦc s’exprime en watt, et donc que l’unité de mesure de jc est le watt par
mètre carré. On écrira encore, pour le transfert thermique conductif associé à travers
une surface (S) finie :
Z
δQ(S) = jc · ndS × dt (13.7)
(S)

Rappelons ici encore un risque de confusion qu’on rencontre dans toutes les études
de transport de grandeurs extensives : jc est une densité volumique de courant
thermique (car les transferts thermiques se font en volume) mais son unité est celle
d’une puissance par unité de surface.

Notons que dans le cas particulier où la surface (S) est fermée,
I le transfert thermique
reçu par le système (Σ) intérieur à (S) vaut δQ→(Σ) = − jc · ndS, compte tenu
(S)
des conventions usuelles de la Thermodynamique. On retiendra :

Flux thermique conductif


X Le flux thermique reçu par conduction par un système thermodynamique
δQ→(Σ)
I
(Σ) de surface extérieure (S) s’écrit = Φc = − jc · ndS, si
dt (S)
n est la normale à (S) orientée vers l’extérieur de (Σ).

2 Loi de Fourier : un modèle phénoménologique de la conduction thermique a été


proposé par Fourier ; on peut le présenter par analogie à la loi d’Ohm, autre modèle
phénoménologique décrivant, lui, la conduction électrique (charge volumique ρc et
densité de courant j = ρc v) sous la forme j = γE = −γgrad V ; cette relation définit
une grandeur γ caractéristique du milieu conducteur, sa conductivité électrique.
292 Physique, MP, MP*

L’hypothèse de Fourier est la suivante : comme les lignes de courant électrique sont
alignées avec les directions de décroissance du potentiel électrique, les lignes de trans-
port thermique sont alignées avec les directions de décroissance de la température.
Ainsi, la loi de Fourier, bien vérifiée dans de très nombreux milieux, est donnée par :

jc = −λgrad T (13.8)

La constante λ, dite conductivité thermique du milieu continu étudié, est caractéris-


tique de la nature du matériau. Comme on le voit ci-dessus, λ s’exprime en watts par
mètre et par kelvin puisque jc est un flux thermique surfacique en watts par mètre
carré, tandis que grad T s’exprime en kelvin par mètre.

Conductivités thermiques en W · m−1 · K−1


Ag Cu Al Quartz Verre
430 390 320 8, 0 ∼ 0, 8
Eau Glace PS Air H2
0, 54 0, 10 3, 0 × 10−2 2, 5 × 10−2 0, 18

Table 13.1 – Conductivité thermique de certains matériaux

Les valeurs de λ varient très largement d’un matériau à l’autre, comme le montre
le tableau 13.1 ; on remarque que la valeur de λ est directement liée à la densité du
milieu. Les isolants formés de matériaux expansés (c’est le cas du polystyrène expansé
PS cité dans la table) ont des conductivités thermiques faibles du fait de leur structure,
formée de gaz piégés dans une structure lacunaire.
2 Isolants parfaits, conducteurs parfaits : on peut parfois faire l’approximation
d’un milieu parfaitement isolant sur le plan thermique si λ est très faible ; c’est en
particulier l’approximation que l’on fera souvent pour les gaz et les matériaux expansés
ou mousseux. Un tel isolant est donc caractérisé par :

Isolant thermique : jc = 0 (λ faible) (13.9)

Au contraire, une conductivité thermique très élevée impose une valeur faible de
grad T , sauf en cas de transport d’énergie avec une densité très élevée ; on fera donc
souvent l’approximation :

Conducteur thermique parfait : T est uniforme (λ élevé) (13.10)

Le diamant est un des meilleurs conducteurs thermiques connus, avec pour conduc-
tivité thermique λ ∼ 2 000 W · m−1 · K−1 à 20 ◦ C. On notera quand même que le
rapport des conductivités thermiques les plus élevées aux plus faibles est de l’ordre de
104 à 105 seulement ; la réalisation d’isolants thermiques parfaits est beaucoup plus
difficile que, par exemple, celle de bons isolants électriques.

13.2.2 Les transferts thermiques pariétaux


2 Flux pariétaux : au sein d’un fluide en mouvement, la présence simultanée de la
convection (liée aux mouvements du fluide) et de la conduction (qui apparaı̂t auto-
matiquement dès lors que le fluide n’est pas isotherme) peut faire l’objet d’une étude
13 : La conduction thermique 293

z
paroi solide

x
Φp Φp Φp Φp Φp
v
ΦH ΦH
fluide en mouvement

Figure 13.4 – Flux pariétal

simplifiée : c’est celle du flux conductif pariétal, à la limite du fluide et d’une paroi
qui le limite. La figure 13.4 présente la géométrie associée à une telle situation.
Sur cette figure, les flux thermiques pariétaux suivent la direction de l’axe (Oz) : ils
sont représentés sur la figure par l’algébrisation des flux pariétaux Φp qui sont ici
dirigés de la paroi solide vers le fluide, supposé donc plus froid que la paroi solide.
La paroi étant étanche, la vitesse v du fluide en écoulement n’a pas de composante sur
l’axe (Oz) ; on peut donc écrire v · ez = 0 donc le flux d’enthalpie dans la direction
de l’axe (Oz) est nul : les transferts thermiques convectifs sont orthogonaux aux
transferts pariétaux.
Sur la figure 13.4, on peut imaginer que la température dans le fluide est une fonction
décroissante de x : les flux enthalpiques convectés ΦH , dirigés le long de l’axe (Ox),
évacuent ici l’apport thermique des flux pariétaux dans le fluide en écoulement.
2 Les hypothèses d’étude des flux pariétaux : dans la géométrie simplifiée sur la
figure 13.4, qui décrit par exemple un écoulement permanent le long d’une paroi, le
phénomène de conduction apparaı̂t dans le sens de −grad T , c’est-à-dire le long de
l’axe (Oz) (normal à la paroi) si la différence entre les températures dans le fluide
TF et dans le solide TS sont nettement plus importantes que les inhomogénéités de
température dans le fluide et dans le solide, ce que nous supposerons ici : TF 6= TS
tandis que TF (r) et TS (r) sont supposées être des fonctions continues de part et
d’autre de la paroi qui sépare le fluide du solide.

Transferts thermiques pariétaux


X On doit prendre en compte les transferts thermiques pariétaux en pré-
sence de discontinuités de la température de part et d’autre d’une paroi.

2 Modèle local : l’étude détaillée des transferts thermiques pariétaux peut être
envisagée à partir des équations de base que sont les relations de continuité de la
température TS (z = 0+ ) = TF (z = 0− ) et de continuité du flux thermique à travers
la paroi (Oxy) ; comme onµl’a déjà
¶ indiqué, ceµflux ¶est par construction exclusive-
∂T ∂T
ment conductif, d’où −λS = −λF , en notant λS et λF les
∂z z=0+ ∂z z=0−
conductivités thermiques du solide et du fluide.
Cependant, cette étude locale détaillée impose l’étude préalable des lignes de courant
v(r) dans le fluide, qui sont bien sûr liées à la variation TF (r) de la température dans
294 Physique, MP, MP*

celui-ci ; on parle de couplage entre la conduction normale ou transverse et la convec-


tion longitudinale. Seules des solutions numériques ont en général pu être proposées
pour ce problème, dont nous ne proposons ici qu’une étude phénoménologique.

2 Couche limite : on peut donner une expression approchée des flux thermiques
pariétaux en considérant l’existence de couches limites, dans les fluides au voisinage
des parois. Dans ces couches minces, la température varie très rapidement, passant,
sur une faible épaisseur (que nous noterons η) de la valeur pratiquement uniforme
TF 0 dans le fluide, pour z < −η à la valeur pratiquement uniforme TS0 dans le solide,
pour z > 0.

C’est précisément l’existence de cette zone où la variation de température est rapide
et transversale (cf. figure 13.5) qui permet de ne considérer que le seul flux conductif
transverse : il est lié à la variation rapide de température dans la couche limite. Ainsi,
même si on ne peut pas, par cette méthode, étudier les variations (lentes) de tempé-
rature longitudinales, on obtient une expression du flux thermique pariétal (mesuré
de long de l’axe (Oz), du fluide vers la paroi solide) selon jp = −λF (grad TF )−η<z<0
λF
donc aussi jp ≃ − (TS0 − TF 0 ) ez .
η
z z

grad TF
Paroi solide, T ≃ TS0 TS0

x jp T

Couche limite
−η −η
b b
Fluide, T ≃ TF 0 TF 0

Figure 13.5 – Couche limite au voisinage d’une paroi

La description complète des transferts pariétaux exige donc de connaı̂tre la conducti-


vité thermique λF du fluide, mais aussi l’épaisseur η de la couche limite dans ce fluide.
Pour cette raison, ces flux pariétaux portent aussi le nom de flux thermiques convecto-
conductifs puisque, bien que de nature conductive, ils dépendent des phénomènes de
convection qui régissent l’écoulement dans la couche limite de fluide.

2 Nature de l’écoulement : l’étude complète des écoulements (dynamique des fluides)


exige la prise en compte des forces exercées de l’extérieur du fluide (pesanteur, etc...)
et à l’intérieur de celui-ci (pression, viscosité) ; elle mène à des équations non linéaires
dont la résolution mathématique se révèle généralement assez lourde et, pour cette
raison, elle est exclue du programme.

Signalons seulement l’existence de deux cas limites : les écoulements laminaires, dans
lesquels les lignes de courant glissent les unes sur les autres tout en restant parallèles,
et les écoulements turbulents, dans lesquels la vitesse du fluide dans la canalisation
varient d’un point à l’autre de façon quasiment aléatoire.
La figure 13.6 montre la visualisation d’un écoulement d’un liquide injecté dans un
autre, à la sortie de la canalisation d’injection. Tant que le fluide s’écoule dans la
canalisation (de faible diamètre d), les lignes de courant restent parallèles aux pa-
rois de cette canalisation : l’écoulement est laminaire. Dès que les parois transverses
s’éloignent, l’écoulement devient rapidement turbulent.
13 : La conduction thermique 295

Figure 13.6 – Flux laminaire et turbulent

Le passage d’un régime à l’autre se fait exclusivement en fonction d’un paramètre sans
dimension appelé nombre de Reynolds R qui, dans une canalisation cylindrique de
vd
diamètre d, vaut R = , où v est la vitesse moyenne du fluide et ν le coefficient
ν
de viscosité cinématique. Les forces volumiques de viscosité sont proportionnelles à ce
coefficient ν.

On remarquera qu’il se mesure en mètres carrés par seconde : c’est donc un coef-
ficient de diffusion, analogue à ceux qui seront définis au prochain chapitre dans
l’étude des bilans thermiques de régime variable. Ce coefficient est lié aux phé-
nomènes diffusifs liés à la viscosité. Les coefficients de viscosité cinématiques des
fluides sont du même ordre de grandeur que les coefficients de diffusivité thermique,
comme le montre le tableau 13.2.

Air Éthanol Glycérol Eau (20 ◦ C)


ν = 1, 56 × 10−5 1, 51 × 10−6 1, 18 × 10−3 1, 0 × 10−6 m2 · s−1

Table 13.2 – Valeurs numériques du coefficient de viscosité cinématique

Dans une canalisation cylindrique, l’écoulement devient en général turbulent pour


R > Rc ≃ 2 300 : c’est le cas des écoulements à faible viscosité, à forte vitesse ou
lorsque les parois de la canalisation sont très écartées. Au contraire, l’écoulement
devient en général laminaire pour R < Rc : c’est le cas des écoulements dans les
fluides très visqueux, ou à faible vitesse ou encore dans les canalisations de faible
diamètre.

13.2.3 Coefficient de transfert pariétal


2 Définition : généralisant l’étude précédente, le transfert thermique pariétal à
l’interface entre le solide et le fluide, compté positivement du fluide vers la paroi
solide, peut se mettre sous la forme |jp | = h|TF 0 − TS0 |, où le coefficient de transfert
thermique pariétal h est d’autant plus important que le fluide est bon conducteur de
la chaleur et que l’épaisseur de la couche limite est plus faible, favorisant par exemple
les transferts thermiques de surface lorsque l’écoulement est turbulent.
Reprenant les conventions d’algébrisation développées plus haut, le transfert ther-
mique pariétal reçu par le système (Σ) à travers la surface (S) qui le limite s’écrit :

δQ→Σ
I
= −Φp où Φp = jp dS avec jp = h (TΣ − Text ) (13.11)
dt (S)

où le flux thermique pariétal par unité de surface jp est positif s’il est sortant de
la surface (S) qui limite (Σ), c’est-à-dire aux points où la surface du côté intérieur
296 Physique, MP, MP*

de (S) est à température TΣ plus élevée que celle Text du côté extérieur de (S). La
relation (13.11) porte parfois le nom de relation de Newton pour le transfert pariétal
convecto-conductif.

On prendra bien garde de ne jamais confondre le coefficient de transfert pariétal h


avec l’enthalpie massique h du fluide ! Il est hélas possible de rencontrer ces deux
grandeurs dans un même problème, par exemple lors de l’étude de l’écoulement d’un
fluide recevant une puissance thermique par transfert pariétal lors de son écoulement.

2 Ordres de grandeur : les flux de transfert thermique de surface jp se mesurant


en watts par mètre carré, le coefficient de transfert thermique pariétal h s’exprime en
watts par mètre carré et par kelvin. La valeur du coefficient h dépend de la nature
du fluide mais aussi de l’épaisseur de la couche limite (ordinairement de l’ordre d’une
fraction de millimètre), donc du type de régime d’écoulement dans le fluide :
• dans un régime de convection naturelle, l’écoulement du fluide s’établit spontané-
ment du fait des écarts de température dans le fluide ;
• dans un régime de convection forcée, un dispositif (pompe, ventilateur) impose les
conditions de circulation du fluide, en général à une vitesse supérieure à celle
observée dans le cas de la convection naturelle.

De plus, dans chaque cas, on peut rencontrer des gradations dans les valeurs de h,
selon par exemple les valeurs du nombre de Reynolds. Notons seulement les ordres de
grandeur de h présentées dans le tableau 13.3.

Nature du transfert Nature du fluide h, (W · m−2 · K−1 )


Convection Gaz 5 à 30
naturelle Eau 100 à 1 000
Gaz 10 à 300
Convection Eau 300 à 1, 2 × 104
forcée Huile 50 à 1, 7 × 103
Métal liquide 6 × 103 à 1, 1 × 105

Table 13.3 – Coefficient de transfert thermique pariétal

13.2.4 Application à l’étude des transferts thermiques :


2 Principe : la prise en compte des transferts pariétaux revient à remplacer un
problème réel de transfert thermique par un problème simplifié (cf. figure 13.7).
Dans le problème réel, l’étude de la variation de température dans la couche limite,
d’épaisseur η au voisinage de la position z0 de la paroi devrait se faire avec continuité
de la température et du flux thermique conductif : T (z0− ) = T (z0+ ) et jc (z0− ) = jc (z0+ ).
Dans le problème simplifié au contraire, la prise en compte de la couche limite n’est
plus nécessaire ; la température devient, dans ce modèle, une fonction discontinue :
TΣ = T (z0− ) 6= T (z0+ ) = TF . Par contre, on continue à prendre en compte la continuité
des flux thermiques avec égalité de l’apport conductif et du transfert pariétal convecto-
conductif, jc (z0− ) = jp (z0 ).
En effet, que le régime soit variable ou permanent, il ne peut y avoir discontinuité des
flux thermiques de part et d’autre d’une surface d’épaisseur η négligée, puisque un
bilan thermique pour cette couche mince (masse volumique ρ et capacité thermique
13 : La conduction thermique 297

T T

TΣ b

F F
Σ
TF b

η Σ

z0 z z z
b b 0
Problème réel Problème simplifié

Figure 13.7 – Conditions aux limites pour un transfert pariétal

∂T
massique c) s’écrit, par unité de section droite, ρcη = jc (z0− ) − jp (z0 ) ; lorsque
∂t
η → 0, on retrouve bien la continuité des flux thermiques, c’est-à-dire l’égalité du flux
conductif arrivant du côté du solide avec le flux pariétal partant vers le fluide.
Cette condition se traduit¯ aussi pour la répartition de température T (z) par la condi-
∂T ¯¯
tion aux limites −λΣ = h (TΣ − TF ) ; plus généralement, on écrira :
∂z ¯ z0

Conditions aux limites en présence de transferts pariétaux


X Si (S) est la surface limitant le système thermodynamique (Σ), de nor-
male n orientée vers l’extérieur, la conservation du flux thermique à
la surface (S) s’écrit jc · n = jp , où la densité volumique de courant
thermique jc est calculée à la limite intérieure de (Σ), tandis que la
densité volumique de courant thermique pariétal jp a pour expression
jp = h (TΣ − Text ).
298 Physique, MP, MP*

Ce qu’il faut absolument savoir

Les transferts thermiques peuvent être réalisés par trois processus : la convec-
tion (déplacement macroscopique de matière), la conduction (transfert d’agita-
tion thermique par déplacements microscopiques) et le rayonnement thermique
(transfert dans le vide de l’énergie associée à une onde électromagnétique).
Tout transfert thermique est associé à un flux thermique Φth : le transfert reçu
par (Σ) est δQ = Φth dt avec pourI flux thermique entrant à travers la surface
fermée (S) limitant (Σ) Φth = − jth · ndS, où jth est la densité volumique
(S)
de flux thermique pour le processus étudié.
∂ ¡
U + E ext + DH+E ext = Putile + Pth où
¢
Un bilan énergétique s’exprime par
∂t
on a noté E ext l’énergie externe 1/2mv 2 +Epext ; le débit de la grandeur extensive
H + E ext est lui-même un flux sortant, celui du vecteur (h + eext ) × v.
En l’absence de travail mécanique utile et d’énergies extérieures, on peut écrire
∂U
I
= Plocal − ΦH − Φc − Φp − Φr , où ΦH = hv · ndS est le flux d’enthalpie
∂t (S)
convectée sortant de (S), Φc , Φp et Φr sont les flux conductif, pariétal et radiatif
sortants de (S) et Plocal la puissance localement créée.
∂U ∂T
Z Z
Dans ce bilan thermique, = ρc dτ et Plocal = plocal dτ , ce qui
∂t (Σ) ∂t (Σ)
définit la capacité thermique c dans les conditions de la transformation et la
densité volumique locale de puissance créée.
Le transfert thermique conductif reçu par
I le système thermodynamique (Σ) est
δQ→Σ
donné par = −Φc avec Φc = jc · ndS. La loi de Fourier impose
dt (S)
jc = −λgrad T .
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le coefficient de transfert pariétal h augmente si le fluide est un bon conducteur
thermique et si la convection est efficace (ou forcée), c’est-à-dire si la couche
limite est peu épaisse.
Chapitre 14

Régimes de transfert thermique

14.1 Bilans thermiques conductifs

14.1.1 L’équation de diffusion thermique


2 Expression locale : l’application du théorème d’Ostrogradski au flux de jc permet
aussi d’écrire, Zpour le système thermodynamique (Σ) intérieur à une surface fermée
(S), Φc = − div jc dτ . La comparaison de cette expression avec le bilan ther-
(Σ)
mique (13.4) permet d’écrire, en présence seulement de flux
Z conductifs Zet de termes
∂T
Z
de création locale, l’égalité intégrale ρc dτ = − div jc dτ + plocal dτ .
(Σ) ∂t (Σ) (Σ)
Cette identité devant être vérifiée quel que soit le volume d’intégration, on en déduit
la relation locale traduisant le bilan thermique conductif :

∂T
div jc + ρc = plocal (14.1)
∂t

Cette équation différentielle exprime le bilan conductif local sous forme d’une équation
∂ρ
analogue à l’équation de continuité div (ρv) + = 0 pour la conservation de la
∂t
masse ; la présence du terme de création locale plocal traduit l’absence de conservation
de l’énergie thermique.

Rappelons les conditions d’application de la relation (14.1) : on étudie un système


fermé (absence de transports convectifs) et on néglige les phénomènes radiatifs ;
on suppose aussi que le système étudié n’échange aucun travail et que le premier
principe se ramène donc au seul bilan thermique.
Notons qu’on peut aisément retrouver cette équation différentielle dans un modèle
unidimensionnel simple, conformément à la figure 14.1.
L’application du premier principe à un système infinitésimal de longueur dx, de
section S, donc de volume S dx et de masse dm = ρSdx impose, en l’absence de
tout travail reçu, dU = δQ = δQc + δQlocal , où on a noté δQc le transfert ther-
mique reçu par conduction à travers les parois du système en x et x + dx et δQlocal
le transfert apporté localement par des sources réparties en volume. On écrit alors
δQc = (Φc (x) − Φc (x + dx)) dt où Φc (x) = Sjc (x) et δQlocal = plocal Sdxdt ; comme
300 Physique, MP, MP*

Φc (x) Φc (x + dx)

b b
x x + dx

Figure 14.1 – Modèle unidimensionnel de conduction thermique

∂T ∂jc ∂T
enfin dU = ρcSdx dt, il vient bien sûr + ρc = plocal , qui est la forme
∂t ∂x ∂t
particulière de l’équation (14.1) dans le cas unidimensionnel.

Dans la plupart des cas, il est exigé des étudiants qu’ils retrouvent l’équation (14.1)
en utilisant par exemple le raisonnement unidimensionnel présenté ci-dessus ; il faut
donc à la fois savoir et savoir retrouver cette forme locale de l’équation de bilan
thermique.

2 Équation de diffusion thermique : l’emploi simultané de l’équation-bilan (14.1) et


∂T
de la loi de Fourier (13.8) mène à −λ∆ T +ρc = plocal puisque div grad f = ∆ f ; on
∂t
réécrit habituellement cette relation, pour faire apparaı̂tre les analogies et différences
1 ∂2f
avec l’équation de d’Alembert ∆ f = 2 2 , sous la forme :
c ∂t

ρc ∂T plocal ∂T plocal
∆T = − ou = Dth ∆ T + (14.2)
λ ∂t λ ∂t ρc

λ
Le coefficient Dth = porte le nom de coefficient de diffusion ou diffusivité ther-
ρc
mique ; il s’exprime en mètres carrés par seconde et traduit la plus ou moins grande
facilité de l’homogénéisation des écarts de température dans un matériau donné. Une
bonne diffusion thermique exige une conductivité thermique λ élevée (forte propension
à transmettre les flux thermiques) mais aussi une faible capacité thermique volumique
ρc (faible pouvoir de stockage de l’énergie sous forme thermique).

Matériau λ, W · m−1 · K−1 c, J · kg−1 · K−1 ρ, kg · m−3 Dth , m2 · s−1


Cuivre 390 385 8 920 1, 1 × 10−4
Eau 0, 54 4, 18 × 103 1 000 1, 3 × 10−7
Air 2, 6 × 10−2 1, 02 × 103 1, 28 2, 0 × 10−5

Table 14.1 – Diffusivité thermique des solides, liquides et gaz

La table 14.1 présente la détermination de la diffusivité thermique d’un solide (le


cuivre), d’un liquide (l’eau à 20 ◦ C) et d’un gaz (l’air dans les conditions normales de
température et de pression).

14.1.2 Régimes variables de diffusion thermique


2 Ordres de grandeur : dans tous les cas, on remarque l’ordre de grandeur des
coefficients de diffusion, qui est nettement inférieur à l’unité. On peut interpréter ce
14 : Régimes de transfert thermique 301

résultat de la manière suivante : une longueur ℓ et une durée τ caractéristiques des


ℓ2
phénomènes de diffusion thermique seront reliés par Dth ∼ .
τ
Attention, dans cette expression, ℓ désigne une longueur mesurée dans le sens où
le transfert thermique a effectivement lieu, comme l’axe (Ox) de la figure 14.1 ;
2
Z donc jamais de considérer ℓ comme une surface. Les flux thermiques
il ne s’agit
Φc = jc · ndS sont effectivement proportionnels à la surface d’une section
(S)
droite du vecteur jc , surface mesurée perpendiculairement au sens des transferts
thermiques.
p
Ainsi, si τ est de l’ordre de grandeur de la seconde, ℓ est de l’ordre de Dth τ ∼ 1 cm
avec le cuivre, matériau qui présente une diffusivité thermique parmi les plus élevées
connues. Dans ce cas, l’énergie thermique diffusera en unep seconde sur une profondeur
de 1 cm. Si on prend ensuite τ ∼ 100 s, on trouvera ℓ ∼ Dth τ ∼ 10 cm, et ainsi de
suite.
Avec tout autre matériau de diffusivité plus faible, les dimensions ℓ associées à la
même durée τ seront plus faibles ou, si on préfère, les échelles de temps τ associées
aux mêmes dimensions seront plus importantes :

Durée des phénomènes de diffusion thermique


X La durée d’un phénomène de diffusion thermique varie comme le carré
ℓ2
de la profondeur sur laquelle se fait cette diffusion, selon τ ∼ .
Dth
Pour des dimensions macroscopiques, ces durées sont en général longues,
de l’ordre de plusieurs minutes, voire plusieurs heures : les transferts
thermiques sont des phénomènes lents.

Cette lenteur relative des phénomènes de transfert thermique est souvent mise à
profit pour affirmer qu’un phénomène rapide peut, en première approximation, être
considéré comme adiabatique. L’absence d’isolants thermiques parfaits est ainsi com-
pensée, sur le plan pratique, par la lenteur des échanges thermiques en comparaison
des autres modes d’échange énergétique.

2 Diffusion thermique : l’équation (14.2) prend, en l’absence de toute phénomène


de création locale, le nom d’équation de diffusion thermique ou équation de la chaleur
(nom historique) ; plus généralement, on appellera équation de diffusion (ou équation
de Kelvin) toute équation différentielle de la forme :

∂f (r, t)
= D∆ f (r, t) (14.3)
∂t

où le coefficient de diffusion D se mesure en mètres carrés par seconde, quelle que soit
la nature de la grandeur f .
Au contraire de l’équation de d’Alembert, la dérivée temporelle apparaı̂t ici au premier
ordre ; les solutions de cette équation aux dérivées partielles ne sont donc en général
pas invariantes par renversement du sens du temps. On peut par exemple noter que si
∂f ∂f
on fait le changement t → t′ = −t, alors ′ = − et l’équation de diffusion (14.3)
∂t ∂t
n’est pas invariante par ce changement.
302 Physique, MP, MP*

∂2f
Au contraire, dans le cas des solutions de l’équation de d’Alembert = c2 ∆ f , le
∂t2
même changement de variables laisse l’équation inchangée puisqu’une seconde dériva-
∂2f ∂2f
tion impose ′2 = (−1)2 2 .
∂t ∂t
Cette circonstance n’a rien d’inattendu dans la mesure où on se souvient du caractère
irréversible des transferts thermiques dus à des différences de température : les situa-
tions de transfert thermique privilégient un sens d’écoulement du temps. Au contraire,
les propagations d’onde sont des évolutions réversibles.

14.1.3 Méthodes d’étude des phénomènes conductifs en régime variable


2 Le problème étudié : on s’intéresse ici à un milieu conducteur de la chaleur,
caractérisé par une conductivité thermique λ, une capacité thermique massique c et
une masse volumique ρ ; ces trois grandeurs sont supposées constantes, ainsi donc que
la diffusivité thermique Dth = λ/ρc. Dans un tel milieu, que nous supposerons soumis
en volume aux seuls échanges thermiques conductifs, la température T est la solution
∂T plocal
de l’équation aux dérivées partielles = Dth ∆ T + , où la densité volumique
∂t ρc
de puissance thermique localement créée plocal est une fonction supposée donnée du
point et du temps.
2 Les cas particuliers : on a déjà vu qu’en régime permanent et en l’absence de tout
terme de création locale, l’équation de diffusion thermique prend la forme de l’équation
de Laplace ∆ T = 0 ; sa résolution mène au calcul des conductances thermiques.
Toujours en régime permanent, mais dans le cas où on ne néglige plus les termes de
création locale, l’équation de diffusion thermique prend le nom d’équation de Poisson ;
plocal
elle s’écrit ∆T = − . Il est possible de montrer que sa solution est unique pour
λ
des conditions aux limites données.
L’étude exhaustive des solutions en régime quelconque (variable) de l’équation de
la diffusion thermique n’est pas possible ; nous présenterons cependant quelques mé-
thodes de résolution, en supposant dans tout ce qui suit que le terme de création
locale est absent, plocal = 0.
∂T
2 Conditions aux limites : la résolution de l’équation de diffusion = Dth ∆ T im-
∂t
pose en général la connaissance de conditions initiales (à l’instant t = 0 par exemple)
et de conditions aux limites, aux bords du volume du système (Σ) dans lequel s’ap-
plique l’équation de diffusion.
Il est en général plus important de considérer d’abord l’existence et la nature des
conditions aux limites ; en particulier, la présence de deux conditions aux limites pour
la résolution dans un domaine borné de l’espace mène souvent à l’emploi de séries
de Fourier pour le développement des solutions, tandis que la résolution dans une
région de l’espace non bornée passe parfois par des méthodes de Fourier généralisées,
développant les solutions sous forme d’intégrales (ou transformées) de Fourier.
2 Nature des conditions aux limites : elles dépendent de la nature du milieu qui
entoure la région (Σ) de l’espace où on cherche à résoudre l’équation de diffusion
thermique.
• Lorsque le milieu étudié (Σ) est limité par un conducteur thermique parfait (C), on
impose T (r, t) = T0 (t) en tout point de la surface limite séparant (Σ) et (C) ;
14 : Régimes de transfert thermique 303

T0 (t) désigne ici la température (uniforme) dans tout le volume du conducteur


parfait (C).
• Si de plus ce conducteur (C) est traité comme un thermostat (parce qu’il est par
exemple de grand volume), alors T0 (t) est aussi une constante au cours du temps.
• Lorsque le milieu étudié (Σ) est limité par une paroi (Π), on connaı̂t parfois le plus
pariétal Φp à travers la paroi (Π), par exemple si Φp peut être déterminé par
l’étude d’un autre mode de transfert thermique. On aura alors une condition
aux limites Zportant sur le flux de jc à travers la surface (Π), ce flux étant égal
à Φp , selon jc · ndS = Φp .
(S)
L’étude détaillée des transferts thermiques pariétaux convecto-conductifs est
proposée plus loin.
• Si le milieu (Σ) est limité par un isolant supposé parfait, le flux de jc doit être nul
à travers toute surface entourant (Σ) ou, si on préfère, la composante normale
jc · n doit être nulle en tout point de la surface extérieure de (Σ).

2 Méthodes d’intégration des équations de la diffusion : la résolution d’une équation


∂f
de diffusion = D∆f peut toujours se faire en recherche de solutions séparées, ce
∂t
qui revient à rechercher des solutions de la forme :

f (r, t) = f0 + R(r)Θ(t) (14.4)

1 dΘ 1
où les fonctions R et Θ vérifient alors nécessairement =D ∆ R(r). Les
Θ(t) dt R(r)
deux membres de cette égalité ne dépendent ni du temps (comme le montre la seconde
expression) ni de l’espace (comme le montre la première) ; il s’agit donc d’une vraie
constante, que nous noterons −1/τ :
• pour respecter sa dimension physique : τ est une durée, comme le montre l’équation
1 dΘ 1
différentielle =− ;
Θ(t) dt τ
• τ est vraisemblablement toujours négatif, puisque sinon la solution de cette même
équation différentielle serait une exponentielle réelle divergente pour t → ∞,
physiquement inacceptable.
dΘ Θ
Les équations vérifiées par Θ(t) et R(r) deviennent alors respectivement = − et
dt τ
τ
∆ R = − R. La forme de la solution R(r) dépend du système de coordonnées choisi et
D µ ¶
t
des conditions aux limites, mais la forme générale de la solution Θ(t) = Θ0 exp −
τ
montre qu’une telle méthode de résolution mène à l’étude de régimes transitoires
thermiques ; la forme la plus générale de la solution est a X priori une combinaison
linéaire de divers régimes transitoires, sous la forme f (r, t) = Rτ (r) exp (−t/τ ), où
τ
Rτ est solution de l’équation aux valeurs propres de Laplace ∆ Rτ (r) = −τ Rτ (r)/D.
∂f
2 Solutions harmoniques : on peut considérer l’équation de diffusion = D∆ f
∂t
comme une équation d’onde et en rechercher des solutionsn sous la forme d’ondes o
planes progressives et monochromatiques, f (r, t) = f0 + Re f 1 exp [i (ωt − k · r)] ;
304 Physique, MP, MP*

on obtient alors l’équation de dispersion iω = −Dk2 qui montre la nature complexe


du vecteur d’onde, et donc la nécessité de l’absorption des ondes en même temps que
leur propagation. On obtient alors k = ku, où u est le vecteur unitaire de la direction
de propagation, donc Re(k) > 0 ce qui impose :
r
1−i ω 1−i
k= √ = (14.5)
2 D δ

On remarque que Im(k) < 0, ce qui traduit une absorption de l’onde ; on peut pour
s’en convaincre rappeler
n la forme explicite de f (r, t), par exemple
o avec u = ex , se-
lon f (r, t) = f0 + Re f 1 exp [i (ωt − Re(k)x)] × exp (Im(k)x) ; c’est l’exponentielle
³ x´
réelle exp (Im(k)x) = exp − qui rend compte de cette absorption. Celle-ci se fait
δ r
2D
sur une longueur de l’ordre de grandeur de l’épaisseur de peau δ définie par δ = ;
ω
plus les phénomènes thermiques sont rapides et plus ils s’atténuent après une courte

longueur. Ainsi, un phénomène diurne, avec ω = dans un milieu ordinaire, avec
1 jour
−5 2 −1
Dth ∼ 10 m · s s’atténue sur une longueur δ ∼ 1 m. C’est par exemple pour cette
raison qu’une bonne cave (pour la conservation des boissons par exemple) doit être
enterrée à quelques mètres de profondeur seulement, pour assurer une atténuation
satisfaisante de l’amplitude des oscillations thermiques de surface.
2 Solutions remarquables : on rencontre souvent dans l’étude des phénomènes de
diffusion des répartitions de grandeurs physiques (température,
√courants thermiques,
etc.) fonctions de la variable réduite (sans dimension) u = x/2 Dt ; en particulier, la
fonction gaussienne et la fonction d’erreur :
u
1 2
Z
G(x, t) = √ exp −u2 et erf(u) = √ exp −v 2 dv
¡ ¢ ¡ ¢
(14.6)
t π 0

sont souvent utilisées pour l’étude de problèmes de diffusion, puisqu’on vérifie immé-
diatement que ces fonctions sont toutes deux solution de l’équation de diffusion à une
∂f ∂2f
dimension d’espace, = D 2 . La figure 14.2 représente le comportement de ces
∂t ∂x
fonctions paires de x pour des valeurs consécutives de t.
Le tracé de la gaussienne G(x) représente bien les évolutions des écarts de température
dans une barre, initialement chauffée en son centre, en fonction de la distance x
à ce centre : la température s’homogénéise progressivement, le pic de température
s’aplatissant progressivement tout en ralentissant régulièrement
√ sa diffusion puisque
sa largeur à mi-hauteur progresse seulement comme t.
Le tracé de la fonction d’erreur représente aussi assez bien une évolution vers l’équi-
libre thermique d’un milieu unidimensionnel, initialement à une température élevée,
si on impose brutalement et durablement une température plus faible à son extrémité
x = 0. Là aussi, on voit une évolution progressive qui va en ralentissant, le point√ où
la température est la moyenne des valeurs extrêmes ne progressant que comme t.

Dans les deux cas, on retrouve l’évolution caractéristique D ∼ ℓ2 /τ ou ℓ ∼ Dτ ,
comme prévu de manière générale par l’équation de diffusion. On pourra une fois
encore faire utilement la comparaison avec la conclusion c ∼ ℓ/τ ou ℓ ∼ cτ qu’on
obtiendrait pour des ondes de célérité c, solutions de l’équation de d’Alembert.
14 : Régimes de transfert thermique 305


G(x, t) erf(u) = erf(x/2 Dt)
√ b
1/ t 1
t
t t′ > t
√ b b b
1/2 t 0, 5
t′ > t t′′ > t′
t′′ > t′

b
x b
x
√ √
2 ln 2 Dt 0, 95 Dt

Figure 14.2 – Fonction gaussienne et fonction d’erreur

14.1.4 Entropie et diffusion thermique


2 Application qualitative du second principe : le caractère irréversible des transferts
thermiques dans les phénomènes conductifs est du à l’existence de différence des tem-
pératures de divers points d’un système physique. cette irréversibilité impose certaines
conditions aux solutions de l’équation de diffusion thermique :
• Les phénomènes de diffusion thermique s’atténuent au cours du temps et tendent en
général vers un état d’équilibre thermique ; ce sont des phénomènes transitoires.
• Les phénomènes de transfert thermique ralentissent progressivement au fur et à
mesure que les gradients thermiques s’atténuent, donc au fur et à mesure que
l’on s’approche de l’équilibre.

2 Application quantitative du second principe : on peut vérifier le caractère irrévesible


des transferts thermiques conductifs en effectuant un bilan de création d’entropie pour
un système thermodynamique (Σ), de surface extérieure (S), soumis en volume aux
seuls transferts donnés par la loi de Fourier.
Nous envisageons pour ce système une transformation localement réversible, puisque
les différences de température T (M ) − T (M ′ ) → 0 lorsque M M ′ → 0 : c’est la
définition même du caractère continu des solutions T (r, t) recherchées. On peut alors
∂T
écrire, pour un volume élémentaire dτ dans le matériau, δ 2 Q = dU = ρc dτ dt donc
∂t
2
δ Q ρc ∂T div jc
d2 S = qui s’écrit aussi d2 S = dτ dt = − dτ dt.
T T ∂t T
Pour le systèmeZ (Σ) en entier, la variation d’entropie au cours d’une durée dt vérifie
dS div jc
donc =− dτ ; cette variation doit être la somme des entropies créée et
dt (Σ) T
dS δScréé δStransféré
échangée par unité de temps, = + , où on vérifiera le caractère
dt dt dt
irréversible de la transformation en calculant le terme transféré pour en déduire le
δScréé
caractère strictement positif de l’entropie créée par unité de temps .
dt
L’entropie transféré correspond à l’ensemble des transferts thermiques pariétaux, sur
la surface (A) qui limite le système thermodynamique (Σ). Ainsi, un élément d’aire
dA correspond à un transfert thermique δQ = −jc ·ndA dt, la normale n étant orientée
vers l’extérieur de (Σ) et δQ compté positivement s’il est reçu par (Σ). En ce point
306 Physique, MP, MP*

de la surface, la température deIla source qui fournit ce transfert est notée T et on


δStransféré jc · n
peut donc écrire =− dA.
dt (A) T
µ ¶
δStransféré
Z
jc
Par application du théorème d’Ostrogradski, = − div dτ ; la
dt (Σ) T
dS
comparaison avec la variation d’entropie du système montre que l’entropie créée
dt Z · µ ¶ ¸
δScréé dS δStransféré jc div jc
par unité de temps est = − = div − dτ .
dt dt dt (Σ) T T

Tenant compte des formules de dérivation vectorielles div (f w) = f div w + grad f · w


1 grad f δScréé jc · grad T
Z
et grad = − , il vient =− dτ qu’on écrira encore, du
f f2 dt (Σ) T2
µ ¶2
δScréé grad T
Z
fait de la loi de Fourier, = λ dτ > 0 : les transferts thermiques
dt (Σ) T
par conduction sont toujours irréversibles, le seul cas d’annulation de l’entropie créée
correspondant à la fin de la transformation, lorsque T est uniforme en tout point du
milieu conducteur (ou bien au cas où λ = 0).

Irréversibilité et déséquilibre thermique


X Toute inhomogénéité de température entraı̂ne une irréversibilité des
transferts thermiques, sauf de part et d’autre d’un isolant thermique
parfait.

14.2 Régimes permanents thermiques

14.2.1 Conduction thermique en régime permanent

2 Équation de Laplace : en régime permanent, l’équation de diffusion thermique


prend alors la forme de l’équation de Laplace ∆ T = 0 ; la résolution ce cette équation
aux dérivées partielles se fait en général en deux temps :
• la géométrie du système impose le choix des coordonnées (cartésiennes, cylindriques
ou sphériques) adaptées à la géométrie du système thermodynamique ;
• la solution de l’équation de Laplace T (r) ainsi écrite ne dépend en général alors
plus que des conditions aux limites de ce système : valeurs de T ou de grad T
(donc de jc ) sur la surface limitant le volume étudié.

T2

jc

T 1 > T2

Figure 14.3 – Tube de champ du courant thermique


14 : Régimes de transfert thermique 307

Nous étudierons dans la suite la géométrie résistive décrite sur la figure 14.3, le système
(Σ) étant délimité par deux zones parfaitement conductrices de températures fixées
T1 et T2 , et par les limites d’un tube de champ formé par les lignes de champ du
vecteur jc (on parle de lignes de courant thermique).
On peut aussi utiliser un milieu conducteur limité latéralement par un isolant ; les
lignes de courant de jc sont alors tangentielles à ces limites, par définition même d’un
isolant thermique.

On se rappellera que les lignes iso-T sont perpendiculaires aux lignes de champ
de grad T , donc de jc ; en effet, une variation de température est donnée par
dT = grad T · dr ; une ligne iso-T correspond donc à dT = 0 donc à un dé-
placement dr orthogonal à grad T . En représentant des schémas analogues à celui
de la figure 14.3, on prendra donc soin de représenter des lignes de courant thermique
perpendiculaires aux surfaces isothermes !
L’équation de diffusion thermique étant supposée résolue, on peut en déduire la fonc-
tion T (r) ainsi que ses dérivées, et en particulier jc = −λgrad T , dont les interpréta-
tions sont deux grandeurs intégrales, définies sur la figure 14.4.
Z M2
• L’intégrale ℑ(C) = grad T · dr, menée sur n’importe quelle courbe (C) joignant
M1
les surfaces (S1 ) et (S2 ) des deux conducteurs thermiques parfaits, a pour valeur
ℑ(C) = T2 − T1 .
Par définition même du gradient, cette intégrale est indépendante du choix de
la courbe (C).
Z
• L’intégrale ℑ(S) = grad T · nds, menée sur n’importe quelle surface (S) cou-
(S)
pant le tube de champ (les
Z surfaces (S1 ) et (S2 ) conviennent d’ailleurs) a pour
interprétation −λℑ(S) = jc · ndS = Φc , qui est le flux thermique à travers
(S)
la surface (S).
Notons toutefois que cette interprétation ne subsiste que si λ est uniforme dans
(Σ) ; si ce n’est pas le cas, on peut bien sûr toujours étudier Φc , qui n’est plus
forcément proportionnel à ℑ(S) .
Puisqu’en régime permanent div jc = 0, le vecteur jc est à flux conservatif, c’est-
à-dire que le flux thermique sortant d’une surface fermée est nulle ; on en déduit
immédiatement que Φc et ℑ(S) ne dépendent pas du choix de la surface (S).

T2
b surface (S2 )
(C) M2

bM milieu (Σ)

(S)
M1
b
surface (S1 )
T1

Figure 14.4 – Géométrie d’une résistance thermique

Le signe de Φc dépendant de l’orientation de la normale n, nous choisirons dans la


suite par convention cette normale dans le sens effectif du transfert thermique attendu,
308 Physique, MP, MP*

c’est-à-dire dans le sens du vecteur jc ; par exemple, dans le cas de la figure 14.4, le
vecteur jc est orienté de (S1 ) vers (S2 ) car on a supposé T1 > T2 .
2 Conductance thermique : de façon évidente, l’ajout d’une constante quelconque
à T ne change ni son caractère de solution de l’équation de Laplace ∆ T = 0, ni les
intégrales ℑ(S) et ℑ(C) qui ne dépendent que de grad T ; ces intégrales ne dépendent
donc pas de T1 et de T2 , mais seulement de T1 − T2 .
En fait, ces deux intégrales dépendent linéairement de la différence T1 − T2 puisque
les équations ∆ T = 0 et jc = −λgrad T sont linéaires ; le rapport de ces deux
intégrales ne dépend donc pas de T1 − T2 . Il ne dépend que de la géométrie du milieu
matériel (Σ) et de sa conductivité thermique λ. Ce rapport, défini pour être positif
par construction, vaut :
Z
jc · ndS
Φc (S)
Gth = =Z (14.7)
T1 − T2
grad T · dr
(C)

Si de plus λ est une constante, on peut aussi écrire Gth = λℑ(S) /ℑ(C) et la conductance
thermique est le produit de la conductivité thermique par une grandeur de nature géo-
métrique, qui est le quotient d’une surface (orthogonale aux transferts thermiques) par
une longueur (mesurée parallèlement à ceux-ci) ; on se souviendra donc de l’expression
approchée générale :

S⊥
Gth ∼ λ >0 (14.8)
ℓk

1 1 ℓk
On définit aussi la résistance thermique Rth = ∼ . L’unité de mesure
Gth λ S⊥
des conductances thermiques est le watt par kelvin, et l’ordre de grandeur de ces
conductances dépend du matériau choisi et de sa géométrie.
Prenons d’abord un exemple dans le domaine du bâtiment ; la conductivité thermique
du béton est λ = 1, 3 W · m−1 · K−1 et un mur de béton de 10 cm d’épaisseur et de
20 m2 de surface a une conductance thermique Gth = 260 W · K−1 ; ceci signifie qu’un
écart thermique de 10 ◦ C de part et d’autre d’un tel mur impose un flux thermique
(pertes thermiques) égal à Φc = 2, 6 kW ! Cette valeur très élevée explique l’emploi
de matériaux isolants (matériaux expansés ou laines, ou encore circulation d’air dans
les murs de béton) dans la construction. Pour mieux visualiser l’importance d’une
telle fuite de 2, 6 kW, en termes de dépenses de chauffage. Elle représente près du
tiers de la puissance maximale disponible dans un abonnement électrique domestique
habituel, seulement pour compenser une fuite thermique sur un seul mur de 20 m2 .
Le cas de la laine de verre est justement intéressant, avec λ = 0, 045 W · m−1 · K−1 ,
la même épaisseur et la même surface mènent à Gth = 9, 0 W · K−1 et Φc = 90 W
pour le même écart de température. Si on comprend l’intérêt pratique de l’isolation
thermique, il reste à savoir commet associer les deux conductances calculées ici, en
développant les règles d’association en série et en parallèle.
2 Analogies électriques : les relations (14.7) et (14.8) suggèrent l’analogie avec les
conductances et résistances électriques, que l’on peut définir avec la même géométrie
que celle de la figure 14.4 par la relation :
14 : Régimes de transfert thermique 309

Z
j · ndS
I (S) S⊥
G= =Z ∼γ >0 (14.9)
V1 − V2 ℓk
grad V · dr
(C)

où on peut suivre les règles de substitution du tableau 14.2 pour l’analogie entre
phénomènes électrocinétiques et thermiques.

Grandeur thermique Grandeur électrocinétique


Température T Potentiel V
Flux thermique Φc Courant électrique I
Conductance thermique Gth Conductance électrique G
Résistance thermique Rth Résistance électrique R
Conductivité thermique λ Conductivité électrique γ
Densité de courant thermique jc Densité de courant électrique j
Loi de Fourier, jc = −λgrad T Loi d’Ohm, j = γE = −γgrad T

Table 14.2 – Analogies entre conduction thermique et électrique

Gth G
En particulier, pour une même géométrie, on trouvera = . Nous verrons ulté-
λ γ
rieurement que la même analogie s’applique aussi aux calculs des capacités de conden-
Q
sateurs ; la définition C = de ces capacités montrera qu’elles sont l’analogue
V1 − V2
des conductances électriques et thermiques, et qu’on pourra étendre le résultat ci-
dessus sous la forme générale :

Gth G C
= = (14.10)
λ γ ε

où la permittivité diélectrique ε de l’isolant constituant l’espace de séparation des


deux armatures du condensateur sera, comme on le verra, de l’ordre de grandeur de
la constante ε0 , atteinte seulement dans le cas du vide.
Signalons ici une autre analogie possible entre phénomènes électriques et transferts
thermiques : la relation dU = CdT définit une capacité thermique C, qui décrit l’accu-
mulation d’énergie interne d’un système thermodynamique lors d’une augmentation
de température. De façon qualitativement semblable, la relation dq = CdU définit
un capacité de condensateur C, qui décrit l’accumulation de charges électriques d’un
système électrostatique lors d’une augmentation de la tension à ses bornes.
Enfin, quand le même flux thermique traverse deux isolants, ils sont dits placés en
série ; la chute de température aux bornes de l’ensemble est la somme des deux chutes
de température successives et on applique la règle d’addition des résistances, donc
1 1 1
= + ; la conductance thermique est donc moindre que la plus
Gth,série Gth,1 Gth,2
faible des deux conductances mises en série, comme dans le cas de l’isolation évoquée
plus haut d’un mur de béton par une couche de laine de verre.
De même, quand deux matériaux sont soumis à la même différence de température,
ils sont dits placés en parallèle ; le flux thermique à travers l’ensemble est la somme
des deux flux thermiques et on applique la règle d’addition des conductances, donc
310 Physique, MP, MP*

Gth,parallèle = Gth,1 + Gth,2 ; la conductance thermique est donc plus élevée que la plus
élevée des deux conductances mises en parallèle.

Conductances et capacités
X Les règles d’addition des conductances, conductances thermiques et ca-
pacités sont les mêmes. Dans le cas d’une association en série, on fait la
somme des termes 1/G, 1/Gth ou 1/C. Dans le cas d’une association en
parallèle, on fait la somme des termes G, Gth ou C.
On reconnaı̂t une association en série car le flux extensif (le courant
électrique ou le flux thermique) est le même dans tous les éléments de
l’association.
On reconnaı̂t une association en parallèle car la contrainte intensive aux
bornes (la différence de potentiel ou la différence de température) est la
même pour tous les éléments de l’association.

2 Méthodes de résolution : la résolution d’un problème de transfert thermique en


régime permanent, c’est-à-dire la résolution de ∆ T = 0, suit les mêmes principes
que la résolution d’un problème d’électrostatique, dont il est l’analogue. On retiendra
deux méthodes, en fonction de la simplicité plus ou moins grande de la géométrie du
problème étudié :

• Si la géométrie est très simple, on peut directement affirmer la direction du vecteur


densité de courant thermique jc par une étude de symétrie et d’invariances.
Z
On détermine alors jc par application de la relation jc · ndS = Φc (comme
(S)
on déterminerait le champ électrique par application du théorème de Gauss).
On en déduit les expressions de grad T puis de T , grâce aux conditions aux
limites (comme on déduirait la répartition du potentiel de la donnée de E).
Le rapport Φc /(T1 − T2 ) ne dépend pas du choix de Φc mais seulement de la
géométrie ; il détermine la conductance thermique du système étudié.
• Si la géométrie ne permet pas une identification immédiate des symétries et in-
variances de jc , on développe l’expression de l’équation aux dérivées partielles
∆ T = 0, en utilisant un système de coordonnées orthogonal adapté au problème
posé.
La résolution de cette équation différentielle a, pour des conditions aux limites
données, une solution unique : c’est le théorème d’unicité.
On déduit de l’expression de T (r) le vecteur jc = −λgrad T puis son flux Φc ;
le quotient Φc /(T1 − T2 ) ne dépend pas du choix de Φc mais seulement de la
géométrie ; il détermine la conductance thermique du système étudié.

14.2.2 Géométrie unidimensionnelle en régime permanent

2 Présentation : trois situations classiques correspondant à des phénomènes unidi-


mensionnels simples méritent d’être retenues ; il s’agit des trois géométries cartésienne,
cylindrique et sphérique. Rappelons les expressions du laplacien dans ces trois sys-
∂2f ∂2f ∂2f 1 ∂2f ∂2f
µ ¶
1 ∂ ∂f
tèmes, ∆ f (x, y, z) = 2
+ 2 + 2 , ∆ f (r, θ, z) = r + 2 2 + 2
∂x ∂y ∂z ¶r ∂r ∂r r ∂θ ∂z
∂2f
µ ¶ µ
1 ∂ 2 ∂f 1 ∂ ∂f 1
et ∆ f (r, θ, ϕ) = 2 r + 2 sin θ + 2 2 .
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
14 : Régimes de transfert thermique 311

d2 T
2 Problème unidimensionnel cartésien : ici, T = T (x) donc ∆ T = = 0 donc
dx2
dT
T (x) est une fonction affine de x, T (x) = T (0) + αx et jc = −λ ex = −λαex soit
dx
jc = −jc ex avec α = jc /λ ; ces résultats sont résumés sur la figure 14.5.
T T (0) + jc L/λ
b

T (0)
b
x
b b
0 L
S jc = −jc ex

Figure 14.5 – Régime permanent unidimensionnel cartésien

En particulier, la conductance thermique d’un barreau de section S et de longueur L


T (L) − T (0)
tel qu’il est représenté sur la figure 14.5 vérifie Φc = −jc S avec jc = λ
L
d’où on déduit immédiatement :

S
Cylindre à conduction axiale : Gth = λ (14.11)
L

2 Problème ¶ cylindrique : il vérifie T = T (r) en coordonnées cylindriques donc


µ radial
1 d dT dT a
∆T = r = 0 ; ainsi, r est une constante et on peut écrire jc = er où
r dr dr dr r
on peut interpréter a en calculant le flux de jc sortant d’un cylindre de rayon r et de
ϕc dT
hauteur h, soit Φc = 2πha ; on notera donc plutôt jc = er = −λ er où ϕc est
2πr dr
ϕc r
un flux thermique par unité de longueur. On en déduit T (r) = T (r0 ) − ln .
2πλ r0
z jc
r1 r0 jc ∝
1/r

b b
r
r0 r1
jc jc T
T∝
h ln r
+ ct
e

b b
r
r0 r1

Figure 14.6 – Régime permanent unidimensionnel cylindrique

La géométrie correspondante est rappelée sur la figure 14.6 ; on y constate une dilution
géométrique du courant thermique jc dont l’intensité décroı̂t quand r augmente, de
312 Physique, MP, MP*

façon à préserver le flux thermique par unité de hauteur ϕc à travers des cylindres de
rayon de plus en plus grands.
En particulier, la conductance thermique d’un manchon cylindrique de rayons inté-
rieur r0 et extérieur r1 sur une hauteur h tel qu’il est représenté sur la figure 14.6 vérifie
ϕc r1
Φc = hϕc avec aussi T1 − T2 = ln ; on en déduit l’expression de la conduc-
2πλ r0
2πh
tance thermique de ce manchon cylindrique, Gth = λ ; on vérifie d’ailleurs
ln r1 /r0
la forme générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 sont voisins, puisque
r1 − r0
alors ln r1 /r0 ≃ , la section ouverte au passage du flux thermique est bien
r0
S⊥ ≃ 2πhr0 et la longueur le long de laquelle ce flux se répartit est ℓk = r1 − r0 . On
retiendra au moins :
2πh
Manchon cylindrique à conduction radiale : Gth = λ r1 (14.12)
ln
r0

2 Problèmeµ radial ¶sphérique : il vérifie T = T (r) en coordonnées sphériques donc


1 d dT dT a
∆T = 2 r2 = 0 ; ainsi, r2 est une constante et on peut écrire jc = 2 er
r dr dr dr r
où on peut interpréter a en calculant le flux de jc sortant d’une sphère de rayon r et
Φc dT
de hauteur h, soit Φc = 4πa ; on notera donc plutôt jc = er = −λ er . On en
µ ¶ 4πr2 dr
Φc 1 1
déduit T (r) = T (r0 ) + − .
4πλ r r0
jc
r0
jc ∝
1/r 2
jc jc
b b
r
b
r0 r1
T
T∝
1/r
jc + cte
jc
r
b b
r1 r0 r1

Figure 14.7 – Régime permanent unidimensionnel sphérique

La géométrie correspondante est rappelée sur la figure 14.7 ; on y retrouve une dilution
géométrique de l’intensité du vecteur jc au fur et à mesure que le flux thermique se
répartit sur des sphères de rayon croissant, tout comme on avait observé une dilution
de l’amplitude d’une onde sphérique au fur et à mesure qu’elle se propage loin de
sa source : il s’agit dans les deux cas d’assurer la répartition de la même quantité
d’énergie, en l’absence de pertes, cette énergie se répartissant sur une surface de plus
en plus grande.
En particulier, la conductance thermiqueµd’une coquille
¶ sphérique de rayons intérieur
Φc 1 1
r0 et extérieur r1 vérifie T1 − T2 = − ; on en déduit l’expression de la
4πλ r0 r1
14 : Régimes de transfert thermique 313

4πr0 r1
conductance thermique de ce système, Gth = λ ; on vérifie d’ailleurs la forme
r1 − r0
générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 dont voisins, puisque la section
ouverte au passage du flux thermique est alors S⊥ ≃ 4πr02 ≃ 4πr12 et la longueur le
long de laquelle ce flux se répartit est ℓk = r1 − r0 . On retiendra au moins :

4πr0 r1
Coquille sphérique à conduction radiale : Gth = λ (14.13)
r1 − r0

2 Généralisation : lors de la résolution d’une équation de Laplace ∆ f (r) = 0,


certaines solutions particulières méritent d’être mémorisées. On les retrouvera dans
d’autres domaines de la Physique ; elles sont résumées dans le tableau 14.3.

Géométrie Scalaire f (r) Gradient w = grad f (r)


(solution de ∆ f = 0) (solution de div w = 0)
Cartésien f = f (x) f (x) = ax + b w = aex
b
Radial cylindrique f = f (r) f (r) = a + b ln r w = er
r
b b
Radial sphérique f = f (r) f (r) = a − w = 2 er
r r
Table 14.3 – Solutions classiques de l’équation de Laplace

On peut retrouver ces résultats rapidement en mémorisant la nature de la surface à


travers laquelle le flux est déterminé, comme l’indique le tableau 14.4.

Surface Flux Φ de w Vecteur w


(à flux conservatif)
Φ
plane, aire S Φ=S×w w = wex ; w = = Cte
S
Φ 1
cylindrique, aire 2πrh Φ = 2πrhw(r) w = w(r)er ; w(r) = ∝
2πhr r
Φ 1
sphérique, aire 4πr2 Φ = 4πr2 w(r) w = w(r)er ; w(r) = ∝
4πr2 r2
Table 14.4 – Vecteurs classiques à flux conservatifs

14.2.3 Régime permanent convecto-conductif

2 Étude d’une ailette de refroidissement : considérons un solide supposé unifor-


mément à la température T1 , entièrement plongé dans un fluide à la température
uniforme T0 < T1 (sauf dans la couche limite au voisinage immédiat du solide). Cette
différence de température correspond à un transfert thermique constant de puissance
δQ
Ptherm = < 0 reçu par le solide. Ce refroidissement est supposé assuré exclusi-
dt
vement par un certain nombre N d’ailettes de refroidissement, la géométrie de l’une
d’elles étant précisée sur la figure 14.8.
Cette ailette, de longueur totale ℓ, est supposée avoir une section s assez faible pour
qu’on puisse considérer la température T dans toute section droite comme uniforme ;
ainsi, en régime permanent, la température T ne dépend que de x. On peut alors déter-
miner cette température en faisant un bilan thermique pour la longueur dx d’ailette,
selon s (jc (x) − jc (x + dx)) + jp (x)pdx = 0, où on a noté p le périmètre de l’ailette.
314 Physique, MP, MP*

T1
Fluide, T0

O b b b b
x x + dx ℓ x

Figure 14.8 – Ailette de refroidissement

Dans le cas d’une ailette à section rectangulaire de côtés a et b, s = ab et p = 2(a + b) ;


ab
le rapport s/p est une longueur d⊥ qui vaut alors d⊥ = , en particulier pour
2(a + b)
une section carrée, d⊥ = a/4 est une dimension caractéristique transverse de l’ailette,
ce qui justifie sa dénomination. Finalement, il vient :

djc d2 T
−d⊥ = d⊥ λ 2 = h (T (x) − T0 ) (14.14)
dx dx

2 Résolution : la solutionrde l’équation d’ailette (14.14) ne dépend que de la


d⊥ λ
distance caractéristique δ = ; on l’écrit sous la forme générale T (x) = T0 +
³x´ ³x´ h
αch +βsh et les constantes d’intégration α et β peuvent être déterminées par
δ δ
la continuité de température en x = 0, T1 = T0 + α, et par la continuité des flux ther-
miques conductif et pariétal en·x = µ ℓ, qu’on
¶ écrira
µ j¶¸ c (ℓ) = · h(T (ℓ)
µ−¶T0 ) soit,µpuisque
¶¸
dT λ ℓ ℓ ℓ ℓ
jc = −λ , sous la forme − αsh + βch = h αch + βsh .
dx δ δ δ δ δ
r
th(ℓ/δ) − r d⊥ h
On en déduit α = T1 − T0 et β = (T1 − T0 ) où on a posé r = . On
rth(ℓ/δ) − 1 λ
peut donc décrire la répartition de température dans une telle ailette sous la forme
T (x) − T0 ³x´ th(ℓ/δ) − r ³x´
= ch + sh ; si l’ailette est longue (ℓ ≫ δ, on peut
T1 − T0 δ rth(ℓ/δ) − 1 δ
T (x) − T0 ³ x´
d’ailleurs remarquer que cette expressions s’écrit encore ≃ exp − .
T1 − T0 δ
dT
Le flux thermique conductif dans l’ailette est donné par jc (x) = −λ ; le flux total
¯ dx
dT ¯
¯
évacué par l’ailette peut donc se calculer par Φc = −λs ou encore, après
dx ¯ x=0
calculs, Φcr
= sheq (T1 −T0 ), où on a défini un coefficient de transfert pariétal équivalent
hλ r − th(ℓ/δ)
par heq = .
d⊥ rth(ℓ/δ) − 1
Φc
On peut aussi définir une conductance thermique de fuite par Gth = donc
T1 − T0
ici Gth = sheq ; ce résultat est d’ailleurs général, les transferts thermiques pariétaux
ayant pour analogue électrique les conductances décrivant les fuites de courant, par
exemple vers la masse.
14 : Régimes de transfert thermique 315

Ce qu’il faut absolument savoir

Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
En présence seulement des phénomènes conductifs et de création locale, on doit
∂T
savoir et savoir retrouver par un bilan local la relation div jc + ρc = plocal ,
∂t
qui exprime localement la non-conservation de l’énergie thermique.
Du fait de la loi de Fourier, l’équation locale de bilan thermique devient alors
∂T plocal
l’équation de diffusion = Dth ∆ T + , où la diffusivité thermique Dth
∂t ρc
se mesure en m2 · s−1 .
En régime permanent, on définit la conductance thermique d’un milieu conduc-
Φc
teur par Gth = . On l’obtient en résolvant l’équation de Laplace
T2 − T1
∆ T = 0 dans le volume du milieu conducteur. Il y a analogie avec les conduc-
Gth G S⊥
tances électriques, = . En général, Gth ∼ λ > 0.
λ γ ℓk
Les solutions de l’équation de Laplace ∆ T = 0 en géométrie unidimensionnelle
sont des fonctions : affines T ∼ ax+b en coordonnées cartésiennes, T ∼ a+b ln r
en coordonnées cylindriques et T ∼ a − b/r en coordonnées sphériques.
Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le flux thermique pariétal permet d’établir une condition aux limites pour la
résolution de l’équation de diffusion thermique, sous la forme jc · n = jp en tout
point de la surface (S) extérieure au système (Σ), jp étant comme n compté
positivement vers l’extérieur de (Σ).
La résolution de l’équation de diffusion thermique en régime variable peut se
résoudre en notation complexe si on recherche des régimes harmoniques ; l’équa-
tion de dispersion est alors celle d’une onde évanescente, caractérisée par un
effet de peau.
On peut aussi rechercher des régimes transitoires, par séparation des variables
sous la forme T (r, t) = T0 + R(r)Θ(t) ; on choisira pour T0 la valeur attendue
en régime permanent. On procède ensuite en explicitant d’abord les conditions
aux limites puis ensuite les conditions initiales.

On peut enfin rechercher des fonctions de la variable réduite u = x/2 Dth t,
sous réserve que l’énoncé de la question posée suggère cette méthode.
Chapitre 15

Le rayonnement thermique

15.1 Rayonnement électromagnétique et bilans thermiques

15.1.1 Propriétés du rayonnement électromagnétique


Nous établirons, dans le cadre du cours d’électromagnétisme, certaines propriétés des
ondes électromagnétiques dans le vide et les milieux transparents, que nous affirmerons
seulement ici.
2 Le rayonnement électromagnétique : il consiste en la propagation simultanée d’un
champ électrique E (r, t) et d’un champ magnétique B (r, t). Dans un milieu isotrope
n
d’indice n, on montre la relation de structure B (r, t) = u∧E (r, t) si u est le vecteur
c0
unitaire de la direction de propagation, avec la géométrie des champs B (r, t) · u = 0
et E (r, t) · u = 0, conformément à la figure 15.1, où u = ex .
z
y

B(t′ )
t′ > t

E(t′ )
E(t) E∧B
x
B(t)

Figure 15.1 – Onde électromagnétique

c0 1
Ces deux champs se propagent ensemble à la vitesse de phase vϕ = , où c0 = √
n ε0 µ0
est la célérité de la lumière dans le vide, c0 ≃ 3, 00 × 108 m · s−1 .
2 Milieux, indices, longueurs d’onde : nous ne considérons que les milieux matériels
transparents. Ceci peut n’être vérifié que dans un certain domaine de fréquence, hors
318 Physique, MP, MP*

de ce qu’on appelle les bandes ou zones d’absorption ; on peut alors, dans le cadre de
certains modèles, montrer que n > 1 pour les milieux moléculaires non absorbants.
L’indice optique n dépend (c’est le phénomène de dispersion) de la fréquence ν ou de la
pulsation ω = 2πν du champ ; on préfère souvent en pratique décrire ces oscillations au
c0 2π
moyen de la longueur d’onde dans le vide du rayonnement, définie par λ0 = = ,
ν k
si k = ku est le vecteur d’onde. Un abus de langage courant consiste à parler souvent
de longueur d’onde du rayonnement, alors que la (( vraie )) longueur d’onde de l’onde
électromagnétique dépend bien sûr de l’indice optique n.
Les ondes électromagnétiques sont réparties en divers domaines, selon la valeur de
cette longueur d’onde λ0 ; cette répartition est rappelée dans le tableau 15.2.

8 × 10−7
4 × 10−7

λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques

Rayons X
Rayons γ
Rayons

Ondes
Micro
ondes

radio
U.V.

Lumière

I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014

4 × 1014
ν (Hz)

Figure 15.2 – Spectre des ondes électromagnétiques

Nous poursuivrons la description des ondes électromagnétiques dans le vide : dans


tout ce qui suit, nous supposerons n = 1.
2 Vecteur de Poynting : en tout point de l’espace où parvient une onde électroma-
gnétique, on montrera qu’elle transporte une puissance électromagnétique qui se met
sous forme d’une intégrale de flux, étendue à la surface (S) qui reçoit cette puissance :

Z
E (r, t) ∧ B (r, t)
Pém (t) = R (r, t) · ndS avec R (r, t) = (15.1)
(S) µ0

La grandeur R (r, t), qui porte le nom de vecteur de Poynting, est donc une densité
volumique de flux d’énergie, complètement analogue au vecteur jc pour le transport
d’énergie par conduction. On peut d’ailleurs rappeler l’étude dimensionnelle qui avait
déjà
I été proposée à propos de cette grandeur, en notant que le théorème d’Ampère
R UI
B · dr = µ0 I et la relation E · dr montrent que R à la dimension de 2 si ℓ est

une longueur ; le vecteur de Poynting se mesure bien, comme jc , en watt par mètre
carré.
L’analogie avec les vecteurs densités de courant se poursuit puisqu’on montrera aussi,
pour une onde de direction de propagation u, la relation entre vecteur de Poynting et
densité volumique d’énergie électromagnétique wém (r, t) :
15 : Le rayonnement thermique 319

ε0 E2 B2
R (r, t) = c0 wém (r, t) u avec wém (r, t) = + (15.2)
2 2µ0

où la vitesse de transport de l’énergie est donc ici égale à vg = c0 u. Là aussi, on peut
brièvement évoquer l’analyse dimensionnelle
I des deux termes formant la Z somme wém ,
Q
en notant que le théorème d’Ampère E · ndS = et la relation E · dr = U
ε0
2
ε0 E QU
imposent pour l’unité de où ℓ est une longueur et S une surface ; on vérifie
2 Sℓ
immédiatement qu’il s’agit bien s’une énergie volumique.

Signalons dès à présent que, si on emploie une notation complexe pour l’étude
du champ électromagnétique associé à une onde, on doit se garder de l’appli-
quer aux grandeurs énergétiques (quadratiques) R (r, t) et wém (r, t); seul le calcul

E ∧ B∗
des valeurs moyennes reste possible, selon les relations hRi = Re et
 ε E ∧ E∗ B ∧ B∗  2µ0
0
hwém i = Re + . Tout autre calcul, en particulier de gran-
4 4µ0
deurs instantanées, doit être conduit en revenant au préalable aux grandeurs réelles.

15.1.2 Courant thermique radiatif


2 Définitions : la détermination de la puissance totale rayonnée, en moyenne tem-
porelle, à travers une surface (S) amène à sommer les contributions des différentes
directions et fréquences des rayonnements
Z qui se superposent au voisinage de cette
surface. On l’écrira hPém i = hR (r, t)i · ndS où le vecteur R lui-même est une
(S)
somme, portant sur l’ensemble des directions de propagation traversant (S).
Cette somme de flux de vecteurs de Poynting
Z est une puissance qu’on peut écrire sous
forme d’une intégrale de surface, hPém i = jr dS ; dans le cas d’une surface fermée
(S)
(S) entourant un système thermodynamique (Σ), cette puissance électromagnétique
fait partie du bilan énergétique, et on écrira :
I
δQ→Σ
= −Φr Φr = jr dS (15.3)
dt (S)

Notons ici que jr est algébrique ; on le compte positivement pour un courant énergé-
tique radiatif sortant de la surface fermée (S) qui limite le système thermodynamique
(Σ). C’est donc l’emploi des conventions thermodynamiques pour δQ qui explique
le signe − dans la relation ci-dessus.

Dans l’expression (15.3), on remarque que la densité volumique de courant thermique


radiatif jr n’est plus définie de façon vectorielle, puisqu’il s’agit en général d’une
somme sur plusieurs directions. C’est ce terme jr , analogue des grandeurs jc = jc · n
et jp définies plus haut lors des études de la conduction et des transferts pariétaux,
que nous étudierons dans ce qui suit.
Le rayonnement thermique déterminé par (15.3) est, par ailleurs, réparti a priori sur
l’ensemble du spectre des longueurs d’onde ; nous étudierons plus loin la répartition
spectrale de ce rayonnement..
320 Physique, MP, MP*

2 Bilans énergétiques et rayonnement : les milieux transparents étudiés, siège de


la propagation des ondes électromagnétiques, seront limités par des corps solides ou
liquides considérés comme des matériaux opaques, sur la surface desquels la totalité du
rayonnement électromagnétique incident est soit réfléchi, soit absorbé. Ajoutant aux
flux réfléchi et absorbé un flux éventuellement émis (si le corps étudié est lui-même
un émetteur de rayonnement), on pourra faire un bilan thermique pour le système
(Σ) de surface extérieure (S) en écrivant la puissance thermique totale I reçue par (Σ),
δQ→Σ
par rayonnement et par transfert pariétal, sous la forme =− (jr + jp ) dS.
dt (S)

Le rayonnement joue ainsi dans certains cas le même rôle que les transferts pariétaux
dans l’étude des transferts thermiques : il sert à établir les conditions aux limites
sur la surface (S) qui limite le corps étudié, en termes de continuité des courants
thermiques.

15.1.3 Flux radiatifs hémisphériques


2 Flux incident, flux émergent : on peut, dans le calcul de la densité de courant
thermique radiatif au voisinage de la surface extérieure (S) d’un système thermo-
dynamique (Σ), distinguer les flux énergétiques incident et émergent ; il s’agit dans
chaque cas de distinguer parmi les composantes du champ électromagnétique celles
qui se dirigent vers (Σ), avec R · n < 0, et celles qui partent de (Σ), avec R · n > 0.
Comme la convention usuelle d’orientation des courants thermiques est la direction
de l’extérieur de (Σ), on notera :

jr = ϕ↑ − ϕ↓ (15.4)
|{z} |{z}
émergent de (S) incident sur (S)

Notons que, par hypothèse, ϕ↑ > 0 et ϕ↓ > 0 ; le signe de jr dépend du bilan thermique
local. On remarquera la notation ϕ, associée à la dénomination courant hémisphérique
pour ces grandeurs qui ne concernent que la somme des puissances transportées par le
rayonnement électromagnétique dans un seul sens, au contraire du courant thermique
total jr .
2 Absorption, réflexion : à l’abord de la surface extérieure (S) du système opaque
(Σ), le flux énergétique incident est soit réfléchi, soit absorbé : ϕ↓ = ϕréfl. + ϕabs. .
Le phénomène microscopique responsable de l’absorption du rayonnement électroma-
gnétique est l’excitation des modes de vibration des atomes du système (Σ), sous
l’effet du champ électromagnétique incident. C’est d’ailleurs ce couplage entre ondes
électromagnétiques et agitation thermique qui permet d’inclure le flux radiatif dans
les flux thermiques, à côté des flux conductif et pariétal.
La réflexion totale que l’on rencontre en Optique dans l’étude des miroirs représente
un cas exceptionnel ; plus généralement, la réflexion ne suit les lois de Snell-Descartes
que pour les matériaux à état de surface idéalement régulier. Nous étudierons donc
dans ce qui suit que les relations entre flux hémisphériques, sans nous préoccuper de
la direction de propagation de ces flux.
2 Émission : en plus des phénomènes de réflexion et d’absorption, que l’on rencontre
ordinairement en Optique par exemple, la surface d’un corps opaque peut aussi émettre
du rayonnement électromagnétique, en particulier en liaison avec la température de
ce corps émetteur.
15 : Le rayonnement thermique 321

Émission de rayonnement
X La désexcitation des atomes du système thermodynamique (Σ) peut
conduire à l’émission de rayonnement électromagnétique par la surface
extérieure (S) de (Σ). Ce rayonnement émis s’ajoute au rayonnement
réfléchi pour former le rayonnement total partant de la surface (S).
Ainsi, si on étudie le flux hémisphérique partant (ou émergent) ϕ↑ de l’élément de
surface du corps opaque (Σ), on constate qu’il est, en général, supérieur au seul flux
réfléchi ; le supplément est appelé courant thermique radiatif émis ϕémis par unité de
surface du corps opaque, avec la relation ϕ↑ = ϕréfl. + ϕémis .
2 Bilans radiatifs : on peut visualiser sur la figure 15.3 les bilans des phéno-
mènes d’absorption, de réflexion et d’émission. Chaque flux hémisphérique (ϕréfl. ,
ϕabs. , ϕémis ) est supposé positif dans les définitions ci-dessus. Sur ce schéma, les croix
désigne la conversion d’énergie électromagnétique en agitation thermique locale, c’est-
à-dire en énergie interne (dans le cas de l’absorption) ou réciproquement la création
d’une onde électromagnétique à partir de la vibration des particules chargées dues à
l’agitation thermique du matériau près de sa surface (dans le cas de l’émission).

ϕ↓ ϕ↑

ϕabs. ϕréfl. ϕréfl. ϕémis

ϕabs. ϕémis
système (Σ)

Figure 15.3 – Bilan radiatif

En faisant le bilan énergétique, on calcule le courant thermique radiatif total sortant


de (S) selon (15.4). Le flux hémisphérique réfléchi s’élimine naturellement de ce bilan,
qui prend donc aussi la forme équivalente :

jr = ϕémis − ϕabs. (15.5)


| {z } | {z }
émis par (S) absorbé par (S)

15.1.4 Étude spectrale


2 Définitions : chacun des courants thermiques radiatifs définis ci-dessus (incident
ou émergent, réflechi, absorbé ou émis) est une grandeur intégrale relativement à la
direction de propagation du rayonnement, mais aussi une somme relativement à la
longueur d’onde du rayonnement considéré.
On fait l’étude spectrale de ces courants radiatifs en restreignant par la pensée l’étude
à un certain intervalle de longueur d’onde [λ0 ; λ0 + dλ0 ] pour lequel les divers cou-
dϕx
rants radiatifs se mettent sous la forme dϕx = dλ0 , l’indice x désignant le flux
dλ0
hémisphérique particulier étudié (incident ou partant, absorbé, émis ou réfléchi).
322 Physique, MP, MP*

dϕx
Le flux hémisphérique spectral par unité de longueur d’onde se mesure en watts
dλ0
par mètre carré et par mètre ; on évitera de confondre cette unité avec celle d’une
 dϕ  volumique même si on peut dans les deux cas faire l’analyse dimensionnelle
puissance
x
= W · m−3 = [wém ].
dλ0

On peut aussi étudier la répartition spectrale en fonction de la fréquence ν du rayon-


dϕx c0
nement, en écrivant de même dϕx = dν ; compte tenu de la relation ν = , on
dν λ0
2
c0 dϕx λ dϕx
peut écrire donc |dν| = 2 |dλ|. On a donc aussi = 0 .
λ0 dν c0 dλ0
dϕx
Le flux hémisphérique spectral par unité de fréquence se mesure en watts

 dϕ et par hertz ; c’est aussi, accidentellement, l’unité d’une énergie
par mètre carré
x
surfacique, = J · m−2 .

Dans toute la suite, les études théoriques seront basées sur le calcul des flux hémi-
sphériques spectraux par unité de fréquence, tandis que les applications numériques
pratiques utiliseront plutôt les flux hémisphériques spectraux par unité de longueur
d’onde.
2 Coefficients d’absorption et d’émission : on définit les coefficients d’absorption
a(λ0 ) et de réflexion r(λ0 ) = 1 − a(λ0 ) du rayonnement électromagnétique par les
relations :

dϕabs. dϕ↓ dϕréfl. dϕ↓


= a(λ0 ) = r(λ0 ) (15.6)
dλ0 dλ0 dλ0 dλ0

Le tableau 15.1 montre quelques valeurs de coefficients d’absorption pour divers ma-
tériaux, pour deux longueurs d’onde : λ0 = 600 nm, qui correspond au maximum
de sensibilité de l’œil humain, dans le domaine visible, et λ0 = 9, 3 µm, située dans
le domaine de l’infrarouge lointain. Nous verrons bientôt que cette longueur d’onde
correspond au maximum d’émission des objets terrestres, lorsqu’ils sont chauffés à
une température de l’ordre de 310 K.

Surface a(λ0 = 600 nm) a(λ0 = 9, 3 µm)


Acier galvanisé 0, 89 0, 28
Marbre blanc 0, 47 0, 97
Verre 0, 10 0, 90
Papier blanc 0, 28 0, 95
Végétation 0, 80 0, 85

Table 15.1 – Coefficients d’absorption du rayonnement électromagnétique

Sur ce tableau, on remarque que des objets qui paraissent blancs ou transparents dans
le domaine visible (marbre, verre ou papier) sembleraient noirs pour une observation
dans l’infrarouge (ce sont quasiment des absorbeurs intégraux).
Dans le cas particulier d’une planète, le coefficient de réflexion calculé pour le maxi-
mum de sensibilité de l’œil porte le nom d’albédo, et on le note A = r(600 nm) soit
aussi A = 1 − a(600 nm). L’albédo dépend de la nature de la surface de la planète
(état de l’atmosphère, nature du sol, etc). L’albédo terrestre moyen est de l’ordre de
A ≃ 0, 34.
15 : Le rayonnement thermique 323

Nous verrons dans la suite comment on peut, dans certains cas, déterminer un flux
dϕ0
hémisphérique émis théorique, que nous noterons ; les bilans radiatifs ne se pla-
dλ0
çant pas toujours dans le cas du rayonnement idéal d’équilibre, on définit de même
un coefficient d’émission :

dϕémis dϕ0
= e(λ0 ) (15.7)
dλ0 dλ0

L’identité microscopique des phénomènes d’absorption et d’émission montre que, en


général, le coefficient d’émission et le coefficient d’absorption sont égaux :

a(λ0 ) = e(λ0 ) (15.8)

Le cas d’un émetteur idéal, tel qu’il sera décrit plus bas, correspond à e = 1 (par
définition) donc aussi à a = 1 et r = 0 : on parlera donc d’absorbeur intégral (pour
toutes les longueurs d’ondes) ou encore de corps noir ; la loi donnant l’expression
dϕ0
de en fonction de la longueur d’onde λ0 et de la température de surface T de
dλ0
l’émetteur porte le nom de loi du corps noir.
Un absorbeur ou un émetteur réel, pour lequel on a toujours a < 1 donc e < 1, porte
parfois le nom de corps gris.
2 Flux hémisphérique spectral et global : on peut repasser Z au flux hémisphérique

dϕx
global à partir d’un flux hémisphérique spectral par ϕx = dν ou, selon le
Z ∞ ν=0 dν
dϕx
cas, ϕx = dλ0 . On peut bien sûr accompagner ces définitions de celles de
λ0 =0 dλ0
coefficients de réflexion ou d’émission intégraux ou moyens, seuls utiles pour un bilan
énergétique global :

ϕabs. = ā × ϕ↓ ϕréfl. = (1 − ā) × ϕ↓ ϕémis = ē × ϕ0 (T ) (15.9)

Dans cette expression, ϕ0 (T ) est le flux hémisphérique surfacique, intégré sur toutes
les longueurs d’ondes, émis par un émetteur idéal à la température T .

15.2 Rayonnement thermique d’équilibre

15.2.1 Loi de Planck (loi du corps noir)

2 Équilibre radiatif : en l’absence de transferts mécaniques, un système thrmodyna-


mique (Σ) sera en équilibre thermique (et son énergie interne sera constante au cours
du temps) si la puissance thermique totale reçue Ptotale est constamment nulle.
On parlera d’équilibre radiatif dans le cas particulier où ce système
I est en équilibre
thermique sous l’action du seul rayonnement, avec donc Φr = jr dS = 0. Enfin,
(S)
on parlera d’équilibre radiatif local (parfois improprement appelé équilibre thermody-
namique local, ETL) si cette relation est partout vraie localement : jr = 0.
Compte tenu des relations de bilan (15.4) et (15.5), on peut écrire la condition d’équi-
libre radiatif local sous la forme ϕ↓ = ϕ↑ et ϕémis = ϕabs. .
324 Physique, MP, MP*

Nous nous placerons dans la suite dans le cas où cette relation d’équilibre thermody-
namique local est réalisée pour tout intervalle de fréquence ou de longueur d’onde, ce
dϕ↓ dϕ↑ dϕémis dϕabs.
qui permet d’écrire = et = .
dλ0 dλ0 dλ0 dλ0
2 Loi de Planck : nous allons ici préciser l’expression de la valeur commune des
flux ci-dessus, dans le cas d’un corps noir (absorbeur intégral). En effet, dans le cas
d’un absorbeur intégral, a = 1 pour toute longueur d’onde donc le flux hémisphérique
dϕréfl.
réfléchi est nul.
dλ0
dϕ↓ dϕ↑
Les flux hémisphériques radiatifs spectraux incident et partant d’un corps
dλ0 dλ0
noir à l’équilibre radiatif local sont égaux entre eux, et aussi égaux aux flux hémisphé-
dϕémis dϕabs.
riques radiatifs spectraux émis et absorbé par la surface de ce corps
dλ0 dλ0
dϕ0
noir. Cette valeur commune, , est la loi de Planck‡ , ou loi du corps noir. Elle
dλ0
sera pour l’instant seulement affirmée, sous la forme :

dϕ0 2πhc20 1
=   (15.10)
dλ0 λ50 hc0
exp −1
λ0 kB T

Dans cette expression, h désigne la constante de Planck‡ introduite pour la première


fois en  à l’occasion de l’étude du rayonnement thermique d’équilibre :

h = 6, 6262 × 10−34 J · s (15.11)

et on rappelle les valeurs numériques de la célérité c0 de la lumière dans le vide, et de


la constante de Boltzmann kB :

c0 = 2, 99792458 × 108 m · s−1 kB = 1, 38065 × 10−23 J · K−1 (15.12)

On a vu qu’il était possible de transcrire cette loi de répartition spectrale en termes


de flux hémisphérique par unité de fréquence, par la relation λ0 = c0 /ν ; on obtient
alors la forme équivalente de la loi du corps noir :

dϕ0 2πhν 3 1
=   (15.13)
dν c20 hν
exp −1
kB T

15.2.2 Conséquences de la loi de Planck

2 Étude spectrale du flux hémisphérique d’équilibre : pour analyser les conséquences


5 5
dϕ0 2πkB T
formelles de la loi de Planck, écrivons-la sous la forme = 4 3 f (u) où on a
dλ0 h c0
posé u = hc0 /kB λ0 T et f (u) = u5 / [exp (u) − 1].
15 : Le rayonnement thermique 325

f (u)

u
b
u0 = 4.9651

u5
Figure 15.4 – Tracé de f (u) =
exp (u) − 1

df u5
Le tracé de f est aisé ; sa dérivée vaut = (5 − u − u exp (−u)) soit
du (exp (u) − 1)2
df u5
encore, si exp (u) ≫ 1, ≃ (5 − u) qui s’annule lorsque u0 ≃ 5 (en
du (exp (u) − 1)2
fait, pour u0 = 4, 9651). On en déduit la forme de f (u), et donc de la loi de Planck,
à une température donnée ; f (u) est tracée sur la figure 15.4.
2 Loi du déplacement de Wien : comme le montre l’étude ci-dessus, le flux hémi-
sphérique spectral admet un maximum pour une certaine longueur d’onde λmax qui
vérifie la loi de déplacement de Wien‡ :

hc
λmax T = = 2, 8978 × 10−3 m · K (15.14)
kB u0

Le tableau 15.2 montre quelques valeurs de longueurs d’onde correspondant au maxi-


mum d’émission de certains corps chauffés, en fonction de leur température T .

Corps étudié Température Maximum d’émission


de surface λ0 Domaine spectral
Soleil 5 700 K 510 nm visible
Filament d’ampoule 2 500 K 1, 16 µm proche infrarouge
Objets terrestres 310 K 9, 34 µm infrarouge lointain
Fond cosmologique 2, 7 K 1, 07 mm radio

Table 15.2 – Applications de la loi du déplacement de Wien

On n’oubliera pas non plus que, si le maximum de f (u) est fixé à f (u0 ) ≃ 21, 2, le
5 5
dϕ0 2πkB T
maximum du flux hémisphérique d’équilibre = f (u) varie aussi avec la
dλ0 h4 c30
5
température, proportionnellement à T .
La figure 15.5 illustre la double influence de la température sur le flux hémisphérique
d’équilibre : déplacement de la valeur λmax et de la valeur de l’énergie maximale (ou
totale) émise.

La connaissance de la loi de Planck sous la forme (15.10) ou (15.13) n’est en général


pas exigée ; par contre, la forme générale de la loi de répartition du flux hémisphérique
spectral soit être connue. De même, la loi du déplacement de Wien (15.14) doit être
connue sous la forme λmax T = Cte, mais pas nécessairement l’expression littérale
de cette constante.
326 Physique, MP, MP*

dϕ0
dλ0

T = 5 000 K

T = 3 500 K

λ0
b b
579 nm 827 nm

dϕ0
Figure 15.5 – Tracé de pour deux températures différentes
dλ0

2 Loi de Stefan-Boltzmann : on a constaté ci-dessus l’émission totale augmente


très fortement avec Zla température ; on peut caractériser cette émission totale par
∞ 4 4 Z ∞
dϕ0 2πhkB T u3
l’intégrale ϕ0 (T ) = dλ0 ou encore ϕ0 (T ) = du,
λ=0 dλ0 h4 c20 Z 0 exp (u) − 1
4 ∞ 3
2πk u
qu’on écrira encore ϕ0 (T ) = σT 4 , en posant σ = 3 B 2 J et J = du ;
h c0 0 exp (u) − 1
σ est la constante de Stefan‡ .
Z ∞ 3
u exp (−u)
Le calcul de J = du se fait par développement de Taylor du déno-
0 1 − exp (−u)
π4
minateur ; on trouve après quelques calculs classiques J = ; on en déduit la loi de
15
Stefan-Boltzmann et l’expression de la constante de Stefan :

2π 5 kB
4
ϕ0 (T ) = σT 4 σ= = 5, 6704 × 10−8 W · m−2 · K−4 (15.15)
15h3 c20

La loi de Stefan doit être connue sous la forme ϕ0 (T ) = σT 4 , mais ni l’expression


littérale de la constante de Stefan ni le calcul de l’intégrale J ne sont exigibles.

2 Flux pariétal équivalent : considérons une surface (S), d’aire S, d’un corps porté
à la température T , dont le rayonnement est donné par la loi de Planck. Les échanges
thermiques par rayonnement entre ce corps et son environnement se font par l’inter-
médiaire du flux émis (donc négatif), Φémis
r = −SσT 4 .
On peut souvent considérer l’extérieur du système étudié (par exemple l’atmosphère
qui l’entoure) comme un autre émetteur thermique, rayonnant à travers la même sur-
face S selon la loi de Stefan, mais avec une autre température T ′ , de sorte que le
flux thermique reçu par (S) s’écrit Φreçu
r = SσT ′4 . Dans le cas d’un faible écart de
température, on peut recopier le flux total reçu sous la forme Φr = Sσ(T ′4 − T 4 )
15 : Le rayonnement thermique 327

donc Φr ≃ 4SσT 3 (T ′ − T ), ce qui montre que les échanges thermiques par rayonne-
ment peuvent se mettre sous une forme équivalente aux transferts pariétaux convecto-
conductifs, avec le coefficient pariétal équivalent :

hr = 4σT 3 (15.16)

Remarquons que, dans le domaine ordinaire des températures terrestres, T ≃ 300 K


donc hr ≃ 6 W·m−2 ·K−1 ; il s’agit d’une valeur comparable à celles des flux pariétaux
à l’interface d’un solide et d’un gaz en convection naturelle : on ne peut donc pas
négliger le flux radiatif dans ce cas, puisqu’il sera du même ordre de grandeur que le
flux pariétal convecto-conductif.
2 Étendue spectrale : le spectre d’émission représenté par la loi de Planck est,
comme on le voit sur la figure 15.5, relativement peu étendu de part et d’autre de la
longueur d’onde maximale donnée par la loi de Wien ; cette extension est en fait plus
importante pour λ > λmax que pour λ < λmin .
On appelle étendue spectrale d’un  émetteur thermique
 à l’équilibre à la température T
λmax
l’intervalle de longueurs d’onde ; 8λmax car on peut montrer que cet intervalle,
2
dissymétrique autour de λmax pour les raisons évoquées ci-dessus, concentre 98 % de la
Z 8λmax
dϕ0
puissance émise : dλ0 = 0, 98 σT 4 . La figure 15.6 illustre cette propriété.
λmax /2 dλ 0

dϕ0
dλ0

0, 98 × σT 4
λ0
b b b
λmax /2 λmax 8λmax

Figure 15.6 – Étendue spectrale du rayonnement thermique d’équilibre

On peut, compte tenu de la loi de Wien, donner quelques valeurs numériques de limites
d’étendue spectrale, conformément au tableau 15.3 :
La première ligne (T = 2, 7 K), dans le domaine des ondes radio et centimétriques,
correspond au rayonnement électromagnétique fossile (rayonnement cosmologique)
considéré aujourd’hui comme un des indices essentiels prouvant la réalité des modèles
cosmologiques d’explosion initiale (big bang) de l’Univers.
Les deux lignes suivantes (T = 310 K et T = 2 500 K) relèvent essentiellement
du domaine infrarouge, mais à la température 2 500 K qui est celle des filaments
328 Physique, MP, MP*

Température d’équilibre λmax /2 λmax 8λmax


2, 7 K 0, 53 mm 1, 07 mm 8, 56 µm
310 K 4, 67 µm 9, 34 µm 74, 7 µm
2 500 K 580 nm 1, 16 µm 9, 28 µm
5 700 K 255 nm 510 nm 4, 08 µm

Table 15.3 – Étendue spectrale en fonction de la température de l’émetteur

de Tungstène des lampes à incandescence, l’étendue spectrale s’étend jusque vers le


milieu du spectre visible : il s’agit d’une lumière de couleur rouge.
Enfin, la dernière ligne décrit assez bien le rayonnement solaire, avec une température
de surface T = 5 700 K ; le Soleil émet aussi dans les proches infrarouge et ultraviolet,
mais ces rayonnements sont largement absorbés pas la haute atmosphère et sont peu
sensibles au niveau du sol.

15.3 Exemples d’application

15.3.1 Flux radiatif en régime permanent


2 Dilution géométrique du rayonnement solaire : considérant le Soleil comme un
émetteur thermique à la température TS = 5 700 K, de forme sphérique de rayon
RS = 7, 0 × 108 m, la puissance totale rayonnée par la surface du Soleil est donnée
par PS = 4πRS2 σTS4 = 3, 68 × 1026 W. Cette puissance énorme n’est pas captée par
les planètes qui entourent le Soleil ; la majeure partie quitte le système solaire. Une
planète donnée intercepte seulement une fraction de cette puissance donnée (cf. figure
15.7) par une relation géométrique.

planète

dS⊥
dΩ
2RS b b 2Rp

Figure 15.7 – Dilution géométrique du rayonnement solaire

À la distance r du Soleil, la puissance totale PS est répartie uniformément sur une


sphère de surface 4πr2 , tandis que la planète étudiée intercepte seulement une partie
dS⊥ de cette surface ; la notation dS⊥ rappelle que cette surface est une section droite,
orthogonale à la direction moyenne du faisceau.
On note aussi sur la figure 15.7 que la partie du rayonnement intercepté est invariante
sur un cône donné dont le sommet est au centre du soleil ; la grandeur qui caractérise
ce cône est l’angle solide élémentaire :

dS⊥
dΩ = (15.17)
r2
15 : Le rayonnement thermique 329

En particulier, l’angle solide total sur lequel se répartit un rayonnement isotrope


comme celui du Soleil est Ωtotal = 4π, et la puissance reçue dans un cône d’angle
solide dΩ est donc :

dΩ dΩ
dP = Pisotrope = Pisotrope (15.18)
Ωtotal 4π

En particulier, pour une planète de rayon rp , on a dS ≃ πrp2 donc la puissance reçue


πrp2 πRS2 rp2
par la face éclairée de la planète est Pp = PS soit encore P p = σTS4 .
4πr2 r2
2 Température d’équilibre d’une planète simple : considérons une planète dépourvue
d’atmosphère, qui reçoit du Soleil la puissance Pp . En régime permanent d’équilibre
thermique, cette planète doit émettre une puissance exactement égale à celle qu’elle
reçoit. On peut alors, par exemple, assimiler chacune des faces de la planète à un corps
noir, et appelant Tj la température de la face éclairée (le jour local) et Tn celle de la
face sombre (la nuit locale) ; chacune des deux faces a une aire 2πrp2 et la puissance

totale réémise dans cette hypothèse est donc Pp = 2πrp2 σTj4 + σTn4 .
Si on fait enfin l’hypothèse
s raisonnable Tj ≫ Tn , on obtient la condition d’équilibre
RS
thermique Tj ≃ √ TS . Dans le cas de la Lune, r ≃ 1, 5 × 1011 m donc Tj ≃ 327 K
2r
ou 54 ◦ C ; c’est une approximation raisonnable pour la température de la face éclairée
de notre satellite.
2 Effet de serre atmosphérique : la présence de l’atmosphère modifie profondément le
bilan thermique d’une planète, par deux effets. Tout d’abord, la circulation atmosphé-
rique (les phénomènes de convection thermique en particulier) diminue très fortement
les écarts thermiques entre les températures de jour et de nuit, de sorte qu’on peut
en première approximation considérer la surface de la planète comme un émetteur
de température uniforme Tp . Le bilan thermique proposé ci-dessus devrait r donc être
RS
réécrit sous la forme Pp = 4πrp2 σTp4 , ce qui mène à l’expression Tp ≃ TS . Dans
2r
le cas de la Terre, r ≃ 1, 5 × 1011 m comme pour la Lune donc Tj ≃ 275 K ou 2 ◦ C ; la
température moyenne de la surface de la Terre est bien plus élevée que cette valeur,
du fait de la prise en compte de divers coefficients de réflexion et d’absorption.
Tout d’abord, la surface de la Terre elle-même n’absorbe que partiellement le rayon-
nement solaire, dont a vu qu’il était essentiellement situé dans le domaine visible ;
l’albédo terrestre moyen étant de l’ordre de A = 0, 34, seule la fraction 1 − A du
rayonnement solaire est absorbé, ce qui contribue à diminuer encore la température
d’équilibre de la planète.
Le facteur qui augmente nettement cette température est l’effet de serre, c’est-à-
dire l’absorption d’une fraction importante α du rayonnement réémis par la planète.
Compte tenu de la température de surface de celle-ci, on a vu que le rayonnement
qu’elle émet est essentiellement infrarouge, et l’atmosphère, qui est bien transparente
dans le domaine visible, est bien plus opaque dans l’infrarouge. La puissance réellement
émise par la planète s’écrit donc Pp′ = (1 − α)4πrp2 σTp4 . Si on préfère, on peut dire
que la planète avec son atmosphère se comporte globalement comme un corps noir
fictif de température de surface apparente Ta donnée par l’expression Pp′ = 4πrp2 σTa4 ,
1/4
donc Ta = Tp (1 − α) . Le nouveau bilan thermique de la planète fournit alors
330 Physique, MP, MP*

r  1/4
Rs 1 − A
Pp′ = (1−A)PS soit Tp = TS . Avec α ≃ 0, 45, on trouve Tp ≃ 288 K,
2r 1 − α
soit 15 ◦ C, valeur plus raisonnable.
Le coefficient α dépend significativement de la composition chimique de la planète ; la
présence de certains gaz (CO2 , CH4 , etc.) augmente α donc tend à augmenter la tempé-
rature d’équilibre de la planète : c’est la lente dérive de l’effet de serre atmosphérique
qui est accompagnée de changements climatiques durables.

15.3.2 Flux radiatif en régime variable


2 Chauffage dans un four : considérons le chauffage d’un objet, assimilé à une sphère
(Σ), placé dans un four dont les parois sont entièrement portées à la température Tf
(figure 15.8). Nous négligerons tous les transferts convectifs et conductifs, comme si
l’intérieur du four était vide de tout gaz.

Sf

b

(Σ) T Tf

Figure 15.8 – Chauffage dans un four

Lors de l’étude du bilan thermique du système (Σ), il est clair que la totalité du
rayonnement thermique émis par la surface Sf du four ne doit pas être prise en

compte ; en un point donné de la paroi du four, seule une fraction du rayonnement

atteint effectivement l’objet chauffé, le reste atteint d’autres parties du four. Ainsi,
tout se passe comme si la puissance effectivement reçue par le corps chauffé devrait
être écrite P = S ′ σTf4 , avec S ′ < Sf .
2 Cas de l’émission isotrope par les parois du four : il est possible de montrer,
dans le cas où l’émission est isotrope, et si le four entoure totalement le corps (Σ),
que la surface équivalente à prendre en compte est exactement la surface S du corps
chauffé (Σ) : S ′ = S. Dans ces conditions, le bilan thermique du chauffage de (Σ),
dT
traité comme un absorbeur integral, s’écrit Preçu − Pémis = C , où C est la capacité
dt
thermique du corps (Σ), avec Preçu = σSTf4 et Pémis = σST .
C dT
On obtient l’équation non linéaire Tf4 − T 4 = ; la résolution exacte de cette
σS dt
équation est bien sûr possible mais mène à des expressions difficiles à interpréter. Dans
le cas simple où T reste voisin de Tf , on peut se contenter de l’expression approchée
C dT
Tf4 − T 4 ≃ 4Tf3 (Tf − T ), ce qui conduit à l’équation plus simple Tf − T ≃ ,
4σTf3 S dt
 
t
dont la solution T (t) = Tf + a exp − fait apparaı̂tre une durée caractéristique de
τ
C
chauffage, τ = .
4σTf3 S
15 : Le rayonnement thermique 331

15.4 Interprétations de la loi de Planck

15.4.1 Flux radiatif et énergie volumique


2 Géométrie d’un corps opaque : dans toute la suite, nous étudierons les transferts
thermiques radiatifs d’un système thermodynamique (Σ) formé d’un corps opaque,
échangeant avec l’extérieur de la puissance thermique à travers la surface fermée (S)
qui limite (Σ) (cf. figure 15.9, à gauche).

Cas non isotrope


(S)
z
b
(Σ) b M

Figure 15.9 – Échanges thermiques par rayonnement d’un corps opaque

Au voisinage de chaque point de la surface de (Σ), le rayonnement peut être émis ou


reçu dans la totalité de l’espace hémisphérique correspondant à z > 0, si on choisit
de noter (Oz) la normale extérieure à la surface du système (Σ) en un de ses points.
Nous considérerons que la surface (S) est suffisamment peu accidentée pour qu’on
puisse traiter le rayonnement au voisinage de (S) comme isotrope, ce qui exclut par
exemple le cas de la figure 15.9, à droite.
2 Énergie volumique d’équilibre et puissance émise : considérons un élément de
surface dS de la paroi d’un corps opaque (Σ) ; on notera n = ez la normale extérieure
à la surface, orientée vers le milieu transparent qui entoure (Σ) sur l’ensemble des
directions de l’hémisphère z > 0 (figure 15.10).

dS
z

c0 dt

Figure 15.10 – Flux hémisphérique de rayonnement

Nous considérerons ici une situation d’équilibre radiatif local du solide (Σ) avec son
environnement : le rayonnement électromagnétique environnant la surface extérieure
(S) de (Σ) est alors isotrope, le rayonnement incident et le rayonnement émergent
ayant en tout point même intensité.
Étudions par exemple le rayonnement incident sur l’élément de surface dS du système
(Σ). L’énergie totale reçue par dS pendant la durée dt est δQ = ϕ↓ dSdt. Cette énergie
parvient sur dS en provenance de toutes les directions de l’hémisphère z > 0 situé
au-dessus de dS, de manière isotrope.
332 Physique, MP, MP*

Considérons pour commencer le seul rayonnement incident sur la surface dS dans la


direction θ (cf. figure 15.10) ; elle correspond à l’énergie électromagnétique contenue
dans un cylindre de base dS, de normale n et de hauteur c0 dt, avec donc un volume
dτ = c0 cos θdSdt.
Si on note wém la densité volumique d’énergie électromagnétique au voisinage de la
dΩ
surface dS, seule une fraction de cette énergie se dirige effectivement dans la direc-

tion θ, si dΩ = 2π sin θdθ désigne l’angle solide élémentaire dans la direction θ. Ainsi,
l’énergie qui parviendra sur la surface dS pendant la durée dt est, pour cette seule di-
sin θdθ wém c0 cos θ sin θdθ
rection θ, donnée par wém ×dτ × , soit aussi dSdt ; après inté-
2 Z2 π/2
1
gration sur les angles possibles du rayonnement incident, cos θ sin θdθ = donc
0 2
wém c0
on obtient pour énergie incidente δQ = dSdt, qu’on identifie à δQ = ϕ↓ dSdt.
4
On obtient donc la propriété fondamentale de l’équilibre radiatif local :

c0
Équilibre radiatif local : ϕ↓ = ϕ↑ = wém (15.19)
4

On notera que cette relation est d’origine exclusivement géométrique ; elle s’étend
donc automatiquement aux grandeurs spectrales, par unité de fréquence comme par
unité de longueur d’onde :

dϕ↓ dϕ↑ c0 dwém


Équilibre radiatif local : = = (15.20)
dν dν 4 dν

15.4.2 Le modèle de Rayleigh-Jeans


2 La loi de Rayleigh-Jeans : on peut donner une interprétation simple de la loi de
Planck (15.13), ou plutôt de la densité volumique d’énergie correspondante, dans le
cas des basses fréquences (ou des grandes longueurs d’onde). Dans ce cas en effet, on
dwém 4 dϕ0 8πhν 3 kB T
obtient = ≃ si on peut faire l’approximation hν ≪ kB T

 c0 dν c40 hν
hν hν
donc exp −1 ≃ . Dans le cas du spectre solaire, l’approximation impose
kB T kB T
kB T hc0
ν≪ ou λ0 ≫ ∼ 2 µm : elle ne peut décrire que l’infrarouge lointain.
h kB T
Dans ce domaine restreint, l’expression obtenue est toutefois simple à interpréter
d’un point de vue classique, car elle ne dépend pas de la constante (quantique) de
dwém 8πν 2
Planck h, avec ≃ kB T . On reconnaı̂t ici le théorème d’équipartition de
dν c30
l’énergie en associant l’énergie kB T à chaque degré de liberté d’oscillation du champ
électromagnétique ; un décompte de modes doit donc rendre compte du nombre de
8πν 2 dν
modes dN = pour les fréquences comprises dans l’intervalle [ν ; ν + dν].
c30
2 Onde dans une cavité : imaginons d’abord que le rayonnement électromagnétique
est limité par deux miroirs métalliques, distants de ℓ, qui constituent les deux limites
d’une cavité unidimensionnelle sur lesquelles le champ doit s’annuler (figure 15.11).
L’annulation impose la condition d’onde stationnaire dans la cavité, 2ℓ = nλ0 , où
n > 1 est un entier qui numérote les modes propres d’oscillation. On écrit encore le
15 : Le rayonnement thermique 333

mode 1

mode 4
mode 2 mode 3

Figure 15.11 – Cavité unidimensionnelle

vecteur d’onde de chaque composante progressive de cette onde stationnaire sous la


π
forme k = n ex , si (Ox) est la direction normale aux miroirs de cette cavité.

On montre aisément la généralisation à une cavité tridimensionnelle formée de miroirs
π
limitant un volume cubique de côté ℓ, sous la forme k = [nex + pey + qez ], en

fonction de trois nombres entiers positifs n, p et q. La fréquence correspondante est
c0 p 2
donnée par ω = c0 k donc aussi ν = n + p2 + q 2 .
2ℓ
Sur le plan géométrique, cela signifie que chaque point de coordonnées (n, p, q) d’un
réseau cubique de côté c0 /2ℓ correspond à deux modes de vibration, pour les deux
polarisations orthogonales possibles du champ électromagnétique : lorsque la direc-
tion de propagation du champ électromagnétique est celle de l’axe (Ox), le champ E
peut avoir deux composantes indépendantes sur ey et ez , tandis que la composante
longitudinale est nulle, Ex = 0.
Il suffit donc de compter le nombre de ces modes compris dans l’intervalle de fréquence
[ν ; ν + dν], c’est-à-dire le nombre de cubes élémentaires de volume c30 /8ℓ3 compris
entre les sphères de rayons ν et ν + dν, dans la partiede l’espace où n > 0, p > 0 et
4 3
q > 0. Entre ces deux sphères, le volume est d πν = 4πν 2 dν mais on ne doit en
3
compter que le huitième pour tenir compte de la condition n > 0, p > 0, q > 0.
πν 2 dν/2
Le nombre de modes est donc le rapport 2 × pour le volume ℓ3 entier de
c30 /8ℓ3
8πν 2 dν
la cavité et, par unité de volume, dN = , comme on l’attendait ci-dessus.
c30
Cette interprétation de la loi de Planck à basse fréquence est antérieure aux travaux
de Planck ; on la doit à Rayleigh‡ et Jeans.
2 Les limites du modèle de Rayleigh et Jeans : ce modèle ne prévoit que le comporte-
ment limite à faible fréquence du comportement électromagnétique, et les expressions
dwém 8πν 2 kB T dϕ0 4πν 2 kB T
≃ et ≃ du modèle de Rayleigh et Jeans prévoyaient
dν c40 dν c30
une divergence à haute fréquence (connue sous le nom historique de catastrophe ultra-
violette), que l’on n’observe pas. La figure 15.12 montre la différence entre les modèles
de Rayleigh et Jeans et de Planck. Le modèle de Planck évite la divergence à haute

fréquence au moyen de la substitution kB T −→ .
exp (hν/kB T ) − 1
On peut interpréter qualitativement cette substitution en remarquant que
 le terme
hν hν
correctif introduit par Planck s’écrit ≃ hν exp − sauf à très
exp (hν/kB T ) − 1 kB T
basse fréquence. Tout se passe donc comme si chaque mode d’oscillation du champ
334 Physique, MP, MP*

dwém

dwém 8πν 2 kB T
modèle de Rayleigh et Jeans, =
dν c40

dwém 8πhν 3 1
loi de Planck, =
dν c40 exp (hν/kB T ) − 1

Figure 15.12 – Catastrophe ultraviolette du modèle de Rayleigh-Jeans

(qui portera plus tard le nom de photon) emportait l’énergie hν, les modes de haute
fréquence, donc de haute énergie, étant moins probable dans un gaz de photons ther-
malisé
 à la température
 T , du fait de l’apparition du facteur statistique de Boltzmann,

exp − .
kB T

15.4.3 Interprétation cinétique de la loi de Planck


2 Modèles du rayonnement thermique : l’interprétation statistique développée par
Planck pour introduire de façon exacte la loi du rayonnement thermique qui porte
dwém 8πhν 3 1
son nom, = est assez compliquée à développer ; elle
dν c40 exp (hν/kB T ) − 1
est de plus aujourd’hui remplacée par la théorie statistique de Bose et Einstein, qui
donne en particulier le même résultat dans le cas d’un gaz de photons, mais permet
d’autres applications. Le modèle de Bose-Einstein relève de la théorie quantique ; nous
ne présenterons donc ni ce modèle, ni le modèle historique de Planck.
Il est par contre assez facile de déterminer en partie la loi de Planck du rayonnement
thermique en suivant le modèle cinétique proposé par Einstein en  ; cette étude
présente aussi l’intérêt d’introduire un phénomène nouveau, le phénomène d’émission
stimulée du rayonnement électromagnétique.
2 Équilibre entre matière et rayonnement : pour décrire cet équilibre, Einstein
propose de décrire un milieu matériel comportant au moins deux états quantiques
d’énergie E1 et E2 > E1 , en interaction avec un flux de photons caractérisé par la
dwém
densité volumique d’énergie spectrale . On notera N1 et N2 le nombre d’atomes

par unité de volume, respectivement dans les états d’énergie E1 et E2 .
Lors de l’interaction entre matière et rayonnement, des transitions entre ces deux états
sont possibles si le rayonnement a pour fréquence celle donnée par la loi de sélection
dwém
de Bohr, hν = E2 − E1 . Dans la suite, nous noterons ̟ = la densité
dν ν= E2 −E1
h
volumique spectrale d’énergie électromagnétique à la fréquence de la transition ; le
nombre de photons par unité de volume, susceptibles de réaliser cette transition, est
aussi proportionnel à ̟.
dN1 dN2
L’équilibre entre matière et rayonnement a lieu lorsque = = 0 ; on va
dt dt
donc proposer les divers phénomènes cinétiques susceptibles de faire varier les popu-
lations N1 et N2 des états d’énergie E1 et E2 , afin de voir dans quelles conditions ces
phénomènes peuvent se compenser exactement.
15 : Le rayonnement thermique 335

2 Absorption, émission spontanée, émission induite : l’absorption d’un photon d’éner-


gie hν peut conduire à des transitions de l’état d’énergie E1 vers l’état d’énergie E2 ;
ces transitions correspondent à une interaction entre un atome et un photon, pro-
cessus qu’on peut représenter par la réaction-bilan
A1 + γ → A2 , avec donc une loi
dN1 dN2
cinétique du second ordre, − = = B12 N1 ̟, proportionnellement
dt abs dt abs
donc au nombre d’atomes d’énergie E1 et au nombre de photons à la bonne fré-
quence, lui-même proportionnel à ̟. Le terme B12 est le coefficient d’Einstein pour
l’absorption.
On peut aussi observer des émissions spontanées de photons, un atome quittant son
état d’énergie E2 pour libérer un photon et redescendre sur l’état d’énergie E1 ; le
processus microscopique d’émission spontanée a pour équation-bilan
A2 → γ + A1 ,
dN1 dN2
avec donc une loi cinétique du premier ordre, =− = A21 N2 , où
dt é.sp dt é.sp
A21 est le coefficient d’Einstein pour l’émission spontanée.
Einstein a proposé un troisième phénomène, l’émission induite ou émission stimulée.
Un atome peut aussi quitter l’état d’énergie E2 pour libérer un photon et redes-
cendre sur l’état d’énergie E1 sous l’action du rayonnement électromagnétique, avec
pour équation-bilan γ + A2 → 2γ + A1 , avec donc une loi cinétique du second ordre,
dN1 dN2
=− = B21 N2 ̟. B21 est le dernier coefficient d’Einstein, pour le
dt é.st dt é.st
phénomène d’émission stimulée.
Globalement, on obtient pour condition d’équilibre N2 (A21 + B21 ̟) = N1 B12 ̟.
D’autre part, on sait qu’à l’équilibre thermique, la température T du milieu peut être
N1 exp (−E1 /kB T )
définie par la loi de répartition de Boltzmann, = qu’on écrira
  N2 exp (−E2 /kB T )
N1 hν
encore = exp . La comparaison des deux conditions d’équilibre mène à
N2 B T 
k
A21 + B21 ̟ hν
= exp
B12 ̟ kB T
À température très élevée, kB T ≫ hν et le rayonnement devient très intense, donc
̟ → ∞ ; cette condition d’équilibre impose alors B12 = B21 . On peut alors réécrire la
A21 /B12
condition d’équilibre sous la forme ̟ =   . Cette expression constitue

exp −1
kB T
A21 8πhν 3
la loi de Planck si on identifie le numérateur avec . Cette identification
B21 c40
est possible dans le cadre quantique, ou encore par comparaison avec le modèle de
Rayleigh et Jeans à basse fréquence ; nous nous contenterons de l’affirmer ici.
2 Importance du phénomène d’émission induite : l’importance du modèle d’Einstein
va au delà de la possibilité de retrouver précisément le dénominateur de la loi de
Planck : le phénomène d’émission induite (ou stimulée) en est la conséquence la plus
intéressante. On peut en effet montrer, dans le cadre quantique, que ce phénomène, de
bilan γ + A2 → 2γ + A1 peut être utilisé pour une amplification de l’onde lumineuse,
les photons émis par ce processus étant en phase avec ceux qui le provoquent.
L’amplification a d’abord été réalisée en  dans le domaine des micro-ondes (en
l’occurrence ν = 24 GHz), dans un dispositif connu sous le nom de maser (acronyme
de microwave amplification by stimulated emission of radiation) avant d’être réalisé
336 Physique, MP, MP*

en , notamment par le français Kastler, dans le domaine visible : on parle alors
de laser pour light amplification by stimulated emission of radiation.
La difficulté technique qui a retardé l’observation du phénomène d’émission stimu-
lée trouve son explication dans la condition d’équilibre thermique : tous les photons
émis (spontanément ou de façon stimulée) sont aussitôt réabsorbés. Pour observer un
quantité significative de photons provenant de l’émission stimulée, il faut que ce phé-
nomène l’emporte sur l’absorption, donc que B21 N2 ̟ ≫ B12 N1 ̟, ou N2 ≫ N1 , ce
qui est incompatible avec la condition d’équilibre thermique N2 = N1 exp (−hν/kB T ).
L’effet laser (ou maser ) ne peut donc être observé qu’hors équilibre thermique, en pré-
sence d’un apport énergétique permanent (on parle de pompage) qui assure l’inversion
de population avec N2 ≫ N1 . Un émetteur laser est l’association de trois éléments :
• une cavité résonante (formée de deux miroirs), donc la longueur est accordée sur la
fréquence ν0 à laquelle l’effet laser est possible ;
• un milieu présentant les deux états d’énergie E1 et E2 , avec E2 − E1 = hν0 , qui
constituera le milieu amplificateur dans lequel l’onde circulera lors de ses allers
et retours entre les deux miroirs de la cavité ;
• un dispositif de pompage, assurant l’inversion de population donc l’amplification
cohérente de lumière par émission stimulée.
Un des miroirs de la cavité est très faiblement transparent ; la faible partie du faisceau
qui émerge de cette cavité est le faisceau laser.
15 : Le rayonnement thermique 337

Ce qu’il faut absolument savoir

Dans un milieu transparent, assimilé au vide, un rayonnement électromagné-


tique transporte de l’énergie. La puissance correspondante, reçuIpar un système
δQ→Σ
(Σ) de surface extérieure (S), s’écrit = −Φr avec Φr = jr dS.
dt (S)

Au voisinage de la surface d’un corps opaque, on peut décomposer ce courant


thermique radiatif sortant jr selon jr = ϕ↑ −ϕ↓ mais aussi jr = ϕémis −ϕabs. , le
flux réfléchi s’annulant dans le bilan : ϕ↑ = ϕémis + ϕréfl. et ϕ↓ = ϕabs. + ϕréfl. .
Chacun de ces flux est une
Z ∞somme étendue
Z ∞ à l’ensemble des longueurs d’onde
dϕx dϕx
ou des fréquences, ϕx = dν = dλ0 .
0 dν 0 dλ0
Pour un corps noir (ou absorbeur intégral) à l’équilibre thermique, la valeur
dϕ↑ dϕ↓ dϕémis dϕabs.
commune = = = est donnée par la loi de Planck qu’il
dλ0 dλ0 dλ0 dλ0
dϕ0 2πhc20 1
n’est pas nécessaire de connaı̂tre, = .
dλ0 λ50 exp (hc0 /λ0 kB T ) − 1
dϕ0
La longueur d’onde λmax pour laquelle est maximale est donnée par la loi
dλ0
de Wien, λmax T = Cte, avec Cte = 2, 90 × 10−3 m · K. L’étendue spectrale, qui
concentre 98 % du rayonnement thermique, s’étend de λmax /2 à 8λmax . Elle
s’étend dans le domaine visible pour un émetteur stellaire (T ∼ 6 000 K) et
dans le domaine infrarouge lointain pour un émetteur terrestre (T ∼ 300 K).
Le flux hémisphérique total émis par un corps noir est donné par la loi de
Stefan-Boltzmann, ϕ0 = σT 4 , avec σ = 5, 67 × 10−8 W · m−2 · K−4 .
Un bilan radiatif entre deux corps de même surface et de températures voisines
se met sous la forme d’un flux pariétal équivalent, jr ≃ h(T − T0 ), avec pour
constante caractéristique h ≃ 4σT 3 ≃ 4σT03 .
dϕabs. dϕ↓ dϕémis dϕ0
Pour un corps gris, = a(λ0 ) et = e(λ0 ) , où les coeffi-
dλ0 dλ0 dλ0 dλ0
cients d’absorption a(λ0 ) et d’émission e(λ0 ) sont en général égaux.
Chapitre 16

Le potentiel chimique

16.1 Grandeurs molaires partielles

16.1.1 Variables de Gibbs


2 Système polyphasé : on étudie ici un système thermodynamique formé de plusieurs
phases ; chaque phase est un sous-ensemble macroscopiquement homogène. Ce système
pourra comporter une ou plusieurs phase(s) solide(s) (des solides de natures différentes
n’étant en général pas miscibles), une ou plusieurs phase(s) liquide(s) (en fonction de
la miscibilité des liquides présents) et au plus une phase gazeuse (des gaz de toutes
natures étant en général miscibles en toutes proportions). Nous noterons dans la suite
φ le nombre de phases différentes présentes dans le système étudié.
Ce système présentera aussi plusieurs corps Ai de natures chimiques différentes, cha-
cun des corps étant éventuellement présent dans les diverses phases, sans exclure que
tel ou tel corps soit absent de telle ou telle phase. Nous noterons dans la suite N le
nombre de corps chimiquement différents présents dans le système étudié.
2 Variables de Gibbs : la description du système thermodynamique polyphasé
étudié passe par la détermination des variables de Gibbs‡ du système, constituées
de la donnée de deux variables intensives, la pression p et la température T , et de
la quantité de matière (nombre de moles) de chaque corps dans chaque phase. On
notera dans la suite nψ i cette quantité de matière, pour le corps Ai dans la phase
ψ. Ces quantités de matière forment N × φ variables extensives, dont certaines sont
éventuellement nulles.
La donnée des N φ+2 variables de Gibbs (T, p, nψ i ) constitue la détermination complète
de l’état d’équilibre thermodynamique du système. Nous allons montrer certaines
relations vérifiées, à l’équilibre thermodynamique, entre ces variables.
2 Réactions chimiques : le système polyphasé étudié sera éventuellement le siège
d’une
X p ou plusieurs réactions chimiques simultanées ; chacune d’entre elles sera notée
p
νi,ψ Ai ⇋ 0, où νi,ψ est le coefficient stœchiométrique (algébrique) pour l’espèce
i
Ai , réagissant dans la phase ψ, au cours de la réaction p. On a bien sûr 1 6 i 6 N ,
1 6 ψ 6 φ et 1 6 p 6 r, où r est le nombre de réactions chimiques indépendantes.
Lorsque le corps Ai dans la phase ψ ne participe pas à la réaction p, on notera bien
p p
sûr νi,ψ = 0 ; dans tous les autres cas, νi,ψ est négatif pour un réactif, et positif pour
un produit.
340 Physique, MP, MP*

2 Avancement : on a vu que la conservation de la matière au cours d’une réaction


chimique donnée se traduit par la définition d’un avancement ξp pour chacune des r
réactions qui, simultanément, font varier les quantités de matière de toutes les espèces
figurant au bilan d’une réaction au moins. L’addition des causes de variation mène à :
r
X
dnψ
i =
p
νi,ψ dξp (16.1)
p=1

16.1.2 Grandeurs molaires partielles


2 Définition : considérons une grandeur extensive quelconque E définie pour le sys-
tème thermodynamique polyphasé tout entier : volume V , énergie interne U , entropie
S, etc. On appelle alors grandeur molaire partielle associée à la grandeur extensive E
pour l’espèce Ai dans la phase ψ la grandeur :
!
∂E

i = (16.2)
∂nψ
i T,p,nα
j (α,j)6=(ψ,i)

On notera qu’une grandeur molaire partielle est intensive ; ainsi, le volume molaire
partiel viψ de l’espèce Ai dans la phase ψ s’exprime en mètres cube par mole.
La définition (16.2) permet ainsi de définir une énergie interne molaire partielle upi si,
une enthalpie molaire partielle hpi si et une entropie molaire partielle spi si pour l’espèce
∂U ∂H ∂S
Ai dans la phase ψ, respectivement par uψ i = ψ
, hψ
i = ψ
et sψi = , chaque
∂ni ∂ni ∂nψi
dérivée partielle se calculant en gardant constantes toutes les autres variables de
Gibbs.
2 Théorème d’Euler : considérons une fonction f (x, y) de deux variables x et
y (on généralisera aisément le résultat à un nombre quelconque de variables). La
fonction sera dite homogène de degré q relativement à ses variables si, pour tout réel
λ, f (λx, λy) = λq f (x, y).
Ainsi, une grandeur thermodynamique extensive est fonction homogène de degré 1
des variables nψ i ; une grandeur thermodynamique intensive est fonction homogène
de degré 0 des mêmes variables. Dans d’autres domaines de la Physique, on rencontre
d’autres fonctions homogènes : dans une interaction newtonienne, l’énergie potentielle
est homogène de degré −1 en fonction des coordonnées d’espace ; l’énergie potentielle
élastique est homogène de degré 2 des mêmes coordonnées, etc.
La relation f (λx, λy) = λq f (x, y) est, à x et y fixés, vraie pour tout λ ; dérivée
∂f ∂f ∂f ∂f
relativement à λ, elle mène à x +y = qλq−1 f (λx, λy), les dérivées et
∂x ∂y ∂x ∂y
devant être calculées pour le couples de valeurs (λx, λy). Cette égalité peut s’écrire
∂f ∂f
pour λ = 1 sous la forme x +y = qf (x, y).
∂x ∂y
Dans le cas particulier d’une grandeur extensive, q = 1 si la liste des variables com-
prend toutes les quantités de matière, et exclusivement celles-ci ; nous écrirons donc
X ψ ∂E
le théorème d’Euler des fonctions extensives ni = E, les dérivées partielles
i,ψ ∂nψ
i
étant calculées à p et T constant. On notera donc encore :
16 : Le potentiel chimique 341

φ
N X
X
E= nψ ψ
i ei (16.3)
i=1 ψ=1

Cette relation, qui est la marque de l’extensivité de E, est la forme particulière de la loi
d’addition pour les grandeurs extensives ; on notera toutefois que l’addition concerne
des grandeurs molaires partielles, dérivées partielles calculées dans les conditions du
mélange, et non pas relatives aux corps purs qu’on aurait pu mélanger.
La loi d’addition simplifiée rencontrée pour l’énergie interne et l’enthalpie, au moins
de manière approchée, dans le cours de Thermochimie, ne s’applique pas dans le cas
général. On remarque expérimentalement, par exemple, qu’il n’y a pas addition des
volumes lors d’un mélange. La loi d’addition est encore moins vérifiée dans le cas des
grandeurs entropiques, du fait du caractère irréversible de l’opération de mixage.

16.1.3 Évolution des grandeurs extensives


2 Notations de Lewis : rappelons que, pour toute grandeur  extensive
 E évoluant
∂E
lors d’une réaction chimique, on a défini la dérivée ∆r E = ; en présence
∂ξ T,p
 
∂E
éventuellement de plusieurs réactions simultanées, on écrira ∆r Ep = :
∂ξp T,p,ξq
c’est la dérivée qui exprime la variation de la grandeur extensive E due à la seule
réaction numéro p.
La grandeur E étant a priori fonction des 2 + N φ variables de Gibbs, on écrira
∂E ∂E X ψ ψ
sa variation infinitésimale sous la forme dE = dT + dp + xi dni . Si la
∂T ∂p
i,ψ
réaction chimique numéro p est la seule cause de variation
X p de E, alors dT = 0, dp = 0
et dnψ i = ν p
i,ψ dξp , ce qui permet d’écrire dE = ν xψ
i,ψ i dξp ; on identifie ainsi la
i,ψ
dérivée partielle de Lewis :

φ
N X  
X p ∂E
∆r Ep = νi,ψ xψ
i = (16.4)
i=1 ψ=1
∂ξp T,p,ξq ,q6=p

2 Exemple : considérons la réaction CH2 = CH2 + Cl2 ⇋ CH2 Cl − CH2 Cl menée


en solution aqueuse. Au cours de cette réaction, le volume V varie du fait de l’avan-
cement ξ de la réaction selon dV = ∆r V dξ, avec pour dérivée partielle (notation
de Lewis) ∆r V = −vCH2 CH2 − vCl2 + vCH2 ClCH2 Cl , chacune des grandeurs vA étant le
volume molaire partiel de A dans la solution aqueuse ; il s’agit, dans les trois cas, de
fonctions relativement complexes de la composition chimique, de la température et de
la pression dans le mélange réactionnel.
Le volume total V de la solution est donné par V = vCH2 CH2 n(CH2 CH2 ) + vCl2 n(Cl2 ) +
vCH2 ClCH2 Cl n(CH2 ClCH2 Cl) + vH2 O n(H2 O) ; aucun de ces volumes partiels n’ayant a
priori pas la même valeur dans une solution de composition différente, le volume V
de la solution étudiée (S) n’est en général pas égal à la somme des volumes Vk des
solutions (Sk ) qu’on pourrait mélanger pour obtenir (S).
342 Physique, MP, MP*

16.2 Évolutions monobares et monothermes

16.2.1 L’enthalpie libre, potentiel thermodynamique


2 Notion de potentiel thermodynamique : considérons une évolution spontanée d’un
système isolé, mécaniquement et thermiquement. Le second principe de la Thermody-
namique affirme que l’entropie S de ce système augmentera au cours de toute évolution
spontanée, donc irréversible. Un état d’équilibre ne pourra être atteint que si S atteint
une valeur maximale et ne peut donc plus augmenter.
Par analogie avec la notion d’énergie potentielle en mécanique, on dira que −S est le
potentiel des évolutions des systèmes isolés : la décroissance du potentiel −S est un
critère d’évolution, et le minimum du potentiel −S est une condition d’équilibre.
2 Évolutions monobares et monothermes : le systèmes isolés thermiquement et méca-
niquement sont rares ; on s’intéressera plutôt dans la suite à des évolutions monobares
et monothermes, par exemple du fait d’un contact mécanique et thermique avec l’at-
mosphère, qui imposera dans les états d’équilibre initial et final sa pression pext et
sa température Text . Notons qu’au cours de l’évolution, il est tout à fait possible de
passer par des états tels que p 6= pext ou T 6= Text , ou même des états hors d’équilibre
pour lesquels on ne peut pas définir de pression ou de température unique dans le
système.
L’application des deux principes de la Thermodynamique à un tel système impose
δQ
dU = δW ′ −pext dV +δQ et dS = +δScréé , où δW ′ représente le travail des forces
Text
autres que les forces de pression, tandis que δScréé > 0 est la condition d’évolution
irréversible.
On peut éliminer δQ entre ces relations en écrivant dU + pext dV − Text dS 6 δW ′ , le
cas de l’égalité correspondant aux transformations réversibles. On peut encore définir
le potentiel de Gibbs G∗ = U + pext V − Text S pour écrire cette relation dG∗ 6 δW ′
ou encore, pour une transformation finie, ∆G∗ 6 W ′ .
Remarquant que p = pext et T = Text dans l’état initial comme dans l’état final de la
transformation, on a aussi G∗ = U + pV − T S dans ces deux états initial et final, et
on définit encore l’enthalpie libre de Gibbs :

G = U + pV − T S = H − T S (16.5)

Ainsi, G = G∗ dans l’état initial comme dans l’état final, donc ∆G = ∆G∗ ; on pour
donc écrire la condition d’évolution spontanée ∆G 6 W ′ ou encore −W ′ 6 −∆G′ :
cette relation se lit ainsi :

Interprétation de l’enthalpie libre


X Lors d’une transformation finie monobare monotherme, le système de
peut pas fournir à l’extérieur un travail −W ′ plus grand que la dimi-
nution −∆G de l’enthalpie libre G. Ce cas limite idéal n’est atteint que
dans le cas des transformations réversibles.

Dans la suite, nous nous intéresserons d’abord au cas où δW ′ = 0 ; alors, toute trans-
formation spontanée s’accompagne d’une diminution de G, ∆G 6 0, le cas d’égalité
correspondant à la condition d’équilibre.
16 : Le potentiel chimique 343

Évolutions spontanées monobares monothermes


X Lors d’une évolution spontanée monobare monotherme en l’absence de
tout travail autre que des forces de pression, l’enthalpie libre G diminue ;
l’équilibre correspond donc au minimum de G.

On peut encore affirmer que l’enthalpie libre est le potentiel des transformations mo-
nobares et monothermes.
Dans la définition de G, on constate qu’une évolution spontanée doit réaliser un
compromis entre une diminution de H (critère énergétique) et une augmentation de
S (critère entropique).
2 Identités thermodynamiques : à partir de l’identité dU = T dS − pdV , la transfor-
mation U (S, V ) → H(S, p) = U + pV mène à l’identité dH = T dS + V dp, remplaçant
la variable V par p en   à la fonction de départ U le terme de transformation
ajoutant
∂U
de Legendre pV = −V . On peut généraliser cette méthode de transformation
∂V S
pour définir quatre fonctions thermodynamiques mathématiquement équivalentes, se-
lon le schéma 16.1.

U (S, V ) +pV H(S, p) = U + pV

dU = T dS − pdV −pV dH = T dS + V dp
+
pV

−T S +T S −T S +T S

pV

T
+

S
T
S

F (T, V ) = U − T S +pV G(T, p)

dF = −SdT − pdV −pV dG = −SdT + V dp

Figure 16.1 – Fonctions énergétiques de la Thermodynamique

Ce schéma montre que G, fonction de Gibbs, est fonction des variables intensives (de
Gibbs) T et p, avec l’identité thermodynamique dG = −SdT + V dp. Toutefois, cette
identité a été établie pour un système ne subissant que des variations des paramètres
thermodynamiques T et p ; nous devons généraliser cette identité au cas où les autres
variables de Gibbs nψ i évoluent.

16.2.2 Potentiel chimique et affinité chimique


2 Potentiel chimique : la variation du potentiel thermodynamique G dans le cas
∂G ∂G X ∂G ψ
le plus général peut s’écrire dG = dT + dp + dni ; les deux premières
∂T ∂p ∂nψ
i
i,ψ
344 Physique, MP, MP*

dérivées partielles étant calculées à composition chimique constante, on les identifie


∂G ∂G
immédiatement à = −S et = V comme sur le tableau 16.1 ; quant aux autres
∂T ∂p
∂G
dérivées , il s’agit des grandeurs molaires partielles giψ associées à G.
∂nψi
Du fait de l’importance de la fonction G, ces grandeurs molaires partielles ont reçu
∂G
un nom spécifique : giψ = porte le nom de potentiel chimique de l’espèce Ai dans
∂nψ
i
la phase ψ du mélange étudié ; on le note µψ
i et :

φ
N X
X
dG = −SdT + V dp + µψ ψ
i dni (16.6)
i=1 ψ=1

Ce potentiel chimique est une grandeur intensive qui se mesure en joules (ou plus
souvent kilojoules) par mole. La localité des interactions chimiques (qui ne dépendent
souvent que des termes d’interaction à courte distance) explique que le potentiel chi-
mique µψi est en général une fonction de la seule composition chimique de la phase
ψ, en plus des grandeurs intensives p et T : il ne dépend pas de la présence ou de la
composition des autres phases.
2 L’enthalpie libre en fonction des potentiels chimiques : la fonction G étant extensive,
on peut aussi réécrire la relation générale d’extensivité 16.3 sous la forme :

φ
N X
X
G= nψ ψ
i µi (16.7)
i=1 ψ=1

Remarquons qu’on
X peut encore évaluer la différentielle dG à partir de (16.7) sous la
forme dG = ψ ψ
dni µi + nψ ψ
i dµi et, en comparant le résultat obtenu à (16.6), on
i,ψ
obtient l’identité de Gibbs-Duhem :
φ
N X
X
dµψ ψ
i ni = −SdT + V dp (16.8)
i=1 ψ=1

16.3 Affinité chimique

16.3.1 Définition
2 Affinité : la relation générale (16.4) devient, dans le cas particulier de l’enthalpie
XN X φ
p
libre, ∆r Gp = νi,ψ µψ
i . Toutefois, comme on s’intéresse à une condition de
i=1 ψ=1
diminution de l’enthalpie libre, on s’intéresse à l’opposé de la dérivée de Lewis, qui
prend le nom d’affinité chimique de la réaction numéro p :
  φ
N X
∂G X p
Ap = −∆r Gp = − Ap = − νi,ψ µψ
i (16.9)
∂ξp T,p,ξq ,q6=p i=1 ψ=1
16 : Le potentiel chimique 345

2 Cas d’une réaction unique : dans le cas très courant d’une réaction chimique
unique, la relation (16.9) prend la forme :
 
∂G
A = −∆r G = − (16.10)
∂ξ T,p

Ainsi, une évolution spontanée


  se faisant dans le sens d’une diminution de G, l’étude
∂G X
du signe de sa dérivée = −A, avec A = − νi,ψ µψ
i , nous renseignera
∂ξ T,p
i,ψ
directement sur le sens effectif d’évolution de la variable ξ au cours du temps.

16.3.2 Équilibre et évolution chimiques


2 Condition d’équilibre : puisque G évolue vers un minimum atteint à l’équilibre,
on pourra définir une condition d’équilibre :

Condition d’équilibre chimique


X La p-ième réaction chimique est à l’équilibre lorsque son affinité chimique
Ap s’annule.

2 Condition d’évolution : en dehors de l’état d’équilibre, lors d’une évolution à T et


r
X
p fixés, on pourra écrire dG = − Ap dξp ; en particulier, en présence d’une réaction
p=1
chimique unique (ou si l’avancement d’une seule réaction est variable, les autres étant
par exemple arrêtées par défaut d’un réactif limitant), le signe de −dG sera celui de
Adξ. Puisque G doit diminuer, on en conclut que Adξ doit être positif :

Condition d’évolution chimique


X Lorsqu’une réaction chimique a lieu seule à pression et température
fixées, la réaction évolue dans le sens direct −→ (ou sens 1) lorsque
A > 0 ; elle a lieu dans le sens inverse ←− (ou sens 2) lorsque A < 0.

Cette propriété justifie la dénomination (( affinité chimique )) : on peut dire que les
réactifs ont une affinité (positive) les uns pour les autres lorsque la réaction progresse,
donc lorsque A > 0.
2 Exemple : reprenons l’exemple de la réaction CH2 = CH2 +Cl2 ⇋ CH2 Cl − CH2 Cl,
pour laquelle on peut écrire A = µCH2 CH2 + µCl2 − µCH2 ClCH2 Cl ; la réaction évoluera
dans le sens direct −→ si la somme des potentiels chimiques des réactifs dépasse le
potentiel chimique du produit, donc dans le sens d’une diminution de cette somme de
potentiels chimiques : c’est cette circonstance qui justifie l’emploi du terme (( potentiel
chimique )) pour la dérivée partielle µψ
i .

16.4 Équilibre entre plusieurs phases

16.4.1 Condition d’équilibre


2 Expression générale : la condition d’évolution spontanée d’un système à tempé-
rature et pression fixées est dG < 0 soit, compte tenu de l’identité thermodynamique
(16.6), la condition :
346 Physique, MP, MP*

φ
N X
X
dGT,p fixés = µψ ψ
i dni 6 0 (16.11)
i=1 ψ=1

Dans cette expression, l’égalité correspond soit à une évolution réversible, soit au cas
où G atteint son minimum, c’est-à-dire à la condition d’équilibre.
2 Cas d’un, corps sous deux phases : on peut en particulier s’intéresser au cas d’un
seul corps A (N = 1) pouvant changer d’état, c’est-à-dire en général présent dans
deux phases (φ = 2), que nous noterons α et β. La condition (16.11) prend alors la
β β
forme simple dG = µα α
A dnA + µA dnA 6 0. Comme de plus la conservation
  de la matière
β β β
impose dnα α
A + dnA = 0, la condition d’évolution s’écrit dnA µA − µA > 0.

Ainsi, l’espèce A quittera la phase où son potentiel chimique est le plus élevé puisque
dnβA > 0 correspond à µα β
A > µA et réciproquement ; enfin, l’équilibre entre les deux
phases sera atteint si G atteint son minimum, donc si dG = 0 :

Équilibre entre phases


X Il y a équilibre entre deux phases d’un même corps pur lorsque le poten-
tiel chimique de ce corps A a même valeur dans les deux phases α et β
β
où il est présent : µα
A = µA .

16.4.2 Règle des phases


2 Fractions molaires : pour définir de manière intensive la composition chimique
de la phase ψ, on introduit les fractions molaires dans une phase par les relations :

nψ nψ

i = P N
i
= i
(16.12)
j=1 nψ
j
ni

Bien qu’il soit formellement possible d’étendre la définition ci-dessus à une réunion
de plusieurs phases, voire au système tout entier, nous ne le ferons pas dans la suite :
les fractions molaires ne sont définies qu’à l’intérieur d’une phase donnée.
On a alors la relation évidente entre fractions molaires :

N
X

i =1 pour toute phase ψ (16.13)
i=1

2 Variance : les potentiels chimiques sont des fonctions d’état intensives, dont on
a vu qu’elles imposent, à l’équilibre, certaines relations entre les paramètres intensifs
formés de la température T , de la pression p, et des N φ paramètres intensifs de

composition que sont les fractions molaires xψ i = i
.

i

Ainsi, ces N φ + 2 paramètres intensifs ne sont pas indépendants ; le nombre de pa-


ramètres intensifs effectivement indépendants porte le nom de variance, et nous le
noterons v.
16 : Le potentiel chimique 347

Un système physico-chimique de variance v permet à l’opérateur de fixer au plus v


paramètres intensifs de composition sans empêcher la réalisation des conditions d’équi-
libre ; par contre, si on essayer de fixer un nombre de paramètres intensifs supérieur à
v, on rendra forcément impossible au moins une des conditions d’équilibre (physique
ou chimique), et un de ces équilibres sera rompu. S’il s’agit d’un équilibre chimique, il
y aura par exemple disparition d’un réactif limitant ; dans le cas d’un équilibre entre
phases, une phase disparaı̂tra, etc.

Variance
X On appelle variance v d’un système physico-chimique le nombre maxi-
mum de paramètres intensifs, choisis parmi T , p et les fractions molaires
xψi , qu’un opérateur peut librement fixer sans rompre nécessairement
l’équilibre.

Il est important de remarquer que ce décompte ne concerne que les paramètres in-
tensifs. Il n’est pas possible de faire un décompte analogue des paramètres extensifs,
puisque par exemple un opérateur peut librement doubler toutes les quantités de
matière du système physico-chimique sans modifier aucunement l’équilibre.

2 Règle des phases : il s’agit du décompte effectif de la variance, obtenu en retirant


au nombre N φ+2 de paramètres intensifs le nombre de relations entre ces paramètres.
Il s’agit :
N
X
• pour chaque phase, de la relation xψ
i = 1 ; on dispose ainsi de φ relations
i=1
indépendantes ;
β
• pour chaque couple de phases, de la relation µα i = µi exprimant l’équilibre de
l’espèce Ai entre les phases α et β. Notons que si une espèce est absente d’une
phase, on dispose d’une relation de moins, mais il existe une inconnue de moins
puisque la fraction molaire correspondante est nulle. Au total, on fixe ainsi
N × (φ − 1) relations indépendantes ;
• pour chaque réaction chimique, de la relation Ar = 0 ; on dispose ainsi de r relations
indépendantes ;
• enfin, de toutes les k relations supplémentaires imposées par exemple par la stœ-
chiométrie spécifique des conditions initiales.
Finalement, v = N φ + 2 − φ − N φ + N − r − k s’écrit aussi :

v =N −r+2−φ−k (16.14)

où on note parfois c = N −r ; cette relation est connue sous le nom de règle des phases
de Gibbs.
2 Exemples : considérons un système physique formé d’une seule espèce présente
sous deux phases, en l’absence de toute réaction chimique et de toute relation spéci-
fique ; on aura donc N = 1, φ = 2, r = k = 0 donc v = 1 ; on dit que le système est
monovariant. Ainsi, l’opérateur peut fixer seulement la pression p, l’équilibre imposera
la valeur de la température de changement d’état T ∗ (p). Il n’y a ici pas de variable de
composition puisque le corps est pur dans chacune des deux phases où il est présent.
Considérons maintenant les deux équilibres chimiques de déshydratation des hy-
droxydes de cuivre et d’argent, à savoir 2Ag(OH)2 solide ⇋ Ag2 Osolide + 2H2 Ogaz et
348 Physique, MP, MP*

2Cu(OH)2 solide ⇋ Cu2 Osolide + 2H2 Ogaz ; à haute température, la vapeur d’eau forme
une phase gazeuse et les deux oxydes et les deux hydroxydes forment quatre phases
solides non miscibles ; en présence des deux réactions indépendantes, N = 5, φ = 5 et
r = 2 donc v = 0 ; on dit que le système est zérovariant ou nilvariant. Un opérateur
ne peut rien imposer à l’équilibre puisque les deux conditions d’équilibre chimique
p2 p2
imposent respectivement K1 (T ) = ◦ 2 et K2 (T ) = ◦ 2 , p désignant la pression par-
p p
tielle de vapeur d’eau qui, en l’absence de toute autre espèce dans la phase gazeuse,
se confond avec la pression totale. Cette double condition n’est possible que pour une
valeur fixée de T , qui à son tour impose une valeur fixée de p.

Considérons enfin la réaction chimique de dissociation de l’eau en oxygène et hydro-


gène, 2H2 O ⇋ 2H2 + O2 ; menée en phase homogène gazeuse, avec donc φ = r = 1 et
N = 3 on obtient en général v = 3 : le système est trivariant. L’existence d’une condi-
tion d’équilibre chimique et de la relation xH2 O +xH2 +xO2 = 1 fixe bien deux relations
entre les cinq paramètres T , p, xH2 O , xH2 et xO2 . Toutefois, si on part de vapeur d’eau
initialement pure, la stœchiométrie de la réaction impose de plus xH2 = 2xO2 ; cette
relation supplémentaire, imposée par les conditions initiales, correspond à k = 1 donc
v = 2 ; après cette réduction de la variance, le système physico-chimique n’est plus
que divariant.

16.5 Évolutions et Physique statistique

16.5.1 Entropie et évolutions spontanées

2 Création d’entropie : au cours d’une réaction chimique spontanée isobare et iso-


therme, on peut écrire dG = δW +δQ−pdV −T dS qui s’écrit encore −dG = T δScréé ;
ainsi, la diminution de l’enthalpie libre est une mesure directe de l’enthalpie créée,
A
avec δScréé = dξ. L’augmentation d’entropie qui résulte des réactions spontanées
T
ou plus généralement des transformations spontanées admet une interprétation mi-
croscopique.

Considérons par exemple une réaction de dissolution d’une espèce ionique dans l’eau,
H2 O
par exemple de bilan NaClsolide −→ Na+ + Cl+ . Cette réaction est spontanée, ce qui
se traduit par une forte diminution de G lors de la dissolution. L’étude quantitative
montre que cette diminution ne peut pas s’interpréter seulement par une diminution
de l’enthalpie H ; il y a aussi une forte augmentation de l’entropie S.
CV dT + pdV Cp dT − V dp
Si on se rappelle les expressions dS = ou dS = établies
T T
pour un gaz parfait, on retrouvera donc une forte augmentation d’entropie dans divers
cas :
• dans le cas de la dissolution d’un solide ionique, lors de la dispersion des ions qui
le formaient dans le solution aqueuse ;
• pour un gaz en évolution isotherme, lors d’une augmentation de volume (ou d’une
diminution de pression) qui disperse les molécules du gaz à une plus grande
distance moyenne les unes des autres ;
• pour un gaz en évolution isobare ou isochore, lors d’une augmentation de la tem-
pérature, qui augmente l’agitation thermique des molécules du gaz.
Nous admettrons la généralisation de ces affirmations sous la forme générale :
16 : Le potentiel chimique 349

Interprétation statistique de l’entropie


X L’entropie d’un système thermodynamique est une mesure du désordre
moléculaire ; elle augmente lorsque les évolutions macroscopiques du sys-
tèmes diminuent l’information disponible sur l’état microscopique des
particules qui composent ce système.

Dans certains cas, cette interprétation qualitative permet de justifier les sens d’évo-
lution physique ou chimique calculés à partir des propriétés des potentiels chimiques.
2 Macroétats et microétats : lorsqu’on affirme qu’un système thermodynamique,
donc macroscopique, se trouve dans un macroétat M donné (défini par un certain
ensemble de variables d’état), on ne précise en fait pas complètement son état mi-
croscopique puisqu’il peut se trouver dans n’importe lequel des Ω(M ) microétats m
correspondant à M , macroscopiquement indiscernables.
L’hypothèse fondamentale de la thermodynamique statistique est l’équiprobabilité
de tous les microétats possibles d’un système isolé, c’est-à-dire compatibles avec les
différentes lois mécaniques décrivant le système. Ainsi, un système (Σ) isolé d’énergie
interne totale U peut se trouver, à un certain instant, dans n’importe quel microétat
N
X
tel que l’énergie totale des particules soit égale à U , ǫi = U .
i=1

Ce système, même lorsqu’il a atteint l’équilibre macroscopique, reste en évolution


rapide au niveau microscopique, le système passant de l’un à l’autre des Ω(M ) mi-
croétats possibles. Observer un système thermodynamique, c’est donc observer une
moyenne entre ces microétats qui se succèdent. Manifestement, du fait de l’hypothèse
d’équiprobabilité, le système thermodynamique passera la plupart de sont temps dans
le macroétat µ qui réalise la plus grande valeur possible de Ω(M ), et ceci de façon di-
rectement proportionnelle à ce nombre Ω(M ). Ainsi, les systèmes thermodynamiques
isolés évoluent-ils tous spontanément vers le macroétat le plus probable, c’est-à-dire
qui réalise la valeur de Ω(M ) la plus élevée.
On peut donner une illustration des nombres mis en jeu dans le cas simple des systèmes
constitués de particules à deux états seulement, comme par exemple des particules qui
peuvent être soit à droite, soit à gauche d’une boı̂te divisée en deux compartiments
égaux (cf. figure 16.2).

b4

b3

b2

b1 b5 b6

Figure 16.2 – Exemple de système simple

Si ce système contient en tout N particules (sur la figure, N = 6), le macroétat


caractérisé parD particules
 à droite (ici D = 2) peut être réalisé de Ω(D) façons,
D N!
avec Ω (D) = = ; la fonction de distribution Ω(D) admet son
N D! (N − D)!
N
maximum pour D = , avec un pic très resserré si N ≫ 1.
2
350 Physique, MP, MP*

2 Entropie statistique : la fonction Ω(M ) caractérise un macroétat M donné, et


c’est donc une fonction d’état. Puisque, au cours d’une évolution spontanée, Ω(M )
augmente, cette fonction pourrait être un candidat pour une fonction entropie définie
de façon uniquement statistique, à condition d’avoir les autres propriétés de l’entropie ;
et en particulier à condition d’être extensive.
Considérons donc deux systèmes thermodynamiques (Σ1 ) et (Σ2 ) et juxtaposons-les
par la pensée. Un macroétat M du système (Σ) global est défini par la donnée des
deux macroétats particuliers M1 et M2 de (Σ1 ) et (Σ2 ). Comme ces deux macroé-
tats sont réalisés de façon indépendante –les deux systèmes étant sans interaction–,
respectivement par Ω1 (M1 ) et Ω2 (M2 ) microétats, on en conclut immédiatement que
Ω(M = (M1 , M2 )) = Ω1 (M1 )×Ω2 (M2 ) ce qui montre qu’on peut choisir pour fonction
entropie statistique :

S = k ln Ω (16.15)

pour toute constante positive k ; de façon générale, l’entropie statistique mesure ainsi
l’étendue de l’ignorance relativement à l’état microscopique d’un système, pour un ob-
servateur qui n’en connaı̂t que l’état macroscopique ; c’est ce qu’on appelle en général
la mesure du désordre moléculaire sous-jacent à la donnée d’un macroétat.
Cette interprétation statistique de l’entropie est due à Boltzmann‡ ; on va mon-
trer qu’on peut l’identifier à l’entropie classique sous réserve du choix pour k de la
constante de Boltzmann kB .
2 Constante de Boltzmann : considérons à nouveau le système de la figure 16.2, et
imaginons qu’il décrit un gaz parfait qui subit une détente de Joule, Gay-Lussac qui
double son volume. Dans l’état initial, toutes les N molécules sont du même côté de la
paroi et l’entropie du système vérifie Si = k ln Ω(0) = k ln 1 = 0. Par contre, dans l’état
final, l’entropie du système peut s’écrire Sf = k ln Ω(N/2) = k [ln(N !) − 2 ln ((N/2)!)].
Vu les valeurs élevées de N pour tous les systèmes thermodynamiques, on se contentera
ici de l’expression approchée de Stirling : pour n assez grand, ln n! ≃ n ln n − n.
Ainsi, la variation d’entropie  lors de la détente de Joule,Gay-Lussac s’exprime selon
N
∆S = Sf − Si soit ∆S = k N ln N − N − N ln + N ou enfin S = kN ln 2.
2
Un calcul classique de la même variation d’entropie se fait selon dU = T dS − pdV
p dV
soit, la détente de Joule- Gay-Lussac étant isotherme, dS = dV = nR ; l’aug-
T V
mentation d’entropie lors de la détente envisagée ici vaut ∆S = nR ln 2 = N kB ln 2
où kB est la constante de Boltzmann.
Ce résultat, conforté par des études menées notamment dans le cadre quantique per-
mettent de montrer que l’entropie statistique coı̈ncide bien avec l’entropie classique à
R
condition de choisir pour k la constante de Boltzmann k = kB = .
NA

16.5.2 Principe de limite thermique


2 Lien entre énergie et nombre de microétats : la fonction Ω(U ), tout comme la
fonction entropie S = kB ln Ω(U ), augmente pratiquement toujours très fortement
avec U . Il s’agit d’une conséquence logique de la structure quantique de la matière ;
si on se souvient en effet de l’existence, pour chacun des N atomes ou molécules d’un
16 : Le potentiel chimique 351

échantillon macroscopique, d’une liste d’états d’énergie croissante, on réalise que, plus
l’énergie totale est élevée, plus le nombre de façons de la réaliser l’est aussi.
Prenant pour exemple un système de N particules dont tous les états d’énergie sont
régulièrement espacés de ǫ. Il existe une seule façon de réaliser l’état d’énergie mini-
male U = 0 : toutes les particules doivent être dans l’état fondamental. Il existe N
façons de réaliser l’état d’énergie U = ǫ, selon la particule qu’on place au premier
N (N − 1) N2
niveau excité ; de même, il existe ≃ façons de réaliser l’état d’énergie
2 2
U = 2ǫ, etc.
Inversement, la quasi totalité de systèmes thermodynamiques condensés en phase
cristalline réalisent, à basse température, un état d’entropie minimale, voire nulle
dans certains cas, avec un seul microétat correspondant au macroétat de plus basse
énergie possible : si U = Umin alors Ω(U ) → 1 et donc S → 0.
2 Énoncé du principe : l’ensemble des considérations qualitatives ci-dessus justifie
le principe de Nernst ou principe de limite thermique (aussi appelé troisième principe
de la thermodynamique), dont nous admettrons la généralisation à tous les systèmes
thermodynamiques :
Principe de limite thermique
X L’entropie S de toutes les phases condensées tend vers zéro lorsque la
température du système tend vers zéro.
Ainsi, l’entropie n’est pas définie à une constante arbitraire près ; il existe un état de
référence d’entropie nulle, même s’il est impossible à réaliser en pratique et ne peut
donc être déterminé que par extrapolation.
Remarquons que, s’il n’en allait pas ainsi, l’enthalpie libre G = H −T S, qui dépendrait
des états de référence choisis pour H et pour S, serait définie à une fonction affine
arbitraire de T près ! Il n’en est rien et nous verrons ultérieurement comment la donnée
d’une seule constante arbitraire, relative à l’enthalpie H, suffit à déterminer G. Cette
constante a d’ailleurs déjà été définie dans le cours de Thermochimie : c’est l’enthalpie
de formation.

16.6 Expressions du potentiel chimique

16.6.1 Propriétés générales


2 Importance : l’emploi des propriétés énoncées ci-dessus pour le potentiel ther-
modynamique G des transformations monothermes et monobares impose de savoir
calculer G, et donc ses dérivées partielles que sont les potentiels chimiques. Nous
allons ici apprendre à identifier certaines expressions simples du potentiel chimique.
2 Variables de composition : le potentiel chimique µψi de l’espèce Ai dans la phase
ψ dépend, comme on l’a vu, de la température T , de la pression p, et en général de
la seule composition chimique de la phase ψ : il est indépendant de la présence et de
la composition d’autres phases.
Le potentiel chimique est d’autre part une grandeur intensive ; il de dépend donc pas
des quantités de matière nψ
j dans la phase ψ (avec j = 1, . . . , N ) mais seulement de
leurs valeurs relatives, donc des fractions molaires déjà définies.
Nous considérerons toujours dans la suite que les potentiels chimiques sont des fonc-
tions de T , p et des N − 1 fractions
 molaires indépendantes de la phase ψ, sous la
forme µψi = µψ
i T, p, xψ
j j=1,···N .
352 Physique, MP, MP*

Dans le cas d’un mélange idéal de gaz parfaits, pV = nRT et pi V = ni RT donc


pi
xi = et la fraction molaire est égale à la pression partielle relative (loi de Dalton).
p
On peut aussi définir le volume Vi qu’occuperaient les ni moles de l’espèce i si elles
étaient amenées à la pression p du mélange à la même température T par pVi = ni RT ,
ce qui permet encore d’écrire xi = Vi /V , ce qui justifie le nom de pourcentage en
volume parfois donné aux fractions molaires des phases gazeuses ; Ainsi, dire que l’air
contient 21 % d’oxygène en volume revient à affirmer que la fraction molaire de O2
est égale à xO2 = 0, 21 dans l’air.

16.6.2 Influence de T et p sur le potentiel chimique


2 Influence de la température : considérons le cas particulier d’une phase unique,
α
présentant un constituant
 unique A, pour lequel on peut  donc
 écrire G = nµA = nµ.
∂G ∂µ
La relation générale = −S permet ici d’écrire = −s, où on a appelé
∂T p,n ∂T p
s l’entropie molaire de ce corps pur dans cette phase.
Cette entropie molaire est en général une fonction relativement complexe de T et
p ; pour cette raison, les données thermodynamiques doivent permettre une prise en
compte phénoménolgique des variations de température ; en particulier, il n’existe
en général pas de température privilégiée pour laquelle l’expression des potentiels
chimiques serait simple.
Nous ne définirons donc pas de température standard ; l’étude d’un problème thermo-
dynamique à la température T exige la lecture de tables prévues pour cette tempéra-
ture, ou bien la prise en compte de tables de correction de température (comme les
lois de Kirchhoff établies dans le cours de Thermochimie).
 
∂G
2 Influence de la pression : dans le même cas que ci-dessus, = V donc
∂p T,n
 
∂µ
= v, qui est le volume molaire de ce corps dans cette phase. Le volume
∂p T
molaire est en général une fonction assez simple de T et p ; ainsi, pour un gaz parfait,
RT
v= ; pour une phase condensée (liquide ou solide), v est pratiquement constant
p
et de toutes façons assez faible. Pour cette raison, les données thermodynamiques
permettent une compensation aisée des effets de la pression.
Nous définirons donc dans la suite une pression standard, égale à p◦ = 1 bar ; l’étude
d’un problème thermodynamique à la pression p 6= p◦ exige bien sûr une compensa-
tion, qui sera simple dans tous les cas. La quasi-totalité des tables thermodynamiques
sont par ainsi construites par convention pour la pression standard.

16.6.3 Potentiel chimique en phase gazeuse


2 Potentiel chimique d’un gaz parfait : considérons un gaz parfait unique A, seul
dans sa phase GP. Le potentiel chimique correspondant s’identifie à l’enthalpie libre
molaire Gm de ce gaz, puisque G(T, p, n) = nGm (T, p). L’identité thermodynamique
dGm = −Sm dT + Vm dp où Sm est l’entropie molaire et Vm = RT /p le volume molaire
du gaz parfait.
Z p
RT
On en déduit immédiatement que Gm (T, p) − Gm (T, p◦ ) = dp que l’on écrira
p◦ p
p
encore µGP (T, p) = µGP (T, p◦ ) + RT ln ◦ . C’est cette expression que nous choisirons
p
16 : Le potentiel chimique 353

de généraliser, en notant µ◦,GP (T ) = µGP (T, p◦ ) le potentiel chimique du corps A


dans l’état de référence, formé du gaz pur A à la température T et à la pression p◦ .
La différence entre le potentiel chimique dans l’état (T, p) et le potentiel chimique dans
p
l’état de référence (T, p◦ ) fait intervenir l’activité a = ◦ , sous la forme générale :
p

µψ
i = µ◦,ψ
i +RT ln aψi (16.16)
|{z} |{z}
état de référence acivité

avec dans le cas d’un gaz parfait les expressions de l’activité et de l’état de référence :

Potentiel chimique d’un gaz parfait pur


État de référence Activité ai

X Gaz parfait, pur µ = µ◦ GP


(T )
p
p◦
p = p◦ = 1 bar, T

Attention à ne pas confondre affinité chimique A et activité a ; ces deux grandeurs


interviendront toutes deux dans les conditions d’équilibre physique ou chimique mais
n’ont pas la même signification, ni la même unité : A se mesure en joule par mol,
et a est un nombre pur.

2 Mélange idéal de gaz parfaits : considérons (cf. figure 16.3) n1 moles du gaz parfait
G1 , sous la pression p1 , à la température T ; ce gaz occupe le volume V = n1 RT /p1 .
Avant de le mélanger à n2 moles du gaz parfait G2 , on va porter celui-ci à la même
température T et sous la pression p2 telle que le gaz occupe lui aussi le volume V ;
ainsi on doit avoir p2 V = n2 RT .

S
p1 , V, n1 , T p2 , V, n2 , T

v
P

Figure 16.3 – Mélange idéal de gaz parfaits

Le mélange se fait en retirant la séparation S, donc sans aucun apport d’énergie


mécanique ; si les parois du système sont adiabatiques, l’énergie totale du système
est conservée (sauf en cas de réaction chimique entre les gaz, ce que nous exclurons
ici). En particulier, si le mélange se comporte comme un gaz parfait, il conserve la
température T des constituants du mélange puisque Uf = U1 + U2 .
Par contre, chaque molécule du mélange ainsi formé se voit offrir un volume plus
important, et on s’attend donc à une perte d’information sur les microétats, donc à
une augmentation de l’entropie : le mélange est bien sûr irréversible. Pour restituer
354 Physique, MP, MP*

l’entropie de départ, on peut imaginer de déplacer le piston P de la figure 16.3 dans le


sens indiqué par v, tout en maintenant constante la température T , jusqu’à ramener
le volume total de 2V à V . Si le mélange s’est comporté comme un gaz parfait, la
température et le volume en fin de transformation étant T et V , la pression totale
RT n1 p n2 p
vaut p = (n1 + n2 ) et les pressions partielles p1 = et p2 = sont
V n1 + n2 n1 + n2
égales aux pressions initiales des gaz qui ont été mélangés.
Au cours de ce déplacement du piston, on a diminué l’espace offert à chaque molécule
du mélange ; chacune de ces molécules se retrouve en fin de mélange dans le même
environnement géométrique que celui qu’elle avait avant le mélange. Nous admettrons
donc que l’entropie en fin d’opération est identique à l’entropie de départ. On peut
aussi dire que l’augmentation d’entropie due au mélange (irréversible, système isolé) a
été compensée par la diminution d’entropie de la compression (isotherme, réversible).
L’ensemble de cette transformation a conservé la température donc l’énergie interne
et l’enthalpie, mais aussi les pressions partielles, ainsi que l’entropie S. On en déduit
que G = H − T S n’a pas non plus été modifiée par le mélange, ce qui permet de
redéfinir un mélange idéal :
Mélange idéal de gaz parfaits
X On appelle mélange idéal de gaz parfaits le résultat du mixage de gaz
parfaits, qui, s’il est réalisé à température T et pressions partielles pi
constantes, conserve aussi les fonctions d’état U , H, S et G.

2 Potentiel chimique en mélange idéal : dans un tel mélange de deux gaz on peut
écrire, conformément à ce qui précède, G = G1 + G2 , où G1 et G2 sont déterminées
n1 p n2 p
avant mélange, soit G = n1 µ◦1 (T )+n1 RT ln +n2 µ◦2 (T )+n2 RT ln . On
  n 1 + n2 n1 + n2
∂G
en déduit alors µ1 = où on dérive la somme des trois termes n1 µ◦1 (T ),
∂n1 n2 ,T,p
n1 RT ln(n1 p) et −(n1 + n2 )RT ln(n1 + n2 ) pour obtenir respectivement les dérivées
µ◦1 (T ), 1 + RT ln(n1 p) et −1 − RT ln(n1 + n2 ). Sommant les trois termes, on obtient
n1 p
µ1 = µ◦1 (T ) + RT ln , ce qui permet d’identifier la forme générale (16.16) avec
n1 + n2
les expressions de l’activité et de l’état de référence :
Potentiel chimique d’un gaz parfait en mélange idéal
État de référence Activité ai

X Gaz parfait, pur µ = µ◦ GP


(T )
pi

p
= xi ◦
p p
p = p◦ = 1 bar, T

2 Mélange gazeux quelconque : l’étude de mélanges de gaz non parfaits se fait


toujours conventionnellement à partir du modèle du mélange idéal, auquel on apporte
une rectification, connue sous le nom de coefficient d’activité γi :
Potentiel chimique d’un gaz en mélange quelconque
État de référence Activité ai

X Gaz pur µ = µ◦ G
(T ) γi
pi p
= γi xi ◦
p◦ p
p = p◦ = 1 bar, T
16 : Le potentiel chimique 355

Le coefficient d’activité de tous les constituants d’un mélange de gaz réels tend vers
1 lorsque la pression du mélange tend vers zéro : tout mélange devient un mélange
idéal de gaz parfaits à basse pression.

On remarquera que, dans toutes les phases gazeuses, l’état de référence se confond
avec l’état standard à la température T : corps pur et pression p = p◦ = 1 bar.

16.6.4 Potentiel chimique en phase liquide

2 Solutions idéales : les mélanges liquides (quand ils sont possibles ; tous les liquides
ne sont pas miscibles) s’éloignent en général beaucoup des mélanges idéaux de gaz
parfaits. Toutefois, il existe certaines situations exceptionnelles pour lesquelles les
propriétés physiques des molécules des deux liquides mélangées sont assez semblables
pour qu’on puisse parler de mélange idéal.

Un tel mélange idéal sera l’analogue d’un mélange idéal de gaz parfaits pour ce
qui concerne l’influence des concentrations (c’est-à-dire, des fractions molaires) ; par
contre, il ne le sera pas pour ce qui concerne l’influence de la pression qui est,
comme on l’a vu, bien plus réduite pour les phases condensées. Ainsi, nous défini-
rons le mélange idéal réalisé à la pression p par l’expression du potentiel chimique
µi (T, p, xi ) = µ◦i (T, p) + RT ln xi ; ainsi, l’état de référence, atteint pour xi = 1, est le
corps pur seul dans sa phase liquide.

Son potentiel chimique µ◦i (T, p) dépend toujours de la température, mais très peu de
la pression puisqu’on peut écrire
 G◦  = nµ◦i (T, p) pour n moles de ce corps pur, et
∂µi
dG = −SdT + V dp impose ici = vi◦ , volume molaire de ce liquide pur.
∂p T
Le volume molaire d’un liquide reste en général faible, et souvent constant ; par
exemple pour l’eau liquide, v ◦ = 18 × 10−3 L · mol−1 donc la variation de poten-
Z p′
tiel chimique associée est µ◦i (T, p′ ) = µ◦i (T, p) = vi◦ dp ≃ vi◦ (p′ − p) ; elle sera
p
souvent négligeable devant les termes de l’ordre de RT puisque, avec T = 300 K, il
RT
faudrait une variation de pression p′ − p de l’ordre de ◦ ∼ 1 400 bar pour qu’il n’en
vi
aille pas ainsi.

Finalement, nous devrons distinguer l’état de référence de l’état standard, mais en


remarquant que la différence reste toujours faible :

Potentiel chimique d’un liquide en mélange idéal


État de référence Activité ai

X Liquide pur µ = µ◦ L (T, p) xLi =


nLi
nL
p, T
Le potentiel
 ◦ Lchimique
 de l’état de référence dépend un peu de la pression,
∂µ ◦
avec = v ; on négligera souvent cette variation.
∂p T

Le cas des solutions liquides réelles peut être pris en compte, comme dans le cas des
gaz, par la définition et la mesure d’un coefficient d’activité ; on écrira alors :
356 Physique, MP, MP*

Potentiel chimique d’un liquide en mélange réel


État de référence Activité ai

X Liquide pur µ = µ◦ L (T, p) γi xLi = γi


nLi
nL
p, T
Le potentiel
 ◦ Lchimique
 de l’état de référence dépend un peu de la pression,
∂µ
avec = v ◦ ; on négligera souvent cette variation.
∂p T

On observe expérimentalement que le coefficient d’activité tend vers 1 (et la solution


se comporte comme une solution idéale) dans deux cas :
• lorsque les structures électroniques des constituants du mélange sont presque iden-
tiques : ainsi, l’environnement électronique d’une molécule dans le mélange est
presque le même que l’environnement électronique de la même molécule dans le
corps pur ; elle ne subit que l’effet de dilution avec xLi < 1 ;
• lorsque l’espèce Ai étudiée est fortement majoritaire ; là aussi, on explique cette
propriété en remarquant qu’un composant majoritaire d’un solvant a un envi-
ronnement électronique presque inchangé par rapport à la situation où il est
pur. De plus, on doit avoir µi → µ◦i lorsque xi → 1 puisqu’on retrouve le cas du
corps pur ; il faut donc que ln(γi xi ) → 0, donc γi → 1.

2 Solutions diluées : une telle solution est formée d’un solvant S majoritaire (xS / 1)
et d’un (ou plusieurs) soluté(s) A fortement dilué(s) (xA ≪ 1). Nous pouvons consi-
dérer que l’environnement chimique de chaque molécule du solvant est suffisamment
semblable à celui du corps pur pour qu’on puisse le traiter comme une solution idéale,
et nous écrirons donc µS (T, P, xS ) = µ◦S (T, p) + RT ln xS :

Potentiel chimique du solvant d’une solution diluée


État de référence Activité ai

X Solvant liquide pur µ = µ◦ L (T, p) xLS / 1


p, T
Le potentiel
 ◦ Lchimique
 de l’état de référence dépend un peu de la pression,
∂µ ◦
avec = v ; on négligera souvent cette variation.
∂p T

C’est une erreur courante que d’oublier de prendre en compte le solvant et les
variations de son potentiel chimique dans l’étude de l’enthalpie libre G =
X
ni µi
i
du mélange liquide ; en effet, même si le solvant n’apparaı̂t pas dans les bilans des
équations chimiques qui ont lieu dans la solution, sa quantité de matière est toujours
prépondérante. Du fait de la valeur élevée de nS , le coefficient nS µS n’est jamais
négligeable, pas plus que les variations dues au terme RT ln xS .

Considérons une solution comportant un solvant S et un soluté unique A ; considérons


alors une variation isotherme et isobare de la composition de cette phase liquide. La
relation de Gibbs-Duhem (16.8) mène dans ce cas à nLS dµLS + nLA dµLA = 0, ce qu’on
écrira plutôt xLS dµLS + xLA dµLA = 0. D’autre part, µLS = µ◦S L (T, p) + RT ln xLS donc
16 : Le potentiel chimique 357

dxLS dxLS dxLA


dµLS = RT . On en déduit l’équation différentielle dµ L
A = −RT = RT
xLS xLA xLA
L L
puisque xA + xS = 1.
L’intégration de cette équation différentielle mène à µLA = f (T, p) + RT ln xLA ; l’inter-
prétation de la constante d’intégration f (T, p) n’est pas aisée puisqu’elle correspond :
• à la limite où xLA → 1, c’est-à-dire au soluté pur ;
• dans une expression approchée qui n’a de signification que si xLA ≪ 1, c’est-à-dire
pour un soluté infiniment dilué.
Un tel état de référence est donc fictif ; il correspond seulement à une valeur numérique
de potentiel chimique de référence, ce qui n’empêche d’ailleurs pas de calculer cette
valeur.
L’usage veut d’ailleurs qu’on modifie légèrement l’expression établie ci-dessus, en re-
nL nL
marquant que xLA = AL ≃ LA ; de même, la concentration molaire volumique de
n nS
nLA
l’espèce A est [A] = . Le volume V de la solution tout comme la quantité de
V
L
matière nS du solvant restent en général constants au cours des diverses réactions
[A] C ◦V
chimiques en phase diluée, et on peut donc écrire xLA = ◦ × k où k = est
C nLS
une constante et C ◦ n’importe quelle concentration molaire volumique choisie par
convention. Dans toute la suite, on prendra C ◦ = 1 mol · L−1 .
[A]
On peut donc encore écrire µLA = f ′ (T, p) + RT ln ◦ , et donc définir un état de réfé-
C
rence fictif adapté à l’étude des solutions diluées, en particulier des solutions aqueuses :
Potentiel chimique d’un soluté en solution diluée
État de référence Activité ai
[A]
X Soluté infiniment dilué, extra- µ = µ◦ sd
(T, p)
C◦
polé à C ◦ = 1 mol · L−1 .
p, T
Le potentiel chimique de l’état de référence dépend peu de la pression.

Convertissant logarithmes naturels et décimaux, on pourra écrire le potentiel chimique


[A]
d’une espèce A en solution aqueuse diluée sous la forme µaq A ≃ µA
◦ aq
(T ) + RT ln ◦
C
RT [A]
ou encore µaq A ≃ µA
◦ aq
(T ) + lg ◦ puisque ln 10 ≃ 2, 30. L’étude des réactions
2, 30 C
en solution aqueuse se faisant généralement à 298 K, on peut recopier cette relation
[A]
µaq
A ≃ µA
◦ aq
(298 K) + 1, 08 kJ · mol−1 × lg ◦ . On remarque bien sûr que ce facteur de
C
conversion est important (1, 08 kJ · mol−1 ) ; il n’est pas rare de voir des concentrations
varier de 10−2 à 10−12 mol·L−1 , donc une variation du potentiel chimique de l’ordre de
plusieurs dizaines de kilojoules par mole : l’effet de la concentration est ici clairement
visible. Il justifie d’ailleurs le fait qu’on ne prenne pas en compte les corrections de
pression.
2 Cas de non-miscibilité : il existe des liquides qui ne se mélangent pas ; chaque
liquide reste seul dans sa phase et constitue donc dans celle-ci un corps pur, dont
l’état est confondu avec l’état de référence et dont l’activité reste égale à l’unité :
358 Physique, MP, MP*

Potentiel chimique d’un liquide seul dans sa phase


État de référence Activité ai

X Le liquide pur lui-même. µ = µ◦ L (T, p) 1


p, T
Le potentiel
 ◦ Lchimique
 de l’état de référence dépend un peu de la pression,
∂µ
avec = v ◦ ; on négligera souvent cette variation.
∂p T

16.6.5 Phases solides


L’étude générale des mélanges entre solides est encore plus complexe que le cas des
liquides. Nous ne retiendrons que deux cas limites : la miscibilité parfaite (mélange
idéal de deux solides) et la miscibilité nulle.
2 Solutions solides idéales : c’est un cas assez rare ; il correspond à des molécules
présentant de très fortes affinités de structure : isomères géométriques par exemple.
On définit de telles solutions solides idéales par analogie avec les solutions liquides
idéales :
Potentiel chimique d’un solide en mélange idéal
État de référence Activité ai

X Solide pur µ = µ◦ S (T, p) xSi =


nSi
nS
p, T
Le potentiel
 ◦ Schimique
 de l’état de référence dépend un peu de la pression,
∂µ ◦
avec = v ; on négligera souvent cette variation.
∂p T

2 Cas de non-miscibilité : dans la majorité des cas, les solides ne sont pas miscibles
entre eux. Dans ce cas de non-miscibilité absolue, chaque solide reste seul dans sa
phase ; s’agissant d’un corps pur, il est dans un état confondu avec l’état de référence
et son activité est égale à l’unité :

Potentiel chimique d’un solide seul dans sa phase


État de référence Activité ai

X Le solide pur lui-même. µ = µ◦ S (T, p) 1


p, T
Le potentiel
 ◦ Schimique
 de l’état de référence dépend un peu de la pression,
∂µ ◦
avec = v ; on négligera souvent cette variation.
∂p T
16 : Le potentiel chimique 359

Ce qu’il faut absolument savoir

Un système physico-chimique est caractérisé par les N φ + 2 variables de Gibbs,


T , p et les nψ
i . Si on ne s’intéresse qu’aux paramètres intensifs de composition,

on utilisera les fractions molaires xψ i = i
.

En évolution monotherme monobare, un système évolue spontanément dans
le sens d’une diminution de l’enthalpie libre G = H − T S = U + pV − T S.
Cette diminution peut être due à une diminution de l’enthalpie H, ou à une
augmentation de l’entropie S, qu’on interprète alors comme une augmentation
du désordre moléculaire.
P
L’évolution de la fonction G est régie par dG = −SdT + V dp + i,ψ µψ ψ
i dni ,
!
∂G
où µψi = est le potentiel chimique de l’espèce i dans la phase ψ.
∂nψi α
T,p,nj
X ψ ψ
Du fait de l’extensivité de G, on a aussi G = ni µi .
i,ψ

β
Lors du changement d’état d’un corps pur, l’équilibre est donné par µα i = µi ;
hors équilibre, l’évolution se fait dans le sens qui diminue le potentiel chimique.
Lors d’une
 réaction
 chimique, l’équilibre est donné par A = 0, où on a défini
∂G
A=− = −∆r G ; hors équilibre, l’évolution se fait dans le sens donné
∂ξ T,p
X
par le signe de A. Puisque dnψ
i = νi,ψ dξ, on a aussi A = − νi,ψ µψi .
i,ψ

Du fait des conditions d’équilibre, les N φ+2 paramètres intensifs d’équilibre ne


sont pas équivalents ; le nombre de paramètres intensifs qu’un opérateur peut
librement fixer sans rompre l’équilibre est donné par la variance v, donc par
la règle des phases v = N − r + 2 − φ − k, où r est le nombre de réactions
chimiques et k le nombre de relations stœchiométriques spécifiques.
Le potentiel chimique µψ i d’un corps i dans une phase ψ s’exprime en fonction
du potentiel chimique µ◦i ψ dans l’état de référence (qui dépend peu de la
température) et de l’activité aψ ψ ◦ ψ
i , selon µi = µi (T ) + RT ln aψ
i , avec :

Phase, à p et T Référence à la temp. T Activité


Gaz parfait Gaz pur, p◦ pi /p◦ = xi p/p◦
Solution idéale (liq. ou sol.) Corps pur, p xi
Solvant en phase liquide Liquide pur, p xi
Soluté dilué Extrapolé à C ◦ , p [A] /C ◦
Corps pur (liq. ou sol.) Corps pur, p 1

Pour les solutions et mélanges réels, on multiplie l’activité du cas parfait par
un coefficient d’activité γi . Par convention, C ◦ = 1 mol · L−1 et p◦ = 1 bar.
Chapitre 17

Changement d’état des corps purs

17.1 Équilibre d’un corps pur sous deux phases

17.1.1 Condition d’équilibre


2 Le système étudié : on étudie ici le système formé d’un corps pur unique, présent
sous deux phases α et β, qui seront par exemple, mais pas nécessairement, la phase
liquide et la phase vapeur. En l’absence de toute réaction chimique, ce système a une
variance v = N − r + 2 − φ − k = 1 − 0 + 2 − 2 − 0 soit v = 1 ; un tel système
est monovariant. Les deux phases étant formées d’un corps pur unique, il n’y a pas
de variable de composition et le caractère monovariant indique seulement l’existence
d’une relation entre les variables p et T lorsque l’équilibre monobare et monotherme
est réalisé.
2 La condition d’équilibre : elle s’écrit sous la forme µα (T, p) = µβ (T, p) ; l’égalité
des potentiels chimiques du corps étudié dans les deux phases impose une relation
implicite entre la température et la pression, lorsque l’équilibre est réalisé.
On notera cette relation sous la forme p = p∗ (T ) si on exprime la pression d’équilibre
p∗ en fonction de T , ou encore T = T ∗ (p) dans le cas contraire. Ces deux fonctions
sont réciproques. On parlera en particulier :
• pour un changement d’état liquide → vapeur, de la pression de vapeur saturante
(on rencontre encore parfois le terme tension de vapeur saturante) psat (T ) et de
la température d’ébullition T éb (p) ;
• pour un changement d’état solide → liquide, de la température de fusion T f (p) ;
• pour un changement d’état solide → vapeur (sans passer par la phase liquide), de
la température de sublimation T s (p).
En dehors du domaine où µα (T, p) = µβ (T, p), l’équilibre entre les deux phases n’est
pas possible ; il y a changement d’état complet jusqu’à disparition de la phase dont le
potentiel chimique est le plus élevé.

17.1.2 Diagrammes d’équilibre


2 Diagramme (p, T ) : le tracé de la courbe d’équilibre (p, T ) définit un diagramme
d’équilibre, sur lequel on porte de part et d’autre de la courbe d’équilibre la nature
de la phase stable. Dans le cas des diagrammes solide–liquide et liquide–vapeur, l’in-
tersection des deux courbes d’équations µS (T, p) = µL (T, p) et µL (T, p) = µV (T, p)
362 Physique, MP, MP*

correspond à un point pour lequel on a aussi l’égalité µS (T, p) = µV (T, p) : cette inter-
section est commune avec l’équilibre liquide–vapeur ; on parle de point triple. L’allure
de l’ensemble des trois courbes associées aux trois états solide, liquide et vapeur figure
sur le diagramme 17.1.
p Fluide

bC
solidification ⇋ fusion Liquide
⇋ vaporisation
liquéfaction
Solide AL

T b AV Gaz
⇋ sublimation
condensation T

Figure 17.1 – Diagramme d’équilibre (p, T )

Sur ce diagramme, le point T est le point triple où coexistent les trois états liquide,
vapeur et solide ; avec φ = 3, il s’agit d’un état zérovariant dont la pression et la
température sont fixées ; c’est d’ailleurs un tel état qui sert de référence pour l’échelle
légale de température, le point triple de l’eau ayant pour température TT = 273, 16 K
ou encore tT = 0, 01 ◦ C. À titre documentaire, la pression d’équilibre du même point
triple de l’eau est particulièrement faible, pT = 612 Pa = 6, 12 mbar.
Pour des températures supérieures à celle TC du point critique C (ou, ce qui revient
au même, pour des pressions supérieures à celle pC du point critique), il n’existe plus
de changement d’état liquide–vapeur, mais un seul état qui porte le nom de fluide
hypercritique. Dans le cas de l’eau, les coordonnées du point critique sont pC = 218 bar,
tC = 375 ◦ C. Signalons aussi les coordonnées du point critique de CO2 , beaucoup plus
facile à atteindre avec pC = 73 bar et tC = 32 ◦ C ; c’est pour ce gaz que la notion de
point critique a été mise en évidence pour la première fois par Andrews en .
2 Diagramme (p, V ) : considérons, sur le diagramme de la figure 17.1, une ligne
verticale correspondant à une température donnée, comprise entre le point triple et le
point critique. À cette température, l’évolution par augmentation de pression permet
de passer progressivement de l’état gazeux (au point AV ) à l’état liquide (au point
AL ). On peut étudier l’évolution du volume et de la pression d’un système fermé au
cours de cette évolution ; la courbe p = p(V ) correspondante porte le nom d’isotherme
d’Andrews et l’allure de trois isothermes d’Andrews est tracée sur la figure 17.2.
p

Cb T > TC

psat (T ) b b b T = TC
A0 A A1
ion

ros
ée
llit

T < TC
ébu

équilibre L ⇋ V V

Figure 17.2 – Isothermes d’Andrews pour le changement d’état liquide–vapeur


17 : Changement d’état des corps purs 363

Les isothermes d’Andrews sont parfois tracées pour l’unité de masse (V est alors
remplacé par le volume massique 1/ρ) ou pour l’unité de quantité de matière (en
fonction du volume molaire v). L’interprétation de principe du diagramme est in-
changée. Pour un tracé numérique, il est en tous cas indispensable de préciser la
qualtité de matière totale étudiée.
Pour T > TC , il n’y a pas de changement d’état et l’isotherme est une courbe mo-
notone décroissante,
 dont  la pente est reliée à la compressibilité isotherme du fluide
∂p 1
hypercritique par =− .
∂V T χT V
Pour T = TC , le passage par le point critique se manifeste par
 un point d’inflexion à
∂2p
 
∂p
dérivée nulle, donc par la double condition = 0 et = 0.
∂V TC ∂V 2 TC
On peut aussi remarquer qu’en ce point,les  variations dedensité
 en fonction de la
∂ρ m ∂V
pression sont extrêmement rapides, avec =− 2 → 0 ; les rapides
∂p TC V ∂p TC
fluctuations qui en résultent se traduisent expérimentalement par un aspect particulier
du fluide au point critique ; cet aspect (( laiteux )) porte le nom d’opalescence critique.
Pour T < TC , le fluide est soit liquide (à haute pression ou faible volume) soit gazeux
(à basse pression ou pour un un grand volume) le changement d’état étant marqué
par un palier de pression, pour la valeur égale à la pression d’ébullition péb (T ) à cette
température. Lors d’un changement d’état isotherme par abaissement de pression,
l’ébullition commence donc par l’apparition de la première bulle de vapeur au point
A0 et se termine par la disparition de la dernière goutte de liquide au point A1 .
L’ensemble des points A0 porte le nom de courbe d’ébullition ; l’ensemble des points
A1 le nom de courbe de rosée. Les deux courbes se coupent au point critique C et
forment ensemble la courbe de saturation. La courbe de saturation et l’isotherme
critique divisent le plan (p, V ) en quatre domaines :
• à haute température (T > TC ), on a le domaine du fluide hypercritique, tandis qu’en
dessous de cette température, on a les domaines du liquide et de la vapeur ;
• à basse température (T < TC ) :
• à gauche de la courbe d’ébullition, on a le domaine du liquide ;
• à droite de la courbe de rosée, on a le domaine de la vapeur ;
• enfin, sous la courbe de saturation, on a le domaine du système diphasé ; un
point A de ce domaine s’interprète en terme de théorème des moments.
2 Théorème des moments : au point A du palier de changement d’état de la figure
17.2, le volume du mélange est donné par la relation d’extensivité (théorème d’Euler)
V = nL v ◦L (T, p) + nV v ◦V (T, p), en notant nL et nV les quantités de matière sous
forme liquide et vapeur, et v ◦L (T, p) et v ◦V (T, p) les volumes molaires partiels du
liquide et de la vapeur à la température T de l’isotherme et à la pression p = péb (T )
correspondante ; comme toute grandeur intensive, donc locale, ces volumes molaires
partiels ne dépendent que de paramètres intensifs, c’est-à-dire qu’ils sont indépendants
de nL et nV .
Les volumes molaires partiels ayant même valeur en tout point de l’isotherme de
changement d’état, on peut les déterminer aux points A0 et A1 , où la totalité de la
matière se retrouve respectivement sous forme liquide et vapeur, avec donc les volumes
V0 = (nL + nV ) v ◦L (T, p) et V1 = (nL + nV ) v ◦V (T, p).
364 Physique, MP, MP*


On en déduit immédiatement les différences V − V0 = nV v ◦V (T, p) − v ◦L (T, p) et

V1 − V = nL v ◦V (T, p) − v ◦L (T, p) , d’où le quotient, connu sous la nom de théorème
des moments, qui exprime le rapport des quantités de matière dans les deux phases :

nL V1 − V V A1 − V A
= = (17.1)
nV V − V0 V A − V A0

Naturellement, dans le cas d’un diagramme d’Andrews tracé en termes de volumes


massiques ou molaires, les quotients du théorème (17.1) sont inchangés : il s’agit dans
tous les cas de grandeurs extensives.
Le théorème des moments porte ce nom car la simple comparaison des bras de levier
(au sens mécanique du terme) AA1 et A0 A permet de savoir la proportion de matière
qui a achevé son changement d’état le long du palier de pression ; le schéma de la
figure 17.3 illustre cette interprétation.

A0 A A1

nV
nL

Figure 17.3 – Illustration du théorème des moments

17.2 Propriétés énergétiques des changements d’état

17.2.1 Propriétés énergétiques


2 Enthalpie de changement d’état : considérons à nouveau un changement d’état
quelconque, α ⇋ β, caractérisé en tout point de la courbe de changement d’état
par la relation µα (T, p) = µβ (T, p). Chacune des phases correspondant à un corps
pur, on peut aussi écrire cette condition d’équilibre µ◦α (T, p) = µ◦β (T, p), mais aussi
Gα β
m (T, p) = Gm (T, p), si Gm désigne l’enthalpie libre molaire du corps étudié.

Toutefois, Gm = Hm − T Sm pour chacune des deux phases, mais l’égalité des en-
thalpies libres ne signifie pas l’égalité des enthalpies ni des entropies molaires ; on
définira donc indifféremment l’enthalpie molaire de changement d’état par une des
deux relations :

α→β β α
 β α

Lm (T ) = Hm (T ) − Hm (T ) = T Sm (T ) − Sm (T ) (17.2)

Le changement d’état étant une transformation monobare, la variation d’enthalpie qui


β α
accompagne celui-ci vérifie aussi Qp = ∆H = Hm −Hm pour une mole de changement
d’état. L’enthalpie molaire de changement d’état porte donc aussi le nom de chaleur
latente molaire de changement d’état, avec :

α→β
Qp = ∆H = Lm (T ) pour une mole de réaction α → β (17.3)
17 : Changement d’état des corps purs 365

Pour un changement d’état partiel, si on note dξ la quantité de matière qui change


d’état (avec donc une notation analogue à celle de l’avancement d’une réaction chi-
mique), on écrira pour le transfert thermique isotherme isobare nécessaire au change-
ment d’état :

α→β
δQp = dH = Lm (T ) × dξ (17.4)

Le changement d’état étant aussi une transformation réversible lorsqu’il est mené
aux conditions T, p∗ (T ) de la courbe d’équilibre, on peut écrire lors d’une mole de
changement d’état la seconde relation :

Qp Lα→β (T )
∆S = = m pour une mole de réaction α → β (17.5)
T T

avec de même pour un changement d’état partiel :

δQp Lα→β (T )
dS = = m × dξ (17.6)
T T

Le caractère extensif de la chaleur latente qui apparaı̂t dans (17.4) et (17.6) permet
aussi de définir une chaleur latente de changement d’état massique ℓα→β , avec la
Lα→β (T )
relation ℓα→β (T ) = m , si M est la masse molaire de l’espèce qui change
M
d’état.
Le tableau 17.1 présente quelques valeurs de chaleurs latentes massiques de change-
ment d’état ; on notera la valeur très élevée de la chaleur latente de vaporisation de
l’eau (en particulier si on la compare à celle de son analogue structurel H2 S). L’abon-
dance de l’eau sur terre, et ces propriétés thermiques exceptionnelles, liées aux liaisons
intermoléculaires spécifiques entre molécules d’eau (on parle de liaisons hydrogène),
expliquent le rôle de l’eau comme volant thermique de régulation dans les systèmes
industriels, comme d’ailleurs à la surface de la biosphère terrestre.

Corps Changement d’état T p ℓ


Fusion 0 ◦C 1 bar 334 kJ · kg−1
60 ◦ C 0, 2 bar 2 360 kJ · kg−1
Eau Ébullition 100 ◦ C 1 bar 2 260 kJ · kg−1
213 ◦ C 20 bar 1 890 kJ · kg−1
H2 S Ébullition −60 ◦ C 1 bar 548 kJ · kg−1
Azote Fusion −210 ◦ C 1 bar 25, 5 kJ · kg−1
Ébullition −196 ◦ C 1 bar 201 kJ · kg−1

Table 17.1 – Chaleurs latentes de changement d’état

2 Interprétation entropique : le signe positif des chaleurs latentes présentées dans


le tableau 17.1 ci-dessus peut s’interpréter simplement, en vertu de l’interprétation
statistique de l’entropie : lors des passages solide → liquide puis liquide → vapeur,
l’augmentation du désordre moléculaire s’accompagne logiquement d’une perte d’in-
formation au niveau microscopique, donc d’une augmentation d’entropie. En vertu de
la relation (17.6), les chaleurs latentes correspondantes sont positives :
366 Physique, MP, MP*

Lfusion > 0 Lébullition > 0 (17.7)

On peut rendre compte de façon quantitative de cette augmentation d’entropie en


remplaçant le diagramme p = p(V ) proposé ci-dessus pour le tracé des isothermes
d’Andrews par un diagramme T = T (S).

Comme dans le cas de l’isotherme d’Andrews, on rencontre sur le plan pratique des
tracés en fonction de l’entropie massique ou de l’entropie molaire.

L’allure de ce diagramme entropique d’ébullition d’un fluide a l’allure générale de


la figure 17.4 ; on y représente en général les courbes correspondant à une évolution
isobare.
T p>p C

C p < pC
b
ll.
u
éb

T éb (p) b b b
A0 A A1 ros
ée

équilibre L ⇋ V S

Figure 17.4 – Diagramme entropique pour le changement d’état liquide–vapeur

Dans ce diagramme, la disposition relative des zones monophasées liquide et vapeur est
identique au diagramme d’Andrews : pour p < pC , les zones de faible température ou
de faible entropie correspondent au domaine du liquide, tandis qu’à haute température
ou pour les grandes valeurs de l’entropie on retrouve les gaz.
Bien sûr, pour p > pC , il n’y a pas de changement d’état et les courbes d’évolution sont
des isobares du fluide hypercritique, courbes S(T ) toujours monotones croissantes.

Notons que les diagrammes d’Andrews p(V ) et entropique T (S) sont analogues
en ceci que δW = −pdV et δQ = T dS pour une transformation réversible, les
aires dans les deux diagrammes étant donc respectivement l’opposé du travail ou le
transfert thermique fourni au système. Dans les deux cas, le diagramme exprime un
paramètre intensif (p ou T ) en fonction d’une grandeur extensive (V ou S).

17.2.2 Relation de Clapeyron

2 Établissement de la relation de Clapeyron : la relation établie ici ne figure pas au


programme ; elle est proposée à titre d’illustration des propriétés différentielles de la
grandeur µ, potentiel chimique d’une espèce dans sa phase.
La relation générale décrivant la courbe d’équilibre α ⇋ β s’écrit µ◦α (T, p) = µ◦β (T, p),
relation qui doit être vraie en tout point de la courbe d’équilibre T = T ∗ (p), ou de la
fonction réciproque p = p∗ (T ), qui décrit évidemment la même courbe.
On peut donc différencier cette relation le long de la courbe de changement d’état sous
∂µ◦α ∂µ◦α ∂µ◦β ∂µ◦β
la forme dT + dp = dT + dp, ce qui fournit la relation entre dp
∂T ∂p ∂T ∂p
et dT , c’est-à-dire la pente de la courbe d’équilibre pour le changement d’état α ⇋ β.
17 : Changement d’état des corps purs 367

On remarque alors que les potentiels chimiques µ◦α et µ◦β sont ceux d’un corps pur ;
l’identité thermodynamique dG = −SdT + V dp peut donc s’écrire, pour une mole
du corps dans une des deux phases, sous la forme dµ◦ = −s◦ dT + v ◦ dp, soit encore
∂µ◦α ∂µ◦β
= −s◦α et = −s◦β en fonction des entropies molaires des deux phases, et
∂T ∂T
∂µ◦α ∂µ◦β
= v ◦α et = v ◦β en fonction des volumes molaires des deux phases.
∂p ∂p
On réécrit donc encore −s◦α dT + v ◦α dp = −s◦β dT + v ◦β dp ; en tenant compte de la
relation (17.5), qui peut s’écrire aussi sous la forme Lα→β = T s◦β − s◦α , il vient la


relation de Clapeyron :

dp∗ 1 Lα→β(T )
= (17.8)
dT T v ◦β − v ◦α

2 Exemples : considérons d’abord le cas de la fusion de la glace, pour lequel on


a déjà affirmé que Lfusion > 0, tandis qu’on sait que v ◦S > v ◦L ; on en déduit que la
courbe d’équilibre solide–liquide présente une pente négative, qui est d’ailleurs très
élevée car la différence des volumes molaires des deux phases condensées est très faible.
Au contraire, le volume molaire de la vapeur est très élevé et la pente de la courbe
d’ébullition est bien plus faible ; on utilise d’ailleurs souvent les trois approximations
RT
v ◦V ≫ v ◦L , v ◦V ≃ et Léb (T ) ≃ Cte pour obtenir une expression approchée de
p
dpsat pLéb
la courbe d’équilibre liquide–vapeur, sous la forme = 2
qu’on écrit encore
dT RT
sat éb sat éb

dp L dT p L 1 1
= qui s’intègre sous la forme ln ◦ = − , si T0 est la
psat R T2 p R T0 T
température d’ébullition sous la pression standard p ; T0 = 373 K pour l’eau.

17.2.3 Changements d’état de seconde espèce


2 Courbes de refroidissement : considérons le refroidissement progressif d’un liquide,
à pression constante ; à partir du moment où la température de fusion est constante,
on observera un palier de température pendant la durée nécessaire à l’évacuation de
la totalité de l’énergie correspondant à la chaleur latente de l’échantillon, avant que
le refroidissement de l’échantillon solide ne reprenne.
T

Tf

m × ℓf
Q

Figure 17.5 – Courbe de refroidissement d’un liquide

Si on trace la courbe d’évolution de la température en fonction du transfert thermique


Q évacué depuis le début de l’opération, on obtient la représentation de la figure
368 Physique, MP, MP*

17.5 ; les pentes de part et d’autre du palier de changement d’état sont simplement
les capacités thermiques isobares CpL et CpS des échantillons solide et liquide.

On peut d’ailleurs aussi observer (en pointillés sur la figure 17.5) un retard au chan-
gement d’état : la solidification ne se produit pas dès la température de changement
d’état atteinte, mais un peu plus tard, et on observe un liquide surfondu métastable
pour T < T f , jusqu’à ce qu’une perturbation provoque l’apparition d’un premier
cristal de solide et la solidification rapide avec retour au palier de changement d’état.

2 Changements d’état de seconde espèce : la courbe de refroidissement présentée


ci-dessus présente deux caractéristiques :
• la présence du palier, liée à l’existence de la chaleur latente de changement d’état,
ℓf
définie par exemple en notations massiques par f = sS − sL , donc par une
T
discontinuité de l’entropie massique de part et d’autre de la courbe d’équilibre
solide–liquide ;
• la différence de pente de part et d’autre de ce palier, liée à la discontinuité
  des
1 ∂s
capacités thermiques massiques, dont on rappelle ici que cp = . Ainsi,
T ∂T p
il y a en général aussi discontinuité de la dérivée première de l’entropie massique
de part et d’autre de la courbe d’équilibre solide–liquide.
Toutefois, on rencontre dans certains cas des changements d’état de seconde espèce,
dans lesquels la première discontinuité disparaı̂t, c’est-à-dire pour lesquels la chaleur
latente de changement d’état est nulle. La courbe de refroidissement ne présente alors
plus de palier de température et prend simplement la forme de la figure 17.6.
T

b
Tf

Figure 17.6 – Courbe de refroidissement et changement d’état de seconde espèce

La seule marque du changement d’état est donc la rupture de pente lors du changement
d’état ; il est donc nettement plus difficile à mettre en évidence, sur le seul plan
thermique, qu’un changement d’état de première espèce.

L’ébullition réalisée au point critique vérifie cette propriété (annulation de la chaleur


latente de changement d’état). Le changement d’état conducteur–supraconducteur à
basse température est un autre exemple de changement d’état de seconde espèce (au
moins en l’absence de champ magnétique) ; il s’accompagne toutefois de changements
importants de propriétés physiques non thermiques qui le rendent facile à mettre en
évidence, et peuvent d’ailleurs avoir aussi des conséquences thermodynamiques :
17 : Changement d’état des corps purs 369

• dans l’état supraconducteur, le champ magnétique éventuel est expulsé hors du


volume du matériau supraconducteur, ce qui se traduit par l’apparition de cou-
rants supraconducteurs à la surface de l’échantillon de matériau ainsi refroidi
sous la température de transition.
• dans l’état supraconducteur, la conductivité électrique du matériau s’annule, ce
qui n’est évidemment pas le cas d’un conducteur ordinaire. Remarquons donc
qu’un supraconducteur ramené accidentellement et localement au-dessus de sa
température de changement d’état peut donner lieu à un phénomène d’(( em-
ballement )) : le retour à l’état conducteur s’accompagne d’une réapparition de
l’effet Joule, donc d’un apport thermique supplémentaire qui échauffe encore le
matériau, etc.

17.2.4 Propriétés colligatives


2 Principe de l’étude : certaines propriétés d’une solution lors d’un changement
d’état du solvant dépendent seulement du potentiel chimique du solvant, donc de
la concentration particulaire de soluté ; on parle de propriétés colligatives (ce terme
signifiant (( dépendant de l’ensemble ))). Nous étudierons pas exemple dans ce cadre
les modifications des propriétés du changement d’état d’un corps pur A, lorsque ce
corps n’est pas tout à fait pur, mais présent à l’état de mélange dans au moins une
des phases.
Nous supposerons toutefois que ce mélange se comporte simplement vis-à-vis des
variables de concentration, c’est-à-dire qu’il est idéal vis-à-vis de A, au moins parce
que A y joue le rôle de solvant, fortement majoritaire. On décrit par exemple dans ce
cadre :
• de faibles variations de la température de congélation d’un liquide, lorsque le liquide
n’est pas tout à fait pur : c’est l’étude de la cryométrie ;
• de faibles variations de la température d’ébullition d’un liquide, lorsque le liquide
n’est pas tout à fait pur : c’est l’étude de la ébulliométrie ;
• de faibles variations de la pression de vapeur saturante d’un liquide, lorsque le
liquide n’est pas tout à fait pur : c’est l’étude de la tonométrie.

Dans tous les cas, le principe de l’étude est le même :


• on écrit, pour le corps A qui est en équilibre dans deux phases (ou de part et d’autre
de la membrane) la condition d’équilibre, c’est-à-dire l’égalité des potentiels
chimiques ;
• on écrit ensuite la même condition pour l’équilibre (( idéal )), non perturbé par
la petite modification introduite par l’opérateur (présence du soluté, écart de
température, etc.) ;
• on fait enfin la différence des deux équations, tous les écarts étant assimilés à des
différentielles.

2 L’exemple de la cryométrie : considérons l’équilibre liquide–solide entre l’espèce


A, seule dans la phase solide, et l’espèce A, majoritaire dans la phase liquide, mais en
présence d’une certaine quantité, faible de solutés divers X, dont on notera xX ≪ 1 la
fraction molaire. L’équilibre sera supposé réalisé à la pression p◦ ; il se fait alors à la
température T , qui est en fait l’inconnue du problème. L’équation fondamentale qui
régit l’équilibre est µLA = µSA . Le solide étant seul dans sa phase et la solution liquide
supposée idéale pour le solvant A, on écrit aussi µLA ◦ (T ) + RT ln xA = µSA ◦ (T ).
370 Physique, MP, MP*

L’équilibre entre les deux phases de A se faisant, pour le corps pur A, à la température
T ∗ , on écrit aussi l’équation d’équilibre dans ces conditions µLA ◦ (T ∗ ) = µSA ◦ (T ∗ ). Il
reste à comparer les deux équations en en faisant la différence ; on suppose pour
cela que T = T ∗ + ∆T , avec |∆T | ≪ T ∗ , ce qui permet par exemple d’écrire de
façon approchée µLA ◦ (T ) − µLA ◦ (T ∗ ) ≃ −sLA ◦ (T∗ )∆T puisque l’entropie molaire de A,
L ◦

∂µ
liquide et seul dans sa phase, vérifie sLA ◦ = − A
.
∂T p=p◦

On a donc obtenu −sLA ◦ (T ∗ )∆T +RT ln(1−xX ) ≃ −sSA ◦ (T ∗ )∆T , où on doit continuer
le développement limité en se limitant au premier ordre seulement, sous la forme
RT ln(1 − xX ) ≃ −R(T ∗ + ∆T )xX ≃ −RT ∗ xX si on suppose que xX et ∆T sont du
même ordre. Il reste donc sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) ∆T = −RT ∗ xX .
On réécrit cette expression en fonction de la chaleur molaire de changement d’état
du solvant pur A, calculée à la température du changement d’état du corps pur T ∗ ,
L∗
sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) = ∗ , pour obtenir la loi de Raoult de la cryométrie, sous la
T
RT ∗ 2
forme ∆T = − ∗ xX .
L
2 Applications : on peut considérer la relation obtenue comme une méthode de
détermination de l’abaissement du point de congélation (puisque ∆T < 0 dans tous
les cas), par exemple de l’eau salée par rapport à l’eau pure. La propriété ∆T < 0 se
généralise d’ailleurs à des fractions molaires xX non nécessairement faibles, comme on
le montre plus loin ; cet abaissement est mis à profit :
– dans la protection des routes contre la formation de verglas lors des pluies d’hiver,
par un salage préventif ;
– pour la réalisation de thermostats à des températures Celsius négatives, en présence
de glace fondante dans de l’eau salée.
On peut aussi remarquer que la mesure de ∆T permet d’accéder à une fraction molaire
xX , alors qu’un opérateur contrôle habituellement une fraction massique en réalisant
une solution diluée avec une balance de précision. La relation entre ces grandeurs,
l’une mesurée et l’autre préparée, permet d’accéder aux valeurs (relatives) des masses
molaires des espèces que l’on peut mettre en solution ; ce type de mesure est donc à la
base des méthodes d’analyse chimique pour la détermination des formules chimiques
brutes du composé X.
Pour déterminer la masse molaire d’une espèce X, il suffit de trouver un solvant A de
cette espèce et d’observer l’abaissement du point de congélation, ou bien l’élévation
du point d’ébullition de cette phase liquide (A majoritaire, X minoritaire).
2 Interprétation chimique : en réalisant une solution de X dans A, on abaisse le
potentiel chimique du liquide A, ce qui impose un changement dans l’équilibre entre
phases de A : la phase liquide est stabilisée par la baisse de son potentiel chimique.
Le domaine de stabilité en température de cette phase liquide s’élargit lorsque la
température de fusion s’abaisse et la température d’ébullition augmente.
Le chapitre suivant généralise l’étude des propriétés colligatives en décrivant les chan-
gements d’état de mélanges, sans faire obligatoirement d’hypothèse restrictive sur la
nature de ces mélanges.
17 : Changement d’état des corps purs 371

Ce qu’il faut absolument savoir

Un changement d’état est une transformation qu’on peut mener de manière


réversible, isotherme et isobare, en un point de la courbe d’équilibre d’équation
implicite µα (T, p) = µβ (T, p).
La relation explicite T = T ∗ (p) qui résulte de la condition d’équilibre porte le
nom de température de fusion (solide → liquide), d’ébullition (liquide → gaz)
ou de sublimation (solide → gaz).
La relation réciproque p = p∗ (T ) porte le nom de pression de vapeur saturante
(liquide → vapeur).
Le changement d’état d’une mole d’un corps pur à la température d’équilibre
T ∗ (p) est caractérisé par les variations d’enthalpie ∆H = L∗ (T ∗ ) et d’entropie
L∗ (T ∗ )
∆S = ; la grandeur L∗ est la chaleur latente de changement d’état.
T∗
Dans le cas d’augmentation du désordre moléculaire (transformations solide →
liquide, liquide → gaz et solide → gaz), on a forcément L∗ > 0.
Dans le cas particulier de l’équilibre liquide-vapeur, les isothermes p = p(V )
et les isobares T = T (S) délimitent une zone d’équilibre diphasé délimitée par
la courbe de saturation, formée de deux branches, la courbe de rosée pour la
formation de la première goutte de liquide, et la courbe d’ébullition pour la
formation de la première bulle de vapeur.
La position d’un point de la zone d’équilibre diphasé sous la courbe de satu-
ration permet de déterminer le rapport des quantités de matière dans les deux
phases, par application du théorème des moments.
La courbe de saturation culmine au point critique, point stationnaire sur la
courbe isotherme p(V ) ou isobare T (S) ; au delà de ce point, il n’y a plus de
changement d’état et le fluide est hypercritique.
Les courbes d’équilibre T ∗ (p) pour la sublimation, la fusion et l’ébullition se
croisent au point triple, domaine triphasé et zérovariant de caractéristiques
(T, p) fixées pour un corps pur donné.
Chapitre 18

Mélanges et diagrammes binaires

18.1 Tracé des diagrammes binaires

18.1.1 Mélanges binaires


2 Le système étudié : ici et dans toute la suite de chapitre, nous considérons un mé-
lange binaire forme de N = 2 corps présents dans au plus φ = 2 phases, sans réaction
chimique. Nous étudierons essentiellement les binaires en équilibre liquide-vapeur,
bien que des méthodes analogues s’appliquent à l’étude des mélanges en équilibre
solide-liquide.
Nous considérerons dans toute la suite que les phases vapeur éventuellement présentes
forment des mélanges idéaux de gaz parfaits ; en effet, les écarts à l’idéalité dans les
phases condensées (liquide et solide) sont toujours assez importants, de sorte que la
prise en compte de faibles défauts des phases vapeur n’a guère d’importance.
Par contre, l’hypothèse d’un mélange idéal liquide (ou solide) n’est vérifiée que de
façon exceptionnelle.
2 Variance et miscibilité : la variance du système est ici v = N + 2 − φ − r − k avec
r = k = 0 donc v = 2 : un mélange binaire des corps A1 et A2 , présents dans les deux
phases, est un système divariant. Nous choisirons dans la description de considérer
les fractions molaires x1 du corps A1 ; de plus, nous adopterons ici les notations xL1
et xV1 pour ces fractions molaires, les deux phases étant, provisoirement au moins,
supposées respectivement liquide (L) et vapeur (V).
Un tel mélange binaire liquide-vapeur peut être décrit par les paramètres intensifs T ,
p, xL1 et xV V V L L
1 , dont on peut déduire x2 = 1 − x1 et x2 = 1 − x1 . De plus, un tel système
étant divariant, il existe nécessairement deux relations entre ces quatre paramètres
intensifs ; ces deux relations sont formées des égalités des potentiels chimiques des
corps présents dans les deux phases. Plus généralement :

Mélange binaire avec miscibilité totale


X Dans le cas où les deux corps A1 et A2 sont présents dans les deux
phases α et β du mélange binaire, les deux relations entre les para-
β β β
mètres intensifs T , p, xα α α
1 et x1 s’écrivent µ1 (T, p, x1 ) = µ1 (T, p, x1 ) et
α α β β
µ2 (T, p, 1 − x1 ) = µ2 (T, p, 1 − x1 ).

On remarque bien que chaque potentiel chimique ne dépend que de la composition de


la seule phase correspondante, et pas de la composition de l’autre phase du binaire.
374 Physique, MP, MP*

2 Étude qualitative de l’équilibre liquide–vapeur : considérons le cas particulier de


l’équilibre liquide–vapeur d’un mélange des deux corps A1 et A2 , étudié par exemple
à pression p fixée. La double condition d’équilibre µL1 (T, p, xL1 ) = µV V
1 (T, p, x1 ) et
L L V V V
µ2 (T, p, 1 − x1 ) = µ2 (T, p, 1 − x1 ) permet d’éliminer par exemple x1 entre ces deux
relations, pour en déduire T = T (xL1 ), tout comme on peut éliminer xL1 pour exprimer
T = T (xV 1 ).

Reportés sur un même système d’axes (fractions molaires en abscisse, température


en ordonnée), on s’attend bien sûr à ce que ces deux relations ne coı̈ncident pas : on
obtient la même valeur de T pour deux compositions différentes des phases liquide et
vapeur ; ce sont les points L et V de la figure 18.1.
T
p fixé

V′ b b
T′
L′
V b b
T
L

xL1 ou xV
1

Figure 18.1 – Construction progressive des diagrammes binaires isobares

Reprenant la même construction à une autre température T ′ , on retrouve deux points


L′ et V ′ qui s’interprètent de la même façon, construisant ainsi de proche en proche
les courbes T = T (xL1 et T = T (xV 1.

Le même principe permet bien sûr de construire de la même façon les courbes p = p(xL1
et p = p(xV
1 si c’est la variable T que l’on fixe pour l’étude de l’équilibre.

18.1.2 Diagrammes binaires liquide–vapeur


2 Définitions : les relations d’égalité des potentiels chimiques imposent des relations
β
entre les paramètres intensifs T , p, xα 1 et x1 , dont on déduit de façon évidente les
β
paramètres xα 2 et x2 . Nous décrirons d’abord ces relations dans le cas particulier de
l’équilibre liquide–vapeur (α = L et β = V), mais on peut aisément généraliser cette
étude à d’autres cas.
L’étude exacte des expressions des potentiels chimiques µL1 , µV L V
1 , µ2 et µ2 étant sou-
vent très délicate, on se contentera souvent d’une étude expérimentale des relations
d’équilibre, par le tracé de diagrammes :

Diagrammes binaires
X On parle de diagramme binaire isobare si on fait une étude à pression p
fixée ; un tel diagramme est formé de deux courbes, T = T xL1 qui est


la courbe d’ébullition et T = T xV 1 qui est la courbe de rosée.


On parle de diagramme binaire isotherme si on fait une étude à tempé-
L
rature T fixée ; un tel diagramme est formé de deux courbes, p = p x1
V
qui est la courbe d’ébullition et p = p x1 qui est la courbe de rosée.
18 : Mélanges et diagrammes binaires 375

Il est facile de mémoriser les noms des deux courbes si on réfléchit à la signification
de ces courbes. Ainsi, étudier un paramètre (p ou T ) en fonction de xL1 signifie impli-
citement que xL1 est connu, donc qu’on a préparé un mélange liquide de composition
précise et qu’on étudie la pression ou la température à laquelle il se mettra en équilibre
avec la phase vapeur ; le point de la courbe d’ébullition est donc un point de début
d’ébullition, ou de formation d’une première bulle de vapeur.

Les diagrammes binaires isobares sont les plus courants et les plus conformes à
l’expérience usuelle : pour réaliser l’ébullition d’un mélange, on augmente sa tempé-
rature, souvent à pression constante égale, par exemple, à la pression atmosphérique.
Toutefois, on peut aussi réaliser la même ébullition par abaissement de la pression à
température constante, par exemple à la température ambiante : on doit alors faire
appel aux diagrammes isothermes.

De même, étudier le même paramètre intensif p ou T en fonction de xV 1 signifie impli-


citement que xV 1 est connu et qu’on a donc préparé un mélange vapeur de composition
précise et qu’on étudie les conditions dans lesquelles il se mettra en équilibre avec la
phase liquide ; le point de la courbe de rosée est donc un point de formation d’une
première goutte de liquide.

2 Forme générale des diagrammes : les courbes d’ébullition et de rosée correspondent,


pour xL1 → 0 et xL1 → 1, au changement d’état d’un corps pur, respectivement le corps
A2 ou le corps A1 ; ceci explique l’allure particulière, en fuseau des diagrammes bi-
naires, comme par exemple ceux qui sont représentés sur la figure 18.2 : le resserrement
aux extrémités du fuseau correspond aux caractéristiques du changement d’état du
corps pur.
T T p p
p fixé T fixé
V) b T éb psat b p=
x1 1 2 p(x L
T( 1)
=
T
n

éb
tio
e

ro

u
sé

lli
lli

sé
ro

tio
u

e
éb

L ) p=
x1
T( p(x V
T2éb b T= 1 )
b psat
1

x2 x1 x2 x1

Figure 18.2 – Forme en fuseau des diagrammes binaires

Sur ces diagrammes, le domaine d’existence du liquide (monophasé) se trouve du côté


des basses températures (à pression fixée, sur le diagramme de gauche) ou des hautes
pressions (à température fixée, sur le diagramme de droite) ; ceci explique (au moins
qualitativement) la position relative des courbes d’ébullition (du côté du liquide) et
de rosée (du côté de la vapeur).

On a ici choisi de tracer l’allure de diagrammes binaires pour un composé A2 plus


volatil que le composé A1 ; dans le cas du diagramme isobare (à gauche), on a donc
une température d’ébullition plus basse pour le composé A2 ; dans le cas du diagramme
376 Physique, MP, MP*

isotherme (à droite), on a au contraire une pression de vapeur saturante plus élevée
pour ce composé A2 plus volatil.
Nous reviendrons bien sûr plus en détail sur ces diagrammes et sur leur interprétation ;
remarquons pour l’instant qu’on a choisi de tracer des fuseaux de courbes monotones
en fonction de xL1 ou xV
1 ; nous allons étudier cette propriété.

2 Azéotropie : considérons par exemple le cas d’un diagramme isotherme (avec


donc dT = 0). Si une des courbes d’équilibre qui forme ce diagramme, la présence
d’un éventuel extremum impose donc dp = 0 en ce point.
On comprend bien que l’étude des diagrammes isobares (dp = 0) et des extrema
associés (dT = 0) correspond aux mêmes calculs que pour les diagrammes isothermes.
Dans les deux cas, on peut écrire, le long de la courbe d’équilibre (courbe d’ébullition
ou courbe de rosée selon le paramètre choisi en abscisse) dµL1 = dµV 1 ; supposant alors
dxV 1
V
que la phase vapeur est idéale, on a aussi dµ1 = RT V donc aussi dµL2 = dµV 2 =
x1
dxV
1
−RT .
1 − xV1

Rappelons alors, à dT = 0 et dp = 0, l’expression de l’identité thermodynamique


dGL = µL1 dnL1 + µL2 dnL2 pour des variations de l’enthalpie libre de la phase liquide du
fait de variations de sa composition. La relation GL = µL1 nL1 + µL2 nL2 peut aussi être
différenciée sous la forme dGL = dµL1 nL1 + dµL2 nL2 + µL1 dnL1 + µL2 dnL2 .
En comparant les deux expressions de dGL , on obtient 0 = dµL1 nL1 + dµL2 nL2 qui
s’écrit encore, après division par la quantité de matière totale de la phase liquide,
0 = dµL1 xL1 + dµL2 xL2 : c’est l’identité de Gibbs-Duhem.
1 − xL1 V xL1 V
Les relations établies ci-dessus imposent alors 0 = −RT dx 1 + RT dx1 , ce
1 − xV
1 xV
1
qui impose enfin xL1 = xV
1 : les deux courbes se coupent au point extremum s’il existe.

Théorème de Gibbs-Konovalov
X Dans un diagramme binaire, les deux courbes d’ébullition et de rosée
ne peuvent présenter que des extrema communs, situés au même point
(mêmes valeurs de la pression, de la température et de la composition
des deux phases). Un tel extremum porte le nom de point azéotrope.

La figure 18.3 montre un diagramme binaire isobare présentant un point azéotrope ;


la composition commune des deux phases au point azéotrope est notée xZ1 .

Notons bien que l’établissement des propriétés développées ici n’est pas exigible ; le
résultat par contre (le théorème de Gibbs-Konovalov) doit être connu.
On remarque qu’un mélange ayant, dans les phases solide ou vapeur, la composition
du point azéotrope se comporte comme un corps pur : la température de début d’ébul-
lition et celle de début de rosée sont confondues, à une valeur T1Z qui simule donc une
température d’ébullition d’un corps pur.

Il existe en général des diagrammes binaires avec des azéotropes à maximum ou


à minimum. Par ailleurs, s’il n’est pas exclu théoriquement qu’un binaire puisse
présenter plusieurs points azéotropes, cette situation est exceptionnelle et ne nous
concernera pas ici.
18 : Mélanges et diagrammes binaires 377

T T
p fixé
b
TZ

b T éb
1

T2éb b

x2 xZ1 x1

Figure 18.3 – Diagramme binaire isobare avec azéotrope

2 Exemples : la figure 18.4 présente un diagramme binaire isobare sans azéotrope,


celui du mélange eau–méthanol. La figure 18.5 présente un cas d’azéotropie, le mélange
eau–éthanol. Ils sont tous deux tracés pour p = p◦ = 1 bar.
100 ◦ C

90 ◦ C

Méthanol
80 ◦ C

70 ◦ C
64, 0 ◦ C
60 ◦ C
Eau

0, 0 0, 2 0, 4 0, 6 0, 8 1, 0

Figure 18.4 – Exemple de diagramme binaire sans azéotrope

Dans le cas du mélange eau–éthanol sous 1 bar, la température d’ébullition de l’éthanol


pur est 78, 8 ◦ C, tandis que la température d’ébullition de l’azéotrope est de 78, 4 ◦ C.
Z
La composition de celui-ci est xéthanol ≃ 0, 9. On remarque dans ce cas que, pour
Z
xéthanol 6 xéthanol 6 1, il n’est pas possible à cette échelle de distinguer les courbes
d’ébullition et de rosée du mélange.

18.1.3 Diagrammes binaires sans miscibilité à l’état liquide


2 Cas de non-miscibilité : il arrive que certains corps ne soient pas miscibles dans
toutes les phases ; si une telle situation ne se rencontre jamais pour la phase vapeur,
on connaı̂t par contre des cas de non-miscibilité à l’état liquide et, encore plus fré-
quemment, à l’état solide.
Considérons à titre d’exemple l’ébullition d’un ensemble formé des deux phases li-
quides, non miscibles entre elles, composées des deux corps purs A1 et A2 ; la présence
378 Physique, MP, MP*

100 ◦ C

95 ◦ C

90 ◦ C

Éthanol
85 ◦ C

80 ◦ C
78, 8 ◦ C
Eau

0, 0 0, 2 0, 4 0, 6 0, 8 1, 0

Figure 18.5 – Exemple de diagramme binaire avec azéotrope

d’une phase supplémentaire diminue d’une unité la variance et on pourra donc ren-
contrer trois cas :
• la présence simultanée des trois phases (A1 liquide, A2 liquide et le mélange gazeux
de A1 et A2 ) ; cette situation, monovariante, impose une valeur unique de la
composition de la phase vapeur et de la température, si la pression est fixée ou,
de manière analogue, une valeur unique de la composition de la phase vapeur
et de la pression, si c’est la température qui est fixée.
Cette composition particulière de la phase vapeur porte le nom de point hété-
roazéotrope.
• la présence simultanée de deux phases seulement, le liquide A1 étant seul présent
en équilibre avec le mélange gazeux de A1 et A2 , forme un système divariant ;
• de même, la présence simultanée de deux phases seulement, le liquide A2 étant seul
présent en équilibre avec le mélange gazeux de A1 et A2 , forme aussi un système
divariant.
Nous retiendrons donc le résultat :
Mélange binaire avec miscibilité nulle
X Dans le cas où les deux corps A1 et A2 sont présents dans la phases β
mais ne sont pas miscibles dans la phase α, on peut observer :
• l’équilibre entre A1 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
1 (T, p, x1 = 1) = µ1 (T, p, x1 ) ;
• l’équilibre entre A2 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
2 (T, p, x2 = 1) = µ2 (T, p, x2 ) ;
ou enfin le point hétéroazéotrope, les trois phases étant présentes, à l’in-
tersection des deux conditions définies ci-dessus.

2 Diagrammes liquide–vapeur en cas de non-miscibilité : en plus des diagrammes


simples en fuseau et des diagrammes comportant un point azéotrope (qu’il s’agisse
d’un minimum ou d’un maximum), on peut rencontrer un troisième type de dia-
gramme, en cas d’absence de miscibilité. Considérons pour cela un mélange de deux
espèces A1 et A2 , non miscibles dans l’état liquide, mais en équilibre avec leur mélange
à l’état de vapeur. On a déjà affirmé qu’un tel système ne peut présenter d’équilibre
diphasé qu’en cas d’équilibre avec une seule phase liquide ; considérons donc l’équilibre
entre A1 , liquide pur, et le mélange gazeux.
18 : Mélanges et diagrammes binaires 379

pxV1
La condition d’équilibre µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln , écrite dans l’hypothèse d’un
p◦
mélange idéal de gaz parfaits, est l’équation de la seule courbe d’équilibre qu’on puisse
définir ici : la pression p ou la température T en fonction de xV 1 , donc la courbe de
rosée.

Il n’y a pas de courbe d’ébullition à proprement parler, car il n’y a pas de mélange
liquide à faire bouillir, seulement une ou deux phases liquides qui ne se mélangent
pas.
On voit clairement qu’à T fixé, cette partie de la courbe de rosée a pour équation
pxV1 = Cte ; c’est une branche d’hyperbole, au moins dans l’approximation d’un mé-
lange idéal de gaz. On peut même préciser l’expression de la constante, en remarquant
que l’équilibre du corps pur A1 impose, lorsqu’il est réalisé à la température T , la rela-
psat
1 psat
1
tion µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln ; la courbe de rosée a donc pour équation p ≃
p◦ xV1
psat
2
en présence de A1 liquide pur, et donc p ≃ en présence de A2 liquide pur.
1 − xV 1
p p
T fixé

ébullition b pZ
rosé
e, A L b psat
1 ⇋V 1

L V
psat b A2 ⇋
2 rosée,

x2 xZ1 x1

Figure 18.6 – Diagramme binaire isotherme sans miscibilité

La figure 18.6 montre la construction de ces deux branches de la courbe de rosée, et


leur point d’intersection, qui porte le nom de point hétéroazéotrope.
En présence simultanément des trois phases (vapeur, liquide A1 et liquide A2 ), le
système est monophasé et la pression imposée, à température fixée, à la valeur lue
à l’intersection des deux branches de la courbe de rosée ; on peut donc interpréter
l’horizontale passant par ce point comme une pseudo-droite d’ébullition, décrivant la
pression de début d’ébullition du système liquide diphasé.
Notons que, lors de cette ébullition commençante, la composition de la phase vapeur
qui se forme initialement est celle donnée par le point hétéroazéotrope, de composition
donnée par la fraction molaire xZ1 . Par construction, cet hétéroazéotrope a une pression
d’équilibre plus élevée que les deux constituants purs : l’hétéroazéotrope est toujours
plus volatil que les corps purs qui le composent.
Il n’est pas aussi simple d’étudier les deux branches de la courbe de rosée isobare
psat (T ) psat (T )
d’un binaire, puisqu’elle consiste à résoudre l’équation p = 1 V ou p = 2 V
x1 1 − x1
pour p fixée, cette équation ayant T pour inconnue. On peut procéder par exemple
380 Physique, MP, MP*

numériquement au moyen de tables de valeurs de la pression de vapeur saturante ; nous


nous contenterons d’un tracé qualitatif, basé sur la forme du diagramme isotherme de
la figure 18.6, et sur les remarques suivantes :
• quand on passe du diagramme isobare au diagramme isotherme, les positions des
phases liquide et vapeur sont inversées ; il en va donc de même des courbes de
rosée et d’ébullition ;
• l’hétéroazéotrope est plus volatil que les corps purs ; son point d’ébullition est donc
plus faible que celui des deux corps purs.
Dans ces conditions, le tracé de la figure 18.7 représente, logiquement, les deux
branches de la courbe de rosée et l’horizontale de température T Z , assimilé ici en-
core à la courbe d’ébullition.
T T
p fixé
T2éb b rosé
e, A L
2 ⇋V
V b T éb
L ⇋ 1
e, A
1

ros

b
TZ
ébullition

x2 xZ1 x1

Figure 18.7 – Diagramme binaire isobare sans miscibilité

Ce diagramme représente bien le comportement de nombreux binaires sans miscibilité,


comme dans le cas eau–benzène ; la température d’ébullition de l’hétéroazéotrope est
69, 3 ◦ C, à comparer à 80, 1 ◦ C pour le benzène et 100 ◦ C pour l’eau (sous 1 bar).

18.1.4 Diagrammes binaires solide–liquide


2 Définitions : bien que l’étude des diagrammes binaires de fusion (équilibre solide–
liquide) ne figure pas à notre programme, on peut dans les cas les plus simples géné-
raliser simplement les résultats décrits dans le cas de l’ébullition au cas de la fusion.
Nous noterons seulement d’ores et déjà deux différences :
• du fait de la faible influence de la pression sur les phases condensées (liquide et
solide), on n’étudiera que des diagrammes isobares, pour l’étude de la fusion en
fonction de la température ;
• les courbes de rosée et d’ébullition changent ici de nom ; on parle de courbe liquidus
pour le tracé de T = T (xL1 ) et de courbe solidus pour le tracé de T = T (xS1 ).

2 Exemples : les espèces qui sont miscibles à l’état solide comme à l’état liquide
sont très rares ; il s’agit toujours d’espèces ayant de fortes analogies de structures
électroniques. On peut dans ce cas observer des diagrammes binaires en fuseau, ou
éventuellement avec azéotropie.
Toutefois, le cas le plus fréquent est celui des corps non miscibles en phase solide ;
les diagrammes correspondants sont alors semblables à celui de la figure 18.7 ; on
18 : Mélanges et diagrammes binaires 381

présente plus bas (figure 18.8) un diagramme binaire solide–liquide à relativement


basse température, celui du naphtalène N et du paradichlorobenzène P. Le mélange
liquide obtenu à l’équilibre en présence des deux phases solides porte ici le nom de
mélange eutectique cet équilibre est réalisé à 31, 9 ◦ C, température inférieure aux
températures de fusion de N pur (56, 0 ◦ C) et de P pur (82, 1 ◦ C).
90 ◦ C
82, 1 ◦ C

70 ◦ C
idus
Liqu
56, 0 ◦ C

b Solidus 31, 9 ◦ C
30 ◦ C
Eutectique
N

P
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0

Figure 18.8 – Diagramme binaire solide-liquide naphtalène–paradichlorobenzène

Le même type de diagramme décrit les mélanges cristallins étudiés en Géologie ; le dia-
gramme de la figure 18.8 est celui du mélange d’anorthite (CaAl2 Si2 O8 ) et de diopside
(CaMg2 Si2 O8 ).
1 600 ◦ C
1 557 ◦ C

1 500 ◦ C Liqu
idus
Eutectique
1 400 ◦ C 1 391 ◦ C

1 300 ◦ C
Solidus b 1 270 ◦ C
D
A

0, 0 0, 2 0, 4 0, 6 0, 8 1, 0

Figure 18.9 – Diagramme binaire solide-liquide anorthite–diopside

On remarque bien sûr la valeur très élevée des températures de fusion mises en jeu dans
ce second diagramme ; les matériaux concernés sont des roches, étudiés en particulier
pour leur importance dans la minéralogie des champs pétroliers.

18.2 Lecture des diagrammes binaires

18.2.1 Diagrammes binaires isobares


2 Domaines monophasés : considérons d’abord un diagramme binaire isobare en
fuseau, sans azéotrope, comme celui de la figure 18.10. Supposons qu’on prépare un
mélange liquide de A1 et A2 , de composition donnée par la fraction molaire x1 , à
suffisamment basse température pour que l’ébullition ne puisse pas avoir commencé.
Le point représentatif de cette situation monophasée est M0 (ici et dans toute la suite
de la description, les notations sont celles de la figure 18.10).
382 Physique, MP, MP*

T T
p fixé bM
4
b T éb
1
M3
b b T3
VAPEUR rosée L3
V2 b
M2 b b T2
V1 L2
b b T1
M1

T2éb b ébullition M0 b

LIQUIDE
x2 x1 x1

Figure 18.10 – Lecture d’un diagramme binaire isobare

Lors du chauffage isobare de ce mélange M0 , l’équilibre liquide-vapeur ne sera pas


atteint avant la température T donnée par T = T (x1 ) sur la courbe d’ébullition,
puisque ici x1 = xL1 ; c’est le point M1 de la courbe d’ébullition. Ainsi, tout le domaine
situé sous la courbe d’ébullition est le domaine monophasé d’existence exclusive de la
phase liquide.
Considérons de la même façon un mélange initial gazeux de même composition, pré-
paré à température assez élevée pour se trouver à l’état gazeux ; c’est le point M4 . Un
refroidissement isobare ne permettra pas de faire apparaı̂tre de liquide avant le point
M3 , dont la température vérifie T = T (x1 ) sur la courbe de rosée, puisqu’ici x1 = xL1 .
Tout le domaine situé au-dessus de la courbe de rosée est le domaine monophasé
d’existence exclusive de la phase vapeur.

Cette interprétation justifie évidemment que, même en cas d’intersection des courbes
(par exemple dans le cas d’azéotropie), l’ordre de ces courbes est fixé : il ne saurait
y avoir de croisement des courbes de rosée et d’ébullition.

2 Étude de l’ébullition : reprenons à nouveau l’étude de l’évolution d’un mélange


de composition initiale M0 , par chauffage isobare en système globalement fermé. La
température T1 = T (M1 ) est donc celle du début de l’ébullition. Lors de ce début
d’ébullition, il se forme une première bulle de vapeur dont la composition chimique
est donnée par T1 = T1 (xV 1 ) sur la courbe de rosée : c’est le point V1 .

On remarque que la première bulle de vapeur qui se forme est fortement enrichie (par
rapport au mélange initial en train de bouillir) dans le composé A2 qui, ici, est le
composé de plus basse température d’ébullition, et qui est donc aussi le composé le
plus volatil. Comme la phase liquide a conservé la composition du mélange de départ,
la conservation de la matière impose la formation d’une bulle de vapeur en quantité
infinitésimale à la température T1 . L’ébullition ne peut donc se poursuivre de manière
quantitative que par augmentation de la température.
2 Poursuite de l’ébullition : lorsque la température a atteint la valeur T2 , les com-
positions des phases liquide et vapeur ne sont plus identiques ; elles sont données par
les abscisses des points L2 et V2 , disposés respectivement sur la courbe d’ébullition et
sur la courbe de rosée. Le point M2 ne représente plus qu’un rappel de la composition
initiale du mélange.
18 : Mélanges et diagrammes binaires 383

À la température T2 , la vapeur formée est toujours plus riche que le mélange initial
dans le composé le plus volatil, mais cette différence est moins marquée qu’au début
de l’ébullition, car la quantité de vapeur formée est de plus en plus importante. Au
contraire, la composition du liquide restant est de plus en plus riche dans le composé
A1 qui est le moins volatil : ceci signifie bien sûr aussi qu’il reste de moins en moins
de liquide.
Lorsque la température atteint la valeur T3 , l’ébullition de termine : la composition
de la phase vapeur a repris la valeur de la composition du mélange initial au point M3
tandis que le point L3 désigne la composition d’une dernière goutte de liquide, qui
prend une composition très enrichie en composé moins volatil avant de disparaı̂tre. Un
chauffage ultérieur ne concerne plus qu’une phase vapeur homogène, jusqu’au point
M4 par exemple.
On pourrait bien sûr reprendre l’étude de l’évolution en sens inverse par refroidisse-
ment isobare de la phase vapeur donnée par M4 :
• la première goutte de liquide apparaı̂t à la température T3 ; sa composition, donnée
par l’abscisse du point L3 , est fortement enrichie dans le composé le moins
volatil ;
• plus tard, en cours de liquéfaction, les compositions des phases liquide (L2 ) et
vapeur (V2 ) sont différentes entre elles et de celle du mélange initial (M2 ) ; ces
compositions dépendent de la température T2 et varient de façon continue avec
celle-ci ;
• la dernière bulle de vapeur disparaı̂t à la température T1 , avec une composition
donnée par l’abscisse du point V1 , très riche dans le composé le moins volatil.

2 Courbes de chauffage : on remarque bien sûr que la température évolue tout au


long de l’ébullition : le point M1 de température T1 désignait le début de l’ébullition,
et le point M3 de température T3 désignera la fin de celle-ci et la disparition de la
dernière goutte de liquide.
T T

FE
T3
Ébullition
DE
T1

Ébullition d’un binaire t Ébullition d’un corps pur t

Figure 18.11 – Courbes d’évolution de température lors d’une ébullition

On remarquera donc l’absence de palier de température lors du chauffage d’un mélange


binaire ; la courbe décrivant les variations de température étant représentée, pour un
mélange binaire comme pour un corps pur, sur la figure 18.11. Dans le cas d’un
binaire, on observe une différence entre les températures de début (DE) et de fin (FE)
d’ébullition.
L’existence d’un palier de température lors du changement d’état n’existe que lorsque
les courbes de rosée et d’ébullition ont un point d’intersection : pour les corps purs
mais aussi pour les azéotropes, qui simulent donc, comme on l’a déjà dit, le compor-
tement d’un corps pur lors de l’ébullition.
384 Physique, MP, MP*

Il est en principe facile de mettre en évidence la différence entre un mélange azéo-


trope et un corps pur : la composition d’un mélange azéotrope dépend un peu de
la pression. Ainsi, si l’ébullition d’une phase liquide donnée présente un palier de
température à une certaine pression, on peut refaire l’expérience avec le même mé-
lange à une autre pression ; si le palier ne subsiste pas, on a identifié un mélange
azéotrope.

18.2.2 Théorème des moments chimiques


2 Nécessité du théorème des moments : la lecture d’un diagramme binaire fournit par
lecture directe les compositions de la phase liquide et de la phase vapeur en fonction
de la température et de la pression ; par contre, on n’en déduit pas directement la
proportion respective de ces deux phases.
Lors de la réalisation d’une ébullition par exemple, c’est l’étude de ces proportions
respectives qui indique si on est plus ou moins avancé dans l’opération d’ébullition.
Considérons par exemple le diagramme binaire isobare sans azéotrope de la figure
18.10 ; l’ensemble des résultats établis ici se généralisent sans difficulté à tous les
types de diagrammes binaires, isobares ou isothermes, avec ou sans azéotrope.
À la température T2 , le point M2 a pour abscisse la fraction molaire de l’espèce A1
dans le mélange (( initial )) (le liquide qu’on fait bouillir, ou la vapeur qu’on cherche
à refaire passer à l’état liquide), tandis que les points L2 et V2 sont respectivement
situés sur la courbe d’ébullition et sur la courbe de rosée. Plus les points M2 et L2
sont proches, plus on est proche de la zone d’existence exclusive de la phase liquide ;
au contraire, plus les points M2 et V2 sont proches, plus on est proche de la zone
d’existence exclusive de la phase vapeur.
Les proportions respectives des deux phases liquide et vapeur peuvent donc être déter-
minées en considérant la distance respective de ces divers points ; on a déjà rencontré
le principe d’une telle analyse graphique dans le théorème des moments pour l’ébul-
lition d’un corps pur (lors de l’étude des isothermes d’Andrews) ; on va ici proposer
une règle analogue pour les mélanges binaires.
2 Expression du théorème des moments : les abscisses de L2 et V2 sont par définition
nL nV nL
égales à xL2 = xL1 = L 1 L et xV2 = xV 1 = V
1
V
, soit aussi xL2 = L1 ,
n1 + n2 n1 + n2 n
nV n L
+ nV
n1
xV2 = 1V . L’abscisse de M2 s’écrit de même xM2 = L 1 1
= L .
n n1 + nL2 + nV 1 + n2
V n + nV
n1 nV − nV L V

1 n +n
Considérons alors la mesure algébrique V2 M2 = xM2 − xV2 =
nV (nL + nV )
L V V L
n n −n n
soit V2 M2 = 1V L 1 V .
n (n + n )
nL1 nL + nV − n1 nL

De la même façon, M2 L2 = xL2 − xM2 = que l’on écrit encore
nL (nL + nV )
nL nV − nV nL
sous la forme M2 L2 = 1L L 1 V .
n (n + n )
On remarque bien sûr que les deux numérateurs sont égaux, ce qui permet de déter-
miner le rapport des quantités de matière des deux phases, qui constitue le théorème
des moments chimiques :
18 : Mélanges et diagrammes binaires 385

M2 L2 nV
= L (18.1)
V 2 M2 n

L’interprétation de ce théorème en termes de bras de levier mécaniques, comme dans


le cas du théorème des moments pour l’ébullition d’un corps pur, est évidente ; la
proportion de la phase vapeur augmente lorsqu’on s’approche du domaine exclusif
de la vapeur, donc lorsque V2 M2 diminue. Il est donc très facile de retrouver ce
théorème si on ne l’a pas mémorisé.

18.2.3 Généralisations
2 Fractions massiques : certains diagrammes isobares ou isothermes sont tracés en
termes de fractions massiques au lieu des fractions molaires ; ils se lisent et s’inter-
prètent exactement de la même façon que les diagrammes en fractions molaires, mais
toutes les lectures d’abscisse sur l’axe horizontal se font en termes de masses.
En particulier, le théorème des moments s’interprète comme un rapport de masses
dans les deux phases, liquide et vapeur. La figure 18.12 fournit par exemple le dia-
gramme binaire du mélange d’eau et d’acide nitrique, tracé à pression constante p = p◦
L V
et en termes de fractions massiques wHNO 3
(pour la courbe d’ébullition) et wHNO 3
(pour
la courbe de rosée). Ce diagramme présente un azéotrope.
130 ◦ C

120 ◦ C b
Rosée

HNO3
110 ◦ C
ion
Ébullit
100 ◦ C

90 ◦ C Azéotrope
H2 O

wHNO3
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0

Figure 18.12 – Diagramme binaire isobare eau–acide nitrique

2 Diagrammes isothermes : considérons une dernière fois trois points V2 , M2 et L2


du diagramme binaire isobare de la figure 18.10. S’agissant de trois points situés sur
la même horizontale, donc à la même température, en retrouvera les mêmes points
sur un diagramme isotherme, comme celui de la figure 18.13.
Le corps A1 étant toujours ici supposé plus volatil que le corps A2 , la disposition
relative des pressions de vapeur saturante est à l’opposé de celle des températures
d’ébullition, et plus généralement l’ensemble du diagramme est inversé. Par contre, on
conserve l’interprétation des courbes de rosée et d’ébullition, qui permettent toujours
de relier la pression à la composition des deux phases.
Ainsi, le théorème des moments permet toujours de déterminer, pour p2 fixée dans le
domaine diphasé, la proportion des quantités de matière dans les deux phases :
386 Physique, MP, MP*

p p
b T fixé bM
psat
2
0
LIQUIDE
ébullition
rosé M1
e b b p1
V1 M2 L
b b b 2 p2
V2
L
b b 3 p3
M3 b psat
1
M4 b

VAPEUR
x2 x1 x1

Figure 18.13 – Lecture d’un diagramme binaire isotherme

M2 L2 nV
= L (18.2)
V 2 M2 n

L’expression du théorème est exactement identique quel que soit le diagramme utilisé.
De même, l’étude d’une ébullition isotherme par diminution de pression se fait par
lecture des points successivement parcourus sur le diagramme, à composition globale
constante pour un système fermé, donc sur une verticale dont l’abscisse indique la
composition x1 du système que l’on fait bouillir ; on observe :
• au point M0 , le mélange initial est totalement liquide et se trouve dans le domaine
monophasé, en grisé sur la figure 18.13 ;
• en diminuant la pression, la première goutte de vapeur apparaı̂t à la pression p1 ;
sa composition, donnée par l’abscisse du point V1 , est nettement enrichie, par
rapport au mélange de départ, dans le composé A2 le plus volatil ;
• au fur et à mesure que l’ébullition se poursuit, la pression diminue et la composition
de la phase vapeur (l’abscisse du point V2 à la pression p2 ) se rapproche de celle
du mélange de départ. Au contraire, la composition du liquide restant s’éloigne
de celle du mélange initial et ce liquide s’enrichit dans le composé le moins volatil
A1 , comme on le voit en lisant l’abscisse du point L2 à cette même pression p2 ;
• la dernière goutte de liquide disparaı̂t à la pression de fin d’ébullition p3 ; cette
dernière goutte était très fortement enrichie dans le composé le moins volatil,
et au même moment la composition de la phase vapeur est devenue identique à
celle du mélange de départ ;
• une diminution ultérieure de la pression ne modifie plus l’état du mélange gazeux,
qui évolue dans le domaine monophasé vapeur (grisé sur la figure) à faible pres-
sion.

2 Cas d’azéotropie : l’existence d’un point azéotrope, qu’il s’agisse d’un diagramme
isobare ou isotherme, ne modifie pas non plus l’interprétation des courbes du dia-
gramme. Considérons par exemple le diagramme isobare de la figure 18.14 : l’ébullition
d’un mélange de composition x1 par augmentation de température.
Lors de l’ébullition, on retrouve en particulier les températures et compositions suc-
cessives des deux phases par lecture des points (M1 , V1 ) pour le début d’ébullition,
18 : Mélanges et diagrammes binaires 387

T M4 T
p fixé b
VAPEUR
b M3
b b
L3 M2 V2
b b b

ée
ros L2 V1
b b

n
itio
M1
b T éb
ull 1
éb

M0 b
T2éb b
x2 LIQUIDE x1
b b b
x′1 xZ1 x1

Figure 18.14 – Diagramme binaire avec azéotrope

(L2 , M2 , V2 ) pour un point en cours d’ébullition puis (V3 , M3 ) pour la fin d’ébul-
lition. Le théorème des moments s’applique bien sûr toujours pour déterminer le
rapport des quantités de matière dans les deux phases en cours d’ébullition, selon
nL /nV = M2 V2 /L2 M2
La seule particularité à noter dans le cas des diagrammes avec azéotrope est l’exis-
tence, dans certains cas, de plusieurs intersections des courbes de rosée ou d’ébullition
avec une horizontale (isotherme) donnée. Le système évolue bien sûr continûment,
donc en restant toujours sur la même branche des courbes de rosée et d’ébullition.
Par exemple, dans le cas de l’ébullition décrite sur la figure 18.14, tout se passe
comme si on réalisait l’ébullition d’un mélange du corps A1 et du corps fictif Z formé
du mélange azéotrope ; seul un fuseau du diagramme est utilisé, et les compositions
des deux phases restent toujours, au cours de l’évolution, supérieures à celle xZ1 de
l’azéotrope. Au contraire, si on avait réalisé l’ébullition d’un mélange de composition
initiale donnée, sur la figure 18.14, par l’abscisse x′1 , les compositions des deux phases
en cours d’ébullition seraient à tout instant restées inférieures à celle de l’azéotrope.
2 Cas de non-miscibilité : nous allons à nouveau montrer comment l’étude du
changement d’état d’un système binaire peut se faire par simple lecture du diagramme,
y compris dans le cas d’absence de miscibilité à l’état liquide.
Le diagramme étudié (isobare) est celui de la figure 18.15 ; compte tenu que le système
triphasé formé du mélange des gaz et des deux phases liquides ne peut exister qu’au
seul point hétéroazéotrope, ce diagramme fait apparaı̂tre cinq zones du plan :
• les zones monophasées liquide et vapeur, grisées sur la figure ;
• les zones diphasées pour l’équilibre de la vapeur avec un seul des liquides purs, en
blanc sur la figure ;
• la zone triphasée d’équilibre des deux phases liquides et de la phase vapeur, qui se
réduit au point hétéroazéotrope H.
Considérons par exemple l’ébullition isobare d’un système liquide préparé avec une
nL
composition donnée par l’abscisse x1 = L 1 L du point M0 de la figure 18.15.
n1 + n2
On remarquera que le système de départ n’est pas un mélange, mais seulement la
juxtaposition de deux phases liquides non mélangées. Pour cette raison, x1 n’est pas
une fraction molaire.
388 Physique, MP, MP*

T T
M4 b p fixé
VAPEUR
T2éb
M3
L3 b b

ée
b
M2
b
V
b 2 ros
L2
A2 , L ⇋ V A1 , L ⇋ V
M1 Hb
L1 b b T1éb
b ébullition
x2
M0 LIQUIDES x1
b b
x1 H
x1

Figure 18.15 – Diagramme binaire sans miscibilité à l’état liquide

Lors de l’élévation de température, on va comme dans les autres cas observer plusieurs
phases dans l’évolution du système :

• lorsque la température atteint celle du point M1 , l’ébullition commence ; la compo-


sition de la première bulle de vapeur est celle du point hétéroazéotrope H.
• pendant un certain temps, le dégagement de vapeur de composition xH 1 provoque
l’ébullition d’un mélange gazeux de A2 et A1 plus riche en A1 que le système
initial ; ainsi, l’ensemble des deux phases liquide restantes s’appauvrit régulière-
ment en A1 ;
• après une certaine durée d’ébullition à température constante (avec donc un palier
comme pour l’ébullition d’un corps pur), il ne reste plus que le seul liquide A2
pur : le point représentatif de la phase liquide a donc régulièrement évolué de
M1 à L1 , ce qui justifie qu’on considère l’horizontale M1 L1 comme une branche
de la courbe d’ébullition ;
• le système étant diphasé depuis la disparition de la dernière goutte de A2 liquide,
l’évolution de la température peut reprendre ; en particulier, lorsque la tempé-
rature est celle de l’horizontale L2 M2 V2 , la composition de la phase liquide est
donnée par L2 (le corps A2 est toujours pur), celle de la phase vapeur formée
est donnée par le point V2 (on voit qu’elle se rapproche progressivement de la
composition globale du mélange) et le théorème des moments permet d’écrire,
pour cette température, nV /nL = L2 M2 /M2 V2 ;
• l’ébullition du liquide restant (A2 pur) se poursuit alors, et la phase vapeur s’enrichit
en A2 jusqu’à retrouver la composition de l’ensemble du système de départ ; c’est
la fin de l’ébullition, acquise au point M3 ;
• un chauffage ultérieur du mélange vapeur monophasé ne change plus l’état du sys-
tème, jusqu’au point M4 .

Les courbes d’évolution de la température lors de l’ébullition montrent donc, dans ce


cas, un palier partiel, comme on le voit sur le schéma 18.16.
Pendant ce palier, le système est triphasé et la composition de la phase vapeur est celle
de l’hétéroazéotrope. Lorsque le palier se termine, le mélange n’est plus que diphasé
avec disparition d’une des deux phases liquides.
18 : Mélanges et diagrammes binaires 389

T diphasé

triphasé Fin d’ébullition


THéb
Début d’ébullition
t
Ébullition

Figure 18.16 – Ébullition sans miscibilité à l’état liquide

18.3 Distillation

18.3.1 Distillation simple

2 Opération de distillation : l’opération de distillation simple consiste à réaliser


l’ébullition d’un mélange liquide et à récupérer la vapeur formée au fur et à mesure de
sa formation. Cette vapeur, une fois condensée, forme le distillat, tandis que le liquide
restant forme le résidu de la distillation.
T T
T2éb b p fixé
VAPEUR
ébu rosée
lliti
on
D2
b b
R2
D1
b b
R1 b T éb
1
bM
0
LIQUIDE
x2 x1 x1

Figure 18.17 – Distillation d’un mélange binaire

Considérons la distillation isobare d’un mélange binaire sans azéotrope, dont le dia-
gramme binaire est représenté sur la figure 18.17. Lors du début de l’ébullition, la
composition du résidu est celle du mélange de départ (point R1 ) tandis que les pre-
mières bulles de vapeur, formées à la composition du point D1 , vont fournir un distillat
très enrichi dans le composé le plus volatil.

Le système n’étant pas fermé, la composition de l’ensemble n’est pas constante au


cours du temps. Puisqu’on évacue un mélange, dans le distillat, particulièrement riche
dans le composé A1 qui est ici le plus volatil, le résidu s’appauvrit en A1 . Au bout
d’un certain temps, la composition du résidu est donné par le point R2 , et les bulles
de vapeur produites à ce moment ont pour composition celle du point D2 .

Au fur et à mesure de la distillation, le résidu acquiert une composition donnée par la


courbe d’ébullition, tandis que la masse de résidu diminue. Le distillat étant évacué
de ce système binaire au fur et à mesure de sa formation, la composition du résidu
390 Physique, MP, MP*

évolue également, formant une moyenne des compositions des vapeurs évacuées sur la
courbe de rosée.

2 Résultat de la distillation simple : dans le cas de la distillation d’un mélange sans


azéotrope, comme celui de la figure 18.17, on constate immédiatement que le distillat
est en général plus riche dans le composé le plus volatil que le mélange de départ. La
distillation simple peut n’avoir pour but que cet enrichissement partiel. Dans le même
temps, la composition du résidu s’enrichit en composé le moins volatil.

Si la distillation pouvait être menée à son terme, elle aboutirait à un résidu pur,
constitué uniquement du composé le moins volatil (ici, A2 ). Comme on va le voir,
cette purification est en fait impossible.

La purification de A2 présente en effet deux limitations ; on ne peut obtenir comme


composé pur que le seul composé le moins volatil du mélange ; de plus, le distillat
évacué a emporté une partie notable du composé A2 , partie qui est d’autant plus im-
portante que la distillation progresse ; le rendement de la distillation en A2 quasiment
pur est toujours faible.

De plus, la présence éventuelle d’un azéotrope avec maximum sur les courbes de
rosée et d’ébullition limite l’opération ; si cet azéotrope est présent, la composition
limite du résidu est celle de l’azéotrope.
La figure 18.18 montre un montage destiné à la distillation simple au laboratoire de
Chimie.

Figure 18.18 – Montage de distillation simple

La distillation simple est aussi utilisée pour modifier la composition d’un mélange, sans
provoquer de purification totale ; la distillation des alcools alimentaires (la figure 18.19
montre un alambic traditionnel) s’accompagne de réactions chimiques catalysées par
le cuivre des cuves de l’alambic, qui contribuent à la modification de la composition
chimique de l’alcool distillé.
18 : Mélanges et diagrammes binaires 391

Figure 18.19 – Bouilleur pour la distillation d’alcools

18.3.2 Distillation fractionnée


2 Principe de la distillation fractionnée : l’opération consiste à réaliser l’opération
de distillation dans une colonne réfrigérée permettant de recondenser plusieurs fois de
suite le distillat au fur et à mesure de sa formation. On utilise pour cela une colonne
à plateaux superposés, chaque plateau étant à température un peu moins élevée que
ceux au-dessus desquels il est situé.
T T
T2éb p fixé
VAPEUR
rosée V1′
b b V1
L′1 b b
L1
ébul V2′
litio
n b b V2
b b
L′2
L2 b b b
T1éb
L3
LIQUIDE
x2 x1 x1

Figure 18.20 – Distillation fractionnée d’un mélange binaire

Considérons la distillation fractionnée (isobare) d’un binaire sans azéotrope, dont le


diagramme binaire est représenté sur la figure 18.20. Au début de la distillation, la
composition du mélange est donnée par le point L1 , qui est aussi la composition
(provisoire) du résidu.
La vapeur qui se forme immédiatement au dessus de cette phase en équilibre, et en
équilibre avec celle-ci, à une composition donnée par le point V1 , enrichie dans le com-
posé le plus volatil par rapport à L1 . Sur le premier plateau refroidi à la température
TL2 < TV1 , la vapeur en question se condense avec conservation de la composition,
formant des gouttes de liquide à la composition donnée par le point L2 .
Si ce liquide est en équilibre avec de la vapeur, celle-ci, de composition donnée par V2
monte au dessus de ce plateau pour atteindre le plateau de refroidissement suivant,
392 Physique, MP, MP*

où la condensation forme de nouvelles gouttes de liquide de composition L3 .


Ainsi s’établit dans la colonne de distillation (cf. figure 18.21) un gradient de tem-
pérature dirigé vers le bas, tandis que la composition de la vapeur varie de façon
pratiquement continue, le gaz formé en haut de la colonne étant pratiquement formé
du composé A1 le plus volatil, quasiment pur si le nombre de plateaux de la colonne
est suffisant.

Figure 18.21 – Montage de distillation fractionnée

Dans le cas d’une distillation fractionnée réalisée en système ouvert, la composition


du résidu évolue de façon continue, selon L1 L′1 . . ., jusqu’à atteindre celle du corps A2
pur ; le point représentatif de la composition du résidu de distillation se déplace donc,
au fur et à mesure de l’opération, jusqu’à la limite du corps pur.
2 Résultat de la distillation fractionnée : on peut récupérer en sommet de colonne le
composé le plus volatil, pur. Au fur et à mesure que ce composé est récupéré, le résidu
et l’ensemble du contenu de la colonne s’appauvrissent progressivement en composé
A1 le plus volatil, et la composition du résidu s’approche progressivement de celle du
composé A2 pur. Si on arrête à ce moment la distillation fractionnée, on a donc pu
séparer A1 pur (dans le distillat) et A2 pur (dans le résidu).
Toutefois, ces prédictions sont infirmées en présence d’azéotrope, l’évolution de com-
position des phases liquide restante et vapeur formée étant limitées au fuseau de
courbes exploité. Ainsi, en présence d’un azéotope à maximum de température, il est
impossible de (( monter )) le point représentatif du résidu au delà du point corres-
pondant ; la distillation est limitée. Par exemple, le mélange d’eau et d’acide nitrique
ne peut être distillé au delà du point azéotrope, comprenant environ 70 % d’acide
18 : Mélanges et diagrammes binaires 393

nitrique en masse (voir le diagramme binaire de la figure 18.12). La distillation d’un


mélange industriel, moins riche que cet azéotrope, ne peut pas purifier l’acide ni-
trique au delà de cette proportion ; l’obtention d’acide nitrique pur (acide fumant) est
réalisée industriellement par d’autres voies (synthèse directe en autoclave).

De la même façon, en présence d’un azéotope à minimum de température, il est impos-


sible de (( descendre )) le point représentatif du distillat en deçà du point azéotrope ;
la distillation est limitée. Par exemple, le mélange d’eau et d’éthanol présente un
azéotrope à minimum de température (voir le diagramme binaire de la figure 18.5)
qui comprend environ 98 % d’éthanol (en volume). La distillation d’un mélange in-
dustriel, moins riche que cet azéotrope, ne peut pas purifier l’éthanol au delà de cette
proportion. L’obtention d’éthanol pur est réalisée industriellement par distillation de
mélanges ternaires eau, benzène, éthanol.

2 Colonne de raffinage : il est possible de récupérer, dans une colonne à distillation


fractionnée à plateaux multiples, des mélanges de composition variée selon le niveau
de la colonne. La figure 18.22 présente une telle colonne.

Figure 18.22 – Colonne de distillation fractionnée industrielle

C’est ce principe qui est adopté pour la distillation du pétrole brut ; de la base au
sommet des tours de distillation, la composition chimique des produits extraits varie
depuis les huiles lourdes jusqu’au méthane, en passant par le gazole, le kérosène,
l’essence, le butane et le propane.

18.4 Le cas des binaires idéaux

18.4.1 Mélanges idéaux


2 Définition : on parle de diagramme idéal lorsque le mélange forme une solution
idéale dans les deux phases en équilibre. Par exemple, un diagramme binaire idéal
liquide–vapeur impose de considérer la phase liquide et la phase gazeuse comme deux
mélanges idéaux ; il s’agit d’une approximation qu’on peut souvent faire lorsque les
deux composants A1 et A2 ont une structure moléculaire suffisamment voisine : il peut
s’agir par exemple de molécules isomères, comme le propan-1-ol et le propan-2-ol.

2 Loi de Raoult : dans le cas d’un mélange binaire idéal, on peut écrire le potentiel
chimique de l’espèce A1 dans les deux phases sous la forme µL1 = µ◦L 1 (T ) + RT ln x1
L
394 Physique, MP, MP*

p1
et µV ◦V
1 = µ1 (T ) + RT ln ; la condition d’équilibre des deux phases est µL1 = µV
1,
p◦
L p 1
donc µ◦L ◦V
1 (T ) + RT ln x1 = µ1 (T ) + RT ln ◦ .
p
On explicite cette loi en la comparant à la définition de la pression de vapeur saturante
du corps A1 pur, pression d’équilibre au-dessus du liquide pur à la même température,
sat(T )
p1
ce qui impose µ◦L1 (T ) = µ ◦V
1 (T ) + RT ln . La comparaison des deux relations
p◦
permet d’écrire la loi de Raoult, caractéristique des mélanges idéaux :

p1 = xL1 psat
1 (T ) (18.3)

On ne confondra pas cette loi avec la loi de Dalton, p1 = xV


1 p, qui est simplement
la définition de la pression partielle de l’espèce A1 .

18.4.2 Diagrammes isobares idéaux


2 Expression des courbes d’ébullition et de rosée : l’écriture de la loi de Raoult pour les
deux constituants du mélange impose p1 = xV L sat V L sat
1 p = x1 p1 (T ) et p2 = x2 p = x2 p2 (T ) ;
on obtient la courbe d’ébullition en éliminant les fractions molaires de la phase vapeur,
xV V L sat L sat
1 + x2 = 1 donc p = x1 p1 (T ) + 1 − x1 p2 (T ). La courbe d’ébullition est donc
ici une droite, passant par les points x1 = 0, p = psat
L L sat
 
2 (T ) et x 1 = 1, p = p1 (T ) ,
correspondant à l’ébullition des corps purs A1 et A2 .
On obtient de même la courbe de rosée en éliminant les fractions molaires de la phase
1 xV 1 − xV
liquide, xL1 + xL2 = 1 donc = sat1 + sat 1 . C’est une hyperbole équilatère,
p p1 (T ) p2 (T )
dont on peut remarquer bien sûr qu’elle passe par les mêmes points extrêmes que la
courbe d’ébullition.
2 Tracé du diagramme isobare idéal : l’allure d’un diagramme isotherme idéal est
représenté sur la figure 18.23, dans le cas où le corps A1 est plus volatil que A2 à la
température T .
p p
T fixé
LIQUIDE
psat
1

n
litio
ébul

rosée
psat
2
VAPEUR
x2 x1

Figure 18.23 – Diagramme binaire isotherme idéal


18 : Mélanges et diagrammes binaires 395

18.4.3 Diagrammes isothermes idéaux


Le tracé des diagrammes isothermes est a priori plus difficile que celui des diagrammes
isobares, car ce tracé exige de déterminer les expressions des pressions de vapeur
saturante psat sat
1 (T ) et p2 (T ) en fonction de la température T . Nous n’en ferons donc
aucune étude générale.
Notons tout de même que cette étude peut se faire en application de la relation de
Clapeyron, dont l’intégration fournit précisément les relations psat sat
1 (T ) et p2 (T ) ; on
peut par exemple intégrer ces relations dans le cadre de l’approximation d’Ellignham,
qui consiste à affirmer que les chaleurs latentes d’ébullition des deux corps A1 et A1
sont indépendantes de la température.
396 Physique, MP, MP*

Ce qu’il faut absolument savoir

L’équilibre diphasé d’un mélange binaire est divariant ; les deux relations entre
L V
les quatre paramètres intensifs T , p, xL1 et xV
1 sont les deux égalités µ1 = µ1
L V
et µ2 = µ2 .
On traduit ces relations par le tracé de deux courbes. Pour la courbe d’ébullition,
T est tracé en fonction de xL1 (dans le cas des diagrammes à p fixé) ou bien p
est tracé en fonction de xL1 (dans les diagrammes à T fixé). Pour la courbe de
rosée, le même paramètre intensif est tracé en fonction de xV
1.

Les deux courbes sont monotones et toujours disposées dans le même ordre
entre deux points d’intersection ; elles ne se coupent que dans le cas des corps
purs et des éventuels mélanges azéotropes.
Les deux courbes délimitent des régions monophasées : le domaine du liquide
pur (T faible ou p élevé) est limité par la courbe d’ébullition, qui permet de
déterminer le début de l’ébullition d’un mélange, tandis que le domaine de la
vapeur pure (T élevé ou p faible) est limité par la courbe de rosée, qui permet
de déterminer la fin de l’ébullition.
T p fixé M4 T
b
VAPEUR
b M3
b b
e V2
sé L3 b M2
ro R 1
b b
b b
V1
C1 L2 b b
n
itio

M1 b T éb
1
ull

C2
b b
éb

M0 b
T2éb b LIQUIDE x1
x′1 xZ1
b b b

Au cours de l’ébullition M0 → M4 d’un mélange de composition x1 (ci-dessus),


on atteint des états intermédiaires (point M2 ) pour lesquels on lit la composition
des deux phases (xL1 = xL2 , xV 1 = xV2 ) et l’avancement de l’ébullition par le
théorème des moments, nV /nL = L2 M2 /M2 V2 .
Seule l’ébullition d’un azéotrope (composition xZ1 simule celle d’un corps pur,
avec palier de température. Dans les autres cas, la température varie au cours
de l’ébullition isobare (et la pression au cours de l’ébullition isotherme).
Lors d’une opération de distillation, le système est ouvert et les compositions
du résidu et du distillat évoluent le long des deux courbes d’équilibre. Pour
une distillation fractionnée, le grand nombre de plateaux permet d’avoir un
gradient de température vers le bas dans la colonne (points C1 , C2 , . . . ), une
composition en tête de colonne quasiment pure (sauf azéotrope à minimum
de température) et un résidu quasiment pur (sauf azéotrope à maximum de
température, comme sur la figure ci-dessus).
Pour un mélange idéal (liquide et vapeur), on retrouve les équations des courbes
d’ébullition et de rosée en écrivant les lois de Dalton (pi = xV
i p) et de Raoult
(pi = xLi psat L V
i (T ), conséquence de µi = µi .)

Vous aimerez peut-être aussi