Académique Documents
Professionnel Documents
Culture Documents
1.1.1 Introduction
2 L’électrocinétique : il s’agit de l’étude du transport d’information (faible puis-
sance) ou du transport de puissance dans des réseaux électriques. On parle éventuel-
lement d’électronique pour le transport d’information ; ce terme prend son origine
dans l’emploi, aujourd’hui en général dépassé, de tubes à vide (à déplacement d’élec-
trons) pour la réalisation des appareils de génération, codage, transport réception
ou décodage des informations. Ces tubes (électronique à lampes) ont en général été
remplacés par de l’électronique à semi-conducteurs, sauf pour certaines applications
spécifiques (amplificateurs acoustiques de puissance, de haut de gamme).
2 Cadre de l’étude : l’étude de l’électrocinétique (passage du courant électrique dans
les réseaux de dipôles) se fait dans le cadre de l’Approximation des régimes quasi-
permanents ou A.R.Q.P. Nous développerons ultérieurement (dans le cours d’élec-
tromagnétisme) les conditions et les conséquences de cette approximation ; pour le
moment, nous nous contenterons d’affirmer ce qui suit :
L’approximation des régimes quasi-permanents consiste à limiter l’étude des réseaux
électrocinétiques à des dimensions maximales ℓmax et à des durées minimales τmin
vérifiant la condition (1.1) :
ℓmax
≪ c0 c0 = 2, 99792458 × 108 m · s−1 (1.1)
τmin
Dans ce cadre, on peut négliger tout phénomène de propagation dans le réseau élec-
trocinétique ; en particulier, la modification d’une grandeur électrique en un point du
circuit a pour conséquence des modifications instantanées des grandeurs analogues
caractérisant les autres points du réseau.
2 Exemples : pour un circuit de dimension ℓmax = 3 m, on trouve τmin ≫ 10−8 s ;
on pourra donc se placer dans le cadre de l’A.R.Q.P. pour l’étude d’un signal de
fréquence fmax ≪ 108 Hz = 100 MHz, ce qui correspond à tout ce qu’on appelle élec-
tronique basse fréquence. Par contre, l’électronique de haute fréquence peut imposer
la miniaturisation des circuits, sous peine de sortir du domaine de l’A.R.Q.P. ; ainsi
à la fréquence de réception des signaux de téléphonie cellulaire (f = 1 800 MHz donc
τmin = 5, 6 × 10−10 s), l’A.R.Q.P. impose ℓmax ≪ 17 cm, ce qui est nettement plus
restrictif.
4 Physique, MP, MP*
Rappelons ici que, ces potentiels étant définis à une constante additive près, on ne
définit ici que N − 1 inconnues indépendantes ; on peut préciser cette indétermination
en choisissant pour nœud A0 la masse conventionnelle du réseau, assurant ainsi V0 = 0.
L’étude d’un tel réseau électrocinétique se ramène alors à la détermination des N − 1
tensions (relatives à la masse) V1 , . . . , VN −1 .
Deux nœuds Ak et Ap d’un même réseau sont (éventuellement) reliés par une branche ;
celle-ci est parcourue par un courant ipk , algébrisé du nœud p vers le nœud k. Notons
que, s’il n’existe pas de branche reliant Ap et Ak , on notera ipk = 0. Enfin, par
convention, on notera ikk = 0 pour tout k.
2 Loi des nœuds : l’A.R.Q.P. impose l’absence d’accumulation de charge électrique
en tout point du réseau ; la somme
X des courants parvenant en un nœud est nulle à
chaque instant. On notera donc ipk = 0 pour tout k la loi des nœuds écrite au
p
nœud Ak .
Contrairement aux apparences, ceci ne fournit pas N mais bien N −X 1 relations
X in-
dépendantes ; en effet, la somme de toutes les lois des nœuds s’écrit ipk = 0
k p
où
Xla Xsomme contient pour chaque couple (p, k) le terme ikp + ipk qui est nul, donc
ipk = 0 et ces relations ne sont pas indépendantes.
k p
i ur
Eb Sb
ug
Ce dipôle est alors caractérisé par la tension à ses bornes ; cette tension peut être
définie selon deux conventions (voir la figure 1.1) : la convention générateur (tension
ug ) et la convention récepteur (tension ur ). On parle aussi respectivement de remontée
de tension ug ou de chute de tension ur .
Après le choix d’une orientation (entrée et sortie) et d’une convention (générateur ou
récepteur), le comportement d’un dipôle électrocinétique est connu si on sait relier i
et u :
– soit par la donnée d’une caractéristique courant-tension, relation donnée sous la
forme d’une courbe i = i(u), si elle existe ;
6 Physique, MP, MP*
1
i = η − gug ug = e − ri avec g= e = rη (1.2)
r
Dans ce modèle (on parle de modèle de Thévenin dans le premier cas, de modèle de
Norton dans le second), η porte le nom de courant de court-circuit, e celui de force
électro-motrice ; g et r sont respectivement la conductance et la résistance internes
du dipôle.
i = η − gug
η ug = e − ri
η
b b e
i r
b b b b b
b b
g gug
e ri
ug
On utilise dans ce cas les schémas de Thévenin et de Norton présentés sur la figure 1.2.
Lorsque de plus g → 0, il n’existe pas de modèle de Thévenin et on parle de générateur
idéal de Norton ou générateur idéal de courant ; si au contraire r → 0, il n’existe pas de
modèle de Norton et on parle de générateur idéal de Thévenin ou générateur idéal de
tension. Les générateurs idéaux ne sont que des modèles limites, utilisés pour simplifier
des exercices ; nous ne les considérerons pas dans les développements théoriques qui
suivent.
2 Générateurs commandés : on dit que le générateur de Norton idéal défini par η
(ou le générateur de Thévenin défini par e) est un générateur libre si la grandeur η
(ou bien e) est une constante indépendante de l’état électrique du reste du réseau.
Si au contraire cette grandeur dépend de l’état électrique du réseau, on parle de
générateur lié ou générateur commandé. Nous ne considérerons dans la suite que le
cas des générateurs liés de manière linéaire, pour lesquels on écrira par exemple le
courant de court-circuit
X η sous forme d’une combinaison linéaire des potentiels dans
le réseau, η = γj Vj .
j
1 : Électricité dans les réseaux linéaires 7
e
ôl
up
ue us
dr
ua
Q
b b
ie is
Figure 1.3 – Courants et tensions d’entrée et de sortie d’un quadrupôle
Il ne s’agit donc pas de n’importe quel dispositif à quatre bornes ! Comme un dipôle,
un quadrupôle est orienté, avec une entrée et une sortie ; par contre, nous choisi-
rons systématiquement la convention de la figure 1.3, qu’on pourrait qualifier de
convention récepteur en entrée et générateur en sortie, ce qui est bien sûr adapté à
un appareil électronique destiné à faire partie d’une chaı̂ne d’appareils successifs.
2 Quadrupôles linéaires : un quadrupôle est linéaire s’il existe une relation linéaire
entre les quatre grandeurs ue , us , ue et is , permettant d’exprimer deux d’entre elles
en fonction des deux autres sous forme matricielle. La relation en question étant en
général inversible, le choix des grandeurs exprimées est a priori arbitraire ; on choisira
donc une des quatre matrices de l’équation (1.3) :
ue ie ie ue
= [Z] = [Y ]
us |{z} is is |{z} us
matrice impédance matrice admittance
(1.3)
us ue us ue
= [T ] = [H]
is |{z} ie ie |{z} is
matrice transfert matrice hybride
2 Modèle équivalent : c’est le modèle de la matrice hybride qui est le plus utilisé en
électronique ; on note alors ses composantes sous la forme (1.4) :
us H −Zs ue us = Hue − Zs is
= (1.4)
ie Ye k is ie = Ye ue + kis
En effet, une telle écriture permet de représenter le quadrupôle comme une association
de dipôles, comportant deux termes passifs et deux générateurs commandés, selon la
us
figure 1.4. La grandeur H = porte le nom de gain en tension en boucle ou-
u
e is =0
us
verte ; la grandeur Zs = − porte le nom d’impédance de sortie du montage.
is ue =0
8 Physique, MP, MP*
ie b b b is
b
b
Zs
ue Ye kis Hue us
b b
b
b
Figure 1.4 – Montage équivalent à un quadrupôle linéaire
De nombreux montages électroniques ne génèrent une tension que s’ils sont eux-mêmes
alimentés, ce qui signifie que ue = 0 impose us = 0 ; on a alors Zs = 0, ce qui permet
aussi d’écrire simplement us = Hue ; dans un tel cas, H s’identifie à la fonction de
transfert déterminée en première année.
Il est souvent inutile de calculer l’impédance de sortie ; le seul fait qu’un calcul
général de tension à la borne de sortie mène à us = Hue , sans avoir fait d’hypothèse
particulière sur la valeur de is , montre automatiquement que Zs = 0.
ie
La grandeur Ye = porte le nom d’admittance d’entrée ; enfin, la grandeur
is =0 ue
ie
k=− porte le nom de coefficient de retour ; ce terme est nul dans tous les
us ue =0
montages unidirectionnels. Dans un tel cas, on écrit encore ue = Ze ie où Ze = 1/Ye
porte le nom d’impédance d’entrée.
e1 e2 e3
R1 R2 33
b b b b b b b
b
b
η1 η2 η3 η4
g1 g2 g3 g4
b
X
De même, l’association en parallèle (même tension u, courant total i = il ) de
l
plusieurs dipôles linéaires,
XmodélisésPselon le schéma de Norton, est un dipôle linéaire
de caractéristiques η = ηl , g = l gl . Pour cette raison, le modèle de Norton est
l
aussi appelé modèle parallèle (voir la figure 1.6).
2 Diviseurs de tension et de courant : considérons une association en série de dipôles
linéaires passifs (ek = 0), selon la figure 1.7 : on parle alors de diviseur de tension :
rk X
uk = u r= rk (1.5)
r
k
i=0
r1 r2 ... rN
b b b b b
u1 u2 ... uN
u
gk X
ik = i g= gk (1.6)
g
k
i1
b b
g1
i2
i b b
b g2 ... b
b b
...
iN
b b b
gN ǫ=0
1.9 à gauche ; l’ensemble est encore équivalent à un générateur linéaire, qu’on peut
X ek X 1
modéliser par ses caractéristiques de Norton η = et g = , ce qui permet
rk rk
k k
X ek X 1
de relier la tension u0 et le courant i0 sous la forme i0 = − u0 , soit
rk rk
k k
encore :
P
gk ek − i0
u0 = k P (1.7)
k gk
i0 i0
b
b
...
...
rN
rN
r1
r1
u0 u0
b
b
...
eN
e1
e1 ... eN
b b b b b b
b
Dans le cas du circuit de la figure 1.9 à droite, le lien entre u0 et i0 reste évidemment
le même ; il constitue alors le Théorème de Millman. Dans le cas particulier où i0 = 0,
on remarque que ce théorème peut se relire ainsi : la tension u0 est le barycentre des
tensions ek , affectés des poids gk .
2 Théorème de Helmholtz : considérons enfin un réseau linéaire quelconque, formé
de N nœuds dont on cherche à déterminer les potentiels V1 , V2 , . . . , VN −1 (avec par
choix de masse V0 = 0). Ce réseau est entièrement constitué de branches linéaires
(dipôles, quadrupôles) que nous décrirons tous dans le modèle de Norton, en écrivant
donc ikp = ηkp − gkp (Vp − Vk ) le courant circulant du nœud Ak vers le nœud Ap .
Dans le cas où la branche Ap Ak est passive, on posera ηkp = 0 ; si elle est absente, on
posera ηkp = 0 et gkp = 0.
Enfin, si le générateur ηkp n’est pas X
un générateur libre, on développera son courant
de court-circuit sous la forme ηkp = αjkp Vj . Finalement, on peut dans tous les cas
j
X
écrire la loi des nœuds ikp = 0 sous la forme matricielle :
p
où [V ] est la matrice colonne des N − 1 potentiels indépendants, [G] est une matrice
carrée de dimension N −1 qui ne dépend que des conductances et, éventuellement, des
caractéristiques αjkp des générateurs liés, et [J] est une matrice colonne de dimension
N − 1 qui ne dépend que des générateurs libres.
1 : Électricité dans les réseaux linéaires 11
Dans le cas (dont nous admettrons qu’il est général, sauf pour des réseaux mal confor-
−1
més) où la matrice [G] est inversible, on peut donc écrire [V ] = [G] [J], qui constitue
le théorème de Helmholtz‡ ou théorème de superposition :
Théorème de Helmholtz
X Le potentiel Vk en un nœud quelconque
X Ak d’un réseau linéaire est une
combinaison linéaire Vk = δki ηi des caractéristiques ηi (ou ei )
générateurs i
des générateurs linéaires du réseau. Les coefficients δki de la combinaison
linéaire ne dépendent que des éléments passifs du réseau (conductances,
résistances) ou des caractéristiques des générateurs liés.
On peut bien sûr utiliser une forme pratique du théorème de superposition : en pré-
sence de plusieurs générateurs, on calcule chaque potentiel en présence d’un seul
générateur libre, puis on somme les résultats obtenus.
i
bA A1
1
b
ire
ire
éa
éa
lin
lin
D u i u
u
u
ea
ea
és
és
R
bA bA
0 0
b
Quel que soit le dipôle D dans lequel ce réseau débite, la répartition des courants et
des tensions ne sera pas modifiée si on remplace D par un générateur idéal de courant
i (cf. figure 1.10 à droite) ; dans le réseau entièrement linéaire ainsi formé, on peut
−1
écrire la première ligne de la relation [V ] = [G] [I] sous la forme V1 = u = e − ri, où
−1
−r est le terme de ligne 1, colonne 1 de la matrice [G] , tandis que e est une certaine
combinaison linéaire des courants de court-circuit des générateurs libres intérieurs au
réseau linéaire.
On peut déterminer e comme la valeur particulière prise par la tension u lorsque i = 0,
tous les autres générateurs étant inchangés.
On peut déterminer r comme la valeur particulière prise par le rapport −u/i lorsque
e = 0, c’est-à-dire lorsqu’on éteint tous les générateurs libres du réseau linéaire.
On reconnaı̂t là le théorème de Thévenin :
12 Physique, MP, MP*
Théorème de Thévenin
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Thévenin de caractéristiques (e, r) :
• r est la résistance équivalente au réseau passivé, c’est-à-dire dans lequel
on a éteint tous les générateurs libres ;
• e est la tension à vide (en remplaçant D par un circuit ouvert) aux
bornes du réseau linéaire.
Théorème de Norton
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Norton de caractéristiques (η, g) :
• g est la conductance équivalente au réseau passivé, c’est-à-dire dans
lequel on a éteint tous les générateurs libres ;
• η est le courant de court-circuit (en remplaçant D par un fil) aux bornes
du réseau linéaire.
Dans les deux cas, on n’oubliera pas que passiver le réseau, c’est annuler les carac-
téristiques e ou η des générateurs libres, tandis qu’on ne modifie pas les générateurs
liés du réseau linéaire.
b
+
ε(t) b
b - vs (t)
b
p
dk x X
2 Régime libre, régime forcé : la solution générale de l’équation = f (t) ak
dtk
k=0
est la somme d’une solution particulière, dépendant de la forme de la fonction f (t),
1 : Électricité dans les réseaux linéaires 13
p
X
et de la solution générale λi exp (ri t) de l’équation sans second membre, où les ri
i=0
p
X
sont les racines complexes de l’équation caractéristique ak rk = 0.
k=0
La solution générale de l’équation sans second membre, qui ne dépend pas de f (t),
porte le nom de régime libre ; on parle de régime forcé pour une solution particulière
de l’équation complète qui a la même forme que la fonction f (t).
2 Systèmes stables : on dit qu’un réseau électrique en régime variable est stable
si les parties réelles Re(ri ) de toutes les racines ri de l’équation caractéristique sont
négatives. Ainsi, chacune des exponentielles exp (ri t) qui intervient dans le régime
libre vérifie |exp (ri t)| → 0 quand t → ∞.
La solution de régime libre est alors bornée et tend vers zéro au bout d’une certaine
1
durée ; on dit aussi que le régime libre est transitoire. Notons alors ri = − ± jωi
τi
(j 2 = −1) une de cesracines de l’équation caractéristique ; on peut encore écrire
t
|exp (ri t)| = exp − et la grandeur τi est une des constantes de temps du régime
τi
transitoire.
dx
Si l’équation différentielle est d’ordre 1, l’équation de régime libre a + bx = 0 a
dt
pour seule racine de l’équation caractéristique r = −b/a qui est réelle ; il faut donc
que a et b soient de même signe. Dans ce cas, la constante de temps est τ = a/b et
dx 1
l’équation différentielle s’écrit encore + x = 0.
dt τ
Formes canoniques des systèmes du premier ordre
X Dans le cas d’une équation du premier ordre, on utilisera la notation
dx 1
+ x(t) = f (t) ; τ > 0 est la constante de temps du régime transitoire.
dt τ
d2 x dx
Si l’équation différentielle est d’ordre 2, l’équation a 2
+b + cx = 0 admet des
dt dt
solutions réelles ou complexes (conjuguées).
– Dans le premier cas, elles sont toutes deux négatives si leur produit c/a est positif
et leur somme −b/a négative, ce qui revient à affirmer que les trois coefficients a, b
et c ont même signe.
– Dans le second cas, la partie réelle commune des solutions est −b/2a qui doit être
négatif (donc a et b sont encore de même signe) tandis que b2 − 4ac < 0 impose
ac > 0 et a et c sont encore de même signe.
On ramène alors l’équation à une forme canonique en divisant par a avant de noter
c/a = ω02 , b/a = 2ξω0 et Q = 1/2ξ.
x
exp
(−t
/τ
2)
1)
/τ
−t
p(
ex
(nulle ou égale à 1) si |t| > ∆t/2, et qu’elle a une pente constante 1/∆t dans l’intervalle
[−∆t/2 , ∆t/2].
H δ
1 1/∆t
∆t
∆t
t t
0 0
Ainsi définie, la suite des fonctions H∆t est dérivable, et leurs dérivées δ∆t sont
représentées en pointillés sur la figure 1.14, à droite. Il s’agit de fonctions nulles
sauf sur l’intervalle [−∆t/2 , ∆t/2], intervalle où elles prennent une valeur telle que
Z A
δ∆t (t)dt = H(A) − H(−A) = 1 pour A > ∆t/2.
−A
Nous admettrons qu’il existe un cadre mathématique, la théorie des distributions de
Schwartz‡ , dans lequel la fonction (( limite )) H de Heaviside est dérivable, sa dérivée
portant le nom d’impulsion de Dirac ou distribution de Dirac.
Distributions de Heaviside et de Dirac
dH
X On note ainsi les distributions H et δ, reliées par
dt
= δ, qui vérifient :
• H(t) = 1 pour t > 0 et H(t) = 0 pour t < 0 ;
• δ(t) = 0 pour t 6= 0 ;
Z ∞
• δ(t)dt = 1.
−∞
H modélise les tensions et courants en échelon à l’instant t = 0 ; δ
modélise les tensions et courants en impulsion au même instant.
Bien sûr, aucun générateur réel ne délivre de tensions représentées exactement pas des
grandeurs proportionnelles à H(t) ou à δ(t) ; il ne s’agit que de modèles limites, que
nous utiliserons cependant couramment, en électrocinétique comme dans d’autres do-
maines de la Physique, pour décrire des grandeurs physiques présentant des variations
rapides.
On prendra garde aux unités : si H est une grandeur sans dimension, la distribution
de Dirac δ se mesure comme l’inverse d’un temps.
C
b b b
b
R
uC
e(t) D uD
b
Figure 1.15 – Réseau R, C série
constate que la variation ∆uC = uC (0+ ) − uC (0− ) est nulle sauf si τ → 0, ce qu’on
obtient par exemple lorsque R → 0. Finalement, on retiendra le résultat général :
Continuité de la tension uC
X La tension uC aux bornes d’un condensateur est en général une fonction
continue du temps, même lorsque le réseau qui comporte ce condensateur
subit des variations brutales d’alimentation, sous réserve que :
• le condensateur doit être connecté par l’intermédiaire d’au moins une
résistance en série ;
• la tension d’alimentation ne doit pas comporter d’impulsion de Dirac.
Considérons alors le réseau de la figure 1.16 ; ce réseau est en quelque sorte l’(( image ))
de celui de l’étude précédente, en remplaçant les modèles série par des modèles paral-
lèle, et D est un dipôle dont le courant iD (t) est supposé borné.
b
iR iL iD
η(t) R L D
b
b
diL
Puisque la tension aux bornes de l’inductance pure L vérifie uL = L , et du fait
dt
diL
de la loi des mailles RiR = uL , on peut écrire la loi des nœuds η(t) = iL + τ + iD
dt
L
où on a posé pour constante de temps τ = .
R
Z 0+
− +
Par intégration entre t = 0 et t = 0 , on obtient τ ∆iL = η(t)dt. Cette inté-
0−
grale est nulle sauf si la tension e(t) est proportionnelle une impulsion de Dirac ; on
en déduit un résultat général, moins utile que celui qui concerne les condensateurs
ci-dessus : le courant iL dans une bobine est en général une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine subit des variations bru-
tales d’alimentation. Ce résultat ne s’applique pas à une bobine idéale si la courant
d’alimentation comporte une impulsion de Dirac.
18 Physique, MP, MP*
Continuité du courant iL
X Le courant iL dans une bobine est toujours une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine condensa-
teur subit des variations brutales d’alimentation, car la résistance interne
d’une bobine ne peut jamais être négligée.
Ce résultat s’applique sauf si le courant d’alimentation comporte une
impulsion de Dirac.
En particulier, tout dipôle linéaire est soumis à une tension définie par u(t), parcouru
dk
par un courant i(t) ; puisque une dérivée relativement au temps k est représen-
dt
tée par (jω)k , toutes les équations différentielles linéaires deviennent des équations
algébriques linéaires, avec :
i=Y u Y = |Y | (1.11)
1
ZR = R Z L = jLω ZC = (1.12)
jCω
2 Généralisation des théorèmes généraux : les règles de calcul dans C pour les impé-
dances complexes Z sont les mêmes que dans R pour les résistances ; tous les théorèmes
généraux établis plus haut :
X association de générateurs ;
X diviseurs de tension et de courant ;
X théorème de Millman ;
X théorème de superposition de Helmholtz ;
X théorème de Thévenin-Norton ;
restent donc valables dans le cadre des régimes harmoniques, à condition de remplacer
les forces électro-motrices e, courants de court circuits η, résistances r et conductances
g par leurs équivalents complexes e, η, Z et Y .
ie b b
i
b s
b
b
b
Zs
ue Ye kis Hue us
b b
b
b
b
ie i
Y e (ω) = (admittance d’entrée) et k(ω) = − e (coefficient de
ue i =0 us u =0
s e
retour, toujours nul dans les montages unidirectionnels) sont maintenant des fonctions
de la pulsation ω.
On appelle diagrammes de Bode‡ les deux représentations donnant le module et
l’argument de H(ω) en fonction de la pulsation ω ; pour des raisons de commodité,
on trace en fait deux diagrammes logarithmiques :
Diagrammes de Bode
X Les diagrammes de Bode d’un quadrupôle linéaire en régime harmonique
sont constitués du tracé :
• en gain, défini par G = 20 lg |H(ω)| en fonction de lg ω (en fait, on
ω
utilise presque toujours l’abscisse sans dimension lg x où x = , où ω0
ω0
est une pulsation caractéristique du système) ;
• en phase, défini par ϕ = arg (H(ω)) en fonction de lg ω (ou encore en
fonction de lg x).
Bien que G soit sans dimension, on lui attribue toujours le nom de déciBel (symbole
dB), unité nommée en hommage à Bell‡ .
2 Filtres du premier ordre : deux filtres simples du premier ordre doivent être iden-
H0
tifiés immédiatement, le filtre passe-bas H(ω) = où x = ω/ω0 et H0 > 0 et le
1 + jx
H0 jx
filtre passe-haut H(ω) = ; les diagrammes correspondants en gain et en phase
1 + jx
sont tracés sur les figures 1.18 et 1.19.
G G
0 lg x 0 lg x
G0 G0
−3 dB −3 dB
pe
dB
nt
20
e
+
−
20
e
nt
dB
pe
Passe-bas Passe-haut
ϕ ϕ
0 lg x
+π/2
lg x
−π/2
Passe-bas 0 Passe-haut
ω0 τ = 1 (1.13)
2 Filtres du second ordre : on doit encore identifier les formes canoniques de trois
fonctions de transfert du second ordre, correspondant respectivement aux filtres :
H0
– passe-bas H(ω) = , avec toujours H0 > 0 et x = ω/ω0 ; on pose ici
1 + 2jξx − x2
aussi ξ = 1/2Q ;
H0 2jξx H0
– passe-bande H(ω) = , qu’on écrit encore H(ω) =
1 + 2jξx − x2 1 + jQ (x − 1/x)
avec les mêmes notations que pour le passe-bas ;
−H0 x2
– passe-haut H(ω) = , qu’on peut obtenir à partir du filtre passe-bas
1 + 2jξx − x2
en faisant le changement jx → 1/jx, c’est-à-dire en changeant simplement le sens
de l’axe des abscisses en lg x, avec un déphasage de π.
L’allure du diagramme de Bode correspondant dépend de la valeur du coefficient
d’amortissement ξ ou, si on préfère, du facteur de qualité Q. Les tracés de la figure
1.20 détaillent le cas du filtre passe-bas du second ordre.
G ϕ
lg x lg x
G0 ξ = 0, 1 ξ = 0, 1
ξ = 10 ξ = 10
−π/2
p en
b
te −
ξ=1 ξ=1
40
B d
−π b
lg x
bπ
ξ = 0, 1 G0 ξ = 0, 1
ξ = 10 ξ = 10
π/2
B
b
d
40
ξ=1 ξ=1
te +
pen
lg x
Lorsque le filtre passe-bas est non résonant, c’est-à-dire pour ξ assez élevé, on peut
H0
factoriser la fonction de transfert H(ω) = , avec donc deux
(1 + jω/ω1 ) (1 + jω/ω2 )
1 1
pulsations de coupure successives ω1 = et ω2 = , où τ1 et τ2 sont aussi les
τ1 τ2
constantes de temps du régime transitoire apériodique associé à l’équation différen-
ξ dus 1 d2 us
tielle us +2 + = H0 ue ; on retrouve ainsi le lien entre régime transitoire
ω0 dt ω02 dt2
et régime forcé, analogue au cas des filtres d’ordre 1 :
ω 1 τ1 = ω 2 τ2 = 1 (1.14)
Lorsque le filtre passe-bas est résonant, pour ξ assez faible, on peut définir une bande
Hmax
passante à −3 dB en cherchant les valeurs de x = ω/ω0 telles que H = √ , avec
2
H = |H|. Rappelons d’abord que le maximum de H est atteint pour x = ωr /ω0
p H0
donné par x = 1 − 2ξ 2 ≃ 1 donc Hmax ≃ ; on cherche donc les solutions de
2ξ
(x2 − 1)2 + 4ξ 2 x2 = 8ξ 2 ; les deux solutions vérifient sont proches de 1, de part et
ω0
d’autre de x0 avec pour écart ∆x ≃ 2ξ, ce qu’on peut encore écrire ∆ω ≃ : le
Q
facteur de qualité mesure l’acuité de la bande passante.
1 : Électricité dans les réseaux linéaires 23
ω0 2
ω ≃ ωr ≃ ω0 ∆ω ≃ ≃ (1.15)
Q τ
On peut faire à part l’étude du filtre passe-bas, car celui-ci est toujours résonant, avec
une pulsation de résonance ωr exactement égale à ω0 , et une bande passante à −3 dB
ω0
exactement égale à ∆ω = , quelle que soit la valeur du facteur de qualité ou du
Q
coefficient d’amortissement ξ. Toutefois, celui-ci influe notablement sur la forme du
diagramme de Bode, comme le montre la figure 1.22.
G ϕ
lg x lg x
G0
ξ = 0, 1
ξ = 10
−π/2
b
dB
pe
ξ = 0, 1
nt
ξ=1
20
e
+
−
20
e
nt
dB
pe
−π b
Le régime transitoire associé à ces diagrammes de Bode est, selon la valeur du facteur
de qualité, apériodique, critique ou pseudo-périodique ; dans ce dernier cas, il existe
un lien simple entre pseudo-pulsation ω et pulsation de résonance ωr d’une part, et
entre constante de temps τ et facteur de qualité Q d’autre part, sous la forme :
ω0 2
ω ≃ ωr = ω0 ∆ω = = (1.16)
Q τ
dq
E
b
Générateur D ur
b
dq
Figure 1.23 – Échanges de puissance
L’énergie perdue par les charges électriques est, pour assurer la conservation de l’éner-
gie totale, transférée au dipôle D, qui reçoit dont le travail électrique δWr = −dEp et
δWr
une puissance électrique Pr = .
δt
On retiendra, en convention des récepteurs, les expressions de l’énergie et de la puis-
sance électrique reçues par un dipôle :
δWr = Pr × dt Pr = u r × i (1.17)
Umax Imax
hP i = √ √ cos |ϕu − ϕi | (1.18)
2 2
√
√ efficaces : dans l’expression (1.18), les termes Ueff = Umax / 2 et
2 Grandeurs
Ieff = Imax / 2 portent respectivement les noms de tension efficace ou courant efficace.
On utilise aussi la notation URMS = Ueff et IRMS = Ieff , où RMS désigne la racine du
carré moyen (root of the mean square) ; plus généralement, pour toute fonction, réelle
ou complexe, T -périodique, on définit ainsi :
Z τ +T
2 1 2
fRMS = f (t) dt (1.19)
T τ
En effet, dans le cas particulier d’une grandeur sinusoı̈dale f (t) = f0 cos ωt, on re-
f0
trouve bien fRMS = √ ; toutefois, on prendra garder à ne pas généraliser à d’autres
2
formes de signaux (cf. figure 1.24), périodiques mais de moyenne f¯ non nulle.
2 Facteur de puissance : on peut alors réécrire l’expression (1.18) en faisant intervenir
le facteur de puissance cos ϕ selon :
26 Physique, MP, MP*
f f f
f¯ f¯ f¯
fa t fa t fa t
r q r
f2 f2
fRMS = f¯2 + a fRMS = f¯2 + fa2 fRMS = f¯2 + a
2 3
2
Ainsi, dans le cas d’un dipôle résistif, ϕ = 0 et Ueff = RIeff donc hP i = RIeff ; pour
une bobine ou un condensateur, ϕ = ±π/2 donc hP i = 0.
On peut généraliser ces résultats en notant que l’impédance Z = u/i du dipôle a
Umax Ueff
pour module Z = = et pour argument arg Z = arg u − arg i = ϕ ; ainsi,
Umax Ieff
2
hP i = ZIeff cos ϕ, où on reconnaı̂t Z cos ϕ = Re(Z) ; on montre de même une relation
analogue avec Y = 1/Z :
2 2
hP i = Re(Z)Ieff = Re(Y )Ueff (1.21)
1 ∗
hP i = Re(P ) P = ui (1.22)
2
ie,n is,n
b b b b
b
Z s,n−1 Z s,n
ue,n
us,n
H n−1 ue,n−1 Y e,n H n ue,n Y e,n+1
b b b
b
Étage n − 1 Étage n Étage n + 1
Dans une telle installation, le courant de sortie is,n de l’étage n est le courant d’entrée
ie,n+1 de l’étage ultérieur, et de même pour les tensions us,n = ue,n+1 . Il n’en va pas de
même pour les puissances : ce qui est fourni par le générateur de tension en = H n ue,n
est en partie dissipé dans l’impédance de sortie Z s,n de l’étage n, et en partie seulement
utilisé dans l’admittance d’entrée Y e,n+1 de l’étage n + 1.
On assure l’adaptation d’impédance de la chaı̂ne électronique si, pour chaque étage,
l’impédance d’entrée Z e,n+1 est choisie de sorte à recevoir la plus grande puissance
possible de la part du générateur (en , Z s,n ) qui l’alimente. On peut écrire la puissance
1
moyenne transférée d’étage en étage sous la forme hP i = Re (ui∗ ) avec u = Z e,n+1 i
2
en
et i = .
Z e,n+1 + Z s,n
Notons alors en = e0 exp (jψ), Z s,n = Xg +jYg et Z e,n+1 = X +jY , de façon à obtenir
e2 X + jY
hP i = 0 Re : le problème de l’adaptation d’impédance
2 (X + Xg )2 + (Y + Yg )2
X
consiste à rechercher le maximum de la fonction f (X, Y ) = ,
(X + Xg )2 + (Y + Yg )2
sachant qu’en pratique X > 0, Xg > 0 tandis que Y comme Yg sont quelconques.
Un maximum sera évidemment toujours atteint en fonction de Y si Y = −Yg ; il reste
X df
alors à rendre maximal f (X) = ; la solution de = 0 est X = Xg . Dans
(X + Xg )2 dX
e2
ce cas, la puissance transférée à l’étage n + 1 est égale à hP i = 0 , exactement égale
2X
à celle dissipée dans l’impédance de sortie de l’étage n puisque les deux impédances
ont même partie réelle.
Adaptation d’impédance
X Il y a transfert maximal de puissance du générateur de sortie d’un étage
à l’impédance d’entrée de l’étage suivant lorsque les deux impédances
(de sortie et d’entrée) successives sont des complexes conjugués.
En pratique, ces impédances sont choisies si possibles toutes réelles, donc
toutes égales.
On dispose alors de chaı̂nes électroniques normalisées, comme par exemple avec les va-
leurs Z e = Z s = 50 Ω en électronique de laboratoire (connecteurs BNC, électronique
aux normes IEEE, etc.) ou Z e = Z s = 75 Ω (télévision, vidéo).
Dans un réseau linéaire, toute grandeur électrique vérifie une équation différen-
X dk x
tielle ak k = f (t) ; si f (t) = 0 le régime est libre.
dt
k
d2 x dx
Une équation stable d’ordre 2 s’écrit 2
+ 2ξω0 + ω02 x(t) = f (t) ; ω0 est
dt dt
la pulsation propre et ξ = 1/2Q le coefficient d’amortissement, Q le facteur de
qualité. Les variationsZ de x et de ẋ à l’instantZt = 0 vérifient les deux équations
ǫ ǫ
dF
∆ẋ + 2ξω0 ∆x = lim f (t)dt et ∆x = lim F (t)dt, où f = .
ǫ→0 −ǫ ǫ→0 −ǫ dt
uC (t) et iL (t) sont continus, sauf branchement direct ou impulsion en entrée.
H0 H0 jx
Filtres du premier ordre : H = passe-bas, H = passe-haut, avec
1 + jx 1 + jx
x = ω/ω0 . Pulsation de coupure à −3 dB, ω0 .
H0 −H0 x2
Filtres du second ordre : H = 2
passe-bas, H =
1√+ 2jξx − x 1 + 2jξx − x2
passe-haut, résonants si ξ < 1/ 2 ; dans ce cas, ωr ≃ ω0 et ∆ω ≃ ω0 /Q.
H0
Hc = passe-bande, ωr = ω0 et ∆ω = ω0 /Q.
1 + jQ(x − 1/x)
Zk
En régime permanent ou forcé, diviseurs de tension (série) uk = u ; diviseurs
Z
P
Y Y k uk − i0
de courant (parallèle) ik = k i ; théorème de Millman u0 = kP
Y kYk
pour le potentiel u0 en un nœud relié à des points de potentiels uk fixés (i0 est le
courant de fuite) ; théorème de superposition pour plusieurs générateurs libres ;
théorème de Thévenin-Norton, eeq = uvide , η eq = icourt-circuit et Z eq = Z passivé .
Pour un quadrupôle linéaire :
b b b
b
b
b
ie Zs is
ue Ye kis Hue us
b b
b
b
b
Électronique
2.1.1 Signaux
x
2 Signaux analogiques : l’objectif de l’électronique (( signal ))
est le transport, éventuellement à longue distance, d’informa-
tions contenues dans la forme de la fonction x(t) ; nous pren-
drons ici pour exemple le signal x(t) ci-contre.
t
Il peut arriver que la tension u(t) = u0 x(t) ou le courant
i(t) = i0 x(t) représentent directement le signal à transporter ; toutefois, ce cas est
exceptionnel car les fréquences d’oscillation du signal ne sont a priori pas adaptées
au support de transport de l’information (ondes hertziennes, câble, fibre optique, etc.) ;
de plus, on peut souhaiter effectuer de plus un multiplexage, c’est-à-dire transporter
sur la même ligne plusieurs signaux simultanément.
On utilise alors la modulation d’une grandeur électrique choisie en fonction du sup-
port physique, grandeur dite porteuse, par le signal x(t). À l’arrivée, l’opération de
démodulation restitue le signal x(t).
2.1.2 Modulation
Après modulation, le signal x(t) présenté plus haut prend alors l’allure de la figure 2.2 ;
on remarque qu’il est impératif que les variations d’amplitude du signal modulant x(t)
doivent rester lentes devant les variations de la porteuse, pour que les deux parties
du signal modulé u(t) (fréquence et amplitude) restent faciles à distinguer lors de
l’opération de démodulation.
u
Si la porteuse est assez peu déformée par la modulation, on pourra montrer qu’elle
peut être considérée comme une combinaison linéaire de signaux sinusoı̈daux dont les
fréquences s’étendent de part de d’autre de la fréquence fp de la porteuse. L’étendue
ainsi occupée dans l’espace des fréquences porte le nom de largeur de bande ; plus
celle-ci est réduite, plus on peut utiliser le même support pour transporter un grand
nombre de signaux simultanés.
2 Démodulation : le schéma de démodulation (pour restituer x(t) à partir d’un
signal comportant plusieurs grandeurs simultanément modulées en amplitude) figure
sur le schéma 2.3 ; on utilise un filtre passe-bande sélectif (ou tuner ) pour sélectionner
la fréquence fp , un détecteur de crête DtC (pour mesurer l’amplitude Um = U0 +αx(t)
à partir de u(t)) puis un filtre passe-haut (pour éliminer la composante constante U0
et restituer la partie variable αx(t)).
Le schéma de modulation (pour obtenir u(t) à partir de x(t)) figure sur le schéma
2.1 ; on utilise un additionneur et un multiplieur.
Le principe même de l’ensemble modulation, démodulation en amplitude explique
l’utilité de divers montages linéaires (additionneurs, soustracteurs, filtres) ou non
linéaires (détecteur de crête, multiplieurs) qui seront présentés ou étudiés plus loin.
2 : Électronique 31
2.1.3 Opérateurs
2 Opérateurs non linéaires : certains ont été cités ci-dessus : multiplieurs et détecteurs
de crête en particulier. On sait aussi réaliser, par exemple au moyen d’amplificateurs
opérationnels, des comparateurs à hystérésis. Certains montages non linéaires seront,
dans ce qui suit, présentés à titre d’exercice seulement ; ils ne figurent toutefois pas
en tant que tels au programme.
2 Opérateurs linéaires : les opérateurs linéaires évoqués ci-dessus peuvent tous,
au moins en principe, être réalisés au moyen d’amplificateurs opérationnels, même si
on utilise aussi d’autres composants pour pallier aux limitations des amplificateurs
opérationnels. Rappelons que ces limitations sont de deux ordres :
– limitation en fréquence ; la bande passante à −3 dB de l’amplificateur opérationnel
lui-même est très basse (inférieure à 1 kHz) ; pour les montages à base d’amplifi-
cateur opérationnel, on peut augmenter la fréquence d’utilisation jusqu’à environ
100 kHz, la contrepartie de la montée en fréquence étant une diminution du gain
en amplitude. Cette perte de gain n’est pas en général une contrainte sévère.
– limitation en courant, donc en puissance : le courant de sortie d’un amplificateur
opérationnel ne peut pas dépasser 10 à 20 mA, sous peine de saturation ; sous une
32 Physique, MP, MP*
a
U0
αx0 /2
f
fp
fp − f fp + f
Ce spectre fait apparaı̂tre la largeur de bande occupée par le signal (de largeur 2f de
part et d’autre de la fréquence centrale fp ). Nous verrons ultérieurement comment les
méthodes d’analyse de Fourier permettent de généraliser le principe de cette étude à
des formes de signaux plus complexes.
Les filtres (passe-bande, passe-bas ou passe-haut) permettent d’opérer des modifica-
tions sur le spectre de fréquences d’un signal ; on peut simplement comprendre le
rôle du filtre en superposant l’allure du diagramme de Bode en gain d’un filtre avec
le spectre de fréquence du signal filtré ; ainsi, pour économiser de la bande passante
tout en transportant la même quantité d’information, on peut appliquer à un signal
modulé en amplitude un filtre passe-haut non résonant, comme sur la figure 2.6 ; sa
fréquence de coupure sera choisie entre fp − f et fp .
Il est à noter que le schéma de la figure 2.6 est strictement qualitatif. En particulier,
le filtrage est considéré comme presque idéal : les composantes filtrées disparaissent
complètement, les composantes non filtrées sont maintenues presque intégralement.
Ce n’est pas le genre de situation auquel nous a habitué l’étude des filtres du second
ordre (coupure à ±40 dB par décade au maximum). On n’oubliera pas ici que les
filtres réels de l’électronique industrielle peuvent être d’ordre bien plus élevé. Un filtre
d’ordre 8 peut ainsi réaliser une coupure à ±160 dB par décade.
Le signal obtenu en sortie
n du montage dont le principe
o est décrit sur la figure 2.6
αx0
s’écrit alors u(t) ≃ H0 U0 cos ωp t + cos(ωp + ω)t , si H0 est le gain (constant)
2
du filtre dans sa partie passante. on dit ici qu’on a récupéré une bande latérale unique
(BLU) du signal modulé.
2 : Électronique 33
a a
Diagramme de
Bode du filtre
f f
fp fp
fp − f fp + f fp + f
t t
Osc xe OC
T = T (xe )
t t t
Ce cas (( idéal )) ξ = 0 ne peut en pratique jamais être réalisé de manière durable, car
on ne peut pas réaliser une égalité parfaite de paramètres physiques ; dès qu’on pense
y être arrivé, de petites modifications inévitables nous en éloignent. Ces modifications
sont dues par exemple aux oscillations elles-mêmes : le réseau dissipe de la puissance
par effet Joule dans ses résistances internes, s’échauffe, et perd l’accrochage.
À partir de là, soit ξ redevient légèrement positif, et les oscillations s’atténuent, soit ξ
redevient légèrement négatif. Dans le cas où ξ < 0, les oscillations sont alors amplifiées
avec une amplitude exponentiellement croissante (figure 2.8 à droite) ; il intervient
en général des comportements non linéaires (saturations, par exemple) qui limitent
la croissance de ces oscillations, et c’est en général dans ce cadre que sont réalisés
les oscillateurs quasi-sinusoı̈daux les plus simples. L’allure d’un signal oscillant avec
amplification et saturation est représenté sur la figure 2.9.
u
Remarquons qu’une seule partie imaginaire nulle impose l’instabilité ; en effet, pour
la pulsation particulière ωi ∈ R, on aura |H(ωi )| → ∞ : on a vu que le système
constitue alors un oscillateur spontané à la pulsation |ωi |.
Nous ne nous intéresserons ici qu’à 5 de ces bornes ; deux d’entre elles sont alimentées
en continu au moyen d’une source de puissance fournissant les tensions constantes
2 : Électronique 37
±Vcc , où Vcc est en général de l’ordre de 10 V à 15 V ; cet apport énergétique permet
à l’appareil de fonctionner en amplificateur.
La présence d’une alimentation symétrique définit aussi une référence interne de ten-
sion à l’amplificateur opérationnel, point de potentiel nul relativement auquel la ten-
sion de sortie vs est définie. On note v+ et v− les potentiels des deux entrées, dites
non inverseuse et inverseuse de l’amplificateur, et ǫ = v+ − v− .
2 Caractéristique de transfert : un amplificateur opérationnel idéal ne consomme
aucun courant en entrée : ip+ = ip− = 0 ; de plus, la tension vs dépend seulement de
ǫ, selon la caractéristique de transfert de la figure 2.11.
vs
Vsat b
pente µ0
−ǫm ǫ
b b
ǫm
b −V
sat
Amplificateurs opérationnels
X Un amplificateur opérationnel idéal est caractérisé par deux propriétés :
• les courants d’entrée sont toujours nuls ;
• si |us | < Vsat ∼ 15 V et |is | < isat ∼ 20 mA, le régime est linéaire.
En régime de fonctionnement linéaire, un amplificateur opérationnel
idéal est caractérisé par la relation us = µ0 ǫ = µ0 (v+ − v− ), où
µ0 ∼ 105 ≫ 1 permet toujours de faire l’approximation v+ ≃ v− .
En régime de saturation en tension, un amplificateur opérationnel idéal
adopte en sortie la tension us = ±Vsat , où us a le signe de ǫ = v+ − v− .
Les amplificateurs opérationnels réels présentent un certain nombre de
défauts. En particulier, en régime variable, la tension de sortie est régie
dus µ0
par les équations τ + us = µ0 ǫ ou us = ǫ, où τ ∼ 15 ms.
dt 1 + jωτ
Z2
Montage non inverseur : H(ω) = 1 + Ze = ∞ (2.1)
Z1
R2
Si Z 1 = R1 et Z 2 = R2 , H(ω) = 1 + et il s’agit d’un amplificateur non inverseur :
R1
si Z 1 = ∞ (circuit ouvert) et Z 2 quelconque (on choisit souvent de mettre simplement
un fil, Z 2 = 0), H(ω) = 1 et il s’agit d’un suiveur.
2 Montage inverseur : considérons maintenant le montage de la figure 2.13.
2 : Électronique 39
b b is
+
ie b b
b - b b
b
ue b b us ue H(ω)ue
b
Z2
Z1 b b b
b
b b b
b
b b
ie Z1 Z2 b b
b
b b is
-
b b ue Ze H(ω)ue
ue b +
us
b b b
b
b
b b b
Z2
Montage inverseur : H(ω) = − Ze = Z1 (2.2)
Z1
que nécessaire. Par contre, les composantes continues et de très basse fréquence
ρ
sont simplement amplifiées puisque H(0) = − .
R
1
– si Z 1 = et Z 2 = R, H(ω) = −jRCω et le montage est un dérivateur.
jCω
2 Additionneur, soustracteur et déphaseur : considérons maintenant le montage formé
de trois entrées représenté sur la figure 2.14. Les différents potentiels indiqués sont
relevés par rapport à la masse.
2R R
u1 b b b
u2 b b
-
2R b us
b +
u0 b b
b
Y
αY
b
b
lg RCω
b −π/2
−π b
b b
Y4
b b b b
b
+
Y1 Y2 b b
Y3 b -
ue u
us
b
b b b b b b
r r′
r′
• Dans les trois cas, k = 1 + varie de 1 à +∞, donc le coefficient d’amortissement
r
varie de 1 à −∞, en passant pas la valeur critique 0 ; pour ξ 6 0, le système
est donc instable. En particulier pour ξ = 0 (k = 3), on obtient la condition
d’accrochage d’un oscillateur sinusoı̈dal de pulsation ω0 .
ie ie
b b b
r
b
+
ue b
b -
R r
b b b
b
i
ue
On n’atteint bien sûr jamais de tensions ou de courants infinis, car les saturations (en
tension ou en courant) de l’amplificateur opérationnel interviennent avant. On dira
dans ce cas que le montage fonctionne en régime saturé ; il n’est pas toujours possible
de prévoir s’il s’agira de saturation positive ou négative.
2 Amplificateur inverseur et comparateur : considérons à nouveau le montage non
inverseur de la figure 2.12, réalisé avec Z 1 = R1 et Z 2 = R2 . Si on tient compte du
caractère non idéal de l’amplificateur opérationnel, on doit écrire v+ − v− = ǫ(t) avec
dus R1
τ + us (t) = µ0 ǫ(t), v+ (t) = ue (t) et v− (t) = us (t). L’équation différen-
dt R1 + R2
dus µ0 (R1 + R2 )
tielle du régime libre est donc τ ′ +us = H ′ ue , où on a posé H ′ =
dt (µ0 + 1)R1 + R2
′ R1 + R2
et τ = τ .
(µ0 + 1)R1 + R2
R1 + R2 τ H′
Étant donné que µ0 ≫ 1, on peut écrire H ′ ≃ et τ ′ ≃ . La solution
R1 µ0
particulière de cette équation (si ue est constant) correspond à un montage amplifi-
cateur non inverseur de gain en tension H ′ : ce résultat est donc presque le même que
celui qu’on obtenait pour un amplificateur idéal. Cette solution est atteinte après une
durée de l’ordre de grandeur de τ ′ ; comme on a vu que τ ≃ 15 ms, µ0 ≃ 105 , alors
un montage ayant un gain H ′ = 100 sera en régime permanent au bout d’une durée
de l’ordre de 15 µs.
On peut faire une remarque supplémentaire, en notant que la bande passante (à
dus
−3 dB) du filtre passe bas associé à l’équation différentielle τ + us (t) = µ0 ǫ est
dt
∆ω = 1/τ ; de même, le montage non inverseur a une bande passante ∆ω ′ = 1/τ ′ . On
a donc établi plus haut la relation :
µ0 × ∆ω = H ′ × ∆ω ′ (2.3)
b b
-
Vsat
b b us
+Vsat
b +
2
+ R1R+R
1
ue b b us
b ue
R2 b b
R1
− R1R+R 2
Vsat
b b b
b
1
−Vsat
β+ xs
β+
+
xe x′e xs
H b
β−
β− xs
Dans le cadre plus général de la figure 2.19, la grandeur de sortie du montage vérifie
xs = Hx′e = H (xe + βxs ), où on a posé β = β+ − β− . On peut donc définir pour le
x H
montage bouclé le gain effectif H b = s = .
xe 1 − βH
Considérons maintenant le cas où l’amplificateur est un filtre passe-bas du premier
H0
ordre, H = , tandis que les deux opérateurs de bouclage ont un gain réel
1 + jω/ω0
1 1 + jω/ω0 1 + jω/ωb0
positif : β+ > 0, β− > 0. On peut alors écrire = −β + =
Hb H0 Hb0
H0
où on a posé Hb0 = et ωb0 = ω0 (1 − βH0 ).
1 − βH0
Ainsi, la chaı̂ne bouclée se comporte elle-même comme un filtre passe bas du premier
ordre, mais avec une valeur différente du gain statique H0 et de la bande passante
ω0 ; seul le comportement asymptotique (pour ω → ∞) est identique pour les deux
montages bouclé et non bouclé.
On remarque à nouveau que, lors du bouclage, le produit du gain par la bande passante
est constant :
On peut donc représenter les diagrammes de Bode en gain des systèmes bouclé et non
bouclé, sur la figure 2.20, en fonction de la valeur de β par rapport au cas critique
1
βc = , avec d’ailleurs βc ∼ 0 souvent.
H0
Un bouclage négatif (ou rétroaction) est caractérisé par β− ≫ β+ et donc par une
diminution du gain avec augmentation de la bande passante.
Le système est alors stabilisé ; en particulier, l’équation différentielle du régime libre
Hb0 dus
associée à la fonction de transfert H b = s’écrit us + τb0 = 0 avec
1 + jω/ωb0 dt
1 1 1
τb0 = donc τb0 = . Puisque β+ ≪ β− , τb0 > 0 et le régime
ωb0 ω0 1 − (β+ − β− ) H0
46 Physique, MP, MP*
β1 > βc ∼ 0
H
ω
β2 < βc ∼ 0
pe
nt
e
−
β3 < β2
20
dB
Figure 2.20 – Bouclage, gain et bande passante
libre est stable, avec même une durée de régime transitoire nettement plus courte
1
qu’en l’absence de bouclage : τb0 ≪ .
ω0
Au contraire, un bouclage positif (ou réaction positive), caractérisé par β+ ≫ β− ,
s’accompagne d’une augmentation du gain, mais pour une bande passante réduite ;
dans le cas extrême, la gain peut devenir infini pour une fréquence unique : le système
devient instable ; il forme par exemple un oscillateur spontané pour cette fréquence.
On peut aussi comprendre cette perte de stabilité du système en notant que, dans
dus 1
l’équation différentielle du régime libre us + τb0 = 0 avec τb0 = , la condition
dt ωb0
β+ ≫ β− impose τb0 < 0 et un régime libre instable.
Nous admettrons finalement la généralisation suivante :
Dans le cas où il existe plusieurs bouclages (comme pour les filtres de Butterworth
de la figure 2.16), on ne peut pas conclure a priori ; toutefois, le contexte de l’énoncé
permet souvent de savoir quel est le type de régime à étudier.
2 : Électronique 47
Pour être transporté, un signal s(t) doit être modulé ; il est transporté à la
fréquence fp du signal porteur sp (t).
En modulation d’amplitude, sp (t) = (A + ks(t)) cos 2πfp t. En modulation de
fréquence, sp (t) = A cos 2π (fp + ks(t)) t.
Un montage linéaire est caractérisé par une fonction de transfert, fraction
N (ω) u
rationnelle en ω, H(ω) = = s . On passe de la notation complexe
D(ω) ue
d 1
Z
D(ω)us = N (ω)ue à l’équation différentielle en faisant ↔ jω et dt ↔ .
dt jω
Lorsque D(ω) = 0, le système forme un oscillateur spontané.
X
Un signal composite xe (t) = ak cos (ωk t + φk ), après traversée d’un montage
k
linéaire de fonction de transfert
X H(ω) = H(ω) exp (jϕ(ω)), forme un nouveau
signal composite xs (t) = H(ωk )ak cos (ωk t + φk + ϕk ).
k
Analyse de Fourier
3.1.1 Introduction
2 Signaux périodiques : pour l’étude des signaux (par exemple électriques) pério-
diques, nous serons amenés à décomposer toute fonction du temps sur une base for-
mée de fonctions harmoniques (c’est-à-dire sinusoı̈dales), de pulsation ω. On pourra
prendre pour exemple le signal tracé sur la figure 3.1, composé de deux fonctions har-
moniques : u(t) = u1 cos ω0 t + u1 cos ω1 t ; dans le cas de l’exemple proposé, u1 = u0 /2
et ω1 = 3ω0 .
u
u(t)
u1 cos ω1 t u0 cos ω0 t
L’intérêt d’une telle décomposition, si elle est possible, est évident : pour chaque com-
posante harmonique de pulsation ωk , on pourra appliquer tous les résultats développés
dans le cours concernant les régimes harmoniques forcés : calculs d’impédance Z(ωk ),
de fonctions de transfert H(ωk ), etc. Dans le cas d’un réseau linéaire, l’existence d’un
théorème de superposition permet alors de considérer le comportement du système
en sommant les contributions des différents termes harmoniques.
À titre d’exemple, supposons que la tension u(t) soit filtrée par un filtre passe haut
jω/ω0
du premier ordre, de fonction de transfert H(ω) = ; cette fonction de
1 + jω/ω0
transfert prend deux valeurs bien différentes pour les deux composantes harmoniques
j 1
de u(t), puisque H(ω0 ) = , de norme √ = 0, 71 et d’argument π/4 = 45◦ , et
1+j 2
50 Physique, MP, MP*
3j 3
H(ω1 ) = , de norme √ = 0, 95 et d’argument 18◦ . Le signal de sortie us (t),
1 + 3j 10
représenté sur la figure 3.2, montre bien l’atténuation relative de la composante de
basse fréquence, et le déphasage correspondant. Le signal complet est alors totalement
déformé.
us
0.71u0 cos(ω0 t + 45◦ )
us (t)
Imaginons maintenant que cette même tension u(t) alimente une bobine, de résistance
R et d’inductance propre L, ces deux grandeurs étant choisies de sorte que R = Lω0 .
Le courant électrique i(t) qui parcourt la bobine s’obtient alors comme somme de deux
composantes, i0 cos(ω0 t + ϕ0 ) et i1 cos(ω1 t + ϕ1 ), avec, du fait de la notation complexe
u0 u0 u1 u1
u = Zi = (R + jLω)i, les expressions i0 = =√ et i1 = =√ ;
|Z(ω0 )| 2R |Z(ω1 )| 10R
de même, ϕ0 = − arg(Z(ω0 )) = −45◦ et ϕ0 = − arg(Z(ω0 )) = −18◦ .
L’allure du courant iL qui parcourt la bobine est reporté sur la figure 3.3 ; on remarque
au contraire du tracé précédent que c’est cette fois-ci la composante de haute fréquence
qui est atténuée.
iL
iL (t) u0 cos(ω0 t − 45◦ )
√
R 2
u1 cos(ω1 t − 18◦ )
√
R 10
Figure 3.3 – Courant dans une bobine alimenté par deux tensions harmoniques
Ici et dans toute la suite, on remarquera l’intervention de termes du type exp (−jωt),
qui semblent avoir une pulsation négative. En réalité, il n’existe que des pulsations
positives, et ce type de terme n’intervient que dans la décomposition formelle d’une
fonction cos ωt ou sin ωt, à pulsation strictement positive.
Il est essentiel de ne pas confondre le caractère pair et impair des fonctions cos kωt
et sin kωt, avec la parité éventuelle de l’entier k ! Ainsi, un harmonique pair (avec
k pair) contient un terme pair ak cos kωt et un harmonique impair bk sin kωt.
On retiendra les relations entre les différentes notations des séries de Fourier :
À cette norme, on associe l’équivalent d’un produit scalaire, défini par la relation :
s
T
1
Z
hf |gi = f (t) g ∗ (t) dt (3.3)
T 0
Théorème de Parseval
X
X
Si ck exp (jkωt) est une bonne approximation d’un signal F , la valeur
k∈I
X
efficace de F est la somme kF k2 = Feff
2
≃ |ck |2 .
k∈I
On peut aisément interpréter ce résultat en remarquant que |ck |2 est la valeur efficace
de l’harmonique k, c’est-à-dire de la fonction ck φk ; ainsi, le théorème de Parseval
s’interprète en termes énergétiques, la puissance transportée par le signal F étant la
somme des puissances transportées par chacun de ses harmoniques.
On peut illustrer ce résultat dans le cas du courant circulant dans une bobine présenté
u0 u1
en 3.1.1 ; on avait alors écrit iL (t) = √ cos (ω0 t + ϕ0 ) + √ cos (ω1 t + ϕ1 ), avec
2R 10R
ω1 = 3ω0 et u1 = u0 /2. La puissancedissipée dans la bobine ne dépend que de sa
2 u20 2 1 2
résistance, avec P (t) = RiL (t) = cos (ω0 t + ϕ0 ) + cos (ω1 t + ϕ1 ) + f (t),
2R 20
u2
où la fonction f (t) = √0 cos (ω0 t + ϕ0 ) cos (ω1 t + ϕ1 ) est de moyenne nulle.
R 20
La figure 3.4 présente l’allure des deux termes dont la somme forme la puissance P (t) ;
on voit que le passage au carré renforce encore l’importance relative du terme de basse
u20
1
fréquence ; en moyenne, il ne reste que hP i = 1+ , somme des deux termes
4R 20
du théorème de Parseval.
P
ω0
ω1
T
a0 1
Z
= F (t)dt
2 T 0 (3.4)
T T
2 2
Z Z
ak = F (t) cos(kωt)dt bk = F (t) sin(kωt)dt
T 0 T 0
∞
a0 X
F (t) = + ak cos(kωt) + bk sin(kωt) (3.5)
2
k=1
2 Parité : considérons un signal pair, c’est-à-dire que F (−t) = F (t). Dans ce cas, les
2 T /2
Z
coefficients bk = F (t) sin(kωt)dt sont des intégrales d’une fonction impaire
T −T /2
sur un domaine symétrique, donc bk = 0. La décomposition de F ne comporte donc
que des fonctions paires, cos(kωt).
2 T /2
Z
De même, un signal impair vérifie F (−t) = −F (t) et ak = F (t) cos(kωt)dt ;
T −T /2
ce sont des intégrales d’une fonction impaire sur un domaine symétrique, donc ak = 0.
La décomposition de F ne comporte donc que des fonctions impaires, sin(kωt), et sa
valeur moyenne a0 est nulle.
2 Intégration : si un signal comporte une partie continue a0 /2, celle-ci s’intègre sous
la forme a0 t/2 + cte, qui n’est pas périodique et ne peut être traitée dans ce cadre.
Dans tout autre cas, la primitive d’une somme de fonctions harmoniques est aussi une
somme de fonctions périodiques, et on peut aussi en proposer une intégration terme
∞
a0 X
Z
à terme. Ainsi, si F (t) = + ak cos(kωt) + bk sin(kωt) et Φ = F (t)dt, on
2
k=1
∞
α0 X
aura Φ(t) = + αk cos(kωt) + βk sin(kωt) avec les relations :
2
k=1
56 Physique, MP, MP*
bk ak
αk = − βk = (3.7)
kω kω
k
b b b b b b
−T /2 t
bk
T /2
k
−1 b b
0 1 2 3 4 5
Comme on n’oublie pas par ωT = 2π, on peut encore écrire ces coefficients :
4
Créneau impair : b2p = 0 b2p+1 = (3.8)
(2p + 1)π
Le spectre correspondant est tracé sur la figure 3.5 ; on remarque qu’il ne contient que
des termes impairs (c’est-à-dire en sin kωt), eux-mêmes d’ordre impair (b2p = 0). On
notera aussi que la suite des b2p+1 décroı̂t lentement : il faut beaucoup d’harmoniques
pour former une bonne approximation de la fonction créneau. Cette circonstance est
due aux discontinuités de la fonction, qui correspondent à des transitions rapides,
c’est-à-dire à des termes de haute fréquence, qui sont justement des harmoniques de
rang élevé.
Cr′T ak
1
b b
k
−T /2 T /2 t
b b bk
−1 b b b b b b
k
0 1 2 3 4 5
On pourrait éventuellement définir une fonction créneau décalée d’un quart de période,
donc paire ; elle est représentée sur la figure 3.6, avec son spectre en fréquence. Le
décalage fait que la nouvelle série ne contient que des termes pairs (en cos kωt) mais
toujours seulement des harmoniques d’ordre impair.
On peut enfin représenter quelques termes de la série de Fourier de la fonction créneau,
pour montrer qualitativement comment la série converge vers CrT ; les trois premiers
termes (harmoniques 1, 3 et 5) ainsi que leur somme sont représentés sur la figure 3.7.
harmonique 1
harmonique 5
harmonique 3
k
b b b b b b
−T /2 t 0 1 2 3 4 5
b b bk
T /2
b b
k
−1
∞
X 16(−1)p+1 sin ((2p + 1)ωt)
de moyenne nulle, fournit TrT (t) = ; finalement on
p=1
T π(2p + 1) (2p + 1)ω
obtient les coefficients bk , qui sont d’ailleurs représentés sur la figure 3.8 :
8(−1)p+1
Triangle impair : b2p = 0 b2p+1 = (3.9)
(2p + 1)2 π 2
On remarque bien sûr la décroissance plus rapide des coefficients b2p+1 avec le rang
2p + 1 : le triangle présente des variations beaucoup moins brutales que le créneau.
Il faut donc moins d’harmoniques de haute fréquence pour en réaliser une bonne
approximation ; la convergence rapide de la série de Fourier du triangle est illustrée
sur la figure 3.9.
harmonique 1
harmonique 5
t
harmonique 3
> a:=k->omega/Pi*int(sin(omega*t)*cos(k*omega*t),t=0..Pi/omega);
> b:=k->omega/Pi*int(sin(omega*t)*sin(k*omega*t),t=0..Pi/omega);
On obtient alors les ak au moyen des commandes :
> a0; a(1); a(2); a(3); a(4);
a0 1 2 2
qui fournissent = , a2 = − , a4 = − , les autres termes étant nuls, et :
2 π 3π 15π
> b(1); b(2); b(3); b(4);
1
qui fournissent b1 = , les autres termes étant nuls. Finalement, on peut écrire ce
2
1 1 2 2
signal redressé sous la forme F (t) ≃ f (t) = + sin(ωt)− cos(2ωt)− cos(4ωt) ;
π 2 3π 15π
la convergence de cette série à trois termes seulement est illustré sur la figure 3.10.
F (t) f (t)
t t
Il ne faut surtout pas oublier de traiter chaque composante (ak , bk ) avec sa pulsation
ωk = kω, au lieu par exemple de traiter tous les termes comme s’ils avaient la même
pulsation ω que le fondamental !
60 Physique, MP, MP*
∞ 2
b2
a 2
0
X a k
2
Feff = + + k (3.10)
2 2 2
k=1
3.2.1 Définition
2 Généralités : au contraire de l’étude des séries de Fourier, les notions dévelop-
pées dans ce chapitre ne seront pas traitées en cours de Mathématiques. Nous nous
contenterons donc de justifications qualitatives, dont la formalisation complète relève
de la théorie des distributions de Schwartz‡ et figure en général au programme de
l’enseignement du second cycle universitaire.
Nous considérerons dans tout ce qui suit des fonctions f à valeurs complexes d’une
variable réelle, absolument intégrables sur R, c’est-à-dire telles que l’intégrale impropre
Z +∞
|f (t)| dt converge. Les propriétés présentées ici s’étendent aussi à certaines
t=−∞
distributions, et notamment à la distribution de Dirac‡ , dont nous rappellerons plus
loin les propriétés.
sin x
2 Sinus cardinal : nous définirons la fonction sinus cardinal par sinc(x) = ;
x
cette notation sera utilisée dans toute la suite du cours de Physique, avec le prolon-
gement par continuité sinc(0) = 1.
sinc(u)
1
5π
b b sinc = 0, 13
2
2π
b b
−2π 2π b u
b b b b b0 b b b
b b
−π π
b b
3π
sinc = −0, 21
2
Le tracé de cette fonction est reporté sur la figure 3.11, avec quelques points re-
marquables Z ; ajoutons aux propriétés qui sont indiqués sur cette figure la valeur des
∞ Z ∞
intégrales sinc(u)du = π et sinc2 (u)du = π.
−∞ −∞
La fonction tracée sur la figure 3.11 présente un maximum principal en u = 0 ; celui-ci
(grisé sur la figure) est souvent caractérisé par sa largeur à la base égale à 2π.
On parle aussi parfois de largeur à mi-hauteur du maximum principal ; elle est ici
assez proche de la demi-largeur à la base du même maximum, donc de π.
Les points indiqués sur la figure 3.11 correspondent aux points de contact de la fonc-
1
tion sinc avec les enveloppes ± ; ils sont immédiatement voisins des maxima secon-
u
daires de la fonction.
2 Transformée de Fourier directe : considérant une fonction quelconque f , non né-
cessairement périodique,√on généralise la définition (3.4) des coefficients de Fourier en
posant (le coefficient 1/ 2π est conventionnel) :
+∞
1
Z
fˆ(ω) = √ f (t) exp(−jωt) dt (3.11)
2π t=−∞
La fonction transformée est aussi une fonction complexe d’une variable réelle, mais
l’unité de mesure de sa variable est changée ; si t se mesure en seconde, ω est une
pulsation en radian par seconde. Ainsi, la transformée de Fourier passe de l’espace
direct (des variables temporelles t) à l’espace réciproque (des pulsations ω).
∆t ω
t
b
0 2∆ω
∆t ω
b
t
t0
2∆ω
∆t × ∆ω ∼ 2π (3.12)
Théorème de Parseval
X Une fonction f (t) et sa transformée de Fourier fˆ vérifient le théorème
Z +∞ Z +∞
de Parseval, |f (t)|2 dt = |fˆ(ω)|2 dω : l’énergie totale trans-
t=−∞ ω=−∞
portée par le signal f est la somme des énergies transportées par chacune
des fréquences qui le composent.
Distribution de Dirac
X Pour toute Z ∞fonction g, la distribution de Dirac est l’objet qui assure
l’égalité g(t)δ(t − t0 )dt = g(t0 ).
−∞
Z ∞
Avec g(t) = 1 et t0 = 0 on retrouve bien sûr la propriété déjà énoncée, δ(t)dt = 1.
−∞
1
f (t) = δ(t − t0 ) ⇒ fˆ(ω) = √ exp (−jωt0 ) (3.13)
2π
On peut noter dans (3.15) le changement de signe dans l’exponentielle par rapport
à (3.11) ; on peut aussi relire cette définition en notant que ǧ est une combinaison
1
linéaire de termes harmoniques exp(+jωt), avec une amplitude √ g(ω) pour la
2π
composante de pulsation ω.
2 Lien avec la transformée directe : considérons enfin le cas où g(ω) = fˆ(t) est
ˇˆ
elle-même une transformée
Z +∞ Z de Fourier directe. On peut alors écrire la ǧ = f sous la
+∞
1
forme ǧ(t) = f (t′ ) exp(−jωt′ ) dt′ exp(jωt) dω ou, en admettant
2π ω=−∞ t′ =−∞
Z +∞ Z +∞
1 ′
l’interversion des sommes, ǧ(t) = f (t ) exp (jω(t − t )) dω dt′ .
′
2π t′ =−∞ ω=−∞
Z K
Puisque hK (t − t′ ) = exp (jω(t − t′ )) dω = 2Ksinc(K(t − t′ )) l’intégrale en ω est
−K
lim h∞ (t − t′ ) = 2πδ(t − t′ ), compte tenu de (3.14).
K→∞
Z +∞
Revenant au calcul précédent, ǧ(t) = f (t′ )δ(t − t′ ) dt′ = f (t). On montre ainsi
t′ =−∞
que la combinaison de deux transformées de Fourier successives, directe et inverse,
ramène à la fonction de départ :
TF directe TF inverse
f (t) −→ fˆ(ω) = g(ω) g(ω) −→ ǧ(t) = f (t)
(3.16)
TF inverse TF directe
g(ω) −→ ǧ(t) = f (t) f (t) −→ fˆ(ω) = g(ω)
3 : Analyse de Fourier 65
Comme on l’a noté en (3.16), le résultat est évidemment le même quel que soit l’ordre
des transformations.
Ainsi, on peut passer de l’espace direct (temporel) à l’espace inverse (fréquentiel) et
réciproquement, ce qui justifie enfin pleinement l’emploi des notations complexes pour
d
les dérivations et vice-versa ⇋ jω, quelle que soit la forme du signal étudié.
dt
xe (t)
b
t
t′
xs √
H(ω) = = 2π × x̂is (3.17)
xe
Cette propriété générale est parfaitement illustrée dans le cas d’une fonction de trans-
fert d’ordre 2 ; considérons par exemple un filtre passe-bas, de fonction de transfert
H0
normalisée H(ω) = . L’équation différentielle correspondante est donc,
jω ω2
1+ − 2
Qω0 ω0
d 1 d2 xs 1 dxs
compte tenu du passage automatique ⇋ jω, 2 + + xs = H0 xe .
dt ω0 dt2 Qω0 dt
La forme générale de la solution de régime permanent est un régime transitoire apé-
riodique, critique ou pseudo-périodique selon les valeurs de Q relativement à la valeur
critique Qc = 2.
On a vu que pour Q ≫ Qc , le régime transitoire est pseudo-périodique, donc de grande
durée et de pseudo-pulsation ω ≃ ω0 ; la fonction de transfert présente alors un pic
étroit centré sur ωr ≃ ω0 .
3 : Analyse de Fourier 67
xe (t)
xs (t)
1 ℓ 1ℓ
R= =̺ = (4.1)
G s γs
dG = Gu dx
dC = Cu dx
dR = Ru dx
u(x, t) u(x + dx, t)
b b
b
2 Lignes idéales : nous traiterons essentiellement dans la suite des lignes idéales,
dans lesquelles on peut négliger les effets résistifs : Ru = 0 (pas de résistance des fils
de la ligne) et Gu = 0 (ou, ce qui revient au même, 1/Gu → ∞ : la résistance de fuite
à travers l’isolant qui sépare les deux fils est infinie ; il s’agit d’un isolant parfait).
4 : Lignes électriques et propagation d’ondes 71
r
Lu
Zc = (4.2)
Cu
Avec les valeurs proposées plus haut, Zc ∼ 300 Ω ; en général, les impédances des
lignes bifilaires valent quelques dizaines à quelques centaines d’ohm.
[LC]
De même, l’analyse dimensionnelle du produit Lu Cu montre [Lu Cu ] = où d est
[d2 ]
une distance ; faisant intervenir la pulsation ω0 de résonance d’un circuit L, C, on
1
obtient [Lu Cu ] = 2 ; ce produit est donc l’inverse du carré d’une vitesse en on
[dω0 ]
définira une célérité caractéristique de ligne c :
1
c= √ (4.3)
Lu Cu
Avec les valeurs proposées plus haut, c ∼ 3, 0 × 108 m · s−1 ; nous montrerons ultérieu-
rement que la célérité caractéristique d’une ligne vérifie toujours c 6 c0 , où c0 est la
c0
célérité des ondes électromagnétiques dans le vide. On posera éventuellement c = ,
n
où n > 1 porte le nom d’indice pour la ligne étudiée.
∂u(x, t) ∂i(x, t)
= −Ru i(x, t) − Lu (4.4)
∂x ∂t
72 Physique, MP, MP*
∂u(x + dx, t)
2 Loi des nœuds : i(x, t) = i(x + dx, t) + dGu(x + dx, t) + dC devient,
∂t
∂i(x, t) ∂u(x + dx, t)
au même ordre, = −Gu u(x + dx, t) − Cu ; toutefois, les deux
∂x ∂t
∂u(x, t)
termes en u(x + dx, t) = u(x, t) + dx doivent, à cet ordre du développement,
∂x
être remplacés par u(x, t). On en déduit la seconde équation des télégraphistes :
∂i(x, t) ∂u(x, t)
= −Gu u(x, t) − Cu (4.5)
∂x ∂t
∂2u ∂2u ∂u
= Lu Cu + Ru Gu u + (Ru Cu + Gu Lu ) (4.6)
∂x2 ∂t2 ∂t
Cette équation se simplifie pour une ligne idéale (Ru = 0, Gu = 0) et prend alors la
forme (4.7), qui montre l’importance de la grandeur c définie plus haut :
∂2u 1 ∂2u 1
2
= 2 2 c= √ (4.7)
∂x c ∂t Lu Cu
∂ 2 f (x, t) 1 ∂ 2 f (x, t)
= (4.8)
∂x2 c2 ∂t2
2 Ondes planes progressives : on donne ce nom aux grandeurs qui ne dépendent que
de la variable x ± ct ; nous considérerons ici la fonction f+ (x − ct) puisqu’on obtient
la même interprétation pour f− (x + ct) en changeant le signe de c.
S’agissant d’une fonction quelconque, sa forme ne peut pas être déterminée a priori ;
toutefois, on peut en donner une interprétation graphique en supposant une forme
de fonction quelconque. Puisqu’elle dépend de deux paramètres, nous choisirons de la
représenter par des (( photographies )) successives, à trois instants t < t′ < t′′ , comme
sur la figure 4.2.
f+
à t à t′ à t′′
x
x0 x′0 x′′0
Cette absence de déformation est liée, dans le cas de la ligne électrique bifilaire, au
caractère idéal de celle-ci (Ru = 0, Gu = 0). En présence de termes dissipatifs, on
peut continuer à voir des phénomènes de propagation, mais avec une atténuation
progressive de l’amplitude de l’onde.
On caractérise au moyen de l’adjectif progressif chacune des deux composantes f+ et
f− de l’onde plane, en précisant dans quel sens cette progression a lieu :
Dans (4.10), la grandeur a = a0 exp (jϕ) avec a0 > 0 est l’amplitude complexe de
l’onde, a0 son amplitude réelle et ϕ sa phase à l’origine. Les deux signes ± corres-
pondent bien sûr aux deux sens possibles de propagation.
Une telle onde est une fonction sinusoı̈dale du temps, de pulsation ω, de fréquence
ω 1 2π
ν= , de période T = = .
2π ν ω
On peut aussi choisir d’écrire cette même ondehsous des formes équivalentes, en modi-
x i
fiant l’écriture de l’exponentielle complexe exp jω t − qui décrit la propagation,
c
par exemple pour l’onde progressive :
t x
exp [j (ωt − kx)] = exp [j2π (νt − σx)] = exp j2π − (4.11)
T λ
ω
Puisque ω est la pulsation, le coefficient k = porte le nom de pulsation spatiale
c
k
ou vecteur d’onde ; de même, σ = porte le nom de fréquence spatiale ou nombre
2π
2π
d’onde ; enfin, λ = est la période spatiale ou longueur d’onde. k et σ se mesurent
k
−1
en m et λ en mètre.
Afin de proposer une première généralisation des expressions (4.11), on peut introduire
le vecteur k = kex , justifiant le terme de vecteur d’onde ; si sa norme k désigne la
pulsation de l’oscillation spatiale, sa direction ex décrit le sens de la propagation.
OPPH
X On appellera onde plane progressive harmonique toute fonction de l’es-
pace et du temps prenant, au point r et à l’instant t, la forme complexe
f (r, t) = a exp [j (ωt − k · r)], où a = a0 exp(jϕ) est l’amplitude com-
plexe de l’onde, ω > 0 sa pulsation, et k = ku avec k > 0 et u2 = 1 est
le vecteur d’onde. u est la direction de propagation de l’OPPH et k sa
pulsation spatiale. Cette onde se propage dans le sens positif de l’axe u
avec la vitesse de phase vϕ = ω/k, vϕ = vϕ u.
76 Physique, MP, MP*
Le terme vitesse de phase est employé ici car cette vitesse intervient dans l’écriture
u·r
du terme de phase de l’onde f (r, t) = a exp ϕ (r, t), avec ϕ (r, t) = ω t − .
vϕ
∂ ∂ ∂ ∂
= jω = −jkx = −jky = −jkz (4.12)
∂t ∂x ∂y ∂z
Nous utilisons ici la notation complexe f ((r, t)) = a exp [j (ωt − k · r)] pour décrire
une onde plane ; toutefois, les grandeurs physiques (donc réelles) étudiées étant en
général données par Re(f (r, t)), il est a priori équivalent d’utiliser l’autre convention
g (r, t) = a exp [j (k · r − ωt)] ; dans ce cas, on n’oubliera pas de remplacer dans
∂ ∂
tous les calculs intermédiaires (complexes) les dérivées selon = −jω, = jkx ,
∂t ∂x
∂ ∂
= jky , = jkz ; en fin de calcul bien sûr, le retour aux parties réelles assure
∂y ∂z
que le sens physique ne change pas.
L’atténuation de l’amplitude des ondes lors de leur propagation peut avoir deux
origines, l’une géométrique et l’autre physique. Nous verrons par exemple dans le
cours d’optique qu’une onde lumineuse émise par une source ponctuelle s’écrit sous
a
la forme W (r, t) = exp [j (ωt − kr)] : cette onde voit son amplitude diminuer
r
comme l’inverse 1/r de la distance à la source et on parle de dilution géométrique
de l’amplitude de l’onde. Toutefois, il n’y a ici aucune diminution de l’énergie trans-
portée avec la distance : la puissance surfacique rayonnée est proportionnelle à
|W (r, t) |2 , donc à 1/r2 ; à travers une surface 4πr2 de sphère de rayon r, on
retrouve bien un transport de puissance constant. Par contre, en présence de phéno-
mènes dissipatifs (comme l’effet Joule, entre autres), on assistera à une diminution
plus rapide de l’amplitude de l’onde.
4 : Lignes électriques et propagation d’ondes 77
Les ondes que nous étudierons sont solutions d’autres équations différentielles, plus
ou moins semblables à l’équation de d’Alembert. Il n’existe alors pas forcément de
solution générale de l’équation de propagation ; on cherchera alors souvent à résoudre
directement sous la forme d’OPPH, ce qui revient à remplacer les dérivées par des
multiplications complexes, et donc à déterminer une relation simple entre k et ω ;
cette relation prend alors le nom d’équation de dispersion.
∂2f 1 ∂2f
2
Considérons par exemple l’équation de Klein-Gordon = 2 + ω0 f ,
∂x2 c ∂t2
que nous rencontrerons régulièrement lors de l’étude des ondes.
Si une OPPH de la forme f (r, t) = a exp [j (ωt − k · r)] vérifie cette équation, on doit
1
imposer la condition nécessaire −k2 f = 2 −ω 2 f + ω02 f , obtenue en remplaçant
c
chaque dérivée par la multiplication associée conformément à (4.12).
1
La solution f n’est pas nulle seulement si −k2 = 2 −ω 2 + ω02 , qui est l’équation
c
de dispersion recherchée. On résume ici la liste de quelques équations aux dérivées
partielles qu’on rencontrera régulièrement dans la suite du cours de Physique, et les
équations de dispersion associées :
∂2f 1 ∂2f ω2
d’Alembert : = k2 =
∂x2 c2 ∂t2 c2
∂2f 1 ∂f ω
Diffusion : = k 2 = −j
∂x2 D ∂t D
Ces équations fournissent k 2 sous forme d’un nombre réel éventuellement négatif, ou
sous forme d’un nombre complexe ; alors qu’on choisira toujours ω ∈ R+ , on se rend
compte qu’en général k ∈ C : on va voir que cette circonstance se traduit par une
absorption de l’onde.
D’autre part, la relation entre k et ω n’est en général pas linéaire ; on va voir que cette
circonstance se traduit par une dispersion de l’onde.
2 Absorption : considérons une OPPH de la forme f = a exp [j (ωt − kx)] où k
est complexe, k = kr + jki , avec kr > 0 et ki ∈ R. On peut encore recopier cette
expression sous la forme f = a exp [ki x] exp [j (ωt − kr x)], ce qui décrit un phénomène
ω
de propagation le long de l’axe (Ox) à la vitesse de phase vϕ = , mais avec une
kr
amplitude de l’onde A(x) = a exp [ki x] qui varie au fur et à mesure de la propagation.
Il existe des milieux amplificateurs, dans lesquels on observera une amplitude crois-
sante au fur et à mesure de la propagation (par exemple dans la cavité d’oscillation
d’un laser) ; toutefois, le cas le plus fréquent est celui des milieux absorbants pour
1
lesquels ki < 0. L’onde porte alors le nom d’onde évanescente et on notera δ = −
ki
la distance caractéristique de son atténuation :
x
f (x, t) = a exp − exp [j (ωt − kx)] (4.14)
δ
78 Physique, MP, MP*
Si l’onde se propage dans le sens contraire de l’axe (Ox), on trouvera de même kr < 0
et ki > 0 ; plus généralement, l’absorption de l’onde peut être immédiatement identi-
fiée si Re(k) × Im(k) < 0.
2 Dispersion : considérons maintenant une OPPH pour laquelle k est réel, mais
avec une relation ω = ω(k) non nécessairement linéaire. Dans un tel cas, la vitesse de
ω
phase vϕ = n’est plus une constante caractéristique de l’onde, mais une fonction
k
de la pulsation ω (ou du vecteur d’onde k) : on écrira en général vϕ = vϕ (ω).
Prenons l’exemple d’une onde vérifiant l’équation de Klein-Gordon présentée plus
haut, avec donc ω 2 − ω02 = c2 k 2 . Il n’y aura propagation (sans atténuation) que si
k ∈ R, donc si ω > ω0 (on dit que ω0 est une pulsation de coupure basse) ; nous nous
placerons dans ce cas pour calculer la vitesse de phase.
ω c
Celle-ci vaut vϕ = = p . Dans ce cas, les ondes de plus haute fréquence
k 1 − ω02 /ω 2
sont les plus lentes (avec une vitesse limite égale à c lorsque ω ≫ ω0 ), et une vitesse
limite infinie lorsque ω → ω0+ (mais l’équation de Klein-Gordon perd souvent son sens
physique au voisinage de la pulsation de coupure ω0 ).
Sur ce tracé, le point G correspond à δωt − δkxG = 2nπ (avec n ∈ Z) ; c’est un point
δω
qui vérifie donc xG = xG0 + t ; il désigne le maximum du groupe ou paquet d’onde,
δk
4 : Lignes électriques et propagation d’ondes 79
δω
et se déplace à la vitesse de groupe vg = . Par contre, le point Φ correspond à
δk
ωm
ωm t − km xΦ = 2mπ (avec m ∈ Z), soit xΦ = xΦ0 + t. Ce point, qui correspond à
km
ωm
une valeur particulière de la phase, se déplace à la vitesse de phase vϕ = .
km
Z +∞
Pour être plus général, on pourra noter f (x, t) = A(k) exp [j (ωt − kx)] dk une
k=−∞
onde décrite comme une intégrale de Fourier, avec, dans cette intégrale, ω = ω(k).
Nous nous limiterons alors à l’étude d’ondes pour lesquelles k reste voisin de k0 , la
répartition des amplitudes A(k) prenant la forme de la figure 4.4 : on parlera d’onde
quasi-monochromatique ou de paquet d’onde.
|A(k)|
∆k
b
k
k0
ω dω
vϕ = vg = (4.15)
k dk
On peut alors écrire ωt−kx = (ω0 +vg q)t−(k0 +q)x, avant de recopier l’expression de
Z +∞
l’onde f (x, t) = exp [j(ω0 t − k0 x)] A(q) exp [jq (vg t − x)] dq, qui apparaı̂t ainsi
q=−∞
comme le produit de deux termes :
• un terme de phase exp [j(ω0 t − k0 x)] = exp [jk0 (vϕ t − x)], qui se propage le long
de l’axe (Ox) à la vitesse de phase vϕ ; ce terme est périodique, avec une période
2π
spatiale λ0 = ;
k0
Z +∞
√
• un terme de groupe A(q) exp [jqξ] dq où ξ = vg t − x ; au facteur 1/ 2π
q=−∞
près, on reconnaı̂t une transformée de Fourier (inverse) de A(q), c’est-à-dire
2π
une certaine fonction F (ξ), de grande largeur (puisque ∆k est petit). Cette
∆k
fonction F (vg t − x) décrit aussi un terme qui se propage, mais à la vitesse de
groupe vg .
2π 2π
Puisque λ0 = ≪ , on peut proposer (figure 4.5) un tracé qualitatif de l’onde
k0 ∆k
quasi-monochromatique, faisant apparaı̂tre les deux termes et leur produit : l’onde
80 Physique, MP, MP*
terme de groupe
b vg
terme de phase
b vϕ
λ0
2π/∆k
On peut remarquer ici la relation vϕ vg = c2 . Cette relation, qui est une consé-
quence particulière de la seule équation de Klein-Gordon, ne doit en aucun cas être
généralisée.
2 Célérité limite : nous vérifierons aussi, à chaque fois que ce sera possible, les
relations (issues de la théorie de la Relativité) :
où c0 est la vitesse de la lumière dans le vide, qui est aussi la vitesse limite du transport
de l’énergie ; par contre, on pourra indifféremment trouver vϕ 6 c0 ou vϕ > c0 , car la
vitesse de phase n’est pas associée à un transport d’information ou d’énergie.
2 Le cas de l’équation de d’Alembert : si l’OPPH f (x, t) = exp [j (ωt − kx)] vérifie
∂2f 1 ∂2f 2 ω2
l’équation de d’Alembert = , on obtient la condition nécessaire k = ,
∂x2 c2 ∂t2 c2
donc les vitesses de phase et de groupe sont égales et constantes ; on dit alors que
l’onde n’est pas dispersée.
u(x, t) = u0+ exp [j (ωt − kx)] + u0− exp [j (ωt + kx)] (4.19)
u+ (x − ct) − u− (x + ct)
i(x, t) = (4.20)
Zc
82 Physique, MP, MP*
On peut alors étudier, selon les valeurs de l’impédance terminale Z(x = 0) disposée
en bout de ligne, distinguer trois cas particuliers :
• Si la ligne est ouverte à son extrémité, le courant i(0, t) est nul à tout instant donc
Z(x = 0) = ∞ et ru = 1. Il y a donc réflexion totale, sans déphasage, de l’onde
de tension incidente.
On remarque aussi bien sûr que ri = −1 ; le courant réfléchi annule, en x = 0,
le courant incident pour assurer l’annulation du courant en bout de ligne.
• Si la ligne est court-circuitée à son extrémité, la tension u(0, t) est nulle à tout
instant donc Z(x = 0) = 0 et ru = −1. Il y a donc réflexion totale avec
déphasage de π de l’onde de tension incidente.
On remarque encore que ri = +1 ; tout le courant incident repart, sans dépha-
sage, après passage par ce court-circuit.
• Enfin, on peut assurer l’absence de réflexion en imposant ru = 0 donc ri = 0, ce
qui impose Z(x = 0) = Zc ; il faut brancher en bout de ligne une résistance de
valeur égale à l’impédance caractéristique de la ligne.
b b b b
b
R b b R b
câble, Zc = R R
b b b
b
b
x=0 x=ℓ
Étage électronique
Dans un tel montage, l’impédance terminale R est adaptée au câble et il n’y a donc
pas d’onde réfléchie ; de plus, l’impédance du câble vu de son entrée x = 0 est égale
à l’impédance terminale x = ℓ ; le générateur (( voit )) donc une impédance de charge
égale à R, et transfère donc une puissance maximale à ce câble.
84 Physique, MP, MP*
2 Formation d’ondes stationnaires par réflexion : on considère ici une ligne électrique
alimentée en régime harmonique, le générateur situé en x < 0 imposant dans la ligne
une onde de tension incidente ui = u0 exp [j (ωt − kx)] ; un choix adapté de l’origine
des temps permet d’imposer u0 ∈ R+ .
Un dispositif réfléchissant situé en x = 0 assure une réflexion au moins partielle de
l’onde, avec le coefficient de réflexion ru = ρ exp (jϕ), où ρ 6 1. On constate donc
l’apparition d’une onde réfléchie, ur = ru u0 exp [j (ωt + kx)].
L’onde de tension totale dans la ligne peut donc se mettre sous la forme u = ui + ur ,
que l’on décomposera en une somme u = (1 − ρ)u0 exp [j (ωt − kx)] + us , où on a fait
apparaı̂tre us = ρu0 exp [jωt] {exp [−jkx] + exp [jkx + ϕ]}.
Le premier terme u = (1−ρ)u0 exp [j (ωt − kx)] est une onde progressive, qui disparaı̂t
en cas de réflexion totale (ρ = 1). Le second terme peut, lui, se mettre sous la forme
us = 2ρu0 exp [jϕ/2] exp [jωt] cos (kx + ϕ/2), et la tension réelle correspondante vaut
donc Re(us ) = 2ρu0 cos (ωt + ϕ/2) cos (kx + ϕ/2).
La séparation des dépendances en x et t permet d’identifier cette tension comme une
onde stationnaire : la vibration de us (x, t) se fait sur place, sans propagation : cette
onde est en effet la résultante de deux ondes progressives de même amplitude ρu0 , se
propageant en sens inverse. Plus généralement :
f (x, t) = f0 [cos (ωt − kx) + cos (ωt + kx)]
Onde stationnaire : (4.24)
f (x, t) = 2f0 cos (ωt) cos (kx)
tension à t
x
tension à t′
tension minimale
λ/2
En tout point de la ligne tel que cos (kx + ϕ/2) = 0, la tension est en permanence
nulle ; on parle de nœuds de vibration. Deux nœuds consécutifs sont donc séparés d’une
π λ
distance égale à = .
k 2
De même, en tout point de la ligne tel que cos (kx + ϕ/2) = ±1, la tension oscille
avec une amplitude maximale, égale à 2ρu0 ; on parle de ventres de vibration. Deux
λ
ventres consécutifs sont également séparés de .
2
4 : Lignes électriques et propagation d’ondes 85
2 Cavités résonantes : considérons enfin une onde stationnaire, écrite sous la forme
f (x, t) = f0 cos (kx + ϕ) cos ωt, disposée dans ce qu’on appelle une cavité résonante
de longueur L, c’est-à-dire un intervalle [0 , L] de l’axe (Ox) avec les conditions aux
limites f (x = 0, t) = f (x = L, t) = 0, ∀t.
On peut rencontrer des cavités résonantes avec bien d’autres conditions aux limites
que la simple annulation aux deux extrémités de la cavité ; l’étude faite ici est
seulement limité au cas le plus simple.
On peut illustrer la notion de cavité résonante dans le cadre optique (une onde lu-
mineuse entre deux miroirs ; nous montrerons ultérieurement qu’un miroir métallique
86 Physique, MP, MP*
n=1
λ/2
b b
x
n=3
n=7 b b
λ/2
λ
L=n (4.25)
2
L’interprétation physique du nombre entier n est alors claire (voir la figure 4.8 par
exemple) : la longueur de la cavité est un nombre entier de demi-longueurs d’onde.
On voit graphiquement que cette condition est obligatoirement vérifiée pour imposer
une double annulation de l’onde aux deux extrémités de la cavité.
2 Puissance : dans une ligne électrique le long de laquelle circule une onde de
tension et de courant, on peut déterminer la puissance électrique fournie à l’abscisse
x de la ligne par l’ensemble de ce qui se trouve avant cette abscisse (le générateur
et une partie de la ligne), en écrivant P (x, t) = u(x, t)i(x, t) ; la figure 4.9 montre en
effet que ces grandeurs sont définies en convention générateur pour cet ensemble.
b
b
i(x, t)
ligne électrique u(x, t)
b
b
Les expressions (4.18) et (4.20) montrent que la puissance transportée par la ligne
1
u2 (x − ct) − u2− (x + ct) .
peut se mettre sous la forme instantanée P (x, t) =
Zc +
4 : Lignes électriques et propagation d’ondes 87
Cette expression montre que les ondes incidente et réfléchie transportent de la puis-
sance indépendamment l’une de l’autre dans les deux sens de propagation ; on pourrait
u2 (x − ct) u2 (x + ct)
par exemple poser P+ (x, t) = + et P− (x, t) = − − .
Zc Zc
Si on utilise une notation complexe avec les expressions (4.19) et (4.21), la puissance
1
moyenne transportée hP i = Re (ui∗ ) s’écrit de même comme une différence de deux
2
|u |2 − |u0− |2
termes, hP i = 0+ ou, en fonction du coefficient de réflexion en x = 0,
2Zc
|u |2
hP i = 0+ 1 − |ru |2 .
2Zc
On définit alors un coefficient de réflexion énergétique R par R = |ru |2 = |ri |2 ; la
puissance totale transportée par l’onde s’annule dans le cas de la réflexion totale,
R = 1. Au contraire, R = 0 dans le cas où la ligne est adaptée à son impédance
terminale ; dans ce cas, aucune puissance n’est réflechie, et toute la puissance de
l’onde incidente est donc dissipée dans cette impédance terminale.
Dans tous les cas, cette puissance transportée ne dépend pas de x : la propagation
dans la ligne ne s’accompagne d’aucune perte d’énergie, puisque le modèle utilisé fait
abstraction de tout terme dissipatif.
2 Ligne avec pertes : reprenons enfin l’étude d’une ligne électrique, avec de faibles
pertes en ligne : nous supposerons donc que Gu = 0 mais nous prendrons en compte
le terme Ru , tout en admettant que son influence reste faible. Les équations des
∂u ∂i ∂i ∂u
télégraphistes deviennent alors = −Ru i−Lu et = −Cu soit, en notations
∂x ∂t ∂x ∂t
−jku + (Ru + jLu ω)i = 0
complexes, le système ; ce système homogène a une
jCu ωu − jki = 0
solution triviale (u = 0, i = 0). Si on veut qu’une onde non nulle se propage dans
la ligne, on devra donc imposer l’annulation de son déterminant, ce qui fournit une
ω2
relation entre ω et k qui n’est autre que la relation de dispersion, −k 2 + 2 = jRu Cu ω.
c
Le terme imaginaire jRu Cu ω étant supposé faible, la solution sera proche de k = ±ω/c
qui correspond à l’absence de pertes. Nous choisirons de poser k = k0 (1 − jǫ) avec
k0 > 0 (ce qui correspond à un choix de sens de propagation) et |ǫ| ≪ 1 ; le signe −
permet d’espérer une solution telle que ǫ > 0, donc Re k × Im k < 0, ce qui décrit
l’absorption de l’onde par dissipation progressive de son énergie par effet Joule.
ω2
On obtient alors k02 (1 − 2jǫ) ≃ 2 − jRu Cu ω ; on en déduit bien que k0 = ω/c
c
Ru
correspond au terme de propagation, tandis que ki = −ǫk0 = < 0. On observera
2Zc
2Zc
bien une onde évanescente, avec une longueur caractéristique d’atténuation δ = .
Ru
Reprenant enfin les ordres de grandeur précédemment cités, une ligne de résistance
par unité de longueur Ru = 1, 7 Ω · m−1 et d’impédance caractéristique Zc = 50 Ω
sera caractérisée par une atténuation de l’onde d’un facteur 1/e ≃ 0, 37 au bout
d’une longueur δ ≃ 59 m. Après quelques centaines de mètres de câble électrique
(( ordinaire )), il est indispensable d’utiliser un dispositif réamplifiant le signal. C’est
là par exemple l’origine de la limite de longueur dans une connexion poste à poste
dans un réseau informatique câblé.
88 Physique, MP, MP*
L’onde lumineuse
5.1.1 Historique
2 Lumière et géométrie : la lumière se propage, dans un milieu homogène, en ligne
droite depuis sa source (le Soleil, une lampe) jusqu’à sa réception dans un détecteur
photosensible (l’œil, une photodiode, etc.). Ce fait, qui est aujourd’hui connu de tous,
n’était pas évident pour les penseurs de l’Antiquité.
On doit cette affirmation aux penseurs arabes du moyen-âge, et notamment au ma-
thématicien et physicien irakien ibn al-Haytam (Alhazen) à qui on attribue la pre-
mière affirmation des lois de la réflexion et de la réfraction. On attribue aujourd’hui
la paternité de la redécouverte de ces lois au français Descartes et au néerlandais
Snell Van Royen.
L’anglais Newton contribua à fonder l’optique moderne dans son ouvrage, Opticks,
publié en . On y trouve une description de nombreux phénomènes lumineux,
comme l’arc-en-ciel ou les interférences lumineuses, ainsi que des spéculations sur la
nature de la lumière, hésitant entre une conception purement corpusculaire et une
théorie vibratoire.
Séparément, les physiciens Huygens‡ , Young‡ et Fresnel‡ développent une théorie
purement ondulatoire, qui est pratiquement celle que nous étudions ici.
2π
d’onde) et ω = . La vitesse de propagation associée (en fait, la vitesse de phase de
T
ω λ
l’onde lumineuse) est alors vϕ = = .
k T
La théorie ondulatoire de Huygens et Fresnel permet de décrire les phénomènes de
réflexion et de réfraction en considérant seulement que la vitesse de phase dépend du
milieu considéré. Adoptant les notations actuelles, on notera cette vitesse de phase :
c0
vϕ = c = c0 = 2, 99792458 × 108 m · s−1 (5.1)
n
où c0 est la vitesse de la lumière dans le vide, et n, qui porte le nom d’indice optique
du milieu étudié, est une caractéristique du milieu. On a déjà eu l’occasion d’affirmer
que vϕ n’est pas forcément inférieur à c0 ; toutefois, dans le domaine optique, on a
toujours n > 1 dans les milieux transparents. La figure 5.1 présente une justification
simple des lois de la réfraction, dans un modèle (( mécanique )) de propagation d’onde.
λ1
v2
b n2
ℓ θ2 z
n1
θ1
b
λ2
(R)
v1
même pulsation si le montage est linéaire. Il existe bien sûr en Optique des milieux
non linéaires, susceptibles de produire des ondes de pulsation ωs différente de la
pulsation imposée à l’entrée ωe . Le domaine de l’optique non linéaire, vaste et en
plein développement, ne nous concerne pas cette année.
2πv
Enfin, pour une onde de vitesse v, λ = ; d’autre part, on posera ici encore v = c/n,
ω
λ1 n2
c étant une vitesse arbitraire. On en déduit donc = .
λ2 n1
On retrouve donc bien la loi de Snell-Descartes de la réfraction :
On peut regretter l’abus de langage courant qui consiste à parler de longueur d’onde
(sans préciser dans le vide) pour cette valeur λ0 . Ici et dans toute la suite, on
n’utilisera que la seule grandeur λ0 , même si elle est parfois notée λ.
Le (( verre optique )) dans ce tableau décrit en fait de nombreux matériaux : les verres
ordinaires (dits verres crown en Optique), essentiellement constitués de Silice SiO2
(70%) et d’oxydes de Sodium (Na2 O, 15%) et de Calcium (CaO, 10%), les verres au
plomb (dits verres flint en Optique et improprement appelés cristal en verrerie, avec
remplacement de l’oxyde de calcium par l’oxyde de Plomb PbO), les verres borosili-
catés (avec adjonction d’oxyde de Bore B2 O3 comme le Pyrex), etc.
Les verres optiques et les autres matériaux transparents ne sont pas seulement carac-
térisés par leur indice mais aussi par le comportement de celui-ci en fonction de la
dn
longueur d’onde λ0 . On définit par exemple la dispersion ; celle-ci est en pratique
dλ0
94 Physique, MP, MP*
B C
n(λ0 ) = A + + 4 (5.3)
λ20 λ0
b b
b
∆θ
b b
b ∆θ
b b
Diffraction de la lumière
X La diffraction est un écart aux lois de propagation de l’optique géomé-
trique, qu’on observe lorsque une onde lumineuse traverse une ouverture
de faible dimension a, ou lorsqu’elle est réfléchie par un dispositif de
faible dimension a :
• lorsque a ≫ λ0 , on peut négliger la diffraction et traiter la propagation
dans le cadre de l’optique géométrique ;
• lorsque a et λ0 sont comparables, la diffraction devient significative et
l’ouverture angulaire ∆θ est de l’ordre de grandeur de λ0 /a ;
• enfin, lorsque a ≪ λ0 , la diffraction se fait dans toutes les directions
et l’obstacle peut être considéré comme une source de lumière isotrope.
2 Interférences : un autre phénomène qu’on peut considérer comme une preuve di-
recte du caractère ondulatoire de la lumière réside dans l’observation des interférences
lumineuses. On observe cette situation lorsque deux ondes lumineuses (ou plus), issues
d’une même source, peuvent parvenir au même point en suivant des chemins différents
(cf. figure 5.3 à gauche).
La source S éclaire le point M via deux dispositifs D1 et D2 , déviant la lumière dans
la direction de la zone d’observation. Si on étudie alors le comportement, au cours du
temps, des deux ondes lumineuses qui se superposent en M , on peut observer diverses
situations :
• si le déphasage entre les deux ondes, tel qu’il résulte de la différence de trajet, est
faible (représentation correspondant à la figure 5.3 à droite, en haut), la somme
96 Physique, MP, MP*
D1
t
b
Sb M Interférences constructives
D2
Interférences destructives
des deux ondes qu’on observe en M a une amplitude élevée : on observe une
quantité importante de lumière. On parle alors d’interférences constructives ;
• si au contraire ce déphasage est proche de π (figure 5.3 à droite, en bas), la somme
des deux ondes en M a une amplitude faible (ou nulle) : on n’observe que peu
de lumière. On parle d’interférences destructives.
L’observation de l’alternance de zones sombres et claires, qu’on appelle franges d’in-
terférence, constitue à la fois une preuve du caractère ondulatoire de la lumière et une
méthode métrologique adaptée à la mesure très précise de faibles dimensions.
Interférences lumineuses
X La superposition en un même point de plusieurs ondes provenant d’une
même source peut conduire à la formation de franges d’interférence, jux-
taposition de zones alternativement sombres et claires.
On observe aussi la différence de contraste (le contraste désigne l’écart relatif de lu-
minosité entre franges claires et franges sombres) dans le cas des figures d’interférence
5 : L’onde lumineuse 97
de la figure 5.5 ; il s’agit dans les deux cas du même dispositif interférentiel mais les
franges (quasiment circulaires ici) sont bien contrastées à gauche, très peu à droite.
2 Polarisation : on classe habituellement les ondes de toutes natures en deux ca-
tégories : les ondes longitudinales, lorsque la grandeur oscillante vibre le long de la
direction de propagation, et les ondes transverses, lorsque cette grandeur oscillante
vibre perpendiculairement à la propagation.
Dans le cas des ondes sismiques par exemple, on peut rencontrer simultanément les
deux types de vibration ; les ondes longitudinales sont des ondes de compression et
les ondes transverses des ondes de cisaillement ; on peut illustrer cette différence de
comportement au moyen d’un modèle de déformation d’un milieu continu, représenté
par une succession de masses ponctuelles en interaction élastique (fig. 5.6).
b
b
b b b b b b b b
b
b
Onde de compression Onde de cisaillement
Dans le cas des ondes lumineuses, l’identification n’est pas aussi facile ; ce sont les
phénomènes de polarisation qui ont permis cette identification.
On doit leur première description à Huygens‡ et leur première étude quantitative au
français Malus. On se contentera ici de dire qu’un même rayon lumineux, incident
sur certains types de cristaux transparents (par exemple la calcite, qui porte le nom de
spath d’Islande lorsqu’elle est transparente), peut donner lieu à deux rayons émergents
(figure 5.7). On parle de rayon extraordinaire pour celui qui subit une réfraction, même
en incidence normale.
Cristal
La présence de deux ondes différentes transportées sur une même direction de pro-
pagation suggère une interprétation en terme d’ondes transverses ; donc un caractère
vectoriel de l’onde lumineuse.
Ainsi, on peut imaginer que, si une onde lumineuse se propage selon la direction ez ,
elle peut avoir deux composantes vectorielles, dirigées selon ex et ey , et qui peuvent se
propager indépendamment. Dans un milieu cristallin, les deux axes (Ox) et (Oy) ne
sont pas nécessairement équivalents et on peut imaginer deux vitesses de propagation
différentes.
Nous ferons la majorité des études ultérieures en Optique dans le cas des milieux
fluides ou des solides amorphes (verres), c’est-à-dire isotropes ; ainsi, la polarisation
ne se manifestera que rarement. Nous préciserons ultérieurement le cadre d’étude
de l’optique, vectoriel (seulement si c’est nécessaire, en présence de phénomènes de
polarisation) ou non (on parlera d’approximation scalaire de l’Optique).
98 Physique, MP, MP*
2 La couleur : les récepteurs d’ondes lumineuses ne sont pas sensibles aux ondes
lumineuses (ou plus généralement aux ondes électromagnétiques) de la même façon
selon la pulsation ω ou, ce qui revient au même, selon la longueur d’onde dans le vide
2πc0
λ0 = de ces ondes. On peut aussi dire qu’ils se comportent comme des filtres,
ω
sélectionnant telle ou telle longueur d’onde, et donc caractérisés par des fonctions de
transfert variées.
Ainsi, l’œil humain dispose de quatre types de récepteurs lumineux disposés dans le
plan de la rétine. Les bâtonnets, situés surtout en périphérie de la rétine, permettent
de percevoir la luminosité et le mouvement ; sensibles aux faibles intensités, ils sont
les seuls à être utilisés pour la vision de nuit.
Les cônes, situés surtout dans un zone appelée fovéa, permettent de différencier les
couleurs. Il existe chez l’homme trois types de cônes :
– sensibles surtout dans le rouge (avec un maximum de sensibilité pour λ0 = 570 nm) ;
– sensibles surtout dans le vert (sensibilité maximum pour λ0 = 535 nm) ;
– sensibles surtout dans le bleu (sensibilité maximum pour λ0 = 445 nm).
Ces trois types de cellules photosensibles n’ont pas la même sensibilité aux variations
d’intensité lumineuse ; en particulier, l’œil humain moyen présente une sensibilité
maximale aux alentours de λ0 = 555 nm, dans le jaune. C’est d’ailleurs pour rendre
compte de cette sensibilité particulière que le système international définit des unités
spécifiques pour la mesure des intensités, flux et éclairement lumineux (ces définitions
ne sont pas au programme) ; le candela est l’intensité lumineuse I d’une source à
λ0 = 555 nm qui émet une puissance par unité d’anglessolide dP/dΩ = 1/683 W·sr−1 ;
le lumen est l’unité de flux lumineux intégré, Φ = IdΩ ; enfin, le lux est l’unité
dΦ
d’éclairement, flux par unité de surface, E = .
dS
Les mesures photométriques porteront, selon se cas, sur l’intensité énergétique I
(mesurée en W·m−2 ), ou bien sur l’éclairement E (mesuré en lux, symbole lx). Dans
le cadre de notre programme, il nous suffit de savoir que ces deux grandeurs sont
toujours proportionnelles pour une longueur d’onde donnée, mais que le coefficient
de proportionnalité dépend de la longueur d’onde.
400
446
500
542
578
600
700
λ0 (nm)
b b b b b b b
orange
violet
rouge
jaune
bleu
vert
b b b b b b b
8 × 10−7
4 × 10−7
λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques
Rayons X
Rayons γ
Rayons
Ondes
Micro
ondes
radio
U.V.
Lumière
I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014
4 × 1014
ν (Hz)
signal que plus tard, lorsqu’il sera rejoint par le signal qui voyage à la vitesse vϕ , donc
à l’instant t′k défini par la condition d’arrivée xR,k = x0 + vR t′k = xS,k + vϕ (t′k − tk ).
vϕ − vS
On en déduit t′k = tk ; la période apparente de réception est T = t′k+1 −t′k pour
vϕ − v R
vϕ − v S
le récepteur, d’où la relation T = T0 : la modification de période apparente
vϕ − v R
du signal porte le nom d’effet Doppler-Fizeau.
On remarque la compatibilité de la relation obtenue avec la mécanique classique :
cette relation ne dépend pas du choix du référentiel galiléen (K), puisqu’une vitesse
d’entraı̂nement commune ve transforme toutes les vitesses v en v ′ = v + ve et laisse
donc la relation ci-dessus inchangée.
vS
Par exemple, pour un récepteur fixe et une source mobile, on note β = la vitesse de
vϕ
la source rapportée à celle de l’onde, et la pulsation apparente de réception ω = 2π/T
ω0
est reliée à la pulsation d’émission par la relation ω = . Lorsque la source se
1−β
rapproche du récepteur, β > 0 et ω > ω0 (décalage vers les hautes fréquences) ; au
contraire, lorsque la source s’éloigne du récepteur, β < 0 et ω < ω0 (décalage vers
les basses fréquences). Cet effet est mis à profit dans le cas des ondes sonores pour
effectuer des mesures de vitesse.
2 Le cas des ondes lumineuses : les ondes lumineuses (ou des ondes électroma-
gnétiques, de façon plus générale) ne peut être traité dans le cadre de la mécanique
classique, mais dans celui de la théorie relativiste, puisque la vitesse des ondes étu-
diées est c = c0 /n ∼ c0 . Toutefois, on peut montrer que l’expression précédente reste
valable lorsque la vitesse relative de l’émetteur et du récepteur reste faible devant
celle c de la lumière.
Ainsi, si une source S s’éloigne, dans le vide, du récepteur R avec une vitesse v, la
100 Physique, MP, MP*
v
f0
θ z
b b
S R
Figure 5.9 – Effet Doppler-Fizeau et ondes lumineuses
composante d’éloignement radiale étant donnée par vz = −v cos θ (cf. figure 5.9), on
peut montrer que la pulsation d’émission ω0 (mesurée dans le référentiel de l’émetteur)
et la pulsation apparente de réception ω (mesurée par le récepteur R) sont reliées par
la relation ω ≃ ω0 (1 − v cos θ/c0 ).
La vitesse c0 étant d’autre part un invariant (c’est-à-dire qu’elle ne dépend pas du
référentiel galiléen utilisé), la longueur d’onde varie, au même ordre d’approximation,
en proportion inverse, λ ≃ λ0 (1 + v cos θ/c0 ). Un éloignement (v > 0) se traduit
donc par une augmentation de longueur d’onde apparente (décalage vers le rouge)
et un rapprochement par une diminution de celle-ci (décalage vers le bleu). Cet effet
trouve son application dans le cadre de l’Astrophysique (pour la mesure des vitesses
radiales d’éloignement des astres et galaxies) mais aussi pour la mesure des vitesses
des véhicules, l’effet Doppler-Fizeau s’appliquant aussi aux ondes radar.
2 Les photons : les travaux de Planck furent complétés en par ceux d’Einstein,
interprétant l’effet photoélectrique comme une interaction individuelle (et non plus
collective, comme dans une source thermique) entre les électrons d’un métal et des
particules individuelles, appelées ultérieurement photons, présentes dans tout flux lu-
mineux. L’énergie individuelle de ces particules est justement le terme ǫ = hν décrit
par Planck.
D’autres expériences mirent ultérieurement en évidence toutes les caractéristiques mé-
caniques de ces particules, obligeant à adopter une double description (on parle de
dualité onde-corpuscule de la lumière. L’extension par De Broglie de cette descrip-
tion aux particules matérielles est à la base de la théorie quantique.
Les photons se déplacent à la vitesse c0 , qui est celle de la lumière dans le vide. On
doit donc impérativement les décrire dans le cadre relativiste.
Dans ce cadre, on peut montrer que toute particule de masse m et de vitesse v
mv
possède une quantité de mouvement (ou impulsion) p = p et une énergie
q 1 − v 2 /c20
E = p2 c2 + m2 c40 . Ces relations générales admettent deux limites, respectivement
à des vitesses faibles ou voisines de c0 :
5 : L’onde lumineuse 101
dI
546 nm
dλ0
577 nm
579 nm
405 nm
436 nm
492 nm
λ0
2 Sources thermiques : lorsque l’émission lumineuse ne s’effectue pas dans une va-
peur peu dense et transparente, mais à la surface d’un solide, les échanges d’énergie
entre l’émetteur et le rayonnement sont collectifs et décrits par un modèle statistique.
Dans le cas limite du corps noir idéal (qui sera décrit dans le cours d’Électromagné-
tisme), on prévoit un spectre énergétique continu d’émission, dont la forme générale
102 Physique, MP, MP*
dI
dλ0
98 % × Itotal
λm /2
8λm
λ λ0
b m
Cône d’ombre
Soleil
bT T1 b
2
o r b ite de I
o
Jupiter
∂2E ∂2B
∆E = ε0 µ0 ∆B = ε0 µ0 (5.5)
∂t2 ∂t2
1
avec pour vitesse de propagation c0 = √ ≃ 3, 0 × 108 m · s−1 . Sur la base de cette
ε0 µ0
identification numérique, Maxwell proposa d’interpréter les ondes lumineuses comme
un cas particulier d’ondes électromagnétiques, affirmant ainsi que le lumière consiste
en ondulations transverses du support des phénomènes électriques et magnétiques,
c’est-à-dire en fait de ce qu’on identifie aujourd’hui comme l’espace vide lui-même.
2 Géométrie du champ électromagnétique : nous admettrons provisoirement les pro-
priétés du champ électromagnétique associé à une onde lumineuse se propageant dans
un milieu transparent d’indice n ; ces propriétés seront établies dans le cours d’Élec-
tromagnétisme.
L’onde électromagnétique plane progressive décrite sur la figure 5.13 se propage dans
la direction de l’axe (Ox) ; elle a pour vecteur d’onde k = kex , pour pulsation ω avec
c0 ω
pour vitesse de phase vϕ = = .
n k
Les champs électrique et magnétique sont en permanence perpendiculaires à la direc-
tion de propagation : il s’agit d’ondes transverses. L’onde représentée sur la figure 5.13
est de plus polarisée rectilignement selon (Oy), c’est-à-dire que le champ électrique
oscille au cours du temps tout en gardant une direction fixe ; nous verrons ultérieu-
rement que ce n’est pas un cas général puisque la direction de E peut être variable
dans le plan (Oyz). On notera (sur la figure 5.13, E0 = E 0 ey ) :
z
y
B(t′ )
t′ > t
E(t′ )
E(t) E∧B
x
B(t)
n
B= ex ∧ E0 exp [j (ωt − kx)] (5.7)
c0
Les expressions (5.6) et (5.7) sont évidemment des notations complexes, commodes
pour le calcul mais dépourvues de sens direct ; on pourra les remplacer, pour une
interprétation physique, par l’étude des champs électrique et magnétique réels, à savoir
E = Re (E) et B = Re (B).
E∧B
R= (5.8)
µ0
E ∧ B∗
1
hRi = Re (5.10)
2 µ0
La puissance
x moyenne transportée par l’onde à travers une surface (S) s’écrit alors
hP i = hRi · ndS. Au vu de 5.6 et 5.7, et puisque E ∧ (ex ∧ E∗ ) = ex E · E∗ , on
(S)
n
écrira encore le vecteur de Poynting moyen hRi = Re (E · E∗ ) ex .
2µ0 c0
où le vecteur J est un vecteur complexe, unitaire, appelé vecteur de Jones. Ce vec-
teur permet de déterminer la direction du champ électrique réel et fournit donc une
nomenclature simple de tous les états de polarisation possibles.
1
2 Polarisation rectiligne : considérons d’abord le cas simple où J = , donc aussi
0
E = E 0 ey exp [j (ωt − kx)] et E = Re (E) = |E 0 |ey cos (ωt − kx + arg(E 0 )) : il s’agit
d’un champ identique à celui représenté sur la figure 5.13, avec une direction fixe pour
le champ électrique, alignée sur l’axe (Oy) : on parle de polarisation rectiligne.
106 Physique, MP, MP*
t )′
rc
E(
ire droite
ω(t′ − t)
u la
x E(t) y x y
i re g a u
b b
E( ω(t − t) ′ E(t)
ula
t ′) he
circ
c
1 1 1 1
J= √ J= √
2 j 2 −j
1 1 1 1 1 1
De même, = √ √ +√ ; toute onde polarisée rectiligne-
0 2 2 j 2 −j
ment est la superposition de deux ondes polarisées circulairement en sens inverse.
2 Polarisation elliptique : revenons maintenant au cas le plus général d’un vecteur
de Jones quelconque, ses deux composantes étant de norme et de phase arbitraires.
On peut choisir l’origine des durées pour rendre réelle l’une des composantes (nous
la noterons
A ∈ R+ +
) mais pas l’autre (notée donc B exp (jϕ) avec B ∈ R ) ; ainsi,
A
J= donc le champ électrique réel a pour composantes instantanées
B exp (jϕ)
Ex = E0 A cos (ωt − kx) et Ey = E0 B cos (ωt − kx + ϕ). C’est l’équation paramé-
trique d’une ellipse, dont les grand et petit axes ainsi que le sens de parcours dé-
pendent des valeurs de A, B et ϕ.
La polarisation la plus générale d’une onde électromagnétique est donc une polarisa-
tion elliptique, dont les cas rectiligne et circulaire ne sont que des dégénérescences.
Sous réserve de choisir les axes (Oy) et (Oz) alignés avec respectivement de grand
axe (de longueur 2a) et le petit axe (de longueur 2b) del’ellipse, le vecteur
de Jones
1 a cos α
le plus général peut alors être écrit J = √ ou encore J = ,
a2 + b2 ǫjb ǫj sin α
avec ǫ = ±1 et 0 6 α 6 π/2. En effet, le champ électrique correspondant a pour com-
posantes Ey = E0 cos α cos (ωt − kx) et Ey = ∓E0 sin α sin (ωt − kx), qui correspond
à une vibration de polarisation elliptique droite (ǫ = −1) ou gauche (ǫ = +1), sauf si
α = 0 ou π/2 (polarisation rectiligne) ou si α = π/4 (polarisation circulaire).
2 Polarisation naturelle : la plupart des sources lumineuses naturelles (en particu-
lier, les sources thermiques et les lampes spectrales) émettent des ondes qui sont la
superposition aléatoire d’un grand nombre d’ondes indépendantes, de polarisations
différentes. Il n’est en général pas possible de suivre les évolutions de la direction du
champ électrique E dans le plan de polarisation ; cette direction semble évoluer de
manière aléatoire dans ce plan.
Dans une telle situation, on parle de polarisation naturelle ; on dit encore que la
lumière observée est non polarisée. On n’observera donc d’effets liés à la polarisation
de l’onde électromagnétique qu’en présence de dispositifs polarisants, ou en présence
de sources particulières (les lasers sont des sources de lumière polarisée).
(P)
(P)
(I)
(I)
de polyvinyle étirée mécaniquement. Les chaı̂nes polymères longues sont alors étirées
et des molécules polarisables (de l’iode I2 ) sont alors fixées le long de ces chaı̂nes,
provoquant l’absorption de lumière dans la direction d’alignement.
Dans les deux cas, on peut décrire l’effet d’un polariseur rectiligne idéal comme une
projection du vecteur de Jones sur la direction du vecteur u. On peut décrire cette
projection par une matrice de Jones ; par exemple, pour un polariseur qui aligne le
champ électrique sur la première direction (Oy) du plan de polarisation, la matrice
1 0
de Jones du polariseur est [M ] = et le polariseur transforme la polarisation
0 0
définie par J en une polarisation définie par J′ = [M ]J.
2 Analyseur et loi de Malus : un polariseur rectiligne de direction de polarisation
quelconque dans (Oyz), u = cos θey + sin θez est caractérisé par J′ =
u (J · u) donc,
cos2 θ cos θ sin θ
après calcul, par la matrice de Jones [M ] = .
cos θ sin θ sin2 θ
Analyseur
Lumière à analyser
Mesure de I
Polariseur
Un tel dispositif peut être utilisé pour déterminer la nature de la polarisation d’une
onde quelconque qui traverse ce polariseur, sous réserve d’effectuer une mesure d’in-
tensité (ou d’éclairement, ce qui revient au même) après traversée de ce polariseur
(( tournant )). L’ensemble (polariseur rectiligne et mesure de lumière) porte le nom
d’analyseur et est représenté sur la figure 5.16.
Considérons d’abord le cas où la lumière à analyser est polarisée ; nous
considérerons
le
cos α
cas général d’une polarisation elliptique de vecteur de Jones J = . Après
±j sin α
passage par l’analyseur, le champ électrique est proportionnel au vecteur de Jones
cos θ
[M ]J = (cos α cos θ ± j sin α sin θ) . L’intensité lumineuse mesurée sera alors
sin θ
proportionnelle à E · E , donc à | cos α cos θ ± j sin α sin θ|2 = sin2 α + cos 2α cos2 θ.
∗
Le tracé de la courbe donnant I(θ) = I0 sin2 α + cos 2α cos2 θ est reporté sur la figure
5.17 dans trois cas : α = 0 (polarisation rectiligne), α = π/4 (polarisation circulaire)
et α quelconque (polarisation elliptique). L’étude des variations de I(θ) nous renseigne
donc sur la nature de la polarisation étudiée. Dans le cas d’une polarisation rectiligne
(α = 0), la relation I(θ) = I0 cos2 θ porte le nom de loi de Malus de la polarisation.
Considérons à nouveau ci-dessus l’exemple de la polarisation circulaire. Le champ
électrique tournant rapidement, avec une longueur constante, dans le plan d’analyse,
il est naturel d’obtenir une projection moyenne constante sur toute direction u du plan
(Oyz). Cependant, on obtiendrait le même résultat en projetant sur le même vecteur
5 : L’onde lumineuse 109
I(θ)
Polarisation rectiligne
Polarisation
circulaire
Polarisation
elliptique θ
π 2π 3π 4π 5π
Approximation scalaire
X Lorsqu’un dispositif optique n’introduit aucun effet de polarisation et est
utilisé en lumière non polarisée, on remplace l’étude du champ électro-
magnétique (E (r, t) , B (r, t)) par celle d’une grandeur vibrante unique,
appelée grandeur lumineuse, que nous noterons W (r, t).
L’onde lumineuse
X Dans le cadre de l’approximation scalaire, l’onde lumineuse est une gran-
deur vibrante, W (r, t) ; l’intensité I et l’éclairement E sont proportion-
nels à la moyenne temporelle W 2 (r, t) du carré de cette grandeur.
1 ∂2
∆W (r, t) = W (r, t) (5.12)
c2 ∂t2
5 : L’onde lumineuse 111
ω2
∆w(r) = − w(r) (5.13)
c2
ω
Dans cette expression, le vecteur d’onde k dans le milieu étudié vérifie k = tandis
c
ω 2π
que, pour une onde de même fréquence dans le vide, on écrirait k0 = = . On
c0 λ0
c0
pourra donc faire intervenir l’indice optique n = sous la forme :
c
ω 2π
k = nk0 = n avec k0 = (5.14)
c0 λ0
n2
θ2
θ1′ z
n1
θ1
Cette relation doit être vérifiée ∀(x, y) ; les fonctions x 7→ exp (ax) pour diverses
′
valeurs de a formant une famille libre, cette relation impose k1y = k2y = 0, mais aussi
′ n 1 ω
k1x = k2x = sin θ1 : on dira que la composante tangentielle du vecteur d’onde se
c0
conserve.
′
La relation k1y = k2y = 0 montre que les deux ondes réfléchie et transmise se pro-
pagent dans le plan d’incidence (c’est la première loi de Descartes), ce qui permet de
faire le tracé de la figure 5.18 définissant les angles de réflexion θ1′ et de réfraction θ2 .
′ n1 ω n2 ω
On en déduit alors k1x = sin θ1′ et k2x = sin θ2 , d’où il découle immédiate-
c0 c0
′
ment θ1 = θ1 et n1 sin θ1 = n2 sin θ2 : on retrouve ainsi la deuxième loi de Descartes.
Ces propriétés nous incitent à considérer que le rayon lumineux de l’Optique géo-
métrique est bien représenté par la direction du vecteur d’onde de l’onde lumineuse
w (r, t).
Lois de Snell-Descartes
X La continuité (admise) de l’onde lumineuse de part et d’autre d’un
dioptre impose la conservation de la composante tangentielle du vec-
teur d’onde ; on en déduit les deux lois de Snell-Descartes de la réflexion
et de la réfraction :
• l’onde réfléchie et l’onde réfractée se propagent dans le plan d’incidence,
défini par l’onde incidente et la normale au dioptre au point d’incidence ;
• l’onde réfléchie est symétrique de l’onde incidente par rapport à la
normale ; lors de la réfraction, l’onde traverse la normale et vérifie la
relation n1 sin θ1 = n2 sin θ2 .
2 Ondes sphériques : si une onde lumineuse se propage dans le vide depuis un point
source O, on peut la chercher sous la forme w(r) = w(r) en coordonnées sphériques ;
ω2
1 d dw
on peut aussi montrer l’expression du laplacien ∆w = 2 r2 = − 2 w et on
r dr dr c
a(r) d2 a ω2
en trouve la solution en écrivant w(r) = , qui mène à = − 2 a, d’où une
r dr2 c
solution pour a(r) en somme de deux exponentielles complexes conjuguées, avec donc
exp [j (ωt − k0 r)] exp [j (ωt + k0 r)]
W (r, t) = a+ + a− .
r r
exp [j (ωt − k0 r)]
On parle d’onde sphérique divergente depuis O pour W (r, t) = a+
r
5 : L’onde lumineuse 113
2 Les ondes de l’optique géométrique : considérons des ondes qui se propagent dans
les conditions de Gauss, c’est-à-dire telles que la direction de propagation fait en tout
endroit un angle faible avec l’axe optique (Ox) ; la figure 5.19 présente la propagation
d’une onde plane (à gauche) et d’une onde sphérique (à droite) dans ces conditions.
y y
α x S x
b
Sur cette figure, les traits pleins désignent les directions de propagation, et les traits
pointillés les surfaces à phase constante ; pour une onde plane, exp [j (ωt − k · r)] = cte
définit des plans perpendiculaires à k.
Pour une onde sphérique, exp [j (ωt − kr)] = cte définit des sphères centrées sur S.
Dans les deux cas, on parle de surfaces d’onde ou de surfaces équiphase.
Dans les deux cas, les surfaces d’onde sont perpendiculaires aux rayons lumineux.
Nous généraliserons bientôt ce résultat sous le nom de théorème de Malus.
2 Caractérisation des ondes planes et sphériques : pour l’onde plane de la figure 5.19,
k = nk0 (cos αex + sin αey ) donc w(r) = w0 exp [j (ωt − nk0 (x cos α + y sin α))] ou,
dans les conditions de Gauss, w(r) = w0 exp [j (ωt − nk0 (x + yα))]. Nous noterons
encore ce résultat sous la forme w(r) = w0 exp [j (ωt − Φ(x, y))], la phase Φ d’une
onde plane variant en raison affine de y à x fixé, Φ(x, y) = nk0 (x + yα).
Considérons de même l’onde sphérique de la figure 5.19, pour laquelle nous écrirons
a
w(r) = 0 exp [j (ωt − Φ(x, y, z))], où Φ(x, y, z) = ±nk0 r, avec le signe + pour une
r
onde divergente p et le signe − pour une onde convergente. La distance r de S au point
(x, y, z) est r = (x − xS )2 + y 2 + z 2 .
y2
Dans le plan de figure (z = 0), on peut écrire r ≃ |x − xS | + dans les
2|x − xS |
conditions de Gauss ; d’autre part, |x−xS | = ±(x−xS ) avec la même signification pour
les signes + et − que ci-dessus. Finalement, on obtient dans tous les cas Φ(x, y, z) =
y2
nk0 (x − xS ) + .
2(x − xS )
2 Approximation plane d’une onde sphérique : considérons le cas d’une onde plane
émise depuis l’origine O d’un système de coordonnées (Oxy), et atteignant le point
M0 de coordonnées (x0 , ǫ) (cf. figure 5.20).
y onde
plane
onde M1
b
sphérique r = OM1
ǫ
M0
b b
x0 x
2π
q
L’onde sphérique a pour phase en M1 ϕ(M1 ) = nr avec r = x20 + ǫ2 soit, si
λ0
ǫ2 ǫ2
2π
x0 ≫ ǫ, ϕ(M1 ) = n x0 + . On peut aussi écrire ϕ(M1 ) = ϕ(M0 ) 1 + 2 ,
λ0 2x0 2x0
où M0 est le projeté de M1 sur l’axe (Ox).
De même, on peut comparer l’amplitude de l’onde en M1 et en M0 ; ces amplitudes
w(M1 ) x0 ǫ2
variant comme l’inverse de la distance à la source, = ≃ 1 − 2 . Dans les
w(M0 ) r 2x0
deux cas, on constate que les écarts sont du second ordre en ǫ/x0 ; on pourra donc
éventuellement, si ǫ ≪ x0 , écrire que l’onde émise de O prend en M0 et en M1 la même
valeur (même amplitude et même phase) ; c’est l’approximation des objets à l’infini,
pour lesquels on remplace l’onde sphérique issue de O par une onde plane parallèle à
l’axe optique (Ox) du système ; en effet, une telle onde plane vérifie exactement, par
construction, w(M0 ) = w(M1 ).
• Par contre, si on prend en compte la phase de l’onde, la condition peut être beaucoup
plus restrictive ; en effet, l’écart de phase entre onde plane et onde sphérique
π nǫ2
est de l’ordre de ϕ(M1 ) − ϕ(M0 ) ≃ ; cet écart n’est négligeable (par
p λ0 x0
exemple devant π) que si ǫ ≪ x0 λ. Ainsi, si on éclaire dans le domaine visible
(λ0 ∼ 500 nm) un dispositif optique de largeur ǫmax ≃ 1 cm, on ne pourra
traiter la source comme disposée à l’infini que si x0 ≫ 200 m.
Ainsi, une source ponctuelle S disposée à un mètre de distance d’une lentille (voir plus
bas) éclaire celle-ci de manière quasiment uniforme, mais on ne peut pas assimiler
l’onde à une onde plane, puisqu’on sait bien que l’image S ′ de S est en général
différente de celle F ′ qu’on obtient à partir d’un objet à l’infini.
2 Optique géométrique et transformation de phase : l’optique géométrique peut être
considérée comme l’étude des appareils (lentilles, miroirs, etc.) ayant pour but de
transformer une onde sphérique en une autre onde sphérique (stigmatisme pour un
couple de points à distance finie), une des deux ondes pouvant être remplacée par une
onde plane (si l’objet ou l’image est à l’infini).
Tout dispositif optique dans les conditions de Gauss peut donc être assimilé à un
système plan, perpendiculaire à l’axe optique, réalisant une transformation de phase.
y Π1 Π2
I1 I2 e(ρ)
b b
e(ρ) α
C2 S x
b b b 2 b
S1 C1
e0
Considérons par exemple une lentille mince, milieu d’indice nV , disposée dans l’air
(pour lequel nous prendrons n ≃ 1), séparée de l’extérieur par deux surfaces sphériques
de centres C1 et C2 et de rayons R1 et R2 (cf. figure 5.21). Un rayon lumineux qui
traverse cette lentille doit, pour passer du plan de front Π1 eu plan de front Π2 , se
e(ρ)
propager à travers la lentille (indice nV , distance parcourue ≃ e(ρ) dans les
cos α
conditions de Gauss ; α est l’angle du rayon dans la lentille avec l’axe (Ox)) mais
aussi dans le vide (indice n ≃ 1, distance parcourue ≃ e0 − e(ρ)).
2π
Cette traversée augmente donc la phase de l’onde de ∆Φ(ρ) = (e0 + (nV − 1)e(ρ)).
λ0
On calcule facilement e(ρ) en déterminant les abscisses x1 et x2 de I1 et I2 . Prenant
2 ρ2
pour x1 l’origine en S1 , il vient (x1 − R1 ) + ρ2 = R12 donc x1 ≃ ; en effet, la
2R1
condition cos α ≃ 1 impose x1 ≪ R1 .
ρ2
De même, x2 ≃ − avec l’origine en S2 . Enfin, e(ρ) = e0 − x1 + x2 et le déphasage
2R2
2π nV − 1 1 1
apporté par la lentille est ∆Φ(ρ) = nV e0 + + ρ2 ; on choisit
λ 0 2 R 1 R 2
1 1
de noter V = (nV − 1) + .
R1 R2
116 Physique, MP, MP*
Une onde sphérique arrivant sur la lentille (supposée mince, coupant l’axe optique
au point origine x = 0), divergente depuis le point source d’abscisse xS = p, donc
2π ρ2
de phase Φi = , sera donc transformée en une onde émergente, dont la phase
λ0 2p
2π ρ2 1
varie en fonction de ρ selon Φe = + V ; on peut donc définir un point de
λ0 2 p
′ 1 1 1
convergence sur l’axe, d’abscisse p telle que + V = ′ . V = ′ est la vergence de la
p p f
lentille, f ′ sa distance focale
image. Larelation qui définit V peut se généraliser sous
1 1
la forme V = (nV − 1) − à toutes les lentilles minces sphériques, quel
S1 C1 S2 C2
que soit le caractère convexe ou concave de leurs faces.
dL = n(r)ds (5.16)
Z B
L = (AB) = n(r)ds (5.17)
A
Si l’élément de longueur ds est assez court, l’onde lumineuse peut être considérée
comme localement plane, de vecteur d’onde k = nk0 et où et désigne le vecteur unitaire
k
tangent à la courbe C ; on peut encore écrire dL = · dr puisque ds = et · dr.
k0
L’onde lumineuse en deux points voisins r et r + dr vérifie donc la relation de pro-
pagation W (r + dr, t) = W (r, t) exp (−jk · dr) ≃ W (r, t) (1 − jk0 dL) en fonction
du chemin optique. C’est une équation différentielle, de la forme dW = −jk0 dLW
dont la solution générale, en un point M quelconque atteint à partir d’une source S
arbitraire, s’écrit :
Théorème de Malus
X Les rayons lumineux sont orthogonaux aux surfaces d’onde.
118 Physique, MP, MP*
L’onde optique est caractérisée par une grandeur vibrante W (M, t) ; dans le
cas des ondes monochromatiques, on l’écrit W (M, t) = w(M ) exp (jωt). L’onde
se propage à la vitesse de phase c = c0 /n, où n est l’indice optique du milieu
(n > 1 en général). On retiendra c0 ≃ 3, 00 × 108 m · s−1 .
L’intensité et l’éclairement lumineux sont proportionnels à W (M, t)2 ou, dans
Optique géométrique
6.1.1 Stigmatisme
2 Objets et images : le but des systèmes optiques utilisés en imagerie est la formation
d’images (nettes) à partir d’objets lumineux. Nous considérons dans la suite qu’un
objet lumineux est un ensemble de points A, et que le système doit, pour chaque point
A, former une image ponctuelle A′ .
Rappelons ici qu’on appelle objet tout point à partir duquel une onde lumineuse
sphérique diverge. Si ce point de divergence est situé après la face d’entrée du système
optique étudié, on dit que l’objet est virtuel, et qu’il est réel sinon. Un objet virtuel A
est, en pratique, un faisceau convergent qui convergerait vers A, si le système optique
était absent. Si le faisceau sphérique divergent devient un faisceau parallèle, l’objet
est rejeté à l’infini.
De même, on appelle image tout point vers lequel une onde lumineuse sphérique
converge. Si ce point de convergence est situé après la face de sortie du système
optique étudié, on dit que l’image est réelle, et qu’elle est virtuelle sinon. Une image
virtuelle A′ est, en pratique, un faisceau divergent qui semble provenir du point A′ .
Si le faisceau sphérique convergent devient un faisceau parallèle, l’image est rejetée à
l’infini.
2 Condition de stigmatisme : on dit qu’un système optique (Σ) est stigmatique pour
le couple (A, A′ ), ou encore que A′ est l’image de A, si tout rayon lumineux issu de
A passe, après traversée du système (Σ), par le point A’.
Système
A A′
b b
(Σ)
La figure 6.1 présente un cas de stigmatisme, pour un point objet réel A et un point
image réel A′ . Le tracé (en pointillés) des surfaces équiphase montre que les points A
et A′ peuvent être considérés comme les limites de telles sphères équiphase, lorsque
leur rayon r → 0. On peut interpréter cette propriété comme suit : si tous les rayons
lumineux quittent A avec, pour l’onde optique w(A), la même phase, alors des rayons
lumineux retrouveront la même phase lorsqu’ils convergent en A′ .
On peut d’ailleurs donner une interprétation directe de cette propriété, en imaginant
l’arrivée, en un même point M , de plusieurs ondes lumineuses w1 , w2 , . . .X, déphasées
arbitrairement. Notant par exemple wi = w0 exp (−jϕi ), la somme w = wi peut
i
être représentée sur la figure 6.2 comme la somme d’un grand nombre de complexes
arbitrairement déphasés.
b b b
Diffraction et imagerie
X Lorsque la dimension a d’un système optique et la longueur d’onde λ0
sont d’un ordre de grandeur comparable, on observera des écarts à la
formation de l’image géométrique, qui reste le centre de la zone lumineuse
(ou tache de diffraction).
Nous établirons que l’ordre de grandeur de l’écart angulaire de part et
d’autre de l’image géométrique est en général donné par ∆θ ∼ λ0 /a.
α H(α) x
b b
A
(Σ)
b
R
B n n′
A′ B ′ AB
les conditions de Gauss, n =n (on assimile les sinus et les tangentes). On
SA′ SA
remarque de même, en considérant le rayon lumineux AIA′ et en assimilant SI à un
SI SI
segment de droite, que |α| = et |α′ | = .
SA SA′
Ces deux relations considérées ensemble, et prenant en compte les divers signes,
conduisent à nABα = n′ A′ B ′ α′ ; le terme nABα se conserve ainsi à la traversée d’un
dioptre ; il se conservera évidemment de proche en proche à la traversée d’un nombre
quelconque de dioptres et forme finalement l’invariant de Lagrange et Helmholtz‡
(6.1), pour un système optique formant une image de dimension A′ B ′ à partir d’un
objet de dimension AB.
Dans cette relation, les indices des milieux d’entrée et de sortie sont la plupart du
temps identiques, les systèmes centrés étant plongés dans l’air.
A′ B ′
γ= (6.2)
AB
α′ nentrée
G= Gγ = (6.3)
α nsortie
124 Physique, MP, MP*
e(ρ)
Ab S1 b b
S
b 2
Ab′ x
ρ O
b b
I1 I2
e0
1 1 1 1 1
− + ′ =− + =V = ′ (6.4)
p p OA OA ′ f
On dira qu’une lentille mince est convergente si V ′ > 0 ou, ce qui revient au même,
si f ′ > 0 ; dans le cas contraire, elle est dite divergente. Une lentille convergente
1 1
correspond à − > 0, ce qui est le cas des lentilles présentées sur la figure 6.6.
R1 R2
Dans tous les cas, le centre de la lentille est plus épais que le bord, ce qui justifie la
représentation conventionnelle des lentilles convergentes.
1 1
De même, les lentilles divergentes correspondent à − < 0, donc aux lentilles à
R1 R2
bords plus épais que le centre ; quelques exemples sont présentés sur la figure 6.7.
B
B
b
Fb′ A′ B′ b b
A F O A ′ ′ O
FA F
B′
F ′ A′ f′
γ=− ′
= (6.5)
f FA
OA′ A′ B ′ OA′
La première expression s’écrit aussi γ = 1 − soit, du fait de (6.4), = ;
f′ AB OA
′
ceci montre que les points B, O et B sont alignés. Les droites correspondantes (en
pointillés sur la figure 6.8 sont donc des rayons lumineux qui passent pas O et ne sont
pas déviés ; pour cette raison, le point O est appelé centre optique de la lentille.
La nouvelle expression du grandissement ainsi obtenue porte le nom de relation de
Descartes pour le grandissement :
OA′ p′
γ= = (6.6)
OA p
Enfin, la simple comparaison des deux relations (6.5) permet d’établir une relation
de conjugaison, dite de Newton, et qui est parfois plus commode que la relation de
Descartes (6.4) :
F A · F ′ A′ = −f ′2 (6.7)
p′ − f ′ f′
Recopiant l’égalité des deux expressions (6.5) sous la forme − = ,
f ′ p + f′
′ ′
après développement puis division par p, p et f , on retrouve donc aussi la relation
1 1 1
de conjugaison de Descartes − + ′ = ′ ; il faut en général savoir passer des
p p f
relations algébriques aux schémas de construction, et réciproquement.
Φ Φ′
α
b b
F O α ′ O F′
f′ f′
En pratique, on considérera souvent qu’un objet A est à l’infini s’il est (( suffisamment
loin )) du système considéré ; on peut donner une idée quantitative de cette condition
1 1 1
en remarquant que, si |p| ≫ f ′ , la relation de conjugaison − + ′ = ′ fournit
p p f
f ′p
p′ = ′ ≃ f ′ ; l’image A′ est donc voisine du foyer image F ′ .
f +p
On pourra considérer que l’image est à l’infini si l’écart F ′ A′ est assez faible ; cet écart
f ′2 f ′2
est donné par F ′ A′ = f ′ − p′ = ′ ≃− ; on peut donc considérer que F ′ et A′
f +p p
sont confondus si F ′ A′ ≪ f ′ , donc si |p| ≫ f ′ .
La validité de cette condition dépend bien sûr de la précision recherchée ; ainsi, un
appareil photographique équipé d’un objectif de distance focale f ′ = 50 mm (objectif
reproduisant la vision ordinaire sur une pellicule de 24 mm × 36 mm) traitera un
objet comme disposé à l’infini pour une distance supérieure à 30 m environ, c’est-à-
dire pour un rapport f ′ /|p| inférieur à 0, 2 % ; on peut autoriser des critères plus ou
moins contraignants selon la qualité de l’image désirée.
La construction du rayon émergent associé à un rayon incident quelconque peut mettre
à profit la notion de foyer secondaire ; la figure 6.10 montre comment un rayon lumi-
neux arbitraire passe par un foyer secondaire objet Φ (et on construit donc le faisceau
parallèle émergent), mais peut aussi être considéré comme appartenant à un faisceau
incident parallèle (avec convergence au foyer secondaire image Φ′ ).
I
Φb Φb′
Ab α b b
Ab′ x
F O F′ α′
2 Grandissement angulaire : la même figure 6.10 montre aussi la relation qui lie les
angles faits à l’entrée et à la sortie de la lentille par un même rayon lumineux avec
OI OI
l’axe optique : dans les conditions de Gauss, α = − et α′ = − montrent que
′
OA OA′
α p
le grandissement angulaire est G = = ′ ; on retrouve simplement la relation de
α p
Lagrange et Helmholtz (6.1) dans le cas particulier des milieux extrêmes identiques :
6 : Optique géométrique 129
α′ 1
G= = (6.8)
α γ
B
θ A′ x
b b b bS
A C
B′ b
J
1 1 2 1 1 2
+ = ou + = (6.9)
p p′ R SA SA′ SC
Le miroir étant invariant par toute rotation d’angle θ autour de C, il est aussi forcé-
ment aplanétique, avec pour image de l’objet AB l’arc (assimilé à un segment dans
les conditions de Gauss) A′ B ′ ; on peut d’ailleurs identifier le trait pointillé BCB ′ de
la figure 6.11 avec un rayon lumineux et identifier la relation de grandissement :
A′ B ′ CA′
γ= = (6.10)
AB CA
Cette relation s’interprète donc comme l’existence, par ailleurs évidente, d’un centre
optique, puisque le rayon BCB ′ parvient sur le miroir en J sous incidence normale ;
il est donc réfléchi sur lui-même.
130 Physique, MP, MP*
Toutefois, les relations (6.9) et (6.10) ne sont pas établies avec la même origine. Pour
p′ − R
le grandissement, on passe à l’origine au sommet en écrivant γ = soit encore
p−R
p′ 1/R − 1/p′ p′
γ= ou, compte tenu de la relation de conjugaison, γ = − ; c’est la
p 1/R − 1/p p
relation de grandissement de Descartes :
A′ B ′ SA′ p′
γ= =− =− (6.11)
AB SA p
1 1 2
+ ′
= (6.12)
CA CA CS
2 Foyers et relations de Newton : comme pour une lentille mince, on définit les foyers
objet F (sur l’axe, dont image et à l’infini) et image F ′ (image sur l’axe d’un objet à
l’infini). Faisant respectivement tendre vers l’infini SA′ (ou CA′ ) puis SA (ou CA), on
trouve que les deux foyers sont confondus et vérifient SF = SF ′ = R/2, c’est-à-dire
qu’ils sont situés au milieu de l’intervalle [CS].
B I
A′ Cb Fb b
A F′ S
B′ J
La figure 6.12 place ces foyers et résumes certaines règles de construction de rayons
propres aux miroirs sphériques. On y remarque la représentation symbolique des mi-
roirs par leur plan tangent (avec indication de la concavité). On y a fait figurer quatre
rayons de construction :
6 : Optique géométrique 131
Constructions géométriques
X Pour déterminer l’image d’un objet B hors de l’axe optique par un miroir
sphérique, on peut utiliser :
• le rayon incident sur le miroir en passant par le sommet S, qui est
réfléchi en faisant, avec l’axe optique (qui est aussi la normale au point
d’incidence) un angle égal à celui fait à l’entrée ;
• le rayon incident sur le miroir en passant par le centre optique C, qui
n’est pas dévié, de sorte que B, C et B ′ sont alignés ;
• le rayon incident sur le miroir parallèlement à l’axe optique, qui émerge
du miroir en passant par le foyer F ′ ;
• le rayon incident sur le miroir en passant par le foyer F , qui émerge
du miroir parallèlement à l’axe optique.
2
SF F ′ A′ 2 R
γ=− =− F A · F ′ A′ = SF ′ = (6.13)
FA SF ′ 4
bH
B
bI
α
A′ Cb Fb b
′ S
α A
bJ
′
B
SH
Ces angles, tous deux négatifs sur la figure 6.13, vérifient les relations α = et
SA
′
SH α SA
α′ = ; on en déduit la relation de grandissement angulaire G = = . La
SA ′ α SA′
comparaison avec l’expression (6.11) du grandissement linéaire montre que G = −1/γ.
On peut considérer qu’il s’agit d’un cas particulier de l’invariant de Lagrange et Helm-
holtz (6.1), à condition de poser nsortie = −nentrée . En effet, il est possible de considérer
que les lois de la réflexion (en particulier la relation de Descartes i′ = −i) sont équi-
valentes aux lois de la réfraction (notamment n sin i = n′ sin i′ ) à condition de poser
n′ = −n.
132 Physique, MP, MP*
On peut aussi considérer que le signe − dans la relation G = −1/γ permet de rendre
compte du changement de sens de propagation lors de la réflexion ou, si on préfère,
du changement d’orientation de l’axe optique si on voulait le définir, à l’entrée comme
à la sortie d’un système à miroir, dans le sens moyen des rayons lumineux.
Finalement, on écrira la relation de Lagrange et Helmholtz pour un miroir sphérique :
Gγ = −1 (6.14)
Corps vitré
Cornée
Rétine
Pupille
Nerf
Cristallin optique
Iris
• La cornée, protège l’œil de l’extérieur ; c’est une membrane transparente. Elle est
emplie du corps vitré, liquide très visqueux qui donne à l’œil sa forme.
• La pupille est la partie centrale de l’œil ; elle comporte un diaphragme (l’iris) dont le
diamètre d’ouverture varie en fonction de la luminosité. C’est la pigmentation de
l’iris qui détermine la couleur de l’œil. La pupille contient un liquide transparent,
l’humeur aqueuse, qui, avec le corps vitré, maintient la pression exercée sur le
globe oculaire et permet donc de déterminer sa forme.
• Le cristallin est un milieu biconvexe, légèrement déformable, situé derrière l’iris ; sa
forme détermine les propriétés optiques de l’œil. Son épaisseur est de l’ordre de
5 mm sur une largeur double.
• La rétine est le film sensible sur lequel se forment les images. C’est une mem-
brane nerveuse qui tapisse le fond de l’œil, d’environ 0, 25 mm d’épaisseur et
de quelques centimètres carrés de surface. Elle comporte plus de 100 millions
de cellules nerveuses (bâtonnets) sensibles à l’intensité lumineuse et servant à
la détection du mouvement, et moins de 10 millions d’autres cellules (cônes)
sensibles aux nuances de couleur.
• Le nerf optique, long de 3 à 6 centimètres, transmet l’image rétinienne au cerveau.
Notons que tous les systèmes centrés décrits ci-après ne sont pas toujours utilisés
dans les conditions de Gauss ; il arrive par exemple qu’une lentille d’entrée de micro-
scope ou d’objectif photographique soit éclairée sous une ouverture angulaire très
importante. Cette partie du dispositif est alors adapté spécialement à son utilisa-
tion (lentille asphérique par exemple). De même, les miroirs primaires des télescopes
134 Physique, MP, MP*
peuvent être de forme parabolique et non sphérique, pour assurer, dans le cas par-
ticulier de l’observation à l’infini, un stigmatisme meilleur que celui des conditions
de Gauss.
2 Caractérisation des objets et des images : certains systèmes optiques font des
images d’objets situés à distance finie (objets proches), d’autres d’objets qu’on doit
considérer comme situés à l’infini (objets terrestres lointains, objets astronomiques).
Les images formées seront elles-mêmes situées à distance finie (par exemple si elles
doivent être projetées sur un écran, ou sur le plan d’une surface photosensible), ou à
très grande distance (puisqu’une image à l’infini peut être observée sans accommoder,
c’est-à-dire sans effort musculaire au niveau de l’œil).
Le tableau 6.1 présente des exemples d’appareils correspondant aux quatre couples
possibles de position des objets et des images.
Un objet est caractérisé par sa dimension ; s’il est à distance finie, on utilise la dimen-
sion transversale AB, mais s’il est situé à une grande distance d → ∞, cette dimension
vérifie nécessairement AB → ∞.
Toutefois, on peut continuer à définir une dimension apparente, comme sur la figure
AB
6.15, au moyen du rapport θ = : deux objets A1 B1 et A2 B2 de même rapport θ
d
sembleront, pour l’observateur, de même taille.
B1
B2
θ
A1 A2
d1 Système
d2
Dans ce tableau, P porte le nom de puissance du système optique (on parle ainsi
de la puissance d’un microscope) et se mesure en m−1 (unité appelée en Optique
dioptrie, symbole δ) ; f ′ est la focale s’identifiera souvent avec la distance focale image
du système optique et se mesure en m ; on parle ainsi de la focale d’un télescope,
même s’il est formé de plusieurs miroirs ayant chacun leurs foyers.
B1 (R1 ) K′
A2 Hb Fb b b
A1 F′ H′
) K
(R 2
B2
Un rayon lumineux qui se dirige vers le système parallèlement à l’axe optique croise
ensuite celui-ci en un point de l’axe noté F ′ , qui est le foyer principal image du
système optique (sur la figure, c’est une image réelle). De même, pour émerger du
système parallèlement à l’axe optique, un rayon lumineux doit passer par le point F
avant le système : c’est son foyer principal objet (sur la figure, c’est un objet virtuel).
La définition ci-dessus permet de placer des foyers, pas de définir des focales, et
encore moins un centre optique ! Comme on le montrera, un système centré n’est
en général pas équivalent à une lentille mince unique ; en particulier, il n’a pas de
centre optique situé entre ces foyers.
Sur la figure 6.16, H ′ est l’image de H mais on a choisi, pour des raisons de lisibilité,
A1 B1 6= A2 B2 donc K ′ n’est pas l’image de K.
6 : Optique géométrique 137
B I
Fb α bH H′ b
Fb′ A′
′
A α
J B′
Les deux premières relations de grandissement sont les relations de Newton ; elles
généralisent immédiatement celles obtenues pour les lentilles et miroirs sphériques :
HF F ′ A′
F A · F ′ A′ = HF · H ′ F ′ γ=− =− ′ ′ (6.16)
FA HF A
HF H ′ A′
La comparaison des deux dernières relations de grandissement impose − =
FA HA
HF H ′ F ′ + F ′ A′
soit − = ; on développe alors cette expression qui devient donc
FA HF
+ FA
F A HF + H ′ F ′ = F H HF + H ′ F ′ . Comme cette relation doit être vraie pour
tout A, y compris A 6= H, on a forcément HF + H ′ F ′ = 0 :
f = HF = −H ′ F ′ = −f ′ (6.17)
La relation (6.17) définit les distances focales image f ′ et objet f ; même si on remarque
la forte analogie avec les lentilles minces, il reste la propriété générale H 6= H ′ qui
fait la différence avec le cas des lentilles pour lesquelles O = O′ .
• si H 6= H ′ , le système centré est un système épais, d’épaisseur optique (algébrique)
ē = HH ′ ; un tel système n’a pas de centre optique ;
138 Physique, MP, MP*
B′
A A′
La figure 6.18 montre que, dans ce cas, un rayon incident parallèle à l’axe émerge
parallèlement à l’axe optique ; les deux foyers F et F ′ sont donc simultanément rejetés
à l’infini.
Dans un tel cas, tout objet AB donne une image A′ B ′ dont la dimension se conserve
lorsqu’on translate AB ; en effet, si l’extrémité B se déplace sur un rayon parallèle
à l’axe, alors l’extrémité B ′ se déplace sur le rayon émergent correspondant et la
dimension de A′ B ′ ne varie pas.
Systèmes afocaux
X Pour un système afocal, le grandissement linéaire γ et donc le grandis-
sement angulaire G ne dépendent pas de la position de l’objet : ce sont
des caractéristiques du système.
Si |γ| > 1, le système agrandit les images formées à distance finie des
objets situés à distance finie.
Si |γ| < 1 donc |G| < 1, le système agrandit les images formées à l’infini
des objets situés à l’infini.
6 : Optique géométrique 139
Un système optique est stigmatique si tout rayon issu de A passe par A′ après
traversée du système optique. Il y a stigmatisme si et seulement si le chemin
optique (AA′ ) d’un objet A à son image A′ vérifie (AA′ ) = constante, quel que
soit le rayon choisi de A à A′ à travers le système.
Un système optique est centré s’il présente un axe de révolution (axe optique).
Un système optique centré est aplanétique si tout objet étendu AB dans un
plan de front (plan perpendiculaire à l’axe optique) donne une image A′ B ′
étendue dans un plan de front.
Dans les conditions de Gauss (rayons faiblement inclinés sur l’axe, atteignant
les divers dioptres à des distances de l’axe faibles devant les rayons de courbure),
tout système centré est stigmatique et aplanétique.
Tout ce qui suit est décrit dans les conditions de Gauss.
Il y a aplanétisme si et seulement si nentrée ABα = (−1)n nsortie A′ B ′ α′ , où α
et α′ sont les angles faits avec l’axe optique par un même rayon, issu de A et
passant par A′ ; n est le nombre de réflexions.
A′ B ′ α′
On définit les grandissements linéaire et angulaire, γ = et G = ; alors,
AB α
n nentrée
Gγ = (−1) ou, si les milieux extrêmes sont identiques, Gγ = (−1)n .
nsortie
Pour une lentille sphérique, f ′ = OF ′ = −OF = −f est positif si la lentille
(convergente) est à bords minces, négatif si la lentille (divergente) est à bords
1 1 1 OA′
épais. Relations de Descartes : − + = ′, γ = et G = 1/γ.
OA OA ′ f OA
Pour un miroir sphérique, f ′ = SF ′ = SF = SC/2 (F est au milieu de [SC]).
1 1 1 2 SA′
Relations de Descartes + = ′ = ,γ=− et G = −1/γ.
SA SA ′ f SC SA
F ′ A′ f
Dans les deux cas (lentilles et miroirs), on a γ = − ′
= − et donc
f FA
F A · F ′ A′ = f f ′ (relations de Newton).
Cette relation se généralise à tous les systèmes centrés.
Un système afocal présente des grandissements linéaire γ et angulaire G
constants, quelle que soit la position de l’objet.
Chapitre 7
Diffraction de la Lumière
Le fait qu’on puisse ajouter les éclairements obtenus pour diverses longueurs d’onde,
comme s’ils se propageaient indépendamment les uns des autres, relève de l’hypo-
thèse d’incohérence de rayonnements de longueurs d’onde différentes. Cette hypo-
thèse sera justifiée ultérieurement, à l’occasion de l’étude des interférences lumi-
neuses.
Il est en principe possible de décrire complètement la propagation d’une telle onde
W (M, t) = w(M ) exp (jωt) par la résolution de l’équation de l’équation de propaga-
tion ∆w = −ω 2 /c2 w, avec dans chaque milieu homogène c = c0 /n ; cette résolution,
qui doit être complétée par la prise en compte de conditions aux limites à la surface
de chaque dioptre ou miroir, est en pratique souvent équivalente à la formulation de
la diffraction selon Huygens et Fresnel.
142 Physique, MP, MP*
bM
b
b P
S b
M′
(Σ)
se place dans le cas de la diffraction dans des directions faiblement inclinées sur la
normale n, on peut écrire cos α ≃ 1 et on retrouve l’expression intégrale du principe
de Huygens et Fresnel :
x wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.2)
MP
M ∈(Σ)
x T (M )wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.3)
MP
M ∈(Σ)
x X
MP bP
M b
z
(Σ) b b
O Ω
Pour être plus précis, considérons le cas où la pupille diffractante (Σ) est un certain
plan (Oxy), tandis que l’observation se fait en un point P d’un plan (ΩXY ), parallèle
au précédent mais décalé d’une
p longueur OΩ = z (cf. figure 7.2).
On peut alors écrire M P = z 2 + (X − x)2 + (Y − y)2 ; dans toute la suite, nous
nous placerons dans le cas où la distance
z est nettement supérieure
à toutes les
(X − x)2 + (Y − y)2
autres ; on peut alors écrire M P ≃ z 1 + . Appelant alors d un
2z 2
majorant des grandeurs X, x, Y et y, c’est-à-dire la plus grande dimension rencontrée
sur la pupille et dans l’étude de la figure de diffraction, on pourra considérer que
M P ≃ z avec une précision acceptable si z ≫ d.
En pratique, les observations de figures de diffraction sont faites dans la plupart des
cas à une distance z ∼ 1 m au moins, tandis que la plus grande dimension d’une figure
de diffraction ou d’une pupille diffractante ne dépasse que rarement 1 cm ; ainsi, on
peut considérer que M P ≃ z à mieux que 10−4 près.
On notera donc l’intégrale donnant l’amplitude diffractée sous la forme pratique, qui
sera utilisée dans toute la suite, faisant intervenir une distance (( moyenne )) M P0 :
κ x
w(P ) ≃ T (M )wi (M ) exp [−jk0 (M P )] dΣ (7.4)
M P0
M ∈(Σ)
Remarquons encore une fois qu’une variation relative de 10−4 dans l’expression de
M P n’est, par contre, pas du tout négligeable dans l’exponentielle exp [−jk0 (M P )] ;
imaginons par exemple que (M P ) soit de l’ordre de grandeur de z = 1 m, les variations
les plus importantes attendues pour (M P ) seront de l’ordre de 10−4 m, ce qui, avec
par exemple λ0 = 500 nm, correspond à des variations maximales de la phase k0 (M P )
10−4
de l’ordre de 2π = 200×2π ! On doit donc pour l’instant conserver telle quelle
5 × 10−7
l’expression de l’exponentielle dans (7.4).
Les ordres de grandeurs cités ci-dessus correspondent au cas de la diffraction des ondes
lumineuses ; cependant, le phénomène de diffraction existe pour les ondes électroma-
gnétiques dans tous les domaines des longueurs d’onde, avec des moyens de description
identiques et souvent des approximations analogues à celles qui sont faites ici.
On utilise en pratique couramment la diffraction des rayons X pour la détermina-
tion des structures diffractantes ; toutefois, la longueur d’onde des rayons X étant
nettement plus courte que celle des ondes lumineuses visibles (de l’ordre de 10−12 m
par exemple), on s’intéresse à des objets diffractants de dimensions caractéristiques
nettement plus faibles (cristaux ou macromolécules par exemple).
2 Éclairage par une source ponctuelle : la pupille (Σ) étant éclairée par une source
ponctuelle S, on peut encore écrire l’onde wi (M ) incidente en M en fonction de
7 : Diffraction de la Lumière 145
l’onde émise en S et du terme de déphasage exp [jk0 (SM )] ; toutefois, on devrait ici
distinguer le cas des ondes planes (la source S étant rejetée à l’infini, et le module de
l’amplitude complexe de l’onde étant conservé) et celui des ondes sphériques (la source
S est à distance finie, et module de l’amplitude de l’onde décroı̂t comme 1/SM ) ;
toutefois, dans les mêmes conditions que ci-dessus, cette variation d’amplitude est
pratiquement toujours négligeable, et nous écrirons donc :
Dans toute la suite, on ne s’intéressera qu’au cas d’une pupille plane, dans le plan
(Oxy), éclairée à distance suffisante, et observée également à une distance suffisante
pour négliger tous les termes de dilution d’énergie dans la propagation des ondes
sphériques, ce qui mène à la forme pratique :
x
w(P ) ≃ Kw(S) T (x, y) × exp [−jk0 (SM P )] dxdy (7.6)
M ∈(Oxy)
2 Écarts à l’optique géométrique : considérons, sur la figure 7.3, une pupille plane
diffractante P, dont on notera a une dimension caractéristique.
Sur la figure, cette pupille est éclairée en lumière parallèle, donc les différents points
de la pupille sont éclairés en phase : wi (M ) est constant pour tout point M ∈ P.
146 Physique, MP, MP*
x
α
b M2 b
a α z
b
α
a H1
vers P b
P
M1 b
δ
Figure 7.3 – Écarts à l’optique géométrique
On considère alors les ondelettes émises par divers points de P, qui interfèrent en un
point d’observation P situé à grande distance de la pupille ; pour évaluer un ordre de
grandeur, nous considérerons que ce point est pratiquement à l’infini. Ainsi, les rayons
lumineux qui éclairent P sont quasiment parallèles entre eux, définis seulement par
un angle α.
Dans l’intégrale (7.6) qui permet le calcul de l’amplitude complexe de l’onde lumineuse
en P , la seule différence entre deux ondelettes émises par deux points différents de
la source réside dans le terme exp [−jk0 (M P )]. On peut alors estimer la plus grande
valeur de l’écart de phase en comparant les chemins optiques M P pour deux points
extrêmes M1 et M2 de la pupille ; ces points dont donc distants de a (cf. figure 7.3 à
droite).
À partir du passage dans le plan H1 M2 (orthogonal à la direction du point P ), les
chemins optiques parcourus sur les deux rayons représentés sont identiques ; la seule
différence à prendre en compte est donc de l’ordre de δ = a sin α, soit aussi δ ≃ aα si
on se contente d’étudier de faibles écarts à la direction α = 0 qui est celle de l’optique
géométrique.
On pourra donc considérer deux cas :
2π
• si k0 δ = aα ≪ 2π, toutes les ondes émises par les divers points de la pupille P
λ0
arrivent en phase en P et l’éclairement est maximal ; on peut donc dire que des
λ0
rayons tels que α ≪ éclairent le centre de la figure de diffraction ;
a
• si au contraire k0 δ est de l’ordre de 2π ou plus, les déphasages entre les rayons
émis par les divers points de la pupille P deviennent importants, la somme (7.6)
contient de beaucoup de nombres complexes largement déphasés et on verra peu
ou pas de lumière : on est donc au-delà de la tache centrale de diffraction.
Nous admettrons la généralisation de ce résultat sous la forme suivante :
Les largeurs angulaires α étant souvent faibles, on les mesure en fractions de radian
mais aussi en minutes d’arc (1′ , ou une minute d’arc, est 1/60e de degré) ou en
secondes d’arc (1′′ , ou une seconde d’arc, est 1/60e de minute). On vérifie facilement
que 1′ ∼ 0, 3 mrad et 1′′ ∼ 5 µrad.
7 : Diffraction de la Lumière 147
b b b b
b
M
b
z
′
M
b
ui M ′′ ud
Parmi toutes les directions éclairées par les ondelettes émises par les points M , M ′ ,
etc. de P, on s’intéressera dans ce qui suit à celles qui se propagent dans une direction
commune de vecteur directeur unitaire ud ; ces diverses ondes interfèrent bien sûr
seulement à l’infini.
b
dep M
uis P
S vers
z
H K
b b
b
ui O ud
Il n’est pas nécessaire que le point origine O fasse effectivement partie de la pupille
P ; certaines droites représentées sur cette figure ne sont donc pas nécessairement
des rayons lumineux effectifs.
On peut noter (SM P ) = (SM ) + (M P ) le chemin optique de la source S au point
d’observation P . Quels que soient les dispositifs optiques placés de part et d’autre du
plan P de la pupille, on sait aussi d’après le théorème de Malus que les rayons lumineux
sont perpendiculaires aux surfaces d’onde, ou surfaces de chemin optique constant ;
ainsi, le chemin optique (SM ) est identique au chemin optique (SH) puisque M et
H sont sur la même surface d’onde.
De même, le chemin optique (M P ) est égal au chemin optique (KP ) puisque K et M
sont situés sur la même surface perpendiculaire aux rayons lumineux qui se dirigent
vers P . Finalement, on écrira (SM P ) = (SHOKP ) − (HO) − (OK).
Les chemins optiques (HO) et (OK) étant parcourus dans l’air, d’indice pris égal à
1, de part et d’autre de la pupille, on écrira ces chemins (HO) = HO = HO · ui et
(OK) = OK = OK · ud . L’utilisation de mesures algébriques permet d’étendre le cas
de la figure 7.6 à une situation différente, si le point M était au-dessous de O par
exemple.
x
w(ud ) = Kw(S) exp [−jϕ0 ] T (M ) exp [jk0 OM · (ud − ui )] dxdy (7.7)
M ∈P
x
w(αd , βd ) = Kw(S) exp [−jϕ0 ] T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.8)
R2
S x
b C
L
θi θd
u z
i
P ud
x
2π
w(θd ) ∝ T (x, y) exp j x (sin θd − sin θi ) dxdy (7.9)
λ0
R2
On ne doit en aucun cas raccorder les deux schémas de la figure 7.8 en un seul ;
en effet, le schéma de gauche (pour l’éclairage) est tracé dans le plan défini par les
vecteurs ez et ui , tandis que le schéma de droite (pour l’observation) est tracé dans
le plan défini par ez et ud . Ces deux plans sont en général distincts.
La source ponctuelle S est disposée dans le plan foyer objet de la lentille d’éclairage
Le (de distance focale image fe′ ), au voisinage de son foyer principal objet Fe ; après
7 : Diffraction de la Lumière 151
S b bP
Fe C z Co F′ z
b b e b b o
ui ud
Le Lo
traversée de cette lentille, on obtient donc un faisceau parallèle, donc le vecteur uni-
taire ui ≃ αi ex + βi ey + ez est parallèle à la direction SCe , où Ce est le centre optique
αi βi 1
de Le . Comme SCe = fe′ ez − xS ex − yS ey , on peut écrire = = ′ , ou :
−xS −yS fe
xS yS
αi ≃ − βi ≃ − (7.10)
fe′ fe′
Ainsi, les cosinus directeurs de la direction incidente sur la pupille mesurent des gran-
deurs proportionnelles aux abscisses et ordonnées de la source dans le plan focal de
la lentille d’éclairage.
La même étude faite pour la lentille d’observation Lo , de distance focale image fo′ et
de centre optique Co , montre que le vecteur ud ≃ αd ex + βd ey + ez est parallèle à
Co P = fo′ ez + xP ex + yP ey , ce qui mène à :
xP yP
αd ≃ βd ≃ (7.11)
fo′ fo′
et les cosinus directeurs de la direction diffractée par la pupille mesurent des grandeurs
proportionnelles aux abscisses et ordonnées du point d’observation dans le plan focal
de la lentille d’observation.
Rappelons une fois encore que le calcul de chemin optique proposé à partir de la
figure 7.6 n’est pas modifié par la présence de telles lentilles ; en effet, s’agissant de
dispositifs stigmatiques pour un couple (plan à l’infini, foyer secondaire), ces lentilles
n’introduisent aucune différence de marche supplémentaire par rapport à celle qui
apparaı̂t de part et d’autre du plan de la pupille diffractante P.
x
2π xP xS yP yS
w(xP , yP ) ∝ T (x, y) exp j x + ′ +y + ′ dxdy
λ0 fo′ fe fo′ fe
R2
(7.12)
152 Physique, MP, MP*
On adopte souvent une forme simplifiée de (7.12), en considérant que la source est
disposée au foyer principal objet de Le (donc avec xS = yS = 0) ; bien que cette
approximation ne soit pas très réaliste sur le plan expérimental, elle permet de discuter
plus simplement de la forme de l’intégrale de Fraunhofer :
x
2π
w(xP , yP ) ∝ T (x, y) exp j (xxP + yyP ) dxdy (7.13)
λ0 fo′
R2
Dans l’écriture (7.13), on se gardera de confondre les notations (x, y), coordonnées
du point courant d’intégration, et (xP , yP ), position du point d’observation où on
calcule l’intégrale donnant l’amplitude complexe w(xP , yP ).
On peut aussi considérer que le passage de (7.12) à (7.13) est un simple changement de
f′ f′
l’origine du plan d’observation, xP 7→ x′P = xP − o′ xS et yP 7→ yP′ = yP − o′ yS . Ce
fe fe
changement a pour effet de recentrer la figure de diffraction sur l’image géométrique S ′
f′ f′
de la source S, dont les coordonnées sont évidemment xS ′ = − o′ xS et yS ′ = − o′ yS .
fe fe
2 En résumé : dans toute la suite, nous utiliserons l’expression générale :
x
w(P ) ∝ T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.14)
R2
O′ b
b
M′ P′
O x
b
b
M P
Un tel résultat peut a priori sembler peu naturel : on s’imagine parfois que la figure
de diffraction est translatée en même temps que la pupille. Il n’en est évidemment
rien puisque, quelle que soit la position de la pupille, la figure de diffraction est
centrée sur l’image géométrique de la source, telle qu’elle se formerait en l’absence
de toute pupille. Le déplacement de cette dernière ne peut donc évidemment pas
avoir pour effet le déplacement de la figure de diffraction.
Théorème de Babinet
X En tout point de la zone d’observation, sauf au niveau de l’image géo-
métrique S ′ de la source ponctuelle qui les éclaire, deux pupilles complé-
mentaires fournissent la même figure de diffraction.
On sait que les largeurs respectives des fonctions T (dans le plan des coordonnées
spatiales) et Tb (dans le plan des pulsations spatiales) varient en sens inverse :
∆x · ∆u ∼ 2π donc ∆x · ∆α ∼ λ0 (7.16)
2 Notations : dans toute cette partie, nous calculerons d’abord l’amplitude complexe
diffractée à l’infini, dans une direction définie par les variations (angulaires) des cosi-
7 : Diffraction de la Lumière 155
x
nus directeurs ∆α et ∆β, w(∆α, ∆β) = Kw′0 T (x, y) exp [jk0 (x∆α + x∆β)] dxdy ;
R2
dans cette expression, on a posé w′0 = w0 exp [−jk0 (SOP )].
Ce calcul ne nous renseigne pas directement sur l’aspect de la figure de diffraction, qui
dépend de la répartition de l’éclairement, donné par E(∆α, ∆β) = |w(∆α, ∆β)|2 ; on
exprimera aussi ces éclairements en fonction de coordonnées sur l’écran d’observation,
xP yP
en utilisant les expressions ∆β = ′ et ∆α = ′ , où fe′ est la focale de projection
fe fe
et où les coordonnées (xP , yP ) dans le plan d’observation sont relatives à l’origine O,
confondue avec l’image S ′ de la source ponctuelle qui éclaire la pupille.
Enfin, nous ne considérerons dans la suite que des pupilles purement transparentes,
c’est-à-dire qui vérifient T (M ) = 1 pour M ∈ P et T (M ) = 0 sinon ; le calcul de
2
x
l’éclairement se ramène à E(xP , yP ) = |Kw′0 |2 × exp [jk0 (x∆α + x∆β)] dxdy ,
(x,y)∈P
où E(0, 0) = |Kw′0 |2 × S au centre de la figure, si S est la surface de la pupille.
Nous poserons systématiquement E(0, 0) = E0 dans ce qui suit pour l’éclairement
au centre de la figure de diffraction, ce qui permet enfin d’écrire l’éclairement en un
point de la figure d’interférence sous la forme E(xP , yP ) = E0 |s(xP , yP )|2 , où le terme
(sans dimension) s(xP , yP ) est l’amplitude complexe diffractée réduite, donnée par
1 x
s(xP , yP ) = exp [jk0 (x∆α + x∆β)] dxdy.
S
(x,y)∈P
b x
bO
2j sin k0 a∆α
2
encore sous la forme ; finalement, quelques simplifications mènent à
jk0 a∆α
k0 a∆α k0 b∆β
s(xP , yP ) = sinc × sinc .
2 2
L’éclairement en un point P de la zone d’observation prend alors la forme :
πa∆α πb∆β
E = E0 × sinc2 × sinc2 (7.17)
λ0 λ0
1 E0
4, 5 %
u ∆α
−2π −π π 2π − 2λa0 − λa0 λ0 2λ0
∆u = 2π a a
2λ0 /a
πa∆α
Figure 7.12 – Tracé des fonctions u 7→ sinc2 u et ∆α 7→ E(∆α) = E0 sinc2
λ0
πa∆α
La même figure fait apparaı̂tre le tracé de la fonction ∆α 7→ E(∆α) = E0 sinc2 ,
λ0
qui est la réduction à une dimension de la fonction d’éclairement E(∆α, ∆β).
Toutefois, puisqu’il s’agit d’une fonction de deux variables ∆α et ∆β, on doit en
donner une représentation tridimensionnelle ; la figure 7.13 montre la répartition de
la lumière dans le plan d’observation.
On remarquera l’absence totale de visibilité hors des axes (puisqu’alors aucune des
deux fonctions sinc2 de l’éclairement (7.17) ne prend sa valeur maximale 1) ; la figure
de diffraction prend la forme d’une croix, formée d’une tache centrale et de taches
secondaires, dont la luminosité n’est que quelques pour cent de celle du centre de la
figure (4, 5 % pour le premier maximum secondaire, 1, 6 % pour le second, etc.).
La tache centrale est, le long de chaque axe, deux fois plus large que chacune des taches
secondaires ; en valeurs angulaires, cette largeur à la base du maximum principal est
respectivement égale à 2λ0 /a ou 2λ0 /b selon l’axe étudié.
Compte tenu qu’on a choisi a > b, la figure 7.13 montre bien que la figure de diffraction
est allongée perpendiculairement à la plus grande direction de la pupille.
7 : Diffraction de la Lumière 157
∆β
2λ0
a
∆α
2λ0
b
S′
b b
2λ0 fo′
Sb b
b b b b
b
z
b b
fe′ fo′
P
La figure 7.14 récapitule les éléments du montage de diffraction par une pupille en
forme de fente rectangulaire : la source ponctuelle S donnerait, en l’absence de toute
pupille, une image S ′ au moyen des deux lentilles d’éclairage (focale fe′ ) et d’observa-
tion (focale fo′ ) ; la pupille, allongée dans une direction, donne une figure de diffraction
allongée perpendiculairement.
Dans le plan focal de la lentille d’observation, on observe donc essentiellement une
2λ0
tache centrale dont la largeur angulaire se projette dans le plan focal de la
a
2λ0 fo′
lentille d’observation en une largeur effective . Cette tache centrale est entourée
a
de taches secondaires, moins lumineuses et de largeur deux fois moindres.
2λ0 2λ0
On ne confondra pas la largeur angulaire à la base ou (selon l’axe étudié)
a b
du maximum central de diffraction avec la largeur à la base des pics secondaires, qui
λ0 λ0
ne sont égaux qu’à la moitié du précédent, ou . Le risque de confusion est
a b
d’autant plus grand qu’on s’intéresse souvent à la demi-largeur du pic central, qui
est aussi proche de sa largeur à mi-hauteur ; cette demi-largeur angulaire est bien
λ0 λ0
sûr ou selon l’axe étudié.
a b
λ0 2λ0
On ne confondra pas non plus les largeurs angulaires ou (qui sont des angles
a a
158 Physique, MP, MP*
et se mesurent en radian) avec les largeurs projetées dans le plan focal du dispositif
λ0 fo′ 2λ0 fo′
d’observation, égales respectivement à ou (qui sont des longueurs et
a a
se mesurent en mètre).
Pupilles longues
X Si une pupille plane, de normale (Oz), présente une longueur ℓ très
grande dans la direction de l’axe (Ox), aucune diffraction n’aura lieu
dans cette diffraction et la figure de diffraction sera limitée à une ligne
perpendiculaire à la pupille.
On peut donc, dans le cas des pupilles longues, faire un schéma dans le seul plan
(Oyz), qui concentre les phénomènes de diffraction ; c’est le cas de la figure 7.16.
Dans un tel cas, l’intégrale de diffraction sera écrite comme on l’a fait plus haut dans
le cas du goniomètre de la figure 7.7, donc avec βi = sin θi , βd = sin θd tandis que
Z ℓ/2
αi = αd . Le calcul intégral selon (Ox) mène donc au résultat immédiat dx = ℓ
x=−ℓ/2
et il ne reste alors qu’à étudier la diffraction dans le plan (Oyz) :
Z
w(P ) = Kℓw0 T (y) exp [jk0 y∆β] dy (7.18)
P
7 : Diffraction de la Lumière 159
y yP
b θd P
θd z
N
θi ℓ≫b
fo′
avec, selon que les angles de diffraction sont grands (dans le cas général) ou petits
(comme dans le cas de la figure 7.16, qui utilise une lentille et impose donc de se
placer dans les conditions de Gauss), les deux expressions possibles pour la variation
des cosinus directeurs dans le plan de la diffraction :
yP yS
∆β = sin θd − sin θi ou ∆β = + ′ (7.19)
fo′ fe
xP xS
L’expression (7.18) n’est valable que sur l’axe défini par + ′ = 0 ; pour toute
fo′ fe
autre valeur de xP , w(P ) = 0 et E(P ) = 0.
b b
x ℓ S1′
S b
b b b b b
b z
S′
S1
b b
fe′ fo′
P
La figure 7.17 montre cette situation, une pupille étroite étant éclairée par deux sources
ponctuelles S et S1 décalées parallèlement à la plus grande longueur de la pupille.
Les deux figures de diffraction sont alors décalées de la même façon, chacune étant
centrée respectivement sur l’image géométrique (respectivement S ′ ou S1′ ) de la source
ponctuelle correspondante.
160 Physique, MP, MP*
yP yP
2λ0 fo′ /b
2λ0 fo′ /b
xP
2λ0 fo′ /ℓ
ℓ≫b
Figure 7.19 – Paramétrage pour le calcul de diffraction par une pupille circulaire
Le calcul de l’intégrale
p ci-dessus se faitpen précisant les bornes d’intégration, à savoir
(cf. figure 7.19) − R2 − x2 6 y 6 R2 − x2 puis −R 6 x√6 R ; il vient donc
Z R R2 −x2
xxP fo′ yyP
w(P ) = Kw0 exp jk0 ′ × exp jk0 ′ √
dx ou, après
x=−R fo jk0 yP fo − R2 −x2
Z R √
2fo′ xxP k0 R2 − x2 yP
substitution, w(P ) = Kw0 exp jk0 ′ sin dx.
k0 yP x=−R fo fo′
Cette intégrale, dont on ne sait pas donner d’expression analytique dans le cadre du
Rk0 xP
cours, peut cependant être réécrite en fonction des variables réduites u = et
fo′
Z 1 p
Rk0 yP 4Kw0 R2
v= ′
, sous la forme w(P ) = cos (uX) sin v 1 − X 2 dX, où on
fo v 0
a posé X = x/R et en exploitant la parité du terme intégré.
Le choix de l’ordre d’intégration (y, puis x) est évidemment arbitraire ; le résultat
obtenu doit être symétrique en xP , yP . En fait, il ne dépend même pas du choix
particulier des axes (Ox) et (Oy) dans le plan de la pupille ; en effet, le dispositif
ayant la symétrie de révolution autour de (Oz), il en va de même de la figure de
diffraction.
Ainsi, l’éclairement en un point q
P de l’écran ne dépend pas de xP et de yP , mais
seulement de la distance rP = x2P + yP2 entre P et le centre de la figure. Plus
précisément, le changement de variables proposé ci-dessus montre que l’amplitude
Rk0 rP
complexe w(P ) et l’éclairement E(P ) ne dépendent en fait que de ρ = .
fo′
Nous admettrons que l’intégrale ci-dessus peut s’écrire en termes de la fonction J1 de
J1 (ρ)
Bessel‡ , sous la forme w(ρ) = 2πR2 Kw0 ; avec donc pour éclairement :
ρ
2
J1 (ρ) 2πR
E(rP ) = 4E0 ρ= rP (7.20)
ρ λ0 fo′
4J12 (ρ)
E(rP )
ρ2
1 E0
1, 7 % 1, 7 % × E0
ρ rP
3, 83 7, 02 rA 1, 8 × rA
4J12 (u)
Figure 7.20 – Tracé des fonctions u 7→ et rP 7→ E(rP )
u2
λ0 fo′
rA = 0, 61 (7.21)
R
On remarque sur les tracés de la figure 7.20 que la tache d’Airy est une zone cir-
culaire entourée d’un cercle faiblement lumineux (avec une luminosité maximale de
l’ordre de grandeur de 1, 7 % de celle observée au centre de la figure) ; on peut vi-
sualiser l’existence de cet anneau sur la figure 7.21, qui représente sur un diagramme
tridimensionnel l’éclairement en fonction des coordonnées d’espace.
λ0 fo′
∆α = 1, 22 rA = ∆α (7.22)
R 2
∆α
b
Une telle ouverture angulaire ∆α ne permet pas de distinguer des objets qui éclairent
le système optique sous des angles trop proches, car alors leurs taches d’Airy se re-
couvrent ; la figure 7.22 illustre ce cas, dans le cas où les objets sont effectivement
angulairement résolus car leur écart angulaire θ est assez élevé.
On rend quantitative cette affirmation en imposant le critère de Rayleigh pour la
séparation des faisceaux issus des deux objets observés : on dit qu’il y a séparation si
l’écart θ entre les maxima est supérieur à la demi-largeur à la base de l’un d’eux :
λ0
θ > θmin = 0, 61 (7.23)
R
∆α ∆α
La prévision théorique Le signal observé
Figure 7.24 – Photographies d’une galaxie spirale réalisée avec deux télescopes
7 : Diffraction de la Lumière 165
8.1.1 Présentation
2 Définitions : on parle d’interférences lorsque, en présence de plusieurs faisceaux lu-
mineux éclairant la même région de l’espace, l’éclairement E (ou l’intensité lumineuse)
n’est pas identique à laX somme des éclairements correspondant aux divers faisceaux,
pris séparément : E =
6 Ei .
i
Dans ce chapitre, nous nous intéresserons essentiellement aux interférences à deux
ondes ; la différence E − (E1 + E2 ), lorsqu’elle existe, porte le nom de terme d’inter-
férence. La présence de ce terme se traduit en général par une alternance de zones
sombres et claires : on parle de franges, respectivement sombres et claires, quelle que
soit la géométrie de ces zones.
La conservation de l’énergie totale impose bien sûr que l’énergie totale, sommée sur
l’ensemble de la zone éclairée, reste égal à la somme des énergies qui seraient envoyées
indépendamment
Z Z par
Z les deux faisceaux qui interfèrent ; on peut par exemple écrire
EdS = E1 dS + E2 dS si les intégrales sont étendues à toute la zone éclairée par
l’un ou l’autre des faisceaux.
2 Historique : dès , Newton décrit des phénomènes d’interférence (les anneaux
qui portent son nom, qui apparaissent entre deux surfaces réfléchissantes très proches)
et en propose une interprétation partielle, dans le cadre de la théorie corpusculaire de
la lumière dont il est l’auteur.
L’anglais Young, dont les centres d’intérêt sont multiples, réalise une série d’expé-
riences relatives aux interférences, dont certaines sont décrites plus loin ; il suggère
alors en une interprétation ondulatoire et propose alors une première évaluation,
essentiellement correcte, de la longueur d’onde des ondes lumineuses pour différentes
couleurs.
Enfin, les travaux de Fresnel‡ à partir de fondent la version moderne de la
théorie ondulatoire de la lumière et permet une interprétation correcte tant des phé-
nomènes de diffraction que des phénomènes d’interférence.
Finalement, les phénomènes d’interférence ont trouvé de nombreuses applications dans
la métrologie des petites dimensions, avec notamment les travaux de Michelson ;
l’appareil développé par ce dernier et ses applications seront présentés ultérieurement.
168 Physique, MP, MP*
La présence du terme ϕ0i (t) mérite une explication : il s’agit d’une conséquence des
mécanismes d’émission des ondes lumineuses par les sources de lumière. Ces ondes
ne sont pas émises de façon permanente, mais sous forme de trains d’onde de durée
limitée. Un train d’onde commence à être émis lorsqu’un atome de la source, préala-
blement excité par une source d’énergie, commence à se désexciter. Il cesse d’exister
lorsque l’atome émetteur est perturbé (par exemple par un choc au sein du milieu qui
constitue la source de lumière).
Lorsque l’émission lumineuse reprend un peu plus tard, il n’existe pas de corrélation
entre la phase du nouveau train d’onde et celle du train d’onde qui l’a précédé ; ainsi, la
grandeur ϕ0i (t) varie de manière complexe au gré des émissions successives des trains
d’ondes qui se succèdent, sauf s’il existe un phénomène de synchronisation (comme
par exemple le mécanisme d’émission stimulée, dans le cas des lasers).
Il reste à évaluer la moyenne temporelle de |W 1 + W 2 |2 = (W 1 + W 2 ) (W ∗1 + W ∗2 )
qui s’écrit, après développements, |W 1 |2 + |W 2 |2 + W 1 W ∗2 + W ∗1 W 2 .
Rappelons ici quelques propriétés des nombres complexes qui seront souvent utiles
dans la suite. En plus de la relation |z|2 = zz ∗ déjà utilisée ci-dessus, rappelons
que z + z ∗ = 2 Re(z) ; en particulier, si on adopte la notation trigonométrique
z = ρ exp (iθ), alors z + z ∗ = 2ρ cos θ. De même, on montre sans difficulté que, si
z1 = ρ1 exp (iθ1 ) et z2 = ρ2 exp (iθ2 ), alors |z1 +z2 |2 = ρ21 +ρ22 +2ρ1 ρ2 cos (θ1 − θ2 )
et |z1 − z2 |2 = ρ21 + ρ22 + 2ρ1 ρ2 sin (θ1 − θ2 ).
En fonction des amplitudes et phases des deux ondes, cette grandeur s’écrit encore
2 2
w01 + w02 + 2w01 w02 cos (Φ1 (t) − Φ2 (t)) ; on reconnaı̂t ici les expressions des éclai-
2
rements Ei = w0i (sous réserve que w0i soit indépendant du temps, ce que nous
supposerons ici) ; il vient donc l’expression :
p
E(M ) = E1 (M ) + E1 (M ) + 2 E1 (M )E2 (M ) hcos (Φ1 (t) − Φ2 (t))i (8.2)
| {z }
le terme d’interférence éventuel
Notons bien que ce résultat ne s’applique que pour l’étude des interférences à deux
ondes ! Dans le cas où un plus grand nombre de termes sont à prendre en compte,
on devra procéder à l’addition des complexes W i avant de calculer la moyenne du
module du carré de cette somme de plus de deux termes. Nous verrons ultérieurement
sous quelles conditions on peut aussi dégager une expression générale, qui sera de
toutes façons différente de (8.2).
170 Physique, MP, MP*
Notons d’abord que même deux raies de longueur d’onde très voisines, comme le
sont les composantes du doublet jaune des lampes à vapeur de sodium par exemple,
ne sauraient interférer ; avec des longueurs d’onde écartées seulement d’un millième
ω 2πc0
en valeur relative, on aura ω1 − ω2 ∼ = donc, avec λ0 ∼ 600 nm,
1 000 1 000λ0
12
un écart ω1 − ω2 de l’ordre de 3 × 10 rad · s ; il n’existe à l’heure actuelle
−1
et seules les éventuelles variations temporelles de ϕ01 (t) − ϕ02 (t) peuvent encore em-
pêcher l’observation des interférences. Pour bien comprendre l’origine des variations
temporelles de ϕ0i (t), rappelons une fois encore le mécanisme de l’émission de lumière
dans une source lumineuse. Un atome, excité par un apport d’énergie extérieur (ther-
mique, électrique, etc.) se désexcite par émission d’une onde sinusoı̈dale, jusqu’à ce
que cette émission soit interrompue, par exemple par un choc avec un autre atome.
L’onde émise a alors la forme d’une succession de trains d’onde, chacun correspondant
à une phase aléatoire.
La durée de chacun des trains d’onde, ainsi que la durée de l’intervalle qui sépare deux
trains d’onde consécutifs, est a priori aléatoire ; cependant, chacune de ces durées reste
en général du même ordre de grandeur, que nous noterons τc ou temps de cohérence.
La figure 8.1 présente la forme des trains d’onde W 1 et W 2 émis par deux sources
indépendantes, ainsi que les variations des phases associées ; on constate que, pendant
les intervalles de temps où les deux trains d’ondes W 1 et W 2 coexistent, leur déphasage
ϕ01 − ϕ02 varie très rapidement au cours du temps.
2 Condition de cohérence temporelle : sauf exception, la fréquence très élevée des
chocs dans le milieu qui constitue la source de lumière impose des variations très
rapides des deux phases ϕ01 (t) et ϕ02 (t) ; en général, leur différence varie plus vite
8 : Interférences à deux ondes 171
intervalles de
W1 (t) temps où les deux
ondes coexistent
W2 (t)
On écrit alors en général l’expression de l’éclairement sous la forme (8.4), qui porte
parfois le nom de formule fondamentale des interférences à deux ondes :
p 2π
E(M ) = E1 (M ) + E2 (M ) + 2 E1 (M )E2 (M ) cos δ(M ) + ∆ϕ0 (8.4)
λ0
On retranscrit parfois cette relation sous une forme faisant intervenir exclusivement
des déphasages, en fonction d’un déphasage lié à la différence de marche ∆ϕ :
2π p
∆ϕ = δ(M ) E = E1 + E2 + 2 E1 E2 cos (∆ϕ + ∆ϕ0 ) (8.5)
λ0
172 Physique, MP, MP*
Au contraire, on préfère parfois utiliser une forme faisant intervenir exclusivement des
trajets optiques, en fonction d’une différence de marche (fictive) optique δ0 :
2π p 2π
∆ϕ0 = δ0 E = E1 + E2 + 2 E1 E2 cos (δ(M ) + δ0 ) (8.6)
λ0 λ0
∆λ0 1
2 = (8.7)
λ0 c0 τc
On retrouve ici encore que, plus les termes τc et ∆λ0 sont grands, moins on peut
considérer que la source est monochromatique.
2 Longueur de cohérence : en réalité, l’expression (8.4) ne constitue qu’une première
approche du phénomène d’interférence. En effet, la présence de la différence de marche
2π
δ = (S1 M )−(S2 M ) ou du déphasage ∆ϕ = δ signifie que les ondes qui sont parties
λ0
au même instant de la source lumineuse S atteignent le point M avec un décalage
|δ|
temporel τ = ; les deux ondes qu’on doit additionner au point M sont alors
c0
représentées sur la figure 8.2, où on a représenté en traits gras un train d’ondes (de
durée τc ), tel qu’il parvient en M par les voies de chemins optiques respectifs (S1 M )
et (S2 M ).
En traits plus fins, on a tracé les trains d’onde qui précèdent ou suivent celui qui nous
intéresse ; sans rapport de phase deux à deux, l’addition de ces ondes non cohérentes
ne peut donc mener à l’observation d’interférences. Les seuls intervalles de temps
où le phénomène d’interférence se produit sont alors encadrés sur la figure 8.2 ; ces
intervalles ont pour durée τc − |δ|/c0 .
8 : Interférences à deux ondes 173
W2 (t)
t
|δ|/c0
τc
W1 (t)
t
ℓc ℓc δ
Figure 8.3 – Influence de la longueur finie des trains d’onde : tracé de f (δ)
Notant ℓc = c0 τc pour la longueur (spatiale, moyenne) d’un train d’onde, ou longueur
p 2π
de cohérence, on pourra écrire E = E1 +E2 +2 E1 E2 f (δ) cos δ + ∆ϕ0 et déduire
λ0
ℓc − δ
du tracé 8.3 de f (δ) = une condition supplémentaire de cohérence temporelle :
ℓc
Longueur de cohérence
X On ne peut observer d’interférences que pour des différences de marche
δ inférieures (en valeur absolue) à la longueur de cohérence (ou longueur
des trains d’onde) ℓc .
Plus généralement, du fait de la longueur finie des trains d’onde, les
phénomènes d’interférence sont bien marqués pour des différences de
marche faibles, et sont de moins en moins visibles pour des différences
de marche élevées, et proches de ℓc .
λ20
ℓc = c0 τc = (8.8)
∆λ0
∆λ0 1
On en déduit l’élargissement spectral relatif = , qui constitue une autre
λ0 N
mesure du caractère monochromatique de la source utilisée ; il figure également dans
le tableau 8.1.
Source ℓc N ∆λ0 /λ0
Laser CO2 stabilisé (infrarouge) 30 km 3 × 109 3 × 10−10
Laser Hélium–Néon 30 cm 50 000 2 × 10−5
Raie rouge de l’Hydrogène 4 mm 6 500 1, 6 × 10−4
Lumière naturelle avec filtre coloré ∼ 10 µm ∼ 25 ∼ 0, 04
Lumière blanche ∼ 0, 5 µm ∼1 ∼1
La grande variété des ordres de grandeur présents dans ce tableau impose quelques
commentaires. On remarque d’abord l’excellente monochromaticité des sources laser ;
qui est bien meilleure qu’une source spectrale obtenue par exemple en isolant une raie
d’émission d’une source à Hydrogène.
Au contraire, l’emploi d’un simple filtre coloré ne permet pas de définir une source
monochromatique : si la lumière qui en est issue semble d’une teinte unique à l’œil, il
n’en est rien en réalité.
Enfin, les valeurs concernant la lumière blanche ont été évaluées en considérant qu’il
s’agit d’ondes couvrant tout l’intervalle des longueurs d’onde de λmin = 400 nm à
λmax = 800 nm ; l’intervalle correspondant ∆λ0 = λmax − λmin = 400 nm est donc
bien du même ordre de grandeur que la longueur d’onde moyenne λ0 correspondant
au domaine visible.
2 Cohérence spatiale : la condition de cohérence temporelle énoncée ci-dessus est, en
fait, extraordinairement restrictive si on la prend au sens strict : exiger qu’une source
unique S éclaire le point M par au moins deux voies différentes, c’est restreindre
l’étude des interférences aux phénomènes éclairés par un atome unique ! Comme on
va le voir, il suffit en fait d’utiliser une source de très petites dimensions, même si elle
contient bien évidemment un très grand nombre de sources ponctuelles.
Considérons en effet plusieurs atomes sources k = 1, 2, . . ., qui éclairent par deux voies
différentes le même point d’observation M . Nous admettrons aussi qu’un dispositif
approprié sélectionne une longueur d’onde unique, mais aussi que la différence de
marche δ = (SM )1 − (SM )2 est assez faible devant la longueur de cohérence de la
source.
On peut alors
X écrire l’amplitude lumineuse complexe en M sous la forme de la somme
w(M ) = wk1 (M )+wk2 (M ) où l’amplitude wki (M ) correspondant à l’atome émetteur
k
k K 2π
numéro k et à la voie i (i = 1, 2) vérifie wi (M ) = wi (S) exp −j (SM )i .
λ0
Prenant en compte la différence des deux modules du aux différences d’éclairement
k
p
k
p 2π
des deux voies, on peut noter w1 (M ) = H k E1 et w2 (M ) = H k E2 exp j δ) .
λ0
8 : Interférences à deux ondes 175
les atomes source, donc que la position de tous ces atomes soit confondue avec un
point unique S avec une précision suffisante.
En pratique, il suffira bien sûr que la dimension spatiale de la source soit assez réduite
pour que la différence de marche δ = (SM )1 −(SM )2 ne change pas quand on parcourt
tousles points
de la fente source ; les variations ∆δ doivent en particulier être telles
∆δ
que
≪ π.
λ0
On mémorisera aussi les résultats obtenus ci-dessus à l’occasion du calcul de l’éclaire-
ment observé en présence d’une source étendue sous la double forme très importante :
Éclairage cohérent
X Lors de la somme de plusieurs ondes cohérentes entre elles (issues de la
même source, synchrones),
X on procède à l’addition des amplitudes com-
plexes wtotal = wi avant de calculer l’éclairement E = |wtotal |2 cor-
i
respondant ; les différentes phases intervenant dans cette somme, étant
en relation invariable au cours du temps, font en général intervenir un
terme d’interférence.
Éclairage incohérent
X Lors de la somme de plusieurs ondes incohérentes entre elles (issues de
sources différentesXou non synchrones), on procède à l’addition des éclai-
rements Etotal = Ei puisque les déphasages entre amplitudes varient
i
de manière aléatoire.
où la grandeur p porte le nom d’ordre d’interférence ; cet ordre est unpentier pour
une frange claire (p ∈ Z), avec pour éclairement Emax = E1 + E2 + 2 E1 E2 ; c’est
1
un demi-entier (ce terme, en Physique, désigne un élément de + Z, ou encore
2
la moitié d’un entier
p relatif impair) pour une frange sombre, avec pour éclairement
Emin = E1 + E2 − 2 E1 E2 .
8 : Interférences à deux ondes 177
Le lien entre frange claire et ordre d’interférence entier n’est pas restreint au seul
cas des interférences à deux ondes ; on verra progressivement qu’on obtient le même
résultat dans tous les cas de systèmes interférentiels lorsque les interférences sont
la cause principale de variation de la luminosité en fonction de la position du point
d’observation M .
2 Contraste des franges : les courbes de la figure 8.4 montrent la répartition d’éclai-
rement en fonction de la différence de marche, dans les deux cas où E1 ≃ E2 (à gauche)
et E1 > E2 (à droite) ; on voit que, dans le second cas, on n’observe pas d’annulations
de l’éclairement au niveau des franges sombres ; on dira encore que le contraste des
franges est plus faible dans le second cas.
E1 ≃ E2 E E1 > E2 E
δ δ
b b b b b b
−λ0 +λ0 −λ0 +λ0
Emax − Emin
C= (8.10)
Emax + Emin
C’est une grandeur sans dimension, positive par construction, et qui peut atteindre
au maximum la valeur C = 1 lorsque Emin = 0. En particulier, dans lepcas des
interférences à deux ondes décrites ci-dessus,
√ on a vu que Emax = E1 + E2 + 2 E1 E2 et
p 2 E1 E2
Emin = E1 +E2 −2 E1 E2 donc C = : le contraste ne garde sa valeur maximale
E1 + E2
C = 1 que si E1 = E2 ; il s’annule seulement si E1 = 0 ou E2 = 0.
2 Fonction de visibilité : on a vu que la prise en compte de la longueur de cohérence
finie des trains d’onde qui interfèrent permet
d’expliciter
l’éclairement sous la forme
p ℓc − |δ| 2π
E(δ) = E1 + E2 + 2 E1 E2 cos δ + ∆ϕ0 ; plus généralement, nous ren-
ℓc λ0
contrerons souvent des dispositifs d’interférence à deux ondes permettant d’expliciter
l’éclairement sous la forme :
2π
E(δ) = E0 1 + V (δ) cos δ + ∆ϕ0 (8.11)
λ0
Dans ce cas, la fonction V (δ) porte √ le nom de fonction de visibilité ; dans le cas
2 E1 E2 ℓc − |δ|
précédent, on a par exemple V (δ) = .
E1 + E2 ℓc
Nous donnerons une interprétation générale de (8.11) dans le cas où V varie plus
2π
lentement que le terme d’interférence cos δ + ∆ϕ0 ; on peut alors représenter
λ0
l’allure des fonctions V (δ) et E(δ), à la même échelle, selon la figure 8.5.
178 Physique, MP, MP*
V (δ) E
λ0 δ
Emax − Emin
C= = |V (δ)| (8.12)
Emax + Emin
Notons ici que la fonction de visibilité peut changer de signe ; une zone où V (δ) < 0
est caractérisée par le phénomène d’inversion du contraste : dans ces zones, les
franges claires remplacent les franges sombres, et réciproquement.
M
b
b
S0
S2
b
Cette géométrie d’Young est caractérisée par l’existence de deux points de passage
obligés des rayons lumineux, les sources secondaires S1 et S2 , à partir desquels on peut
éclairer plusieurs points M . La différence de marche entre les faisceaux qui interfèrent
en M peut alors s’écrire δtotal = (S0 S1 M ) − (S0 S2 M ), somme de deux termes :
– la différence δavant = (S0 S1 )−(S0 S2 ), qui est indépendante de M , peut s’interpréter
comme une différence de phase à l’émission par les sources secondaires, fictives,
placées en S1 et S2 .
8 : Interférences à deux ondes 179
b p = +1
S2 S2 M
p = +2
D
p = +3
La forme exacte des franges observées sur un écran dépend de la position de cet écran ;
sur la figure 8.7, l’écran E est disposé parallèlement à l’axe S2 S1 et l’intersection des
franges claires avec l’écran d’observation prend alors la forme d’un réseau de courbes,
comme celles de la figure 8.8.
Nous nous placerons dans la suite dans le cas où la distance D entre les sources
et l’écran est beaucoup plus grande que toutes les autres dimensions mises en jeu :
180 Physique, MP, MP*
D ≫ x, y, a. Les franges de la figure 8.8 sont alors très peu courbées au voisinage du
centre de la figure ; on peut en première approximation traiter ces courbes comme
des droites. On peut d’ailleurs obtenir une équation cartésienne
r de ces droites en
a 2
effectuant un développement limité des longueurs S1 M = x− + y 2 + D2 et
r 2
a 2 2 2
1 2 2 a2
S2 M = x+ + y + D , sous la forme S1 M ≃ D + x + y − ax +
2 2D 4
2
1 a
et S2 M ≃ D + x2 + y 2 + ax + , d’où enfin l’expression importante :
2D 4
ax
δaprès = S1 M − S2 M ≃ − (8.13)
D
ax λ0 D
Une frange δ = δavant − = pλ0 est donc une droite, d’équation xp = x0 − p ,
D a
où on a noté x0 = −Dδavant /a l’abscisse de la frange d’ordre zéro, qui porte aussi
souvent le nom de frange centrale.
On observe ainsi un réseau de franges rectilignes parallèles et équidistantes, la distance
de deux franges consécutives portant le nom d’interfrange i, avec :
λ0 D
i= (8.14)
a
La figure 8.9 montre l’aspect de telles franges ; on y constate aussi la perte progressive
de contraste de part et d’autre de la frange centrale.
abscisse x
sur l’écran
i
Remarquons que la relation (8.14) impose, pour une observation facile, une distance
a faible entre sources secondaires ; ainsi, avec un écran situé à D = 1 m des sources
secondaires et un éclairage monochromatique à la longueur d’onde λ0 = 500 nm
(dans le domaine visible), un interfrange i = 0, 5 mm sera obtenu avec une distance
des sources secondaires a = 1 mm.
On observera de telles franges rectilignes et équidistantes avec divers dispositifs pra-
tiques présentés plus loin : trous et fentes de Young, miroirs de Fresnel, coin d’air.
2 Franges circulaires : considérons maintenant le cas où l’écran d’observation E est
disposé perpendiculairement à l’axe S1 S2 , comme on le voit sur la figure 8.10.
Dans une telle géométrie, les franges d’interférence sont des intersections de courbes
(hyperboloı̈des) présentant l’axe de symétrie de révolution avec un écran qui présente
la même symétrie de révolution ; il s’agit donc nécessairement de cercles d’axe (Ox).
8 : Interférences à deux ondes 181
x
Mb
E
D
S1
b
z
S2 b
Sans donner d’équation algébrique générale de ces franges circulaires, nous noterons
seulement, par exemple en observant la figure 8.11, que ces franges ne sont en général
pas équidistantes ; on ne définira donc ici pas d’interfrange.
y
x
K1
S1 b
α bM
α b x z
F′
a
b b K2
S2
H
f′
Le calcul qui précède ne doit en aucun cas être remplacé par le raisonnement inexact
suivant : les distances S1 K1 et S2 K2 étant égales, on pourrait être tenté d’affirmer
que δ = K1 M − K2 M . Ce résultat est manifestement faux sur la figure (il fournirait
ici δ > 0, ce qui n’est pas le cas) pour la raison suivante : K1 et K2 ne sont pas
des points, mais des zones de traversée de la lentille ; celle-ci, convergente, est plus
épaisse au voisinage de son centre et la traversée en K2 correspond à un chemin
optique supérieur à celui associé à la traversée en K1 . Il n’est ni utile ni simple de
chercher à exprimer cette différence d’épaisseur et on n’utilisera pas cette méthode.
Finalement, la comparaison de ce résultat avec (8.13) montre que les franges restent
rectilignes et équidistantes, d’interfrange i obtenu en faisant D −→ f ′ :
ax λ0 f ′
δ = S1 M − S2 M ≃ − i= (8.15)
f′ a
bM
H
b r
b b α α b
z
S1 S2 F′
s
′ pλ0
δ = pλ0 rp = f 2 1 − (8.17)
a
Il ne s’agit en aucun cas d’une présentation exhaustive de tous les dispositifs inter-
férentiels possibles, mais seulement d’une présentation rapide de quelques unes des
réalisations les plus fréquemment rencontrées.
Les seuls dispositifs interférentiels à deux ondes dont la connaissance détaillée est
exigée par le programme sont les dispositifs à trous (ou fentes) de Young et l’appareil
de Michelson, qui sera présenté dans un chapitre ultérieur.
2 Trous ou fentes de Young : le dispositif des trous de Young est présenté sur la figure
8.14 ; il est formé de deux trous T1 et T2 , en général circulaires, de faible dimension,
éclairés par une source ponctuelle S.
bM
T1
S z
b
zone
d’interférences
T2
E
Du fait de leur petitesse, les deux trous diffractent la lumière incidente et peuvent
être considérés comme des sources secondaires émettant deux faisceaux dont la largeur
angulaire est liée à la dimension des trous.
Un tel dispositif présente exactement la géométrie nécessaire pour observer des franges
quasi-rectilignes, équidistantes, sur un écran E disposé à grande distance des deux
trous, parallèlement au plan (Oxy) dans lequel les deux trous sont percés.
On verra au chapitre suivant comment le dispositif peut être modifié, sans perdre la
forme et la disposition des franges, mais pour augmenter leur luminosité :
– en remplaçant les trous par des fentes fines, longues, perpendiculaires à la direction
T1 T2 : on parle alors de dispositif des fentes de Young ;
– en remplaçant l’observation directe sur un écran par l’emploi d’une lentille de pro-
jection, l’observation étant alors réalisée dans le plan focal image de cette lentille ;
on parle alors d’observation à l’infini des franges rectilignes.
2 Miroirs de Fresnel : le dispositif est représenté sur la figure 8.15 ; une source
ponctuelle S est disposée à la distance d de l’arête O de deux miroirs plans faisant un
angle α, en principe de l’ordre de 10−2 à 10−3 rad, très exagéré sur la figure.
S
b
u
b
S1 O
α
β
b
S2
2 Bilentilles de Meslin : le dispositif (son étude générale est hors programme) est
formé d’une lentille convergente sciée en deux parties qui sont décalées, conformé-
ment à la figure 8.16 ; les deux faisceaux se recouvrent dans une zone d’interférence
restreinte, située entre S1 et S2 ; c’est donc dans cette région qu’on doit disposer
l’écran E.
L1
E
Sb S1 S2
b b
b
M
L2
on peut interpréter cette propriété en remarquant que S2 est une source secondaire
virtuelle (non atteinte par le rayon lumineux) ; S1 est une source secondaire réelle.
Les franges sont alors des surfaces telles que S1 M + S2 M , donc des ellipsoı̈des de
révolution autour de l’axe passant par leurs foyers S1 et S2 ; leur intersection avec
l’écran E est donc formée de demi-cercles d’axe confondu avec S1 S2 .
2 Biprisme de Fresnel : on peut encore proposer un dispositif interférentiel équivalent
aux précédents au moyen d’un biprisme, formé de deux prismes de verre de petit angle
A accolés par la base. Ce dispositif est représenté sur la figure 8.17.
Un prisme n’étant en général pas un dispositif stigmatique pour un point source situé
à distance finie, cet appareil n’est pas équivalent aux dispositifs de Young, sauf dans
le cas de la figure 8.17 où la source est rejetée à l’infini. Le faisceau incident parallèle
fournit alors, en sortie de l’appareil, deux faisceaux parallèles déviés en sens contraire
formant un angle 2α, si α est la déviation due à un des prismes.
S1
α
α
S2
Il existe alors une région de l’espace (en gris sur la figure) où interfèrent deux ondes
planes, cohérentes entre elles mais dont les directions de propagation font un angle 2α ;
on peut considérer que deux sources secondaires S1 et S2 , situées à très grande distance
a
D et décalées d’une très grande longueur a, avec 2α ≃ , éclairent cette région. On
D
observera donc des franges rectilignes, parallèles et équidistantes, perpendiculaires au
plan de la figure 8.17, avec pour interfrange i = λ0 D/a (selon la relation général pour
un dispositif d’Young à grande distance) donc i ≃ λ0 /2α.
Une étude exacte des interférences entre deux ondes planes est proposée plus loin,
dans le cadre du dispositif dit du coin d’air ; on montrera à ce moment que l’expres-
sion exacte de l’interfrange est i = λ0 /2 sin α.
i b
i S
d1 e
d2
lame 1
lame L1 d1 lame 2
S1 b d2
b
2e
lame L2 S2
Les ondes successivement réfléchies par le dispositif ont pour amplitudes réelles res-
pectives w1 = rw0 (après une réflexion), w2 = rt2 w0 (après une réflexion et deux
transmissions), w3 = r4 t2 w0 et plus généralement wn = r2(n−1) t2 w0 pour les ondes
suivantes (n > 3).
Comme r ≪ t ≃ 1, w1 ≃ w2 tandis que wn ≪ . . . ≪ w3 ≪ w2 : il s’agit, en
première approximation, d’interférences à deux ondes (d’amplitudes pratiquement
égales w1 ≃ w2 ).
Si on éclaire le dispositif au moyen d’une source ponctuelle unique S (cf. figure 8.18
à droite), les rayons émergents semblent provenir des deux images de S par réflexion
sur les deux lames ; ces sources secondaires S1 et S2 sont distantes de 2e, si e est la
distance qui sépare les deux lames.
L’ensemble du dispositif est alors équivalent à un dispositif d’Young, l’observation
étant en général réalisée sur un écran parallèle aux lames ; on se trouve dans le cas de
la figure 8.10 et les franges sont circulaires, comme par exemple sur la figure 8.11.
188 Physique, MP, MP*
2 Franges circulaires d’une lame d’air : pour déterminer la nature des franges formées
par un dispositif à lame d’air, on va montrer qu’il n’est en fait pas nécessaire de
connaı̂tre la disposition ni même la nature précise de la source qui éclaire la lame
d’air : il suffit que cette source éclaire la lame sous plusieurs incidences i.
K
i b i
b
i b
H Q
e
P
b
Sur la figure 8.19, le point H représente le dernier point commun aux deux ondes ; en
ce point, ces deux ondes sont en phase. Si l’observation est faite à l’infini, on constate
sur la figure que les deux ondes parcourent des trajets différents pour atteindre le
plan KQ, orthogonal au faisceau de sortie ; l’une parcourt seulement la distance HK,
tandis que l’autre doit parcourir la distance HP Q. Si on néglige tout déphasage lors
des réflexions et transmissions, on peut écrire δ = HP Q − HK = 2HP − HK.
On exprime alors aisément ces différentes longueurs en fonction de l’épaisseur e de la
e sin2 i
lame d’air : HP = puis HQ = 2e tan i donc HK = HQ sin i = 2e . Il reste
cos i cos i
2e
donc δ = 1 − sin2 i , soit enfin :
cos i
δ = 2e cos i (8.18)
Ce résultat n’est évidemment rien d’autre que celui déjà obtenu en (8.16) ; on en dduit
immédiatement les propriétés des franges circulaires obtenues en projection dans le
plan focal de la lentille représentée sur la figure 8.20. Les franges réalisées avec une
lame d’air ainsi projetées à l’infini portent le nom d’anneaux de Haidinger, ou franges
d’égale inclinaison.
Fb′ Mb
Écran
i
f′
Lentille de projection
Lame d’air
En particulier, le rayon rp de la frange d’ordre p estp donné par δ = pλ0 donc, dans
les conditions de stigmatisme de la lentille, rp = f ′ 2 − pλ0 /e.
2 Coin d’air : on passe aisément du dispositif de la lame d’air à celui du coin d’air
en rompant la symétrie de révolution (qui assurait la formation de franges coniques)
8 : Interférences à deux ondes 189
si les deux lames L1 et L2 ne sont plus parallèles, mais forment un dièdre de petit
angle α ; cette situation est alors représentée sur la figure 8.21, tracée dans un plan
perpendiculaire à l’axe du dièdre, qui est aussi l’axe (Oz) formé de l’intersection des
deux lames.
y fr a
ng
es
e1
u b
u e2
ond
M ond u+α
x Y
O b
u′
u′ α
X
Dans les mêmes conditions de transparence que pour l’étude de la lame d’air, on peut
considérer que le système forme, par réflexion, des interférences à deux ondes de même
amplitude (réelle) w1 ≃ w2 = w.
Si le dispositif est éclairé par une source ponctuelle unique S, on peut comme pré-
cédemment remplacer celle-ci par les deux sources secondaires S1 et S2 formées des
deux images de S par réflexion sur les deux lames. Le coin d’air est alors strictement
équivalent à un dispositif de miroirs de Fresnel.
2 Coin d’air en éclairage parallèle : nous allons étudier en détail le cas où le coin
d’air est éclairé par une source à l’infini, c’est-à-dire par une onde plane entièrement
définie par son angle d’incidence u. On a supposé sur la figure 8.21 que cette onde
se propage dans le plan perpendiculaire à l’arête du dièdre formé par les deux lames
réfléchissantes formant le coin d’air.
On étudie, après réflexion sur ces deux lames, les deux ondes, de même amplitude,
formées par réflexion ; ces ondes sont en phase en leur seul point commun O (si
on néglige tout déphasage du aux transmissions et aux réflexions) et on peut donc
exprimer les amplitudes complexes associées sous la forme wi = w exp (−iki · r), les
2π
vecteurs d’onde k1 et k2 ayant même amplitude k0 = , mais ils sont dirigés,
λ0
conformément à la figure 8.21 par les lois de Snell-Descartes, en fonction de l’angle
d’incidence u sur la première lame et de l’angle d’incidence u′ = u + α sur la seconde.
2π sin u x
On peut en particulier écrire les phases de ces deux ondes ϕ1 = ·
λ0 cos u y
2π sin(u′ + α) x
et ϕ2 = · , en utilisant la base proposée sur la figure 8.21. Le
λ0 cos(u′ + α) y
déphasage des deux ondes en un point M quelconque, de coordonnées (x, y, z) s’écrit
2π
alors ϕ2 − ϕ1 = δ, en fonction de la différence de marche δ donnée, après quelques
λ0
transformations trigonométriques, par δ = 2 sin α (x cos(u + α) − y sin(u + α)).
pλ0
Une frange d’ordre p est donc un plan d’équation x cos(u+α)−y sin(u+α) = ;
2 sin α
ces plans sont dirigés par le vecteur unitaire eY = sin(u+α)ex +cos(u+α)ey : ils sont
donc parallèles entre eux. Certains de ces plans figurent, en pointillés, sur le schéma
du dispositif. Si on place un écran perpendiculairement à ces franges (donc dirigé par
(eX , ez )), on observera des franges rectilignes.
190 Physique, MP, MP*
Dans le système d’axes Y, X adapté à l’étude de ces franges, leur équation peut s’écrire
δ = 2 sin αX ; ces franges sont alors équidistantes, la frange d’ordre p se projetant sur
cet écran selon la droite d’équation xp = pλ0 .
L’interfrange est alors la grandeur constante i = xp+1 − xp soit :
λ0
i= (8.19)
2 sin α
Notons qu’on n’observera de franges bien visibles que si l’interfrange est assez grand ;
ainsi, pour obtenir un interfrange de i = 0, 1 mm avec λ0 = 500 nm, il faudra choisir
α = 2, 5 mrad.
L’angle u est aussi faible en général et eX ≃ ex donc δ ≃ 2xα ≃ 2x tan α ; il s’agit
simplement de l’expression δ ≃ 2e(x) où on a noté e(x) l’épaisseur du coin d’air à
l’abscisse x. Cette expression s’interprète ainsi : l’onde 2 doit, en plus du trajet de
l’onde 1, faire un aller et retour entre les deux lames du coin d’air, ce qui correspond
à une différence de marche égale au trajet aller et retour 2e(x).
Pour cette raison, ces franges portent aussi le nom de franges d’égale épaisseur ; on
parle encore de franges de Fizeau.
2 Anneaux de Newton : on peut généraliser l’étude ci-dessus en réalisant des inter-
férences entre deux ondes subissant deux réflexions sur deux surfaces voisines, comme
par exemple les deux faces d’une lame mince d’huile à la surface de l’eau, ou bien
les deux faces d’un coin formé par un miroir et la face inférieure d’une lentille plan-
convexe (figure 8.22). On forme alors des franges de Newton.
r
lentille
lame d’huile
Dans les deux cas, si on se limite aux faibles incidences et à des lames peu inclinées, on
formera des franges d’égale épaisseur. Pour une lame d’huile, δ = 2ne où n est l’indice
optique de l’huile et e l’épaisseur en un point donné du film d’huile forme ; dans le
second cas, δ = 2e(r) car on forme une lame d’air (indice égal à 1) dont l’épaisseur
présente la symétrie de révolution et ne dépend donc que de la distance r à l’axe de
symétrie.
Une frange correspond donc à une courbe d’épaisseur constante, donc à une ligne de
niveau de la fonction e(M ) au point M où on forme les franges.
Dans le cas du dispositif à symétrie de révolution, ces franges sont donc des cercles
concentriques qui portent le nom d’anneaux de Newton. Dans le cas des interférences
formées en présence d’une lame d’huile (ou plus généralement d’une fine lame de
liquide), on peut disposer ainsi d’une méthode de mesure de l’épaisseur du film liquide.
8 : Interférences à deux ondes 191
Les interférences à deux ondes (ou plus) peuvent être réalisées par division du
front d’onde ou par division d’amplitude, pour former des sources secondaires
cohérentes : elles doivent être synchrones et de petite dimension.
En présence de sources cohérentes, on procède à l’addition des amplitudes com-
plexes ; dans le cas contraire, on procède à l’addition des éclairements :
X 2
X
wtotal = wi E = |wtotal | E= Ei
i i
| {z } | {z }
cohérence incohérence
p
Avec deux ondes monochromatiques, E = E1 + E2 + 2 E1 E2 cos ∆ϕ avec pour
2π
déphasage ∆ϕ = δ ; la différence de marche δ peut avoir une composante
λ0
optique (déphasage des sources secondaires) et une composante géométrique
S2 M − S1 M .
Plus généralement, on définit le contraste entre franges claires et sombres en
Emax − Emin
un point du champ d’interférence par C = ; dans le cas (fréquent)
Emax + Emin
2π
où on peut écrire E(M ) = E0 1 + V (M ) cos δ(M ) et si la fonction de
λ0
visibilité V (M ) varie lentement, alors C = |V (M )|.
b
Si deux sources secondaires S1 et S2 sont distantes de a, bM
S1 b
l’observation réalisée sur un écran parallèle à S1 S2 situé b
à grande distance D des sources (géométrie de Young) a b
D b
montre des franges rectilignes, perpendiculaires à S1 S2 , S2 b b i
équidistantes de i = λ0 D/a puisque δ = ±ax/D. b
b
On peut réaliser la même observation à l’infini en utili- bM
S1 b
sant une lentille de projection de focale f ′ ; on observe b
alors des franges rectilignes, perpendiculaires à S1 S2 , a b
b
équidistantes de i = λ0 f ′ /a puisque δ = ±ax/f ′ . S2 b f′ b i
b
Pour montrer ce résultat, on utilise le stigmatisme de le lentille.
Réseaux de diffraction
f1′ x f2′
z
b b b b b
Ces deux fentes sont percées dans un écran opaque éclairé par une onde monochro-
matique l’aspect de cette pupille est représenté sur la figure 9.2.
a
ℓ
Cette onde est issue d’une source ponctuelle S disposée au foyer objet d’une lentille
194 Physique, MP, MP*
convergente de focale f1′ ; l’observation est réalisée dans un écran disposé dans le
plan focal image d’une autre lentille convergente de focale f2′ . Les deux lentilles sont
utilisées dans les conditions de Gauss.
2 Calcul de l’amplitude diffractée : en utilisant le système d’axes orthonormé de la
figure 9.1, l’amplitude diffractée dans la direction définie par les cosinus directeurs
(α, β) par la pupille double que forment les fentes de Young s’écrit sous la forme
x 2π
w(α, β) = Kw0 exp j (xα + yβ) dxdy, où λ0 désigne la longueur d’onde
λ0
M ∈(Σ)
utilisée. L’intégrale porte sur tous les points M de coordonnées (x, y) appartenant
à la
ℓ ℓ
pupille (Σ). Cette intégrale porte donc sur tous les couples (x, y) tels que y ∈ − ;
2 2
a b a b [ a b a b
tandis que x ∈ − − ; − + + − ;+ + .
2 2 2 2 2 2 2 2
On peut donc mettre calculer cette intégrale comme le produit de deux termes fonc-
tions séparément de α et de β, sous la forme w(α, β) = Kw0 A(α) × B(β), où on a
Z +ℓ/2
2π πβℓ
posé B(β) = exp βy dy soit B(β) = ℓ × sinc .
−ℓ/2 λ0 λ0
B(β) est un terme classique de diffraction par une pupille longue ; compte tenu de
la grande valeur de ℓ, la largeur angulaire dans la direction de l’axe (Oy) est limitée
λ0
et de l’ordre de grandeur de , c’est-à-dire qu’elle est très faible : il n’y a pas de
ℓ
diffraction dans la direction de la plus grande longueur de la pupille.
Le terme A(α) étant une intégrale portant sur la réunion de deux intervalles disjoints,
il s’agit d’une somme de deux intégrales analogues A(α) = f+a/2 (α) + f−a/2 (α), où
Z d+b/2
2π
on a choisi de poser fd (α) = exp j αx dx.
d−b/2 λ0
Le changement de variables x′ = x − d permet de calculer immédiatement ces deux
Z +b/2
2π 2π ′
intégrales sous la forme fd (α) = exp j αd exp j αx dx′ soit finale-
λ0 −b/2 λ0
2π παb
ment fd (α) = b exp j αd sinc .
λ0 λ0
πβℓ π π
Finalement, w(α, β) = KB(β)w0 asinc exp j αa + exp −j αa ; on re-
λ0 λ0 λ0
παb
connaı̂t dans cette expression la mise en facteur de wdiff (α, β) = Kw0 aB(β)sinc
λ0
correspondant à la figure de diffraction commune des deux fentes, et d’un terme
∩(φ/2) = exp (jφ/2) + exp (−jφ/2), qui décrit une propriété déjà citée : la translation
π
d’une pupille dans son plan se traduit par un simple déphasage ±φ/2 = ± αa de
λ0
l’amplitude diffractée.
2 Éclairement et terme d’interférences : dans l’éclairement |w(α, β)|2 , on met en
παb πβℓ
facteur l’éclairement Ediff (α, β) = K 2 |w0 |2 a2 ℓ2 sinc2 sinc2 qui serait produit
λ0 λ0
par une pupille diffractante unique (quelle que soit sa position dans le plan de la
pupille) pour écrire E(α, β) = Ediff (α, β) × ∩2 (φ/2) ; le terme ∩2 (φ/2) décrit donc le
phénomène d’interférences à deux ondes.
φ φ
On peut en effet écrire ∩(φ/2) = 2 cos donc ∩2 (φ/2) = 4 cos2 ; on reconnaı̂t ici un
2 2
terme classique d’interférences à deux ondes puisque ∩2 (φ/2) = 2 (1 + cos φ). Ainsi,
9 : Réseaux de diffraction 195
l’éclairement total envoyé par l’ensemble des deux pupilles dans la direction de cosinus
directeurs (α, β) s’écrit :
2πδ
E(α, β) = 2Ediff (α, β) 1 + cos (9.1)
λ0
avec pour différence de marche δ entre les ondes émises par les deux pupilles l’expres-
sion, déjà établie dans le cadre du formalisme simplifié du chapitre précédent, δ = aα.
X Y
On peut d’ailleurs aussi écrire α = ′ et β = ′ , en fonction des coordonnées (X, Y )
f2 f2
du point d’observation sur l’écran ; on a donc encore :
πℓY 2 πbX 2π aX
E(X, Y ) = 2E0 sinc2 sinc 1 + cos (9.2)
λ0 f2′ λ0 f2′ λ0 f2′
∆X ∆X
Emax − Emin
maximal théorique C = = 1. Notons qu’en pratique le contraste observé
Emax + Emin
sera toujours plus faible en présence d’éclairements parasites, l’éclairement minimal
sur l’écran n’étant jamais nul.
Toutefois, la figure 9.3 montre bien que les franges d’ordre élevé sont moins visibles,
car moins lumineuses, que les franges voisines du centre de la figure ; un défaut de
contraste relatif peut ici être évoqué pour expliquer l’aspect attendu sur l’écran, où
on ne verra nettement qu’un petit nombre de franges.
9.2.1 Définitions
2 Réseau de diffraction par transmission : on peut décrire un réseau par transmission
comme la généralisation du dispositif précédent dans le cas où le nombre de fentes
N est supérieur à 2 : on réalise un réseau de diffraction par transmission en réalisant
une pupille percé d’un nombre, en général assez grand, de fentes fines, parallèles et
équidistantes. La figure 9.4 représente une telle pupille.
a a a b b b
Nous considérerons dans toute la suite que ces fentes sont équidistantes ; la distance
de deux fentes consécutives est le pas du réseau a. Ces fentes seront aussi en général
considérées comme très fines, de largeur commune b ≪ a, et de grande longueur ℓ ≫ a.
Un tel réseau est en général réalisé par gravure dans un écran opaque ; le pas a des
réseaux est de l’ordre de grandeur de quelques micromètres ou, ce qui revient au
même, le nombre de traits par unité de longueur 1/a est en général de l’ordre de
quelques centaines à quelques milliers de traits par millimètre.
Les réseaux usuels ayant une largeur utile de l’ordre de quelques centimètres, le nombre
N de traits du réseau éclairé peut atteindre quelques milliers.
2 Réseaux : plus généralement, nous appellerons réseaux une pupille de diffraction
présentant une fonction de transparence périodique. Si la période spatiale n’est réalisée
que le long d’un seul axe (Ox), on parle de réseau unidimensionnel et la période
spatiale, toujours notée a, garde le nom de pas du réseau.
On rencontre aussi des réseaux à double périodicité spatiale, ou des réseaux tridi-
mensionnels ; en particulier, une structure cristalline peut être considérée comme un
réseau tridimensionnel.
Notons encore que les réseaux ne sont pas seulement utilisés dans le domaine de la
lumière visible ; en particulier, on réalise fréquemment l’étude de la diffraction par des
réseaux atomiques ou moléculaires en utilisant des rayons X ; on verra en effet que
des longueurs d’ondes plus courtes (en particulier, du même ordre de grandeur que
9 : Réseaux de diffraction 197
la période a du réseau) sont mieux adaptées à l’étude des propriétés des réseaux de
diffraction.
miroirs
miroirs
a a a α
Figure 9.5 – Réseaux par réflexion, plan (en haut) et réseau de Michelson (en bas)
Dans le second cas (réseau de Michelson‡ , ou réseau en échelon), les miroirs sont
toujours régulièrement disposés avec le pas a, mais ils sont inclinés d’un angle α sur
la direction moyenne du réseau (α est en général de l’ordre de quelques dizaines de
degrés). Un tel réseau peut être utilisé avec des miroirs plus larges ; il correspond en
général à des phénomènes plus lumineux. Par contre, sa réalisation est plus délicate
que celle d’un réseau plan ; il est donc en général produit avec des valeurs de N plus
faibles (quelques centaines par exemple).
me
me
som
som
Figure 9.6 – Somme de cinq nombres complexes régulièrement déphasés
On constate bien que, plus le déphasage de deux de ces cinq complexes consécutifs est
important, plus leur somme est faible. L’effet est d’autant plus marqué que N est élevé
et, si δϕ s’éloigne un tant soit peu de zéro, on aura donc affaire à des interférences
destructives et à une frange sombre.
Notons cependant que la condition d’interférence constructive se détermine de la même
façon, quel que soit le nombre de franges ; on imposera à la différence de marche δ entre
deux ondes issues de deux traits consécutifs d’être un multiple entier de la longueur
d’onde, δ = pλ0 .
On peut résumer ces deux propriétés, qui ne sont d’ailleurs pas spécifiques aux seuls
dispositifs à réseaux, en notant que la largeur des franges brillantes dépend de N ,
tandis que leur disposition n’en dépend pas :
sera supposée périodique de période a le long de l’axe (Ox) et nous supposerons que
la dimension ℓ du réseau le long de l’axe (Oy) est suffisamment grande pour que tout
effet de diffraction soit négligeable le long de cet axe.
La diffraction se fait donc uniquement dans le plan Π = (Oxz) perpendiculaire à la
plus grande dimension des traits du réseau ; dans ce plan, on éclaire le réseau par une
onde plane, monochromatique de longueur d’onde λ0 , dirigée par le vecteur unitaire
ui = αi ex + γi ez ; toutefois, nous ne supposerons pas forcément que |αi | ≪ 1.
La figure 9.7 représente donc les conditions usuelles d’éclairement et d’observation
pour un réseau plan, où on notera αi = sin θi et α = sin θ les cosinus directeurs des
directions d’éclairement et d’observation. Sur cette figure, θ > 0 mais θi < 0.
Π +
b
λ0 b
b
b θ
θi z
b
b
a b
a b
b
En pratique, les angles θi et θ peuvent atteindre des valeurs allant jusqu’à ±60◦ . On
peut justifier ce fait en évaluant rapidement un ordre de grandeur : avec un pas du
réseau de l’ordre de a ∼ 1 µm, la largeur individuelle b de chaque trait d’un réseau
λ0
par transmission vérifie b ≪ 1 µm, donc l’ouverture en cosinus directeur ∆α = de
b
la figure de diffraction vérifie, pour λ0 ∼ 500 nm, la relation ∆α ≫ 0, 5.
Notons que, si le réseau n’est pas en général utilisé dans les conditions de Gauss, la
lentille utilisée pour réaliser le faisceau incident est, elle, utilisée dans ces conditions
paraxiales ; la figure 9.7 plus bas montre cette lentille, utilisée au voisinage de son
axe optique. Il en va en général de même du dispositif (viseur, lentille) utilisé pour
étudier le faisceau émergent dans la direction θp de l’ordre p.
Notons encore que la figure 9.7 est entièrement tracée dans le plan perpendiculaire à
la plus grande dimension des traits du réseau ; on a en effet déjà vu que la diffraction
hors de ce plan est négligeable.
2 Ordres du réseau : sur la figure 9.7, on observe la diffraction à l’infini par une
juxtaposition de motifs identiques (des fentes fines par exemple) décalés de a ; la
condition de formation d’interférences constructives (franges brillantes) est comme
toujours δ = pλ0 , où p ∈ Z est l’ordre du réseau, tandis que la figure classique 9.8
200 Physique, MP, MP*
θi T′b θ +
b
b
ǫ
a z
|ǫ| ≪ π θi θ K
b
b b
(conditions de Gauss)
H T
λ0
Réseau par transmission : sin θp − sin θi = p p∈Z (9.4)
a
2 Réseau par réflexion : le calcul de la différence de marche dans le cas d’un réseau
par réflexion se fait de manière tout à fait analogue, dans le cadre de la figure 9.9 ; on
notera sur cette que θi < 0 et θ > 0.
Dans ce cadre, la différence de marche prend la forme δ = T ′ K−T H, avec les distances
T ′ K = a sin θ et T H = −a sin θi , d’où la relation :
λ0
Réseau par réflexion : sin θp + sin θi = p p∈Z (9.6)
a
2 Orientation des angles : les relations (9.3) et (9.5) sont évidemment changées en
leurs opposées si on change l’orientation des angles ; celle-ci étant conventionnelle,
9 : Réseaux de diffraction 201
θi T′b +
θ K b
θ a z
θi
b b
H T
θi θi
b b
θ θ
La figure 9.10 montre le rayon non dévié correspondant à l’ordre zéro dans les deux cas
(réseaux par réflexion et par transmission) et indique comment retrouver simplement
le signe qui figure dans les expressions de la différence de marche et de la relation de
Bragg, indépendamment du choix d’orientation (ou non) des angles.
La relation encadrée sur la figure 9.10 s’applique, seule, dans tous les cas (et en
particulier aux angles non orientés). On retiendra donc :
Relation de Bragg
X La position angulaire θp du p-ième ordre d’un réseau plan de pas a est
donnée par la relation δ = pλ0 .
La différence de marche δ entre deux rayons passant par deux traits
consécutifs du réseau s’écrit δ = ±a (|sin θ| − |sin θi |) ; on vérifie toujours
que δ = 0 correspond à la direction donnée par les prévisions de l’optique
géométrique, en l’absence de tout phénomène de diffraction.
202 Physique, MP, MP*
Dans la suite, on développera systématiquement l’étude des réseaux plans par trans-
mission ; les résultats obtenus s’adaptent aisément aux autres cas.
2 Aspect et visibilité des ordres : compte tenu de la grande finesse attendue pour
des franges d’interférence à ondes multiples, les maxima de lumière correspondant
à un ordre p donné sont angulairement définis avec une grande précision ; la figure
9.11 montre qualitativement la différence entre des interférences à deux ondes et des
interférences à ondes multiples.
E
Interférences
Interférences à N ondes
à deux ondes
b b b
δ
−λ0 0 λ0
Figure 9.11 – Finesse des franges à ondes multiples
Alors que dans le premier cas on voit une alternance de franges sombres et claires, le
second montre des franges brillantes très fines sur un fond sombre. La conservation
de l’énergie totale montre que, pour conserver l’aire totale sous la courbe lorsque ses
maxima s’affinent (zone grisée sur la figure 9.11), l’amplitude de ces maxima doit
s’élever en même temps que leur largeur décroı̂t.
Toutefois, toutes les franges ne sont pas forcément observables, puisque l’observation
pλ0
de l’ordre p de position angulaire θp sonnée par sin θp = sin θi + (dans le cas
a
d’un réseau par transmission) impose forcément une limite à la valeur de p puisque
|sin θp | 6 1.
À titre d’exemple, considérons le cas où a = 2 µm et λ0 = 500 nm ; on aura ainsi
λ0
= 0, 25. Dans le cas d’un éclairage en incidence normale (sin θi = 0), on pourra
a
ainsi observer a priori les ordres −4 à +4 puisque sin θp = 0, 25 × p ; toutefois, les
ordres ±4, émergents en incidence rasante, ne sont jamais observables. On observera
ainsi les sept maxima correspondant à p = 0, ±1, ±2 et ±3. Les valeurs de sin θp étant
en progression arithmétique, celles de θp ne le sont pas et la figure 9.12 (à gauche)
montre la position de ces sept ordres visibles, telle qu’elle apparaı̂t sur un goniomètre.
Ces ordres apparaissent sous la forme de points si la source est ponctuelle. Toutefois,
comme dans le cas des fentes de Young, on peut allonger la source perpendiculairement
à la figure (c’est-à-dire parallèlement aux traits du réseau) pour faire apparaı̂tre ces
ordres sous la forme de traits lumineux parallèles à l’axe du goniomètre.
La même figure 9.12 représente (à droite) la disposition des ordres observables pour
une incidence non nulle sur le même réseau.
2 Juxtaposition des ordres : lorsque plusieurs longueurs d’onde sont présentes dans le
spectre de la source qui éclaire le réseau, elles correspondent à des sources incohérentes
entre elles et les divers faisceaux émergents se superposent puisqu’on doit additionner
les éclairements correspondant à des sources incohérentes.
Un réseau disperse ainsi, pour un ordre p donné, les diverses composantes monochro-
matiques de la lumière qui l’éclaire, entre deux valeurs extrêmes sin θpmin et sin θpmax
9 : Réseaux de diffraction 203
p=4
p=6
b b
5
=
=
p
p
2b
4b
p= p=
réseau
réseau
p=1b p=3b
p=0b p=2b
p=1
p= b b
p = −1 p=
incidence normale −2 b incidence 30◦ 0
b
p
p
=
=
p = −4
p = −2
−
−
b b
3
1
Figure 9.12 – Ordres d’un réseau, 1/a = 500 traits par mm, λ0 = 500 nm
lorsque λ0 varie de λmin à λmax ; ce caractère dispersif d’un réseau constitue la base
de certaines applications des réseaux, la réalisation de spectromètres.
Dans les mêmes conventions que celles de la figure 9.12, on a représenté sur la figure
9.13 l’étalement angulaire des faisceaux émergents d’un réseau avec a = 2 µm, éclairé
en incidence normale par un faisceau de lumière polychromatique, lorsque λ0 varie de
pλ0
λmin = 400 nm à λmax = 750 nm, en appliquant la relation sin θ(λ0 ) = .
a
3
p=
2
p=
réseau
1
p=
p=0
p=
−
p= 1
−2
p=
−3
On constate que, pour les ordres ±3, |θ±3 | s’étend de 36, 9◦ jusqu’au delà de l’émer-
gence rasante, tandis que pour l’ordre ±2, |θ±2 | s’étend de 23, 6◦ à 48, 6◦ . De même,
les ordres ±4 (non représentés ci-dessus) débutent à 53, 1◦ . Il y a donc superposition
des ordres à partir de l’ordre 2 : une raie lumineuse observée dans certains intervalles
angulaires peut a priori appartenir à deux ordres différents (ou plus), ce qui en rend
l’analyse plus difficile.
Cette circonstance, ajoutée à la diminution de la luminosité diffractée pour les grands
angles, limite en pratique l’observation aux ordres ±1 ou ±2, au moins dans le cas
204 Physique, MP, MP*
2π
Dans le cas des réseaux plans, ϕ = a (sin θ − sin θi ).
λ0
N
X −1
2 Fonction réseau : il reste ci-dessus à déterminer la somme R = exp (jnϕ).
n=0
S’agissant de la somme d’une série géométrique, elle s’écrit immédiatement
sous la
1 − exp (jN ϕ) ψ ψ
forme R = . Notant alors l’identité 1 − exp (jψ) = 2j exp j sin ,
1 − exp (jϕ)
2 2
N −1 sin(N ϕ/2)
on en déduit R = exp j ϕ .
2 sin(ϕ/2)
9 : Réseaux de diffraction 205
sin2 (N ϕ/2)
Eréseau = Eun seul trait × RN (ϕ) RN (ϕ) = (9.7)
sin2 (ϕ/2)
4 b
ϕ
b b b
−2π 0 2π
g6 (ϕ)
f (ϕ)
ϕ
b b b b b
−2π 2π 0 2π 2π
−
N N
b
N2
N 2 × 4, 5 % 3π
ϕ=
N
b b ϕ
b b b b b
−2π 2π 0 2π 2π
−
N N
−1
4N 2 N2
2 3π
donc évaluée, si N est assez élevé, à RN (ϕ1 ) = sin ∼ ∼ , soit
2N 9π 2 22
seulement 4, 5 % du maximum principal voisin.
Nous retiendrons les propriétés générales suivantes :
Propriétés de la fonction réseau
sin2 (N ϕ/2)
X La fonction RN (ϕ) =
sin2 (ϕ/2)
présente les propriétés suivantes :
Elle est paire et 2π-périodique ; ses maxima principaux, atteints pour
ϕ = 2pπ avec p ∈ Z, sont d’amplitude égale à RN (2pπ) = N 2 .
Elle présente, entre deux maxima principaux, N − 1 annulations et N − 2
maxima secondaires ; ceux-ci représentent au plus 4, 5 % de l’amplitude
des maxima principaux ; la demi-largeur à la base d’un maximum prin-
cipal quelconque est égale à ∆ϕ = 2π/N .
2 b sin θ 2π
E(θ) = E0 sinc RN a sin θ
λ0 λ0
p = −1 p=1
p = −2 p=2
p = −3 p=3
p = −4 2∆θ p=4
θ
b b b b b
◦ ◦
−40 −20 0 20◦ 40◦
de diffraction commun qui sert d’enveloppe des franges et montre une diminution
régulière de la luminosité des franges sur les bords de la figure : les franges d’ordre
élevé ne seront jamais observables.
Les maxima de lumière correspondant aux ordres visibles sont par contre toujours
très fins ; on peut en particulier définir et déterminer la demi-largeur à la base ∆θ
d’un de ces maxima en considérant que ∆θ est la petite variation de θ qui mène de
la valeur θp du maximum d’ordre p à la première annulation de la fonction de réseau
voisine de θp , pour θ = θp ± ∆θ.
λ0 a
On aura ainsi sin θp = p tandis que 2π sin(θp + ∆θ) = 2pπ + ∆ϕ ou encore
a λ0
a 2π
2π sin(θp + ∆θ) = 2pπ + ; un développement limité au premier ordre mène alors
λ0 N
a 2π λ0 λ0 1
à 2π cos θp ∆θ = ou ∆θ = = p .
λ0 N N a cos θp a N 1 − p2 λ20 /a2
On remarquera que ce calcul s’applique encore en incidence oblique, puisqu’il consiste
à rajouter le terme constant −a sin θi qui disparaı̂t dans l’évaluation du terme dif-
férentiel ∆θ ; on pourra donc être amené à retrouver l’expression générale (dont la
connaissance n’est pas exigible) :
λ0
∆θ = (9.8)
N a cos θp
10−2
Dans le cas de la figure 9.17, a = 5λ0 et N = 20 donc ∆θ = p soit
1 − p2 /25
∆θ ∼ 10−2 rad ; dans le cas d’un réseau réel, N est plutôt de l’ordre de plusieurs
centaines et la largeur angulaire d’un ordre (ou d’un maximum principal) est de
l’ordre de moins d’un milliradian, ce qui correspond à une tache de largeur inférieure
à 1 mm au foyer d’une lentille de projection de 1 m de focale.
λ0
dont les positions angulaires sont données par la relation sin θp = sin θi + p . Pour
a
un réseau et un ordre donnés, une variation δλ0 de longueur d’onde s’accompagne
donc d’une variation δθ de l’angle d’observation du maximum.
Un réseau est donc (comme un prisme) un dispositif dispersif ; on définit la dispersion
Dp par un réseau utilisé dans l’ordre p de sorte que δθ = Dp δλ0 , donc par la relation :
dθp p
Dp = = (9.9)
dλ0 a cos θp
a a
Comme = q est une fonction croissante de |p|, on aura
cos θp 2
1 − (sin θi + pλ0 /a)
donc intérêt à utiliser l’ordre le plus élevé possible pour obtenir une dispersion élevée,
ce choix pouvant être contrarié par deux inconvénients des ordres élevés :
– la diminution de la luminosité des ordres élevés, du fait de l’enveloppe globale de
diffraction ;
– l’éventualité de la superposition des ordres, qui rend délicate l’interprétation des
raies observées pour les ordres élevés.
2 Spectrosopes à réseau : la réalisation d’un spectroscope à réseau pour la mesure
des longueurs d’onde consiste donc simplement à réaliser une structure diffractante
périodique de période a connue, avant de l’utiliser sur un goniomètre comme dans le
cas des figures 9.12 par exemple.
La mesure de l’angle d’émergence θp et de l’angle d’incidence θi permet donc, si a et
l’ordre p choisi pour l’observation sont connus, d’en déduire une mesure de la longueur
d’onde du rayonnement utilisé, par application de la relation de Bragg (9.4).
λ0
2 Domaine d’utilisation : puisque sin θp = sin θi + p , la condition nécessaire pour
a
l’obtention d’ordres observables est que λ0 et a doivent rester du même ordre de
grandeur, ou plus précisément a & λ0 . En effet :
– si a < λ0 , on aura toujours |p|λ0 /a > |p| > 1 et pratiquement aucun ordre ne sera
observable (sauf l’ordre zéro, qui n’est pas dispersif) ;
– si a ≫ λ0 , la dispersion Dp sera toujours très faible et la mesure des longueurs
d’onde sera très peu précise.
Par exemple, pour la détermination d’une longueur d’onde du domaine visible, on uti-
lisera des réseaux tels que a > 1 µm, où 1/a < 1 000 traits par millimètre. Des valeurs
de a plus faibles correspondent à des mesures possibles dans le domaine ultraviolet.
Les fabricants de réseaux, utilisant notamment des techniques dérivées de l’hologra-
phie, proposent régulièrement pour ces usages des réseaux de diffraction comportant
jusqu’à 5 000 traits par millimètre ou plus.
Pour la détermination de longueurs d’onde plus courtes (par exemple dans le domaine
des rayons X, avec λ ∼ 10−10 m), on peut remplacer les réseaux gravés par des
machines par des structures cristallines, le rôle des traits du réseau étant rempli par
les plans réticulaires du cristal (plans d’alignement des atomes). La distance entre
plans réticulaires est alors de l’ordre de grandeur des paramètres de maille, soit par
exemple a ∼ 200 pm = 2 × 10−10 m.
2 Résolution spectrale : rappelons ici que la résolution d’un appareil de mesure est,
en général, la plus petite variation de la grandeur mesurée repérable par l’appareil.
Dans le cas d’un réseau utilisé pour la mesure des longueurs d’onde, cette résolution
9 : Réseaux de diffraction 209
est évaluée par le plus petit écart δλ0 provoquant une déviation δθ repérable, compte
tenu de l’ensemble des limitations de mesure des angles.
Nous ne prendrons ici en compte que la seule limitation intrinsèque d’un spectroscope,
due au phénomène de diffraction lui-même. La figure 9.18 illustre la répartition de
lumière attendue par un réseau observé dans l’ordre p s’il est éclairé par deux raies
de longueurs d’onde λ0 et λ0 + δλ0 ; du fait de l’incohérence de ces deux raies, on
observera comme éclairement la somme des deux éclairements dus aux deux raies.
E E Dp δλ0
λ0 λ0 + δλ0 λ0 λ0 + δλ0
∆θ
θ θ
Sur cette figure 9.18, le tracé de gauche correspond à deux raies non résolues car
angulairement trop proches ; à l’observation, on croı̂t voir une raie unique (traits
pleins) là où on a en fait la somme de deux éclairements correspondant à deux raies
insuffisamment décalées en longueur d’onde.
Au contraire, le tracé de droite correspond au cas de deux raies résolues : on voir
nettement apparaı̂tre un minimum local entre les deux maxima d’éclairement voisins.
On définit la limite de résolution en appliquant le critère de Rayleigh déjà employé
pour l’étude de la résolution spatiale pour la formation des images : on dira que les
raies sont résolues si l’écart angulaire δθ = Dp δλ0 qui les sépare est supérieur à la
demi-largeur à la base ∆θ commune aux deux pics que l’on cherche à distinguer.
p λ0
Cette condition s’écrit donc δλ0 > , compte tenu de (9.9) et (9.8) ; il
a cos θp N a cos θp
existe donc un écart de longueur d’onde minimal résolu, tel que δλ0 > δλmin constitue
le critère de résolution.
On définit habituellement le pouvoir de résolution du réseau par la grandeur sans
dimension :
λ0
R= = pN (9.10)
δλmin
Ainsi, pour atteindre une résolution élevée, on doit utiliser un réseau comportant un
nombre élevé de traits, dans l’ordre le plus élevé possible.
Avec de simples réseaux par transmission, on peut atteindre N de l’ordre de plusieurs
centaines et R de l’ordre de quelques milliers, ce qui permet de séparer deux raies
distantes, en longueur d’onde, d’un millième en valeur relative ; c’est par exemple le
cas des deux raies du doublet D du sodium ; avec λ1 = 589, 0 nm et λ2 = 589, 6 nm,
210 Physique, MP, MP*
ces raies sont résolues par la plupart des réseaux usuels, sauf si d’autres défauts de
réalisation optiques du spectroscope viennent dégrader la résolution.
Pour atteindre des résolutions plus élevées, on doit changer la technologie de réalisa-
tion des réseaux ; on verra par exemple en exercice comment l’utilisation de réseaux
non plans (réseau de Michelson par exemple) permet d’augmenter fortement la valeur
du pouvoir de résolution R = pN .
2 Applications à l’astronomie : Fraunhofer‡ fur le premier à fabriquer, en , un
réseau constitué de fils fins équidistants tendus entre deux supports. Au moyen d’un
tel réseau, il décomposa la lumière solaire et découvre dans le spectre correspondant
500 raies sombres qui portent aujourd’hui le nom de raies de Fraunhofer.
Bunsen et Kirchhoff donnèrent vers l’interprétation correcte des raies de
Fraunhofer : il s’agit de raies correspondant à l’absorption de la lumière par les
gaz contenus dans la partie la plus froide de l’atmosphère solaire. La comparaison
des longueurs d’onde correspondant à ces raies d’absorption permit de déterminer la
composition chimique de l’atmosphère solaire.
La généralisation de la méthode à l’étude de spectres d’étoiles ou de galaxies plus
lointaines montre en général un décalage vers le rouge des raies d’absorption par
rapport à leur valeur mesurée pour les mêmes éléments au laboratoire. On interprète
ce décalage par un effet Doppler du à l’éloignement des sources stellaires, dans le
cadre de l’expansion de l’univers consécutive à l’explosion primordiale (ou Big Bang).
Π
θ θ
H
J
I
a
a′
l’ordre zéro. La figure 9.20 montre une telle figure de diffraction, dans le cas d’un
cristal à symétrie cubique.
p = δ/λ0
b b b b b
−2 −1 0 1 2
Un réseau peut être utilisé pour la mesure des longueurs a ou des longueurs
d’onde λ0 ; la résolution des mesures augmente avec l’ordre p et avec le nombre
N de traits éclairés.
Pour un spectroscope, le critère de Rayleigh permet d’évaluer la résolution
δλmin selon R = λ0 /δλmin = pN .
Pour la mesure d’une longueur a, on doit choisir une longueur d’onde λ0 . a.
Chapitre 10
Interférences localisées
10.1.1 Historique
2 Le problème de l’éther : lors de la publication du Treatise on Electricity and Magne-
tism par Maxwell en , l’ouvrage prédisait la possibilité de propagation d’ondes
électromagnétiques. La vérification expérimentale, apportée peu de temps après par
Hertz, posa un problème de cohérence avec la théorie mécanique : les équations de
√
Maxwell prévoyaient en effet une célérité de propagation c0 = 1/ ε0 µ0 , valeur uni-
verselle qui ne pouvait donc être réalisée que dans un seul référentiel galiléen : les lois
d’addition des vitesses imposaient un changement de la vitesse de propagation par
changement de référentiel galiléen.
Les physiciens furent donc amenés à admettre l’existence d’un référentiel galiléen
particulier, unique système de référence relativement auquel les équations de l’élec-
tromagnétisme devaient s’appliquer ; on appela ce référentiel éther absolu.
Dans un autre référentiel galiléen R′ , en translation à la vitesse v relativement à l’éther
absolu R, la vitesse d’une onde électromagnétique devait donc devenir c′ = c + v, si
c = c0 u est la vitesse de l’onde électromagnétique se propageant dans la direction u
du référentiel R. Dans la suite, R′ est le référentiel terrestre et les mesures proposées
devaient donc mettre en évidence la vitesse de déplacement de la Terre par rapport à
l’éther absolu.
2 L’expérience de Michelson et Morley : la mise en évidence de ce référentiel de l’éther
absolu fut l’objet de nombreuses expériences, parfois très fines, et toutes infructueuses ;
toutefois, l’une des plus célèbres de ces expériences a conduit à la construction d’un
appareil qui reste d’un usage très étendu aujourd’hui.
Il s’agit de l’expérience menée en par Michelson‡ et Morley, destinée à mettre
en évidence le mouvement de la Terre relativement à l’éther absolu au moyen d’une
méthode interférométrique. En assimilant a priori l’éther absolu au référentiel de
repos du système solaire, les expérimentateurs s’attendaient à une variation périodique
annuelle du système de franges formé.
Le principe de l’expérience est décrit sur le schéma de la figure 10.1 : une source
émet en A deux ondes synchrones à angle droit. Deux miroirs orthogonaux M1 et
M2 renvoient ces ondes vers le point A où on étudie leur déphasage par une méthode
interférentielle ; si les trajets AM1 et AM2 sont identiques, le déphasage est entière-
ment dû au fait que l’ensemble de l’appareil se déplace (avec la Terre) à la vitesse
214 Physique, MP, MP*
x
v
v
A R1 M1
b b
L’une de ces ondes est émise parallèlement à l’axe (Ox) qui est celui de la vitesse v ; le
parcours de A jusqu’au point R1 de réflexion sur un miroir M1 se fait donc à la vitesse
c0 + v par rapport à R′ , tandis que le trajet de retour R1 A se fait à la vitesse
c0 −2 v.
ℓ ℓ 2ℓ v
Le temps de parcours aller et retour est donc τ1 = + ≃ 1+ 2
c0 + v c0 − v c0 c0
car v ≪ c0 , si ℓ désigne la distance AM1 .
L’autre onde est émise perpendiculairement à cette direction, et l’ondevoyage donc à
v2
q
′ 2 2
la vitesse cey = c0 u + vex dans R , ce qui impose c = c0 − v ≃ c0 1 − 2 . Le
2c0
temps de trajet aller
et retour est donc, si la distance AM2 est aussi égale à ℓ, donné
v2
2ℓ 2ℓ
par τ2 = ≃ 1+ 2 .
c c0 2c0
2π
Finalement, l’écart de phase à l’arrivée est de l’ordre de Φ = ω (τ1 − τ2 ) soit Φ = ∆
λ0
où la différence de marche équivalente est donnée par ∆ = ℓv 2 /c20 . En réalisant un
appareil avec des bras de l’ordre de ℓ ∼ 10 m, et v étant de l’ordre de grandeur de la
vitesse de la Terre sur son orbite (v ∼ 30 km · s−1 ), la différence de marche attendue
∆ 0, 1
était de l’ordre de ∆ ∼ 100 nm, soit un ordre d’interférence p = = = 0, 2
λ0 0, 5
dans le domaine visible.
Après trois mois sur son orbite, la vitesse v de la Terre devant tourner de π/2, on s’at-
tendait à voir permuter les rôles des deux bras AM1 et AM2 ; la variation périodique
du système de franges devait être parfaitement décelable, les franges se déplaçant de
manière sinusoı̈dale dans le plan d’observation, de part et d’autre de leur position
moyenne, avec une amplitude totale de déplacement de 0, 4 frange.
Le résultat nul de l’expérience de Michelson et Morley, même après avoir augmenté
la longueur ℓ des bras de l’interféromètre jusqu’à plus de 30 mètres, a amené les
physiciens à réviser certaines notions théoriques fondamentales. On peut citer ici les
travaux du physicien Lorentz et du français Poincaré.
L’interprétation aujourd’hui communément admise du résultat nul de l’expérience de
Michelson et Morley fut donnée en par Einstein, sous la nom de théorie de
la Relativité restreinte, basée sur le fait désormais expérimental que la célérité de la
lumière dans le vide c0 est un invariant par changement de référentiel galiléen.
10 : Interférences localisées 215
x − vt t − vx/c20
x′ = p t′ = p (10.1)
1 − v 2 /c20 1 − v 2 /c20
dx′ dx/dt − v
= (10.2)
dt′ 1 − vdx/c20 dt
dx′ dx
au lieu de la loi d’addition des vitesses = − v (vitesse relative = vitesse
dt′ dt
absolue − vitesse d’entraı̂nement) de la mécanique classique. Notons en particulier
dx dx′
que, si = ±c0 avec η = ±1, alors = ±c0 également : la loi d’addition des
dt dt′
vitesses généralisée laisse, comme prévu, invariante la norme et le sens de la célérité
des ondes lumineuses par changement de référentiel galiléen.
Sp
α
α
α
Séparation du faisceau Réalisation de la lame Sp
M2
Sp M1
3π/2
x
i
On considère alors la progression des divers faisceaux sauf ceux qui sont renvoyés en
direction de la source lors de la seconde réflexion sur la lame semi-réfléchissante ; ces
rayons ont, sur la lame semi-réfléchissante, des angles d’incidence α = π/4 ± i et
subissent donc :
– pour le rayon qui se réfléchit en M1 , une transmission sans dérivation par Sp, une
réflexion sur M1 avec déviation de π−2i, et enfin une réflexion sur Sp avec déviation
de π/2 + 2i ;
– pour le rayon qui se réfléchit en M2 , une réflexion sur Sp avec déviation de π/2 + 2i,
une réflexion sur M2 avec déviation de π − 2i, et enfin une transmission par Sp sans
déviation.
Comme le montre la figure 10.3, les deux faisceaux sortent alors de l’interféromètre
parallèlement entre eux, et perpendiculairement au faisceau d’entrée (avec donc une
déviation totale égale à 3π/2).
10 : Interférences localisées 217
Sp
Les faisceaux qui se réfléchissent sur M1 traversent trois fois la lame, tandis que ceux
qui se réfléchissent sur M2 ne la traversent qu’une fois. Cette différence introduit donc
une différence de marche δlame = 2n(λ0 )h(i), où h(i) est l’épaisseur de lame traversée
(qui dépend de l’incidence i) et n(λ0 ) est l’indice optique de la lame (qui dépend de
la longueur d’onde utilisée).
Pour éviter de devoir prendre en compte ce terme, dont les variations en fonction de
i et λ0 sont complexes, on utilise une lame compensatrice, exactement identique à la
lame séparatrice et disposée parallèlement à celle-ci, mais qui n’a pas subi de trai-
tement semi-réfléchissant ; la figure 10.4 (à droite) montre clairement qu’en présence
de cette lame, chacun des faisceaux traverse exactement trois fois la même épaisseur
du même matériau, supprimant par là même toute différence de marche au niveau de
l’ensemble formé des lames séparatrice Sp et compensatrice Cp.
y
M2
Cp
Le M1
d2 Sp
S x
b
d1
VA
Lo Chariotage
M2
M1 M2′ M1
Dans toute la suite, on remplacera donc le miroir fixe M2 par son symétrique M2′
relativement à la lame séparatrice, et on oubliera toutes les réflexions sur cette lame
séparatrice, conformément à la figure 10.7, à droite.
2 Réglage en lame d’air : lorsque les miroirs M1 et M2 sont rigoureusement per-
pendiculaires, ou encore quand M1 et M2′ sont rigoureusement parallèles, on dit que
l’interféromètre est réglé en lame d’air ; on emploie aussi parfois le vocabulaire abusif
(( réglage en miroirs parallèles )). Les miroirs M1 et M2′ forment alors une lame d’air
fictive d’épaisseur e = d1 − d2 .
On notera, ici et dans toute la suite, que e est une grandeur algébrique ; e est positif
si le miroir M1 est charioté au-delà de la position de M2′ , et négatif sinon. La position
e = 0, pour laquelle M1 et M2′ se superposent exactement, porte le nom de contact
optique.
Dans un réglage en lame d’air, on a déjà eu l’occasion de déterminer la différence de
marche entre les deux rayons, parallèles entre eux, issus de la lame ; la figure 10.8
rappelle le principe de ce calcul de δ au point de convergence P des deux faisceaux,
situé dans le plan focal image de la lentille de projection Lo .
Considérons ainsi un rayon lumineux quelconque incident sous l’angle i en direction
des deux miroirs de l’interféromètre ; on notera S l’intersection de ce rayon avec l’axe
(Ox). Les rayons réfléchis sur les miroirs M1 et M2′ croisent le même axe aux points
S1 et S2 , symétriques de S par rapport à M1 et M2′ ; ces deux points sont distants de
2e et peuvent être considérés comme des sources secondaires en phase avec le point
(commun aux deux faisceaux) S. En partant des deux sources secondaires S1 et S2 ,
on voit donc que la seule différence de marche est δ = S1 H.
Finalement, δ = (SM1 P ) − (SM2 P ) = S1 H = 2e cos i ; l’angle i correspond à la
r
distance r = F ′ P selon la relation tan i = ′ ; l’ensemble du schéma est invariant de
fo
220 Physique, MP, MP*
M2′ M1
b
P i Sb bH i x
F′ b i b b
S2 S1
fo′ e 2e
révolution autour de l’axe (Ox) et les franges sont donc circulaires d’axe (Ox). On
retiendra l’expression de la différence de marche et du rayon de la frange d’ordre p :
rp
δ = 2e cos ip = pλ0 tan ip = (10.3)
fo′
!
rp i2p
Dans les conditions de Gauss, on peut écrire ip ≃ ′ et δ ≃ 2e 1 − , d’où
fo 2
l’expression approchée :
r
pλ0
rp = fo′ 2− (10.4)
e
La relation (10.3), avec 0 6 ip < π/2, montre que p et e sont de même signe ; comme le
rayon des franges ne dépend que du rapport p/e, nous nous contenterons ici d’étudier
les conséquences de (10.4) si e > 0 et p > 0.
D’après cette relation, rp est une fonction décroissante, non linéaire de p ; la valeur
minimale rp = 0 correspond donc à la valeur maximale pmax = 2e/λ0 atteinte au
centre de la figure et qui correspond à un trajet aller et retour de longueur 2e entre
les deux miroirs.
Enfin, pour p > 0 fixé, rp est une fonction croissante de e ; le cas particulier remar-
quable e = 0 correspond à δ = 0 en tout point de l’écran.
On retiendra l’ensemble de des résultats sous la forme suivante, détaillant les proprié-
tés des franges d’égale inclinaison ou anneaux de Haidinger :
La photographie de la figure 10.9 représente les franges d’une lame d’air réalisées avec
un interféromètre de Michelson éclairé par une source spectrale (lampe à vapeurs de
Mercure).
10 : Interférences localisées 221
La présence de nombreux anneaux visibles montre que les valeurs de i ne sont pas
limitées aux conditions de Gauss ; bien au contraire, on atteint facilement quelques
dizaines de degrés pour la valeur maximale de i. La source qui éclaire l’interféromètre
est donc large ; le problème du défaut de cohérence spatiale de cette source est abordé
au § 10.2.1.
2 Applications à la métrologie : la relation (10.3) permet de relier une mesure de
rayon d’un anneau clair (p ∈ Z) ou sombre (p + 1/2 ∈ Z) à une mesure de la longueur
e ou de la longueur d’onde λ0 .
Toutefois, la valeur exacte de l’ordre d’interférence p est en général inconnue ; on doit
donc effectuer au moins deux mesures de rayons, par exemple consécutifs (p2 = p1 − 1
si p1 est l’anneau interne et p2 le rayon externe) ou, pour améliorer la précision,
séparés par m rayons intermédiaires (avec dans ce cas p2 = p1 − m − 1).
cos ip2 − cos ip1
On élimine alors p1 et p2 en écrivant m + 1 = 2e , ce qui permet de
λ0
mesurer e si on connaı̂t λ0 , ou au contraire de mesurer λ0 si on connaı̂t e.
La mesure des longueurs correspondant par exemple à un déplacement donné e des
miroirs depuis le contact optique est une application en métrologie des longueurs ; un
interféromètre de Michelson peut ainsi réaliser des étalons de longueur ou, comme on
le verra en exercice, des mesures d’épaisseur de diverses lames.
La mesure des longueurs d’onde peut s’étendre, comme on le verra plus bas, à la
détermination du spectre de luminance d’une source non monochromatique.
2 Réglage en coin d’air : considérons maintenant un appareil de Michelson réglé
au voisinage immédiat du contact optique, c’est-à-dire pour d1 = d2 . Tout défaut de
réglage du parallélisme des miroirs M1 et M2′ (qu’il soit involontaire ou délibéré) mène
à la formation d’un coin d’air, comme celui qui est représenté sur la figure 10.10.
Les rayons lumineux incidents sur le miroir M1 sous l’incidence i sont dirigés par le
2π
vecteur d’onde k = (cos iex − sin iey ) ; après réflexion sur ce miroir, ils sont dirigés
λ0
2π
par le vecteur d’onde k1 = − (cos iex + sin iey ).
λ0
De même, l’angle d’incidence sur le miroir M2′ est i′ = i + α, si α est l’angle dièdre
formé par M1 et M2′ ; on en déduit que le faisceau réfléchi sur M2′ fait l’angle 2α + i
2π
avec l’axe (Ox), donc qu’il est dirigé par k2 = − (cos(i + 2α)ex + sin(i + 2α)ey ).
λ0
Ainsi, l’onde lumineuse totale observée en un point M (x, y, z) est-elle donnée par
w = w0 [exp (−jk1 · r) + exp (−jk2 · r)] ; la différence de phase correspondante est
222 Physique, MP, MP*
M1 y
α
i
k i
x
i′
k1
e(y)
k2 M2′
2π
donc ∆ϕ = (k1 − k2 ) · r = δ, et on déduit donc le calcul de la différence de marche
λ0
2π
δ de celui de la différence k1 − k2 = 2 sin α (− sin(i + α)ex + cos(i + α)ey ).
λ0
Finalement, δ(M ) = 2 sin α [cos(i + α)y − sin(i + α)x] ; en particulier, lorsque l’ob-
servation est effectuée sur le plan du miroir M1 , x = 0 et on obtient l’expression
approchée valable pour les petits angles :
puisque e(y) = tan αy est l’épaisseur du coin d’air à l’abscisse y ; on interprète bien
sûr ce résultat comme l’existence d’un aller en retour supplémentaire entre les lames
du coin d’air. Ainsi, les franges, données par l’équation δ = pλ0 , sont rectilignes,
d’équation yp = pλ0 /2α, parallèles à l’arête des miroirs M1 et M2′ , et équidistantes
d’interfrange λ0 /2α.
La photographie de la figure 10.11 représente les franges du coin d’air réalisées avec
un interféromètre de Michelson éclairé en lumière blanche. Le problème du défaut de
cohérence temporelle de la source est abordé plus bas, voir le § 10.2.2.
2imax x
2imax
plus grand anneau visible
Avec un interféromètre à franges localisées, on peut utiliser une source étendue (donc
très lumineuse) à condition de ne réaliser l’observation que sur la surface de localisa-
tion. C’est le cas de l’interféromètre de Michelson réglé en lame d’air :
Localisation des anneaux de Haidinger
X Les anneaux de Haidinger (franges d’égale inclinaison d’une lame d’air)
sont localisés à l’infini, c’est-à-dire en pratique dans le plan focal image
de la lentille de projection.
Pour donner une interprétation simple de la localisation des franges de Fizeau, on peut
là encore remarquer que la surface de localisation est formée des points sur lesquels
les parcours des deux rayons traversant les deux bras de l’interféromètre se séparent ;
chaque point de la surface de localisation est, ici encore, l’intersection de deux rayons
lumineux issus, avant traversée de l’interféromètre, de la division d’amplitude d’un
rayon unique issu de la source.
2 Généralisation : les résultats obtenus ci-dessus se généralisent, mais aucune pro-
priété générale n’est au programme. Rappelons donc simplement ici qu’avec tout dis-
positif interférentiel classique, l’élargissement spatial de la source de lumière provoque
en général une diminution du contraste des franges.
Toutefois, certains dispositifs à division du front d’onde présentent la propriété de
localisation des franges : cette perte de contraste est nulle ou très faible pour les points
d’une certaine surface, formée des intersections, après traversée de l’interféromètre,
de deux rayons lumineux issus, avant celui-ci, de la division d’amplitude d’un même
rayon issu de la source.
Il n’y a localisation que si cette propriété définit une surface unique dans l’espace ;
c’est en particulier le cas de l’interféromètre de Michelson, qu’il soit utilisé en lame
d’air (localisation à l’infini) ou en coin d’air (localisation sur les miroirs).
10 : Interférences localisées 225
dE0
Z
E(δ) = 2 [1 + cos (2πσδ)] dσ (10.6)
dσ
dE0
Dans cette relation, × dσ désigne l’éclairement qui serait envoyé sur l’écran par
dσ
une seule voie de l’interféromètre si on limitait les nombres d’onde à un intervalle de
dE0
largeur dσ ; la grandeur porte donc le nom de luminance spectrale de la source.
dσ
La luminance spectrale est donc une mesure du caractère plus ou moins monochro-
matique d’une source lumineuse ; c’est une fonction très étroite centrée en σ0 dans le
cas d’une source quasi-monochromatique (figure 10.13 à gauche) ou au contraire une
fonction très large dans le cas d’une source de lumière blanche (figure 10.13 à droite).
dE/dσ dE/dσ
b
σ b b
σ
σ0 σmin σmax
Le calcul de ce terme est possible explicitement dans le cas d’une luminance spectrale
simple, comme celle d’une raie de nombre d’onde moyen σ0 et de largeur spectrale
∆σ, dont la luminance spectrale est représentée sur la figure 10.14 à gauche.
dE/dσ V (δ)
K
σ0 σ −1/∆σ 1/∆σ δ
b b b
∆σ 2/∆σ
Figure 10.14 – Exemple de calcul de contraste dans le cas d’une raie de largeur ∆σ
dE0 dE0
Z Z
On a alors aisément 2 dσ = 2K∆σ tandis que 2 cos (2πσδ) dσ s’écrit
dσ dσ
Z σ0 +∆σ/2
2K ∆σ ∆σ
2K cos (2πσδ) dσ = sin 2πδ σ0 + − sin 2πδ σ0 −
σZ
0 −∆σ/2
2πδ 2 2
dE0
soit 2 cos (2πσδ) dσ = 2K∆σ cos (2πσ0 δ) V (δ), après quelques transformations
dσ
trigonométriques, et où on a choisi de poser V (δ) = sinc (π∆σδ). On reconnaı̂t alors
dans l’expression de l’éclairement E(δ) = 2K∆σ (1 + V (δ) cos (2πσ0 δ)) une fonction
de visibilité V (δ), représentée sur la figure 10.14 à droite.
dE
La relation générale entre largeurs de la fonction de départ et sa transformée de
dσ
Fourier V (δ) apparaı̂t sur la figure 10.14 : plus la raie étudiée est monochromatique
(∆σ étroit), plus la fonction de contraste est large et donc plus le nombre de franges
visibles est élevé.
On peut généraliser le résultat qui précède à toutes les formes de luminance spectrale,
en montrant dans le cadre général des transformées de Fourier que :
où σ0 est un certain nombre d’onde central, et V (δ) s’identifie en général à une fonction
de visibilité, associée à un contraste des franges C(δ) = |V (δ)|.
La largeur ∆x de la fonction V (x) et celle ∆σ de la luminance spectrale vérifient,
comme pour toute transformée de Fourier, ∆x × ∆σ = 2π ; puisque x = 2πδ, on en
déduit que la largeur ∆δ de la fonction de visibilité, c’est-à-dire l’étendue des valeurs
de la différence de marche δ pour lesquelles le contraste reste suffisant pour que les
franges soient visibles, vérifie :
1
∆δ = δmax − δmin ∼ (10.8)
∆σ0
σ0
∆p = pmax − pmin ∼ (10.9)
∆σ0
λ0 σ0
On peut aussi écrire ≃ ; avec une largeur spectrale relative de un millième,
∆λ0 ∆σ0
λ0
∼ 103 et on peut espérer une fonction de visibilité étalée sur un millier de
∆λ0
franges ; c’est le cas du doublet de raies D du sodium (raies jaune-orangées), dont le
traitement détaillé est présenté ci-après.
2 Exemple : le doublet de raies D du sodium : en première approximation, ce
doublet est formé d’un système bichromatique à deux raies, de longueurs d’onde
λ1 = 589, 0 nm et λ2 = 589, 6 nm. On pose encore σ1 = 1/λ1 , σ2 = 1/λ2 , et on
σ1 + σ2
définit σ0 = et ∆σ0 = σ1 − σ2 .
2
Les deux raies du doublet étant de même intensité, on peut calculer l’éclairement
total produit par un interféromètre éclairé par une lampe à vapeurs de sodium sous
la forme E = E1 + E2 , avec Ei = 2E0 [1 + cos (2πσi δ)] ; après un calcul immédiat, il
vient E = 4E0 [1 + V (δ) cos (2πσ0 δ)] où on a choisi de poser V (δ) = cos (π∆σ0 δ),
reconnaissant une fonction à variation lente du fait de la faible valeur de ∆σ.
Comme précédemment, plus l’écart ∆σ0 est faible, plus la raie bichromatique pourra
être assimilée à une raie monochromatique, et plus la fonction de visibilité aura une
grande étendue en termes de valeurs de δ. On reconnaı̂t toutefois une propriété par-
ticulière des sources bichromatiques : la fonction de visibilité est périodique. Ceci
signifie qu’après la disparition des franges, obtenue pour certaines valeurs de δ qui
annule V (δ), les franges réapparaissent avec changement de signe de V (δ), donc avec
inversion du contraste.
La présence des inversions périodiques du contraste est une propriété caractéristique
des interférences avec des sources bichromatiques ; on peut en comprendre l’origine
physique en traçant, sur la même figure 10.15 les figures d’interférence qui seraient
obtenues séparément pour les longueurs d’ondes λ1 et λ2 (le tracé n’est pas à l’échelle).
E1 + E2
retour du contraste
perte de contraste
δ
E1 et E2
b b b
b b b
Sur cette figure, on voit clairement que le contraste est maximal pour δ = 0 puisque
les deux fonctions E1 et E2 prennent leur maxima aux mêmes points ; par la suite, les
deux systèmes de franges se décalent progressivement jusqu’à observer l’annulation du
228 Physique, MP, MP*
contraste lorsque le décalage des deux systèmes de frange atteint exactement un demi-
interfrange. Sur la figure, des points marquent des maxima de lumière correspondant
aux deux raies de longueurs d’onde λ1 et λ2 ; on voit qu’ils s’alignent dans les zones
de maximum de contraste, et qu’ils sont exactement en opposition dans les zones de
perte de contraste.
Le décalage des systèmes de franges reprend ensuite jusqu’à ce que les systèmes de
franges se retrouvent en phase pour restaurer le contraste, et ainsi de suite.
Revenant à l’expression de l’éclairement produit derrière l’interféromètre de Michelson
éclairé avec une source à vapeurs de sodium, on peut poser λ0 = 1/σ0 ≃ 589, 3 nm et
∆λ0 ∆σ0
définir la largeur spectrale ∆λ0 en longueur d’onde par = , ce qui permet
λ0 σ 0
2π π∆λ0 p
d’écrire E = 4E0 1 + V (δ) cos δ et V (p) = cos puisque δ = pλ0 .
λ0 λ0
Le tracé 10.16 de la répartition d’éclairement V (δ) montre que V (p) est une fonction
π∆λ0 p π
de visibilité, avec des annulations périodiques du contraste pour ≡ [π].
λ0 2
E
4E0 (1 + V (p))
4E0 (1 − V (p))
p
b
λ0 /2∆λ0
Le nombre de franges visibles entre deux annulations du contraste est donc de l’ordre
λ0
de ∆p = , comme affirmé dans le cas général. Ce tracé n’est pas à l’échelle dans
∆λ0
le cas d’une source à vapeurs de sodium.
On peut visualiser l’effet de cette perte périodique du contraste en observant les
photographies de la figure 10.17, prises justement en éclairant un interféromètre de
Michelson réglé en lame d’air au moyen d’une lampe à valeurs de sodium ; on y voit,
de gauche à droite, une chute régulière du contraste des franges.
Dans le cas de la troisième figure, les franges sont pratiquement invisibles, la fonction
de visibilité étant trop faible.
Figure 10.17 – Contraste des anneaux de Haidinger avec une lampe au sodium
En réglage en coin d’air (miroirs inclinés d’un angle α), on observe des franges
d’égale épaisseur, avec δ ≃ 2e(M ) où e(M ) = y tan α est l’épaisseur du coin
d’air au point M , d’abscisse y mesurée depuis l’axe dièdre du coin d’air.
Ces franges de Fizeau sont rectilignes et équidistantes, avec pour équation
2y tan α = pλ0 donc d’interfrange i ≃ λ0 /2α.
Ces franges sont localisées sur la surface des miroirs : le contraste des franges
reste élevé, même en présence d’une source spatialement étendue.
Chapitre 11
Thermodynamique classique
Certaines grandeurs ne sont pas relatives au volume d’un système, mais à la surface
de l’interface entre deux systèmes ; elles concernent donc les échanges entre deux
systèmes. Chaque grandeur X est transportée d’un flux de X par unité de temps.
Les grandeurs surfaciques associées à ces flux sont en général qualifiées de densités de
courant : on parle ainsi de densité de courant de masse, d’énergie ou d’entropie, comme
on parle de densité de courant électrique. Ces densités de courant sont éventuellement
des grandeurs vectorielles, la direction et le sens du vecteur étant ceux des échanges
réalisés. Les notations et unités correspondantes sont indiquées dans le tableau 11.2.
On doit se méfier de toute application numérique basée sur cette valeur numérique
du volume molaire des gaz ; rappelons qu’elle ne s’applique que dans le modèle du
RT
gaz parfait, sur la base de la relation vm = ; le choix des conditions normales
p
(T = 273 K, p = 1 bar) mène à l’application numérique vm = 22, 7 L · mol−1 . La
′
valeur numérique vm = 22, 4 L · mol−1 , encore souvent rencontrée, correspond à
′
p = 1, 013 bar, pression atmosphérique moyenne au niveau de la mer.
Par contre, dans le domaine météorologique par exemple, on effectue les calculs de
dynamique des fluides en considérant des éléments de volume de l’ordre du kilomètre
cube ou plus, simplement parce que choisir une dimension trop faible dépasserait
les capacités de calcul des systèmes informatiques
Z utilisés. Dans ce cas, on appellera
1
pression dans ce volume la moyenne pm = pdV ; c’est la moyenne qu’un expé-
V
rimentateur obtiendrait en explorant l’espace occupé par cet élément mésoscopique
en effectuant plusieurs mesures réparties dans tout cet espace de l’ordre du kilomètre
cube.
Dans toute la suite, nous considérerons les systèmes thermodynamiques comme des
milieux continus ; dire par exemple qu’une grandeur physique g(r) y est homogène
voudra simplement dire que, jusqu’à l’échelle mésoscopique, il n’est pas possible d’ob-
server des variations spatiales de g(r). Naturellement, une telle affirmation est néces-
sairement inexacte à l’échelle microscopique.
2 Vocabulaire de description des systèmes thermodynamiques : un système thermo-
dynamique (Σ) est en général défini en extension, par une limite non nécessairement
matérielle. Si ce système peut échanger de la matière avec l’extérieur, il est dit ouvert,
et fermé dans le cas contraire.
Un système qui ne peut réaliser aucun échange (ni de matière, ni d’énergie) avec l’ex-
térieur est dit isolé. On peut en général compléter fictivement tout système (Σ), pour
en faire un système fermé, en lui adjoignant l’ensemble des parties de son environne-
ment avec lesquels des échanges de matière ou d’énergie ont lieu. L’ensemble fermé
ainsi défini porte parfois le nom d’univers.
Un système thermodynamique est dit homogène si toute grandeur physique mesurable
est homogène, c’est-à-dire présente la même valeur en tout point du système, au moins
236 Physique, MP, MP*
Z
En particulier, la masse est une grandeur extensive avec M = ρ(M )dτ mais
Z M ∈(Σ)
aussi M = dm, donc dm = ρ(M )dτ , ce qui impose la relation entre grandeurs
M ∈(Σ)
volumiques et massiques :
xm (M ) = Mx(M ) (11.3)
11 : Thermodynamique classique 237
(Σ)
vdt
n
θ
dS
Figure 11.1 – Transport d’une grandeur extensive à travers la surface d’un système
Signalons dès maintenant une différence essentielle de convention entre ces débits
de grandeurs extensives, comptés positivement s’ils sortent du système thermody-
namique étudié, et l’usage thermodynamique, qui consiste à compter positivement
ce qui est fourni au système (Σ). On ne s’étonnera donc pas de l’intervention sys-
tématique d’un signe − dans les relations qui utilisent la notion de débit.
Règles d’orientation
X En Physique en général, toute surface fermée sera (sauf mention expresse
du contraire) orientée par convention vers l’extérieur du système.
En Thermodynamique au moins, tous les échanges algébriques seront
(sauf mention expresse du contraire) comptés positivement s’ils sont re-
çus par le système étudié.
Le volume de ce cylindre élémentaire est donc égal à dτ = dS × dℓ cos θ, qu’on écrira
aussi dτ = (v · n) dSdt ; la quantité de X sortant de (Σ) par ce mode de transport est
donc d2 Xconvecté = xV dτ = xV (v · n) dSdt, où on emploie ici le terme de convection
pour tout transport associé à un déplacement de matière.
On retiendra donc l’expression du flux de X convecté par unité de temps à travers la
totalité surface (S) extérieure à (Σ) :
¯
dX ¯¯
I
= jX · ndS jX = xV v (11.4)
dt ¯convecté (S)
Le débit de charge Dq sortant de la surface (S) se mesure dans l’unité [Dq ] = [j] × [S]
soit [Dq ] = [ρc ] × [v] × [S] = C · m−3 × m · s−1 × m2 soit [Dq ] = C · s−1 = A ; il s’agit
évidemment de ce qu’en électrocinétique on appelle le courant électrique sortant de
(S), en on retiendra la relation essentielle dans le domaine de l’Électromagnétisme :
I
Isortant de (S) = j · ndS avec j = ρc v (11.6)
(S)
(S) (S)
(Σ′ ) (Σ)
xb x + dx x
b
On utilise aussi, dans le seul cas des coordonnées cartésiennes, un moyen mnémo-
technique pour mémoriser les expressions des opérateurs gradient et divergence, en
définissant le vecteur symbolique nabla par la relation :
∂ ∂ ∂
∇= ex + ey + ez (11.9)
∂x ∂y ∂z
Z
Comme M (t) = ρ(M, t)dτ , on peut évoquer le théorème de dérivation sous le
M ∈(V )
signe somme des intégrales dépendantZd’un paramètre pour écrire la variation de la
dM ∂ρ(M, t)
masse M se (Σ) sous la forme = dτ .
dt M ∈(V ) ∂t
Enfin, on peut utiliser
I le théorème d’Ostrogradski
Z pour transformer l’intégrale de flux
qui définit Dm = ρv · ndS selon Dm = div (ρv) dτ .
(S) M ∈(V )
∂ρ
Z Z
L’égalité dτ = − div (ρv) dτ devant être vérifiée pour tout volume (V ),
(V ) ∂t (V )
fini ou infinitésimal, on en déduit la loi de conservation (locale) de la masse, connue
en général sous la nom d’équation de continuité :
∂ρ
div (ρv) + =0 (11.11)
∂t
Le même raisonnement permet d’imposer en tout point et à tout instant une relation
locale de conservation de la charge électrique, liant la charge volumique ρc et la densité
volumique de courant j = ρc v, sous la forme identique :
∂ρc
div j + =0 (11.12)
∂t
et non mesurée car le produit, par exemple, de deux températures centigrades, est
dépourvu de sens physique.
Une température centigrade se désigne en degrés (0 ◦ , 25 ◦ , etc.). Dans le seul cas où
la grandeur thermométrique est la dilatation d’un gaz parfait (ϑ = pV /n), on utilise
la notation degrés Celsius (0 ◦ C, 25 ◦ C, etc.).
La notation T est réservée à cette grandeur thermométrique particulière (on parle de
température du gaz parfait), ou à son équivalent légal (on parle de température ther-
modynamique). Les définitions de ces deux grandeurs thermodynamiques équivalentes
seront rappelées plus loin.
2 Pression : la pression est liée à la force de contact exercée par un fluide au repos
sur tout élément de surface dS plongé dans ce fluide ; cette force est normale à la
surface dS et s’écrit dffluide→surface = +pndS, si n est la normale à dS, dirigée vers
l’extérieur du fluide.
L’unité de mesure des pressions est le pascal (newton par mètre carré) mais on utilisera
systématiquement le bar, défini par 1 bar = 105 Pa ; en particulier, on réserve le nom
de pression standard à la valeur p◦ = 1 bar.
La force de pression totale exercée sur le fluide au repos contenu dans un volume
(V ) s’écrit donc,
I compte tenu du principe des actions réciproques, sous la forme
fext→(V ) = − pndS, où l’intégrale porte sur la surface (S) qui entoure (V ) ; cette
surface est orientée vers l’extérieur.
2 Théorème du gradient : pour calculer l’intégrale qui définit la force de pression
totale, on peut adapter le théorème d’Ostrogradski (11.7) en choisissant pour fonc-
tion W la grandeur W = pex ou, plus IgénéralementZpour une fonction scalaire f
quelconque, W = f ex ; il vient alors ex · f ndS = div (f ex ) dτ ; le caractère
(S) (V )
uniforme du vecteur ex a permis sa mise en facteur dans la première intégrale.
∂f
L’application de la relation (11.8) montre alors immédiatement que div (f ex ) = ;
∂x
∂f
I Z
on en déduit que le vecteur f ndS a pour projection dτ sur ex . En per-
(S) (V ) ∂x
mutant circulairement les indices x, y, z, on en déduit le théorème du gradient, qu’on
doit considérer comme une forme particulière du théorème d’Ostrogradski :
I Z
f ndS = grad f dτ (11.13)
(S) (V )
En particulier, la somme des forces de pression exercées sur un fluide au repos prend
la forme :
I Z
fext→(V ) = − pndS = − grad pdτ (11.14)
(S) (V )
−grad p est donc la densité volumique de force équivalente aux forces de pression.
Si le fluide est au repos sous la seule action des forces de pression et de pesanteur,
donc la densité volumique est ρg, on pourraZécrire la condition
Z d’équilibre mécanique
du volume (V ) du fluide sous la forme − grad pdτ + ρgdτ = 0 et, cette
(V ) (V )
244 Physique, MP, MP*
grad p = ρg (11.15)
On pourra souvent considérer que les gaz sont soumis à une pression uniforme puisque
leur masse volumique est souvent faible ; ainsi, avec de l’air dans les conditions nor-
males, ρ ∼ 1, 3 kg · m−3 et, à la surface de la Terre, kgrad pk ∼ 1, 3 × 10−4 bar · m−1 .
Une telle approximation est plus rarement raisonnable dans le cas des liquides ; ainsi,
pour l’eau on a en général ρ ∼ 1 000 kg · m−3 donc kgrad pk ∼ 0, 098 bar · m−1 : un
déplacement vertical de 10, 2 m suffit à faire varier la pression d’un bar.
µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− χT = (11.18)
ρ ∂T p ρ ∂p T
2 Équation d’état : l’existence d’une relation liant, pour un système fluide et fermé,
le volume V (ou la masse volumique ρ) aux pression p et température T découle de
l’existence des coefficients thermoélastiques : on peut en effet tracer, de proche en
proche, une surface définie par l’équations ρ = ρ(T, p) à partir
µ ¶de la µdonnée ¶ de ses
∂ρ ∂ρ
deux tangentes (cf. figure 11.4), donc de ses deux dérivées et .
∂p T ∂T p
ρ
p = Cte T = Cte
pente +ρχT
p
pente −ρα T
L’expression obtenue, qu’on puisse l’expliciter ou qu’on doive la conserver sous forme
graphique ou numérique, porte le nom d’équation d’état. On en généralise la notion
sous la forme suivante :
Équation d’état et variables d’état
X On appelle variables d’état le plus petit ensemble de variables macro-
scopiques nécessaire et suffisant pour la description complète des états
d’équilibre d’un système thermodynamique.
Dans tout état d’équilibre, ces variables d’état vérifient une relation au
moins implicite, qui porte le nom d’équation d’état.
Enfin, on utilise aussi une écriture massique en notant r = R/M la constante massique
des gaz parfaits, ce qui permet de noter :
où on a noté v = 1/ρ le volume massique du fluide. Dans le cas de l’air considéré
comme un gaz parfait, M = 29 g · mol−1 donc r = 287 J · kg−1 · K−1 .
N µ ¶
1 1
mi vi∗ 2
X
2
E = U + mvG + Epext U= + eint
p,i (11.21)
2 i=1
2
Cette expression définit l’énergie interne U du système (Σ) ; le terme cinétique bary-
1
centrique mi vi∗ 2 dans cette expression qualifie l’agitation thermique, c’est-à-dire des
2
XN
mouvements en général désordonnés et de valeur moyenne vi∗ nulle, par construc-
i=1
tion même du référentiel barycentrique.
Les deux termes complémentaires dans l’expression de E décrivent d’une part l’énergie
1 2
cinétique mvG associée à une translation globale du système, par exemple lorsqu’il
2
N
X
est en écoulement, et ses interactions avec l’extérieur, décrites par Epext = eext
p,i .
i=1
Dans le cas où un système est globalement au repos et si ses interactions avec l’extérieur
sont négligeables (par exemple, si le système ne monte ni ne descend dans le champ
de pesanteur), l’énergie mécanique se réduit à l’énergie interne.
2 Modèle cinétique des gaz parfaits monoatomiques : considérons, comme modèle du
gaz parfait monoatomique, un ensemble de N particules ponctuelles, sans interactions
entre elles ou avec l’extérieur sauf aux instants des chocs des particules entre elles
ou sur les parois du système. Nous étudierons le mouvement du système dans son
référentiel barycentrique, supposé galiléen, de manière à évaluer son énergie interne
U , qui n’est alors rien d’autre que la somme de l’énergie cinétique des N particules
qui le composent.
Le système évoluant dans un espace borné (de volume V ), toutes les positions r∗i
des particules du système (dans le référentiel barycentrique) évoluent entre certaines
limites, et nous supposerons qu’il en va de même des vitesses vi∗ dans le même ré-
férentiel. On va s’intéresser aux corrélations entre mouvements en positions, décrites
X N
par le terme f (t) = mi r∗i · vi∗ .
i=1
Au vu des hypothèses précédentes, f (t) reste borné, mais évolue a priori très rapi-
dement au cours du temps, au rythme des mouvements et chocs des particules. Par
df 1 t0 +τ df
Z
contre, la moyenne de sa dérivée sur une durée τ vérifie = dt donc
dt τ t0 dt
df f (t0 + τ ) − f (t0 ) df
= ; si τ est assez grand, → 0.
dt τ dt
Si la durée τ représente l’ordre de grandeur d’une mesure macroscopique des propriétés
du système, on pourra considérer que τ est toujours nettement supérieur à toutes
les durées caractéristiques d’évolution de f (t) ; cette hypothèse revient à négliger, à
l’échelle macroscopique, les fluctuations des grandeurs statistiques du fait du grand
df
nombre de particules étudiées. Dans cette hypothèse, nous écrirons = 0.
dt
N N
df dv∗
mi vi∗ 2 +
X X
On peut alors calculer = r∗i · Fi , où Fi = mi i représente la
dt i=1 i=1
dt
force subie, à l’instant considéré, par la i-ème particule. Si on néglige les fluctuations
11 : Thermodynamique classique 249
3
UGPM (T ) = nRT (11.22)
2
2 Les lois de Joule : il est possible d’établir une généralisation de cette propriété
dans le cadre du théorème d’équipartition, qui affirme que les moyennes de termes
d’énergie quadratique ont tous même valeur ; cette propriété s’applique par exemple
1 1
aux énergies de translation mi vi2 ou de rotation Ji ωi2 , etc.
2 2
Un gaz parfait peut présenter seulement trois degrés de liberté associés aux trois
composantes de la vitesse vi (c’est le cas des gaz monoatomiques) mais il peut en
présenter d’autres, selon que des termes de rotation ou de vibration sont présents ; le
nombre δ de degrés de liberté de rotation dépend de la nature des molécules du gaz, et
de sa température qui permet ou non l’apparition de degrés de liberté supplémentaires,
liés aux mouvements de rotation ou de déformation des molécules.
250 Physique, MP, MP*
δ(T )
Nous retiendrons donc l’expression U (T ) = nRT , où l’étude de δ(T ) est en
2
général difficile et ne peut se faire de manière satisfaisante que dans le cadre de
l’étude quantique des oscillations moléculaires. En pratique, on se contente d’affirmer
les lois de Joule :
µ ¶
1 2
dE = d U + mvG + Epext = δW + δQ (11.23)
2
et on note l’intégrale de cette expression pour une transformation finie sous la forme :
µ ¶
1 2
∆E = ∆ U + mvG + Epext = W + Q (11.24)
2
b
d S2 pext
dr
b
Au cours d’un déplacement dr, les forces de pression extérieur exercées sur le système
exercent un travail (résistant si dr est de même sens que la normale n) donné par
dδW = −pext d2 Sn · dr sur l’aire élémentaire d2 S de la surface extérieure du sys-
tème (on remarquera les notations différentielles d pour le déplacement et d2 pour la
surface ; elles ont pour seul but de signaler que ces deux différentielles n’ont rien en
commun).
Puisqu’on reconnaı̂t dans d2 Sn · dr l’augmentation (algébrique) de volume dV (on
pourrait également la noter dτ ou encore d3 V ) correspondant à la surface élémentaire
d2 S, on peut écrire le travail fourni par les forces de pression au système (Σ) sous la
forme de l’intégrale de surface :
I
δW = −pext dV (11.25)
(S)
Dans le seul cas particulier où la pression extérieure a même valeur en tout point de la
surface (S) qui limite le système thermodynamique, cette expression prend la forme :
δW = −pext dV (11.26)
252 Physique, MP, MP*
p
I I
Pp,éq.local = − p (v · n) dS = − dDm (11.29)
(S) (S) ρ
en fonction du débit de masse dDm sortant de la surface dS. Rappelons ici que le
débit de masse est défini pour la totalité du système par la relation (11.5).
2 Évolutions quasi-statiques : on donne parfois ce nom aux transformations d’un
système pour lequel les paramètres de contrainte extérieurs sont en permanence égaux
aux paramètres correspondants, en tout point intérieur au système. Le système est
alors en équilibre en tout point, et l’évolution du système est donc infiniment lente.
Une transformation quasi-statique est donc forcément aussi un équilibre local, et la
relation (11.28) s’applique, on écrira alors δWqs = −pdV . Toutefois, pour des raisons
qui apparaı̂tront progressivement par la suite, nous préférerons l’expression réversi-
bilité mécanique pour décrire le caractère quasi-statique d’une transformation. On
réécrira donc l’expression (11.28) sous la forme :
δWrév.méca = −p dV (11.30)
En particulier dans le cas d’un système simple (décrit par les seules variables p, V , T
et n), et fermé (à quantité de matière n constante), l’existence d’une relation d’état
(liant p, V et T ) permet d’écrire U = U (T, V ) par exemple.
2 Détente de Joule, Gay–Lussac : l’établissement des fonctions U (T, V ) peut se faire
sur la base de l’étude expérimentale de cette détente dans le vide, réalisée conformé-
ment à la figure 11.6 ; le fluide étudié est séparé d’un espace vide par une paroi. Cette
paroi peut être supprimée sans apport de travail mécanique (il s’agit par exemple
d’une feuille de plastique que l’on brise) ce qui amène le fluide à occuper un volume
final V ′ > V après la détente.
254 Physique, MP, MP*
vide
fluide, V , T
n2 a
µ ¶ µ ¶
a
p+ 2 (vm − b) = RT p+ 2 (V − nb) = nRT (11.31)
vm V
µ ¶
∂U
CV = (11.33)
∂T V
11 : Thermodynamique classique 255
Qmonobare = ∆H (11.34)
µ ¶
∂H
qui sont encore des fonctions d’état, avec pour expressions k = −V + et :
∂p T
µ ¶
∂H
Cp = (11.36)
∂T p
Cp porte le nom de capacité thermique isobare ; c’est une grandeur extensive à laquelle
on associe les grandeurs massique cp et molaire cp,m .
Le coefficient k porte le nom de chaleur latente d’augmentation de pression ; c’est
une grandeur intensive, régie là aussi par
µ des relations
¶ issuesµ de
¶ l’étude formelle de
∂(k + V ) ∂Cp
la fonction H(p, T ), avec en particulier = . L’étude générale
∂T p ∂p T
de k et de ces relations est hors programme ; elles n’apportent d’ailleurs rien d’autre
que les mêmes relations que celles fournies à partir de l’étude du coefficient ℓ puisque
le passage U → H, très utile sur le plan pratique, ne constitue qu’un changement de
variable sur le plan mathématique.
On définit enfin le rapport (intensif) des capacités thermiques :
256 Physique, MP, MP*
Cp cp
γ= = (11.37)
CV cV
On peut en général montrer que, pour des raisons de stabilité thermodynamique, tout
système macroscopique à l’équilibre vérifie Cp > 0, CV > 0 et γ > 1 soit Cp > CV .
2 Le cas des gaz parfaits : l’application des deux lois de Joule montre
µ ¶que U et
∂U
H ne dépendent que de T , on en déduit immédiatement les relations = 0 et
µ ¶ ∂V T
∂H
= 0 ou encore ℓ = p et k = −V ; on réécrira ces résultats :
∂p T
dU
U = U (T ) CV (T ) = δQqs = CV dT + pdV
dT
GP : (11.38)
dH
H = H(T )
Cp (T ) = δQqs = Cp dT − V dp
dT
γ(T )r r
GP : cp (T ) = cv (T ) = (11.39)
γ(T ) − 1 γ(T ) − 1
où on rappelle l’expression r = R/M de la constante massique des gaz parfaits pour
une masse molaire M.
Dans le cas des gaz monoatomiques, on a vu qu’en présence des seuls trois degrés de
liberté de translation on peut écrire u(T ) = 3/2rT donc cV = 3r/2, cp = 5r/2 et
γGP monoat. = 5/3 ≃ 1, 67. Dans le cas des gaz polyatomiques, γ(T ) dépend en général
explicitement de la température ; toutefois, dans le domaine, souvent assez vaste, où
on peut ne prendre en compte que les cinq degrés de liberté de translation et rotation
des molécules diatomiques, on aura u(T ) ≃ 5/2rT donc γGP diat. ≃ 7/5 ≃ 1, 40.
2 Le cas des phases condensées : les liquides et solides présentant en général des
volumes faibles devant ceux des gaz, le terme pV et ses variations sont souvent nu-
mériquement négligeables devant les variations de U et donc de H, ce qui permet
d’écrire, par exemple en notations massiques :
les deux fluides situés de part et d’autre du piston sont caractérisés par les énergies
internes U1 et U2 , les températures T1 et T2 , les pressions p1 et p2 et les quantités de
matière n1 et n2 .
U1 , T1 , p1 , n1 U2 , T2 , p2 , n2
manifester est que la transformation doit parcourir une suite continue d’états d’équi-
libre : une transformation réversible est forcément mécaniquement réversible, ou si on
préfère forcément quasi-statique.
Cette condition n’est cependant pas suffisante ; on peut par exemple imaginer que le
piston de la figure 11.7 soit soumis à des forces de frottement, même pour une trans-
formation très lente. Dans ce cas, le piston restera immobile tant que |p2 − p1 | S 6 f ,
si S est la surface du piston et f la norme maximale de la force de frottement. Ainsi, le
piston se déplacera vers la droite si p1 > p2 + f /s, et vers la gauche si p1 < p2 − f /S ;
le changement de sens de l’évolution exige ainsi une variation finie ∆p1 = 2f /S de la
pression. On généralise cet exemple en définissant de manière générale les transfor-
mations réversibles :
Transformations réversibles
X Une évolution d’un système thermodynamique est dite réversible si elle
est constituée d’une suite continue d’états d’équilibre (transformation
quasi-statique, parcourue de manière infiniment lente) dont on peut
changer le sens d’évolution par une modification infinitésimale des para-
mètres de contrainte.
dS = δStransféré + δScréé
Dans cette expression, δScréé > 0 par convention tandis que δStransféré est
lié seulement aux transferts thermiques et en particulier δStransféré = 0
pour une transformation adiabatique (δQ = 0).
• S est une fonction croissante de la température à volume fixé.
La propriété (dSisolé > 0) ne doit surtout pas être généralisée : l’entropie S d’un
système n’augmente pas forcément si le système n’est pas isolé car tout dépend
alors du sens des évolutions imposées par les contraintes extérieures au système.
dU + p̄dV
dS = ou dU = T̄ dS − p̄dV (11.41)
T̄
2 Entropie transférée : considérons maintenant le cas d’un système non isolé, mais
échangeant de l’énergie avec un thermostat (E) de température fixée T̄E . La réunion
du système (Σ) et du thermostat (E) formant un système isolé, on pourra écrire
dSΣ + dSE > 0, l’égalité désignant le cas des seules transformations réversibles.
Un thermostat est, par définition, un système dont la quantité de matière est suffisante
pour que, quelles que soient ses évolutions, sa température reste quasiment constante
tandis qu’il n’échange de l’énergie que sous forme thermique. Du fait de sa très grande
extension, toute évolution d’un thermostat est réversible ; on peut donc écrire δWE ≃ 0
donc dVE ≃ 0 soit encore dUE = T̄E dSE .
L’ensemble formé de (Σ) et (E) est isolé donc l’application du premier principe mène
à dUΣ +dUE = 0 ; ces deux termes mesurent d’ailleurs le transfert thermique δQΣ reçu
par le système (Σ) de la part du thermostat (E) sous la forme δQ = dUΣ = −dUE . On
δQΣ
peut donc écrire le second principe sous la forme dSΣ − > 0. Cette somme me-
T̄E
surant le degré d’irréversibilité de l’évolution envisagée, on l’identifie immédiatement
à l’entropie créée par l’évolution. Finalement, avec des notations plus générales :
δQ
δStransféré = (11.43)
T̄ext
Dans le cas d’un système effectuant une évolution finie en contact avec un ou plusieurs
thermostats, on peut encore écrire ∆S = Stransféré + Scréé
Z , où Scréé > 0 est la création
δQ
totale d’entropie due à cette évolution, et Stransféré = . Dans le cas particulier
T̄ext
d’une évolution cyclique, l’état final et l’état initial sont identiques donc ∆S = 0 et
la relation prend le nom d’inégalité de Clausius :
δQ
I
∆Scycle = 0 ⇒ = −Scréé 6 0 (11.44)
T̄ext
E0
δQrév
Z
S − S0 = (11.45)
E T̄
2 Cas des gaz parfaits : dans le cas des gaz parfaits, on a vu qu’il est possible d’écrire
deux expressions de δQ selon (11.38) ; on aura alors, en fonction des variables T̄ et V
11 : Thermodynamique classique 261
CV (T̄ ) nR
d’abord, δQrév = CV (T̄ )dT̄ +pdV donc dS = dT̄ + dV ; l’intégration depuis
T̄ V
l’état de référence (V0 , T̄0 ) jusqu’à un état arbitraire (V, T̄ ) se fait en deux temps, par
variations réversibles successives de T̄ (à V constant) puis de V (à T constant), pour
Z T̄
CV (T̄ ) V
obtenir S − S0 = dT + nR ln . Dans le cas particulier (fréquent) où γ
T̄0 T V 0
est constant, on peut réécrire cette expression :
· ¸
1 T̄ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.46)
γ − 1 T̄0 V0
Le même calcul, mené à partir de δQrév = Cp (T̄ )dT̄ − V dp, mène par des voies
Z T̄
Cp (T̄ ) p
analogues à l’expression S − S0 = dT − nR ln ou, si γ est constant :
T̄0 T p 0
· ¸
γ T̄ p
γ = Cte ⇒ SGP − S0 = nR ln − ln (11.47)
γ − 1 T̄0 p0
· ¸
1 p γ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.48)
γ − 1 p0 γ − 1 V0
pV γ
La dernière expression (11.48) peut être recopiée SGP − S0 = CV ln . Une évo-
p0 V0γ
lution adiabatique réversible (donc isentropique) vérifie donc une des trois relations
de Laplace T̄ × V γ−1 = Cte, T̄ γ × p1−γ = Cte′ ou p × V γ = Cte′′ .
On peut aussi utiliser les identités thermodynamiques, comme (11.41) ou celle qu’on
en déduit en écrivant H = U + pV donc dH = dU + pdV + V dp ; on obtient alors le
couple d’identités commodes pour le calcul de dS donc de Sf − Si :
dU = T̄ dS − pdV dH = T̄ dS + V dp (11.49)
262 Physique, MP, MP*
p
ibsoth
C e rme r
éversi
ble, T¯
= T¯1
ad
bD
ia b
ad
at
iq u
ia b
e
at
ré
iq u
v.
b v.
ré
B isother bA
m e rév., T¯
= T¯2 V
Dans toute la suite, nous noterons T la température définie indifféremment par les
deux expressions, correspondant au thermomètre à gaz parfait et à la définition ther-
modynamique :
µ ¶ µ ¶
pV ∂U
T = lim = (11.51)
gaz,p→0 nR ∂S V
2
Dm
(S)
D m1
δQ Dm
3
Considérons alors le système formé des N particules qui, à l’instant t, sont contenues
à l’intérieur de la surface (S) ; à cet instant, leur énergie peut être notée ES (t). À
l’instant t + dt, certaines de ces particules sont encore à l’intérieur de la surface (S)
et l’énergie de ces particules est E(S) (t + dt) ; d’autres sont sorties de cette surface et
leur énergie, comptée algébriquement, est celle I sortie entre t et t + dt, égale donc à
l’énergie convectée DE × dt soit, suivant (11.4), eV v · ndS × dt, où on peut aussi
(S) µ ¶
1
écrire la densité volumique d’énergie totale eV sous la forme eV = ρ u + v 2 + eext p ,
2
fonction des grandeurs massiques u et eext p .
p
I
de pression. Le travail des forces de pression est une intégrale de surface − dDm ,
(S) ρ
p
qui se regroupe avec l’énergie interne massique puisque u + = h ; quant au travail
ρ
mécanique utile, fourni par exemple par les pièces mécaniques mobiles situées dans la
machine, on l’écrira δWutile = Putile dt. On regroupe enfin l’ensemble de ces expressions
sous la forme générale :
µ ¶
∂E 1
I
+ h + v 2 + eext
p dDm = Putile + Ptherm (11.52)
∂t (S) 2
∂M
I
+ dDm = 0 dDm = ρv · ndS (11.53)
∂t (S)
µ ¶
X 1 X
Dm,i hi + vi2 + eext
p,i = Putile + Ptherm Dm,i = 0 (11.54)
i
2 i
µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− et χT = . Dans le champ de pesanteur, grad p = ρg.
ρ ∂T p ρ ∂p T
Pour tous les gaz réels, on a le comportement limite à basse pression pM = ρRT
ou p = ρrT : c’est le gaz parfait avec α = 1/T et χT = 1/p.
Les variables extensives X sont définies
Z par une intégrale dans le volume inté-
rieur à la surface de contrôle, X = xdm avec dm = ρdτ .
(Σ)
Le débit de X sortant
I de (Σ) est un flux à travers la surface (S) fermée qui
limite (Σ), DX = jX ·n→ext dS, avec jX = ρxv. Le théorème d’Ostrogradski
I (S) Z
affirme W · n→ext dS = div Wdτ .
(S) (Σ)
∂ρ
Pour une grandeur conservée (masse, charge électrique, etc.), div (ρv)+ = 0.
∂t
Le premier principe affirme l’existence d’une fonction d’état extensive U telle
1 2
que la somme E = U + mvG +Epext vérifie le théorème de l’énergie mécanique,
2
dE = δW + δQ ou encore ∆E = W + Q. On a en général δW = −pext dV , en
en particulier δW = −pdV en cas de réversibilité mécanique.
µ ¶ µ ¶
∂U ∂H
On définit aussi H = U + pV , CV = et Cp = et γ = Cp /CV .
∂T V ∂T p
Dans le cas d’un
µ système ouvert¶ en écoulement, ce principe prend la forme
∂E X 1 2 ext
+ Dmi hi + vi + Ep,i = Putile + Ptherm .
∂t 2
Le second principe affirme l’existence d’une fonction d’état extensive S, non
conservée, dont les variations comportent un terme d’échange et un terme de
création : dS = δStransféré + δScréé ou ∆S = Stransféré + Scréé , avec δScréé > 0,
δQ
l’égalité correspondant aux transformations réversibles, et δStransféré = .
Tsource
On peut calculer S en utilisant dU = T dS − pdV ou dH = T dS + V dp. On
peut aussi imaginer un chemin réversible menant de l’état initial à l’état final
Z f
δQrév
et écrire Sf − Si = .
i T
δQi
I
Pour une transformation cyclique polytherme, = −Scréé 6 0 (inégalité
Ti
de Clausius) ; on en déduit les théorèmes de Carnot (rendement et efficacités
limites pour les cycles dithermes moteur, réfrigérateur et pompe à chaleur).
∂u ∂h
Pour un gaz parfait, cV = et cp = (Joule) et cp − cV = R (Mayer)
∂T ∂T
pV γ
donc cp = γR/(γ − 1) et cv = R/(γ − 1). On a aussi S − S0 = CV ln si
p0 V0γ
γ = Cte. Relations de Laplace, pV γ = Cte, T V γ−1 = Cte′ et p1−γ T γ = Cte′′
sous 4 conditions (GP, adiabatique, réversible, γ constant).
Chapitre 12
Thermochimie
R
gaz 1 gaz 2
n1 , T , p, V1 n2 , T , p, V2
2 Mélange idéal de gaz parfaits : on dit que le résultat du mixage réalisé sur la
figure 12.1 est un mélange idéal de gaz parfaits si :
• les deux gaz A1 et A2 formaient, avant le mélange, deux gaz parfaits ;
• le résultat de l’opération de mixage est aussi un gaz parfait ;
• après mixage, la pression p et la température T du mélange ont même valeur
qu’avant le mixage.
n1 n2
Dans ce mélange, on note x1 = et x2 = les fractions molaires des
n1 + n2 n1 + n2
deux constituants du mélange, ainsi que p1 = x1 p et p2 = x2 p les pressions partielles
n1 RT
de ces deux constituants. En remarquant par exemple que p1 = , on remarque
V
que p1 et p2 sont les pressions qu’exerceraient les gaz A1 et A2 s’ils occupaient, seuls, le
volume total V du mélange à la température T . Plus généralement, nous retiendrons :
X
xi = 1
n(Ai )
i
pi = xi p où xi = donc X (12.1)
ntotal
pi = p
i
X
La relation p = pi porte parfois le nom (historique) de loi de Dalton.
i
X X
Hmélange idéal (T ) = ni hi,m (T ) Umélange idéal (T ) = ni ui,m (T ) (12.3)
i i
où ui,m et hi,m représente l’énergie interne molaire et l’enthalpie molaire du i-ème
constituant du mélange, calculée comme si ce constituant était seul dans les mêmes
conditions de température.
2 Mélange réel : dans le cas d’un mélange réel de gaz, l’enthalpie du mélange comme
les enthalpies molaires des divers constituants dépendent un peu de la pression ; nous
poserons donc, pour un mélange quelconque :
X
Umélange (T, p, ni ) = ni ui,m (T, pi ) + ∆Umixage (12.4)
i
ainsi que la relation en théorie équivalente mais en général plus utile en pratique :
X
Hmélange (T, p, ni ) = ni hi,m (T, pi ) + ∆Hmixage (12.5)
i
Dans cette équation, les ui,m (T, pi ) et hi,m (T, pi ) sont les énergies internes et enthal-
pies molaires des constituants Ai du mélange, déterminées pour des corps purs, à la
température T du mélange et déterminées comme si la pression du corps pur était
précisément la pression partielle qu’il exerce dans le mélange.
Les grandeurs ∆Umixage et ∆Hmixage désignent donc les variations d’énergie interne et
d’enthalpie lors de l’opération de mixage. Nous les négligerons souvent dans la suite.
X X νréactifs < 0
νi Ai ⇋ 0 ou bien νi Ai = 0 avec (12.6)
νproduits > 0
i i
dni
= dξ ∀i (12.7)
νi
ni (t) − ni0
= ξ(t) ∀i (12.8)
νi
Si à partir d’un certain moment ni (t) = 0, on dit que l’équilibre chimique est rompu
par disparition du réactif limitant Ai .
Si au cours du temps ξ(t) augmente, on dit que l’équilibre chimique progresse (ou
progresse dans le sens ) ; si au contraire ξ(t) diminue, l’équilibre chimique régresse
(ou progresse dans le sens ) ; enfin, si ξ(t) reste constant sans que l’équilibre soit
rompu, on dira que l’état d’équilibre est atteint.
L’évolution vers cet état d’équilibre est, rappelons le, régie par les lois de la cinétique
chimique, en termes de vitesse de réaction. On définit celle-ci par la relation générale :
1 dξ 1 d [Ai ]
v= = (12.9)
V dt νi dt
12 : Thermochimie 271
Comme on l’a noté explicitement dans l’écriture (12.10), la grandeur de réaction est
en général une fonction de T , de p, et de la composition chimique du système donc,
pour un état initial donné, de l’avancement ξ de la réaction.
∂H
On définit ainsi l’enthalpie de réaction ∆r H = , l’énergie de réaction
∂ξ T,p
∂U ∂S
∆r U = ou l’entropie de réaction ∆r S = .
∂ξ T,p ∂ξ T,p
2 Variation des grandeurs extensives : considérons une réaction chimique évoluant
d’un état initial ξ = 0 jusqu’à un certain état final ξ = ξf , qui peut être l’équi-
libre chimique, ou sa rupture en présence d’un réactif limitant, ou encore un arrêt
provoqué par l’opérateur (trempe par refroidissement brutal, etc.) La grandeur ther-
modynamique extensive X varie alors, entre l’état initial et l’état final, d’une grandeur
∆X = Xf − Xi .
D’autre part, la relation (12.7) montre que toutes les variations des quantités de
dni
matière ni sont reliées par = νi , d’où encore :
dξ
∂H X
mélanges quasi-idéaux : ∆r H = ≃ νi hi,m (T, pi ) (12.11)
∂ξ T,p i
∆H ′ = ∆U + (p′ − p)V
iso-V , mono-T État final ξ
p′ , T, V
État initial ξ = 0
p, T, V
État final ξ
∆H p, T, V ′ ∆HT
mono-p et T iso-composition
Comme ce volume V est en général essentiellement celui des phases gazeuses, on peut
encore écrire pV ≃ ngaz ′ gaz
initial RT et p V ≃ nfinal RT , en assimilant les gaz du milieu
réactionnel à des gaz parfaits ; il vient donc :
Pour réaliser cette transformation, on doit donc (cf. figure 12.3 dans le cas de la
réaction Fe3 O4solide + COgaz ⇋ 3FeOsolide + CO2gaz ), à partir de l’état initial, réaliser
le mélange, s’assurer que la réaction est bien totale, puis séparer les produits d’arrivée
et les ramener à la température de départ, sous la pression standard. Il n’est pas
toujours simple de réaliser cette transformation en pratique mais nous l’utiliserons
essentiellement pour des raisons théoriques.
Les quantités de matière dans l’état initial et final étant les nombres purs νi (et non
pas des quantités de matière en mol), il est logique d’exprimer l’unité de ∆r X ◦ (T )
dans l’unité de X divisée par l’unité de quantité de matière ; on peut aussi dire que
∆r X ◦ (T ) est une grandeur intensive puisque rapportée à des quantités de matière
conventionnelles, et non pas à des quantités de matière réelles.
Ce caractère intensif ne doit pas faire oublier que, par définition même de la réaction
standard, ∆r X ◦ (T ) dépend de la définition des coefficients stœchiométriques ; ainsi,
1 3
si on étudie la synthèse de l’ammoniac par mole d’ammoniac N2 + H2 ⇋ NH3 ,
2 2
on trouve ∆r H ◦ (298 K) = −46 kJ · mol−1 , tandis que si on choisit un systèmes
de coefficients stœchiométriques entiers minimal, N2 + 3H2 ⇋ 2NH3 , on trouve
∆r H ◦ (298 K) = −92 kJ · mol−1 .
276 Physique, MP, MP*
L’oubli du facteur 103 dans la conversion des kJ · mol−1 en J · mol−1 est une cause
d’erreur un peu ridicule mais hélas fréquente.
Comme nous le verrons progressivement ici et plus tard lors de l’étude des lois de
l’équilibre chimique, les grandeurs de réaction de référence ∆r X ◦ (T ) peuvent faire
l’objet d’une mesure expérimentale.
X
∆r H ◦ (T ) = νi hi,m (T, pi ) (12.14)
i
Qp = ∆H ≃ ξ × ∆r H ◦ (T ) (12.15)
H m désigne un mixage
b
idéa
ξfinal × ∆r H ◦
m lisa
b tion
:Q
≃ξ
∆r H ◦
p
Qp = ∆r H ∆r H
0
tran
s form
atio b
n ré
elle, m
Qp b
b ξ
b b b
0 ξfinal 1
2 État standard d’un élément : considérons un réactif (ou un produit) formé d’un
corps composé comme l’oxyde de fer Fe3 O4 envisagé plus haut. Il s’agit d’un corps
composé puisque l’espèce est formée de deux éléments chimiques, l’élément fer et
l’élément oxygène.
On remarque (par exemple dans le cas de la dernière ligne du tableau 12.1) que,
si l’espèce étudiée est précisément la forme stable d’un corps simple, la réaction de
formation se réduit à l’identité.
Espèce Hf◦ (298 K), kJ · mol−1 Espèce Hf◦ (298 K), kJ · mol−1
AgClsolide −127, 1 AgClgaz 97, 23
Cl2gaz Cl aq −167, 5
O2 gaz O3 gaz 142, 3
H2 Ogaz −241, 9 H2 Oliquide −286, 0
NH4 aq −132, 8 H aq 0
On notera :
• que l’enthalpie de formation de deux espèces dans deux états physiques différents
est en général différente ;
• que certaines valeurs sont absentes ; il s’agit en fait de valeurs nulles correspondant
à des espèces formées d’un corps simple dans son état standard ;
• que l’ordre de grandeur est en général quelques dizaines ou centaines de kilojoule
par mole ; un signe négatif accompagne la plupart des enthalpies de formation
des espèces stables.
On remarque aussi que ces enthalpies de formation sont définies pour des espèces
ioniques en solution aqueuse ; comme la formation d’une telle espèce isolée n’est pas
possible (un réacteur restant électriquement neutre au cours de la réaction), ces gran-
deurs font l’objet d’une convention supplémentaire : l’enthalpie de formation de l’ion
H aq est nulle à toute température.
On appelle ainsi enthalpie de formation de Cl aq l’enthalpie de référence associée à
la réaction de formation de H , Cl en phase aqueuse ; de proche en proche, on peut
ensuite mesurer l’enthalpie de formation de NH
4 , Cl pour en déduire celle de NH4 aq
(qui figure d’ailleurs dans le tableau 12.2), etc.
2 La loi de Hess : considérons par exemple la réaction de référence décrite sur la
figure 12.3, pour le bilan Fe3 O4 + CO ⇋ 3FeO + CO2 . L’état initial comme l’état final
de cette réaction de référence sont formés de trois moles d’élément fer, cinq moles
d’élément oxygène et une mole d’élément carbone ; on peut donc les former (au sens
des réactions de formation envisagées plus haut) à partir des mêmes états standard
de ces éléments, selon la figure 12.5.
(Fr ) (Fp )
Fesolide O2gaz Cgraphite
5
3 mol mol 1 mol
2
Sur cette figure, (Fr ) désigne la somme des réactions de formation des réactifs, pour
lesquelles la variation d’enthalpie peut s’écrire ∆HF r = Hf◦ (Fe3 O4 ) + Hf◦ (CO), et (Fp )
12 : Thermochimie 279
désigne la somme des réactions de formation des produits, pour lesquelles la variation
d’enthalpie est ∆HF p = 3Hf◦ (FeO) + Hf◦ (CO2 ). Toutes ces enthalpies de formation
sont bien sûr supposées déterminées à la même température T , qui est celle de la
réaction de référence.
L’enthalpie étant une fonction d’état, on peut évaluer la même variation d’enthalpie
sur deux chemins différents, ce qui conduit à ∆HF p = ∆HF r +∆r H ◦ , ce qui constitue
la loi de Hess :
Loi de Hess
X L’enthalpie standard d’une réaction (à la température T ) est la somme
(affectée des coefficients stœchiométriques) des enthalpies de formation
des produits, diminuée de la somme (également affectée des coefficients
stœchiométriques)
X X des enthalpies de formation des réactifs : ∆r H ◦ (T ) =
Hf◦ (T ) − Hf◦ (T ).
produits réactifs
Chauffage Refroidissement
isobare isobare
Z T′
on écrit bien sûr de même ∆Hrefroidissement = − Cp′ (θ, p◦ )dθ où Cp′ concerne trois
T
moles de Fe et une mole de CO2 .
Finalement, ∆r H ◦ (T ) = ∆Hchauffage + ∆r H ◦ (T ′ ) + ∆Hrefroidissement s’écrit encore
Z T′
∆r H ◦ (T ′ ) − ∆r H ◦ (T ) =
′
Cp − Cp dθ, faisant apparaı̂tre la grandeur ∆r Cp◦ (θ),
T
qu’on peut indifféremment définir comme la somme des capacités thermiques des
produits diminuée de cette des réactifs (tous pris dans les conditions standard et
dans les proportions stœchiométriques), ou encore comme la variation de capacité
thermique lors de la réaction de référence :
X X X
∆r Cp◦ (T ) = Cp − Cp = νi c◦p,m (Ai , T ) (12.17)
produits réactifs i
Z T′
∆r H ◦ (T ′ ) = ∆r H ◦ (T ′ ) + ∆r Cp◦ (θ)dθ (12.18)
T
On utilisera aussi sa forme locale, dite première loi de Kirchhoff, obtenue en écrivant
T ′ = T + dT :
d
∆r H ◦ (T ) = ∆r Cp◦ (T ) (12.19)
dT
Les capacités thermiques sont données soit sous forme numérique, soit sous forme
de fonctions d’interpolation données en fonction de la température T . La table 12.3
montre la forme prise par les tables thermodynamiques indiquant les enthalpies de
formation et capacités thermiques, dans le cas où celles-ci sont constantes.
Dans d’autres cas, on donne les capacités thermiques sous la forme de polynômes
d’interpolation, par exemple c◦p (T ) = α + βT + γT 2 , ce qui permet le calcul explicite
de l’intégrale (12.18) si on connaı̂t les valeurs numériques de α, β et γ.
Approximation d’Ellingham
X On dit qu’une réaction est traitée dans le cadre de l’approximation d’El-
lingham si on néglige ∆r Cp◦ ou, ce qui revient au même, si on considère
que ∆r H ◦ est une constante indépendante de la température.
2 Cas d’un changement d’état : considérons le cas d’une même réaction chimique
étudiée à deux températures situées de part et d’autre de la température de change-
ment d’état T ∗ d’un des réactifs ; on peut par exemple étudier la réaction de formation
1
de l’eau H2 gaz + O2 gaz ⇋ H2 O ; pour T < T ∗ on considérera la formation de H2 Oliquide
2
et pour T > T ∗ celle de H2 Ogaz , avec dans ce cas T ∗ = 373, 15 K puisque les réactions
standard sont étudiées sous p◦ = 1 bar.
Dans ce cas, on doit tenir compte du changement d’état, associé à la variation d’en-
thalpie molaire L∗ (T ∗ ) = ∆H, qui est aussi la différence ∆H = Hf◦ (T ∗+ ) − Hf◦ (T ∗− ) ;
finalement, on écrira par exemple :
Z T∗ Z T′
Hf◦ (T ′ ) − Hf◦ (T ) = c◦p (θ)dθ + L∗ (T ∗ ) + c◦p (θ)dθ (12.20)
T T∗
où on remarquera que, dans les deux intégrales, les valeurs de cp sont différentes et
concernent respectivement deux phases différentes, par exemple vapeur pour θ > T ∗
et liquide pour θ < T ∗ .
282 Physique, MP, MP*
∆H = 0 produits + inertes
p◦ , T f
réactifs + inertes
p◦ , T i chauffage
produits + inertes
∆H = Qp p◦ , T i
Un mélange idéal de gaz parfaits réalisé à pression constante est aussi réalisé
à T , U et H constants. Dans ce mélange idéal, on définit les fractions molaires
xi = ni /ntotal et les pressions partielles pi = xi p.
X
Pour une réaction chimique quelconque νi Ai ⇋ 0, on définit l’avance-
i
ment
par
dn([A]i ) = νi dξ. Pour toute grandeur extensive, on note alors
∂
∆r = : c’est la notation de Lewis.
∂ξ T,p
Les chaleurs de réaction sont données par Qp ≃ ξ∆r H ◦ (T ) pour une réaction
monobare monotherme et Qv ≃ Qp − ∆ngaz RT pour une réaction isochore
monotherme.
L’enthalpie standard de réaction ∆r H ◦ est relative à la réaction de référence :
réactifs et produits sont les corps purs pris dans leur état standard (p◦ = 1 bar).
On détermine les enthalpies
X standard de réaction par application de la loi de
◦ ◦
Hess, ∆r H (T ) = νi Hf (Ai , T ) en fonction des enthalpies de formation des
i
réactifs et produits Ai à la même température T .
On peut relier les enthalpies de réaction à deux températures différentes en
d
utilisant la forme différentielle de la loi de Kirchhoff, ∆r H ◦ (T ) = ∆r Cp◦ (T ).
dT
Lors de l’intégration de cette loi, on ajoutera l’enthalpie molaire de change-
ment d’état si l’intervalle d’intégration comprend la température de changement
Z T∗ Z T′
◦ ′ ◦ ◦ ∗
d’état : ∆r H (T ) = ∆r H (T ) + ∆r Cp (θ)dθ + L∗ (T ) + ∆r Cp◦ (θ)dθ.
T T∗
La conduction thermique
b b b b
b b b b
grad T b Φc
b
b
b
bb bb
x x + dx
b b
Globalement, le transport d’énergie se fait dans le sens des x croissants puisque T (x) >
T (x + dx) est associé à un flux thermique algébrique de conduction Φc > 0 ; nous
verrons ultérieurement que Φc est proportionnel à −grad T .
286 Physique, MP, MP*
Φp Φp Φp Φp Φp Φp Φp Φp
Zone de transports conductifs
La figure 13.2 précise la géométrie d’un tel transfert pariétal, entre un milieu solide
(où le transport thermique est régi par les phénomènes conductifs) et un fluide en
écoulement (où les phénomènes conductifs et convectifs coexistent). Cette figure est
représentée dans le cas où le flux thermique pariétal est dirigé du solide vers le fluide,
par exemple s’il s’agit d’un refroidissement de solide par circulation de fluide. Le
transport convectif dans le fluide sert ensuite à évacuer le flux thermique Φp ainsi
transporté à travers la paroi.
2 Rayonnement thermique : il constitue le troisième mode de transfert thermique ;
il ne nécessite pas de support matériel car il s’agit d’un transport énergétique par
une onde électromagnétique qui, comme on le verra par la suite, est susceptible de se
propager dans le vide tout comme dans certains milieux matériels, dits transparents.
Rayt visible
Rayt infrarouge
Mars
Le Soleil
Terre
tour (figure 13.3) : plus les planètes sont éloignées du Soleil, moins elles reçoivent de
rayonnement et plus leur température d’équilibre est basse.
Plus généralement, les transferts thermiques radiatifs sont les seuls présents dans le
vide. Leur étude détaillée (en liaison avec la température de l’émetteur mais aussi
avec la répartition spectrale du rayonnement) est reportée à un chapitre ultérieur.
Sur le plan historique, la confusion a été levée de façon explicite pour la première fois
vers par le physicien britannique Black ; il nommait alors intensity of heat la
température et quantity of heat le transfert thermique.
Fourier aboutit ainsi à la première étude quantitative d’un mode de transfert ther-
mique, la conduction ; c’est aussi le premier que nous étudierons en détail. La réso-
lution de l’équation aux dérivées partielles obtenue amena Fourier à développer les
notions de séries et transformées (intégrales) de Fourier.
L’étude des transferts thermiques par rayonnement débute seulement à la fin du xixe
siècle, avec notamment les travaux du physicien autrichien Stefan‡ ; en il montre
ainsi que l’intensité du rayonnement thermique du corps chauffé à la température T
est proportionnelle à T 4 . En , son élève Boltzmann‡ établit pour la première
fois les bases théoriques de cette propriété.
Ce n’est enfin qu’en que l’allemand Planck‡ établit une loi générale expliquant
notamment les lois de Stefan-Boltzmann et de Wien, fondée sur l’étude statistique
des particules quantiques que sont les photons, constituants du rayonnement élec-
tromagnétique. Les travaux de Planck ont trouvé leur réinterprétation en mécanique
quantique générale dans le cadre de la théorie statistique de Bose et Einstein.
288 Physique, MP, MP*
∂E
I
h + eext ρv · ndS = Putile + Ptherm
¡ ¢
+ (13.1)
∂t (S)
où l’énergie
Z mécanique totale E du système s’écrit comme une intégrale de volume,
E= ρedτ où on a choisi de noter e = u+eext la densité massique d’énergie totale,
(Σ)
somme de l’énergie interne massique u et des termes massiques d’énergie extérieure,
1
cinétique et potentielle, eext = v 2 + ep ext.
2
La même relation fait intervenir un débit sortant, correspondant à la somme de l’en-
thalpie, de l’énergie cinétique et de l’énergie potentielle sortantes ; rappelons ici que
h désigne l’enthalpie massique du fluide en écoulement.
Enfin, dans cette même relation (13.1), Putile est la puissance mécanique utile et Ptherm
la puissance thermique reçue par le système.
13 : La conduction thermique 289
Le premier principe (13.1) se ramène seulement à un bilan thermique si tous les termes
énergétiques d’origine mécanique (c’est-à-dire, non thermique) sont nuls :
• le travail mécanique utile est nul, Putile = 0, par exemple en l’absence de toute pièce
mobile en contact avec le système (Σ) ;
• l’énergie potentielle extérieure eext
p est constante ou nulle, par exemple si on peut
négliger le travail des forces de pesanteur ;
• l’énergie cinétique macroscopique massique v 2 /2 est nulle ou ses variations négli-
geables ; ce sera notamment le cas lors de l’étude d’un système au repos ou à
faible vitesse d’écoulement.
Dans ce cas, le bilan thermique prend la forme :
dU
= −ΦH + Ptherm (13.2)
dt
I
où on a choisi de noter ΦH = ρhv · ndS le flux d’enthalpie sortant de la surface de
(S)
contrôle (S), en fonction de la densité volumique de courant d’enthalpie jH = ρhv ;
en effet, h désigne ici l’enthalpie massique donc hV = ρh est l’enthalpie volumique et
on reconnaı̂t bien dans jH et ΦH les expressions générales des densités volumique de
courant et débit sortant associés à la grandeur extensive H.
2 Notion de flux thermique : lorsque les transferts thermiques reçus par le système
(Σ) se font effectivement à travers la surface (S) qui entoure (Σ), on cherchera à
exprimer la puissance thermique Ptherm reçue par (Σ) par analogie avec X(13.2), c’est-
à-dire sous la forme d’un flux entrant ; on écrira alors Ptherm = − Φk , l’indice
k
k désignant
I la nature du transfert thermique étudié. On cherchera alors à exprimer
Φk = jk dS, en définissant un flux thermique sortant de (S) et son vecteur densité
(S)
volumique, de projection jk = jk · n sur la normale sortante.
Plus généralement, pour un milieu continu quelconque (solide, liquide ou gaz) su-
bissant une transformation également quelconque, nous écrirons indifféremment dans
dU ∂T
Z
toute la suite = ρc dt, où c porte le nom de capacité thermique massique
dT (Σ) ∂t
dans les conditions de la transformation.
290 Physique, MP, MP*
∂T
Z
ρc dτ = −ΦH − Φc − Φp − Φr (13.3)
(Σ) ∂t
Insistons sur l’importance des signes − dans cette relation : lorsqu’il existe un flux
énergétique sortant, qu’il s’agisse d’un flux
I thermique conductif, pariétal ou radiatif
ou d’un flux d’enthalpie convecté ΦH = jH · ndS, l’énergie interne du système
(S)
thermodynamique diminue.
On peut encore modifier l’équation (13.3) ci-dessus pour tenir compte de sources ther-
miques réparties en volume dans le système (V ) étudié, comme par exemple l’existence
d’une réaction chimique exothermique, la désintégration radioactive ou l’effet Joule
dans un milieu conducteur. On ajoutera alors au second membre la puissance Plocal
localement dégagée à l’intérieur de ce système pour obtenir la forme définitive du
premier principe dans le cas des bilans thermiques :
∂T
Z
ρc dτ = Plocal − ΦH − Φc − Φp − Φr (13.4)
(Σ) ∂t
Pour les systèmes fermés, il n’y a pas de débit de grandeurs extensives à travers la
surface (S) qui définit le système, donc ΦH = 0 : les termes convectifs sont négligés.
Ce sera le cas de la plupart des systèmes que nous étudierons cette année.
2 Terme de création locale : le terme Plocal est bien sûr souvent nul ; toutefois,
lorsqu’il est présent, il est en général susceptible d’une modélisation simple. Consi-
dérons par exemple un cylindre conducteur du courant électrique, de section S et de
1
longueur dℓ, donc de résistance dR = dℓ si γ est la conductivité du milieu étudié.
γS
On en déduit la puissance dissipée par effet Joule sous la forme dPlocal = dRi2 , si on
note i le courant qui traverse la section S du conducteur.
µ ¶2
1 i
Finalement, dPlocal = dτ , où dτ = Sdℓ est l’élément de volume du conduc-
γ S
teur, et où i/S est une grandeur locale intensive, la densité de courant électrique. Plus
généralement, nous écrirons toujours :
Z
Plocal = plocal dτ (13.5)
(Σ)
13 : La conduction thermique 291
pour la création thermique locale, avec une densité volumique (intensive) plocal ; cette
grandeur se mesure en watt par mètre cube, et dépend du phénomène modélisé.
Rappelons ici encore un risque de confusion qu’on rencontre dans toutes les études
de transport de grandeurs extensives : jc est une densité volumique de courant
thermique (car les transferts thermiques se font en volume) mais son unité est celle
d’une puissance par unité de surface.
Notons que dans le cas particulier où la surface (S) est fermée,
I le transfert thermique
reçu par le système (Σ) intérieur à (S) vaut δQ→(Σ) = − jc · ndS, compte tenu
(S)
des conventions usuelles de la Thermodynamique. On retiendra :
L’hypothèse de Fourier est la suivante : comme les lignes de courant électrique sont
alignées avec les directions de décroissance du potentiel électrique, les lignes de trans-
port thermique sont alignées avec les directions de décroissance de la température.
Ainsi, la loi de Fourier, bien vérifiée dans de très nombreux milieux, est donnée par :
jc = −λgrad T (13.8)
Les valeurs de λ varient très largement d’un matériau à l’autre, comme le montre
le tableau 13.1 ; on remarque que la valeur de λ est directement liée à la densité du
milieu. Les isolants formés de matériaux expansés (c’est le cas du polystyrène expansé
PS cité dans la table) ont des conductivités thermiques faibles du fait de leur structure,
formée de gaz piégés dans une structure lacunaire.
2 Isolants parfaits, conducteurs parfaits : on peut parfois faire l’approximation
d’un milieu parfaitement isolant sur le plan thermique si λ est très faible ; c’est en
particulier l’approximation que l’on fera souvent pour les gaz et les matériaux expansés
ou mousseux. Un tel isolant est donc caractérisé par :
Au contraire, une conductivité thermique très élevée impose une valeur faible de
grad T , sauf en cas de transport d’énergie avec une densité très élevée ; on fera donc
souvent l’approximation :
Le diamant est un des meilleurs conducteurs thermiques connus, avec pour conduc-
tivité thermique λ ∼ 2 000 W · m−1 · K−1 à 20 ◦ C. On notera quand même que le
rapport des conductivités thermiques les plus élevées aux plus faibles est de l’ordre de
104 à 105 seulement ; la réalisation d’isolants thermiques parfaits est beaucoup plus
difficile que, par exemple, celle de bons isolants électriques.
z
paroi solide
x
Φp Φp Φp Φp Φp
v
ΦH ΦH
fluide en mouvement
simplifiée : c’est celle du flux conductif pariétal, à la limite du fluide et d’une paroi
qui le limite. La figure 13.4 présente la géométrie associée à une telle situation.
Sur cette figure, les flux thermiques pariétaux suivent la direction de l’axe (Oz) : ils
sont représentés sur la figure par l’algébrisation des flux pariétaux Φp qui sont ici
dirigés de la paroi solide vers le fluide, supposé donc plus froid que la paroi solide.
La paroi étant étanche, la vitesse v du fluide en écoulement n’a pas de composante sur
l’axe (Oz) ; on peut donc écrire v · ez = 0 donc le flux d’enthalpie dans la direction
de l’axe (Oz) est nul : les transferts thermiques convectifs sont orthogonaux aux
transferts pariétaux.
Sur la figure 13.4, on peut imaginer que la température dans le fluide est une fonction
décroissante de x : les flux enthalpiques convectés ΦH , dirigés le long de l’axe (Ox),
évacuent ici l’apport thermique des flux pariétaux dans le fluide en écoulement.
2 Les hypothèses d’étude des flux pariétaux : dans la géométrie simplifiée sur la
figure 13.4, qui décrit par exemple un écoulement permanent le long d’une paroi, le
phénomène de conduction apparaı̂t dans le sens de −grad T , c’est-à-dire le long de
l’axe (Oz) (normal à la paroi) si la différence entre les températures dans le fluide
TF et dans le solide TS sont nettement plus importantes que les inhomogénéités de
température dans le fluide et dans le solide, ce que nous supposerons ici : TF 6= TS
tandis que TF (r) et TS (r) sont supposées être des fonctions continues de part et
d’autre de la paroi qui sépare le fluide du solide.
2 Modèle local : l’étude détaillée des transferts thermiques pariétaux peut être
envisagée à partir des équations de base que sont les relations de continuité de la
température TS (z = 0+ ) = TF (z = 0− ) et de continuité du flux thermique à travers
la paroi (Oxy) ; comme onµl’a déjà
¶ indiqué, ceµflux ¶est par construction exclusive-
∂T ∂T
ment conductif, d’où −λS = −λF , en notant λS et λF les
∂z z=0+ ∂z z=0−
conductivités thermiques du solide et du fluide.
Cependant, cette étude locale détaillée impose l’étude préalable des lignes de courant
v(r) dans le fluide, qui sont bien sûr liées à la variation TF (r) de la température dans
294 Physique, MP, MP*
2 Couche limite : on peut donner une expression approchée des flux thermiques
pariétaux en considérant l’existence de couches limites, dans les fluides au voisinage
des parois. Dans ces couches minces, la température varie très rapidement, passant,
sur une faible épaisseur (que nous noterons η) de la valeur pratiquement uniforme
TF 0 dans le fluide, pour z < −η à la valeur pratiquement uniforme TS0 dans le solide,
pour z > 0.
C’est précisément l’existence de cette zone où la variation de température est rapide
et transversale (cf. figure 13.5) qui permet de ne considérer que le seul flux conductif
transverse : il est lié à la variation rapide de température dans la couche limite. Ainsi,
même si on ne peut pas, par cette méthode, étudier les variations (lentes) de tempé-
rature longitudinales, on obtient une expression du flux thermique pariétal (mesuré
de long de l’axe (Oz), du fluide vers la paroi solide) selon jp = −λF (grad TF )−η<z<0
λF
donc aussi jp ≃ − (TS0 − TF 0 ) ez .
η
z z
grad TF
Paroi solide, T ≃ TS0 TS0
x jp T
Couche limite
−η −η
b b
Fluide, T ≃ TF 0 TF 0
Signalons seulement l’existence de deux cas limites : les écoulements laminaires, dans
lesquels les lignes de courant glissent les unes sur les autres tout en restant parallèles,
et les écoulements turbulents, dans lesquels la vitesse du fluide dans la canalisation
varient d’un point à l’autre de façon quasiment aléatoire.
La figure 13.6 montre la visualisation d’un écoulement d’un liquide injecté dans un
autre, à la sortie de la canalisation d’injection. Tant que le fluide s’écoule dans la
canalisation (de faible diamètre d), les lignes de courant restent parallèles aux pa-
rois de cette canalisation : l’écoulement est laminaire. Dès que les parois transverses
s’éloignent, l’écoulement devient rapidement turbulent.
13 : La conduction thermique 295
Le passage d’un régime à l’autre se fait exclusivement en fonction d’un paramètre sans
dimension appelé nombre de Reynolds R qui, dans une canalisation cylindrique de
vd
diamètre d, vaut R = , où v est la vitesse moyenne du fluide et ν le coefficient
ν
de viscosité cinématique. Les forces volumiques de viscosité sont proportionnelles à ce
coefficient ν.
On remarquera qu’il se mesure en mètres carrés par seconde : c’est donc un coef-
ficient de diffusion, analogue à ceux qui seront définis au prochain chapitre dans
l’étude des bilans thermiques de régime variable. Ce coefficient est lié aux phé-
nomènes diffusifs liés à la viscosité. Les coefficients de viscosité cinématiques des
fluides sont du même ordre de grandeur que les coefficients de diffusivité thermique,
comme le montre le tableau 13.2.
δQ→Σ
I
= −Φp où Φp = jp dS avec jp = h (TΣ − Text ) (13.11)
dt (S)
où le flux thermique pariétal par unité de surface jp est positif s’il est sortant de
la surface (S) qui limite (Σ), c’est-à-dire aux points où la surface du côté intérieur
296 Physique, MP, MP*
de (S) est à température TΣ plus élevée que celle Text du côté extérieur de (S). La
relation (13.11) porte parfois le nom de relation de Newton pour le transfert pariétal
convecto-conductif.
De plus, dans chaque cas, on peut rencontrer des gradations dans les valeurs de h,
selon par exemple les valeurs du nombre de Reynolds. Notons seulement les ordres de
grandeur de h présentées dans le tableau 13.3.
T T
TΣ b
F F
Σ
TF b
η Σ
z0 z z z
b b 0
Problème réel Problème simplifié
∂T
massique c) s’écrit, par unité de section droite, ρcη = jc (z0− ) − jp (z0 ) ; lorsque
∂t
η → 0, on retrouve bien la continuité des flux thermiques, c’est-à-dire l’égalité du flux
conductif arrivant du côté du solide avec le flux pariétal partant vers le fluide.
Cette condition se traduit¯ aussi pour la répartition de température T (z) par la condi-
∂T ¯¯
tion aux limites −λΣ = h (TΣ − TF ) ; plus généralement, on écrira :
∂z ¯ z0
Les transferts thermiques peuvent être réalisés par trois processus : la convec-
tion (déplacement macroscopique de matière), la conduction (transfert d’agita-
tion thermique par déplacements microscopiques) et le rayonnement thermique
(transfert dans le vide de l’énergie associée à une onde électromagnétique).
Tout transfert thermique est associé à un flux thermique Φth : le transfert reçu
par (Σ) est δQ = Φth dt avec pourI flux thermique entrant à travers la surface
fermée (S) limitant (Σ) Φth = − jth · ndS, où jth est la densité volumique
(S)
de flux thermique pour le processus étudié.
∂ ¡
U + E ext + DH+E ext = Putile + Pth où
¢
Un bilan énergétique s’exprime par
∂t
on a noté E ext l’énergie externe 1/2mv 2 +Epext ; le débit de la grandeur extensive
H + E ext est lui-même un flux sortant, celui du vecteur (h + eext ) × v.
En l’absence de travail mécanique utile et d’énergies extérieures, on peut écrire
∂U
I
= Plocal − ΦH − Φc − Φp − Φr , où ΦH = hv · ndS est le flux d’enthalpie
∂t (S)
convectée sortant de (S), Φc , Φp et Φr sont les flux conductif, pariétal et radiatif
sortants de (S) et Plocal la puissance localement créée.
∂U ∂T
Z Z
Dans ce bilan thermique, = ρc dτ et Plocal = plocal dτ , ce qui
∂t (Σ) ∂t (Σ)
définit la capacité thermique c dans les conditions de la transformation et la
densité volumique locale de puissance créée.
Le transfert thermique conductif reçu par
I le système thermodynamique (Σ) est
δQ→Σ
donné par = −Φc avec Φc = jc · ndS. La loi de Fourier impose
dt (S)
jc = −λgrad T .
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le coefficient de transfert pariétal h augmente si le fluide est un bon conducteur
thermique et si la convection est efficace (ou forcée), c’est-à-dire si la couche
limite est peu épaisse.
Chapitre 14
∂T
div jc + ρc = plocal (14.1)
∂t
Cette équation différentielle exprime le bilan conductif local sous forme d’une équation
∂ρ
analogue à l’équation de continuité div (ρv) + = 0 pour la conservation de la
∂t
masse ; la présence du terme de création locale plocal traduit l’absence de conservation
de l’énergie thermique.
Φc (x) Φc (x + dx)
b b
x x + dx
∂T ∂jc ∂T
enfin dU = ρcSdx dt, il vient bien sûr + ρc = plocal , qui est la forme
∂t ∂x ∂t
particulière de l’équation (14.1) dans le cas unidimensionnel.
Dans la plupart des cas, il est exigé des étudiants qu’ils retrouvent l’équation (14.1)
en utilisant par exemple le raisonnement unidimensionnel présenté ci-dessus ; il faut
donc à la fois savoir et savoir retrouver cette forme locale de l’équation de bilan
thermique.
ρc ∂T plocal ∂T plocal
∆T = − ou = Dth ∆ T + (14.2)
λ ∂t λ ∂t ρc
λ
Le coefficient Dth = porte le nom de coefficient de diffusion ou diffusivité ther-
ρc
mique ; il s’exprime en mètres carrés par seconde et traduit la plus ou moins grande
facilité de l’homogénéisation des écarts de température dans un matériau donné. Une
bonne diffusion thermique exige une conductivité thermique λ élevée (forte propension
à transmettre les flux thermiques) mais aussi une faible capacité thermique volumique
ρc (faible pouvoir de stockage de l’énergie sous forme thermique).
Cette lenteur relative des phénomènes de transfert thermique est souvent mise à
profit pour affirmer qu’un phénomène rapide peut, en première approximation, être
considéré comme adiabatique. L’absence d’isolants thermiques parfaits est ainsi com-
pensée, sur le plan pratique, par la lenteur des échanges thermiques en comparaison
des autres modes d’échange énergétique.
∂f (r, t)
= D∆ f (r, t) (14.3)
∂t
où le coefficient de diffusion D se mesure en mètres carrés par seconde, quelle que soit
la nature de la grandeur f .
Au contraire de l’équation de d’Alembert, la dérivée temporelle apparaı̂t ici au premier
ordre ; les solutions de cette équation aux dérivées partielles ne sont donc en général
pas invariantes par renversement du sens du temps. On peut par exemple noter que si
∂f ∂f
on fait le changement t → t′ = −t, alors ′ = − et l’équation de diffusion (14.3)
∂t ∂t
n’est pas invariante par ce changement.
302 Physique, MP, MP*
∂2f
Au contraire, dans le cas des solutions de l’équation de d’Alembert = c2 ∆ f , le
∂t2
même changement de variables laisse l’équation inchangée puisqu’une seconde dériva-
∂2f ∂2f
tion impose ′2 = (−1)2 2 .
∂t ∂t
Cette circonstance n’a rien d’inattendu dans la mesure où on se souvient du caractère
irréversible des transferts thermiques dus à des différences de température : les situa-
tions de transfert thermique privilégient un sens d’écoulement du temps. Au contraire,
les propagations d’onde sont des évolutions réversibles.
1 dΘ 1
où les fonctions R et Θ vérifient alors nécessairement =D ∆ R(r). Les
Θ(t) dt R(r)
deux membres de cette égalité ne dépendent ni du temps (comme le montre la seconde
expression) ni de l’espace (comme le montre la première) ; il s’agit donc d’une vraie
constante, que nous noterons −1/τ :
• pour respecter sa dimension physique : τ est une durée, comme le montre l’équation
1 dΘ 1
différentielle =− ;
Θ(t) dt τ
• τ est vraisemblablement toujours négatif, puisque sinon la solution de cette même
équation différentielle serait une exponentielle réelle divergente pour t → ∞,
physiquement inacceptable.
dΘ Θ
Les équations vérifiées par Θ(t) et R(r) deviennent alors respectivement = − et
dt τ
τ
∆ R = − R. La forme de la solution R(r) dépend du système de coordonnées choisi et
D µ ¶
t
des conditions aux limites, mais la forme générale de la solution Θ(t) = Θ0 exp −
τ
montre qu’une telle méthode de résolution mène à l’étude de régimes transitoires
thermiques ; la forme la plus générale de la solution est a X priori une combinaison
linéaire de divers régimes transitoires, sous la forme f (r, t) = Rτ (r) exp (−t/τ ), où
τ
Rτ est solution de l’équation aux valeurs propres de Laplace ∆ Rτ (r) = −τ Rτ (r)/D.
∂f
2 Solutions harmoniques : on peut considérer l’équation de diffusion = D∆ f
∂t
comme une équation d’onde et en rechercher des solutionsn sous la forme d’ondes o
planes progressives et monochromatiques, f (r, t) = f0 + Re f 1 exp [i (ωt − k · r)] ;
304 Physique, MP, MP*
On remarque que Im(k) < 0, ce qui traduit une absorption de l’onde ; on peut pour
s’en convaincre rappeler
n la forme explicite de f (r, t), par exemple
o avec u = ex , se-
lon f (r, t) = f0 + Re f 1 exp [i (ωt − Re(k)x)] × exp (Im(k)x) ; c’est l’exponentielle
³ x´
réelle exp (Im(k)x) = exp − qui rend compte de cette absorption. Celle-ci se fait
δ r
2D
sur une longueur de l’ordre de grandeur de l’épaisseur de peau δ définie par δ = ;
ω
plus les phénomènes thermiques sont rapides et plus ils s’atténuent après une courte
2π
longueur. Ainsi, un phénomène diurne, avec ω = dans un milieu ordinaire, avec
1 jour
−5 2 −1
Dth ∼ 10 m · s s’atténue sur une longueur δ ∼ 1 m. C’est par exemple pour cette
raison qu’une bonne cave (pour la conservation des boissons par exemple) doit être
enterrée à quelques mètres de profondeur seulement, pour assurer une atténuation
satisfaisante de l’amplitude des oscillations thermiques de surface.
2 Solutions remarquables : on rencontre souvent dans l’étude des phénomènes de
diffusion des répartitions de grandeurs physiques (température,
√courants thermiques,
etc.) fonctions de la variable réduite (sans dimension) u = x/2 Dt ; en particulier, la
fonction gaussienne et la fonction d’erreur :
u
1 2
Z
G(x, t) = √ exp −u2 et erf(u) = √ exp −v 2 dv
¡ ¢ ¡ ¢
(14.6)
t π 0
sont souvent utilisées pour l’étude de problèmes de diffusion, puisqu’on vérifie immé-
diatement que ces fonctions sont toutes deux solution de l’équation de diffusion à une
∂f ∂2f
dimension d’espace, = D 2 . La figure 14.2 représente le comportement de ces
∂t ∂x
fonctions paires de x pour des valeurs consécutives de t.
Le tracé de la gaussienne G(x) représente bien les évolutions des écarts de température
dans une barre, initialement chauffée en son centre, en fonction de la distance x
à ce centre : la température s’homogénéise progressivement, le pic de température
s’aplatissant progressivement tout en ralentissant régulièrement
√ sa diffusion puisque
sa largeur à mi-hauteur progresse seulement comme t.
Le tracé de la fonction d’erreur représente aussi assez bien une évolution vers l’équi-
libre thermique d’un milieu unidimensionnel, initialement à une température élevée,
si on impose brutalement et durablement une température plus faible à son extrémité
x = 0. Là aussi, on voit une évolution progressive qui va en ralentissant, le point√ où
la température est la moyenne des valeurs extrêmes ne progressant que comme t.
√
Dans les deux cas, on retrouve l’évolution caractéristique D ∼ ℓ2 /τ ou ℓ ∼ Dτ ,
comme prévu de manière générale par l’équation de diffusion. On pourra une fois
encore faire utilement la comparaison avec la conclusion c ∼ ℓ/τ ou ℓ ∼ cτ qu’on
obtiendrait pour des ondes de célérité c, solutions de l’équation de d’Alembert.
14 : Régimes de transfert thermique 305
√
G(x, t) erf(u) = erf(x/2 Dt)
√ b
1/ t 1
t
t t′ > t
√ b b b
1/2 t 0, 5
t′ > t t′′ > t′
t′′ > t′
b
x b
x
√ √
2 ln 2 Dt 0, 95 Dt
T2
jc
T 1 > T2
Nous étudierons dans la suite la géométrie résistive décrite sur la figure 14.3, le système
(Σ) étant délimité par deux zones parfaitement conductrices de températures fixées
T1 et T2 , et par les limites d’un tube de champ formé par les lignes de champ du
vecteur jc (on parle de lignes de courant thermique).
On peut aussi utiliser un milieu conducteur limité latéralement par un isolant ; les
lignes de courant de jc sont alors tangentielles à ces limites, par définition même d’un
isolant thermique.
On se rappellera que les lignes iso-T sont perpendiculaires aux lignes de champ
de grad T , donc de jc ; en effet, une variation de température est donnée par
dT = grad T · dr ; une ligne iso-T correspond donc à dT = 0 donc à un dé-
placement dr orthogonal à grad T . En représentant des schémas analogues à celui
de la figure 14.3, on prendra donc soin de représenter des lignes de courant thermique
perpendiculaires aux surfaces isothermes !
L’équation de diffusion thermique étant supposée résolue, on peut en déduire la fonc-
tion T (r) ainsi que ses dérivées, et en particulier jc = −λgrad T , dont les interpréta-
tions sont deux grandeurs intégrales, définies sur la figure 14.4.
Z M2
• L’intégrale ℑ(C) = grad T · dr, menée sur n’importe quelle courbe (C) joignant
M1
les surfaces (S1 ) et (S2 ) des deux conducteurs thermiques parfaits, a pour valeur
ℑ(C) = T2 − T1 .
Par définition même du gradient, cette intégrale est indépendante du choix de
la courbe (C).
Z
• L’intégrale ℑ(S) = grad T · nds, menée sur n’importe quelle surface (S) cou-
(S)
pant le tube de champ (les
Z surfaces (S1 ) et (S2 ) conviennent d’ailleurs) a pour
interprétation −λℑ(S) = jc · ndS = Φc , qui est le flux thermique à travers
(S)
la surface (S).
Notons toutefois que cette interprétation ne subsiste que si λ est uniforme dans
(Σ) ; si ce n’est pas le cas, on peut bien sûr toujours étudier Φc , qui n’est plus
forcément proportionnel à ℑ(S) .
Puisqu’en régime permanent div jc = 0, le vecteur jc est à flux conservatif, c’est-
à-dire que le flux thermique sortant d’une surface fermée est nulle ; on en déduit
immédiatement que Φc et ℑ(S) ne dépendent pas du choix de la surface (S).
T2
b surface (S2 )
(C) M2
bM milieu (Σ)
(S)
M1
b
surface (S1 )
T1
c’est-à-dire dans le sens du vecteur jc ; par exemple, dans le cas de la figure 14.4, le
vecteur jc est orienté de (S1 ) vers (S2 ) car on a supposé T1 > T2 .
2 Conductance thermique : de façon évidente, l’ajout d’une constante quelconque
à T ne change ni son caractère de solution de l’équation de Laplace ∆ T = 0, ni les
intégrales ℑ(S) et ℑ(C) qui ne dépendent que de grad T ; ces intégrales ne dépendent
donc pas de T1 et de T2 , mais seulement de T1 − T2 .
En fait, ces deux intégrales dépendent linéairement de la différence T1 − T2 puisque
les équations ∆ T = 0 et jc = −λgrad T sont linéaires ; le rapport de ces deux
intégrales ne dépend donc pas de T1 − T2 . Il ne dépend que de la géométrie du milieu
matériel (Σ) et de sa conductivité thermique λ. Ce rapport, défini pour être positif
par construction, vaut :
Z
jc · ndS
Φc (S)
Gth = =Z (14.7)
T1 − T2
grad T · dr
(C)
Si de plus λ est une constante, on peut aussi écrire Gth = λℑ(S) /ℑ(C) et la conductance
thermique est le produit de la conductivité thermique par une grandeur de nature géo-
métrique, qui est le quotient d’une surface (orthogonale aux transferts thermiques) par
une longueur (mesurée parallèlement à ceux-ci) ; on se souviendra donc de l’expression
approchée générale :
S⊥
Gth ∼ λ >0 (14.8)
ℓk
1 1 ℓk
On définit aussi la résistance thermique Rth = ∼ . L’unité de mesure
Gth λ S⊥
des conductances thermiques est le watt par kelvin, et l’ordre de grandeur de ces
conductances dépend du matériau choisi et de sa géométrie.
Prenons d’abord un exemple dans le domaine du bâtiment ; la conductivité thermique
du béton est λ = 1, 3 W · m−1 · K−1 et un mur de béton de 10 cm d’épaisseur et de
20 m2 de surface a une conductance thermique Gth = 260 W · K−1 ; ceci signifie qu’un
écart thermique de 10 ◦ C de part et d’autre d’un tel mur impose un flux thermique
(pertes thermiques) égal à Φc = 2, 6 kW ! Cette valeur très élevée explique l’emploi
de matériaux isolants (matériaux expansés ou laines, ou encore circulation d’air dans
les murs de béton) dans la construction. Pour mieux visualiser l’importance d’une
telle fuite de 2, 6 kW, en termes de dépenses de chauffage. Elle représente près du
tiers de la puissance maximale disponible dans un abonnement électrique domestique
habituel, seulement pour compenser une fuite thermique sur un seul mur de 20 m2 .
Le cas de la laine de verre est justement intéressant, avec λ = 0, 045 W · m−1 · K−1 ,
la même épaisseur et la même surface mènent à Gth = 9, 0 W · K−1 et Φc = 90 W
pour le même écart de température. Si on comprend l’intérêt pratique de l’isolation
thermique, il reste à savoir commet associer les deux conductances calculées ici, en
développant les règles d’association en série et en parallèle.
2 Analogies électriques : les relations (14.7) et (14.8) suggèrent l’analogie avec les
conductances et résistances électriques, que l’on peut définir avec la même géométrie
que celle de la figure 14.4 par la relation :
14 : Régimes de transfert thermique 309
Z
j · ndS
I (S) S⊥
G= =Z ∼γ >0 (14.9)
V1 − V2 ℓk
grad V · dr
(C)
où on peut suivre les règles de substitution du tableau 14.2 pour l’analogie entre
phénomènes électrocinétiques et thermiques.
Gth G
En particulier, pour une même géométrie, on trouvera = . Nous verrons ulté-
λ γ
rieurement que la même analogie s’applique aussi aux calculs des capacités de conden-
Q
sateurs ; la définition C = de ces capacités montrera qu’elles sont l’analogue
V1 − V2
des conductances électriques et thermiques, et qu’on pourra étendre le résultat ci-
dessus sous la forme générale :
Gth G C
= = (14.10)
λ γ ε
Gth,parallèle = Gth,1 + Gth,2 ; la conductance thermique est donc plus élevée que la plus
élevée des deux conductances mises en parallèle.
Conductances et capacités
X Les règles d’addition des conductances, conductances thermiques et ca-
pacités sont les mêmes. Dans le cas d’une association en série, on fait la
somme des termes 1/G, 1/Gth ou 1/C. Dans le cas d’une association en
parallèle, on fait la somme des termes G, Gth ou C.
On reconnaı̂t une association en série car le flux extensif (le courant
électrique ou le flux thermique) est le même dans tous les éléments de
l’association.
On reconnaı̂t une association en parallèle car la contrainte intensive aux
bornes (la différence de potentiel ou la différence de température) est la
même pour tous les éléments de l’association.
d2 T
2 Problème unidimensionnel cartésien : ici, T = T (x) donc ∆ T = = 0 donc
dx2
dT
T (x) est une fonction affine de x, T (x) = T (0) + αx et jc = −λ ex = −λαex soit
dx
jc = −jc ex avec α = jc /λ ; ces résultats sont résumés sur la figure 14.5.
T T (0) + jc L/λ
b
T (0)
b
x
b b
0 L
S jc = −jc ex
S
Cylindre à conduction axiale : Gth = λ (14.11)
L
b b
r
r0 r1
jc jc T
T∝
h ln r
+ ct
e
b b
r
r0 r1
La géométrie correspondante est rappelée sur la figure 14.6 ; on y constate une dilution
géométrique du courant thermique jc dont l’intensité décroı̂t quand r augmente, de
312 Physique, MP, MP*
façon à préserver le flux thermique par unité de hauteur ϕc à travers des cylindres de
rayon de plus en plus grands.
En particulier, la conductance thermique d’un manchon cylindrique de rayons inté-
rieur r0 et extérieur r1 sur une hauteur h tel qu’il est représenté sur la figure 14.6 vérifie
ϕc r1
Φc = hϕc avec aussi T1 − T2 = ln ; on en déduit l’expression de la conduc-
2πλ r0
2πh
tance thermique de ce manchon cylindrique, Gth = λ ; on vérifie d’ailleurs
ln r1 /r0
la forme générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 sont voisins, puisque
r1 − r0
alors ln r1 /r0 ≃ , la section ouverte au passage du flux thermique est bien
r0
S⊥ ≃ 2πhr0 et la longueur le long de laquelle ce flux se répartit est ℓk = r1 − r0 . On
retiendra au moins :
2πh
Manchon cylindrique à conduction radiale : Gth = λ r1 (14.12)
ln
r0
La géométrie correspondante est rappelée sur la figure 14.7 ; on y retrouve une dilution
géométrique de l’intensité du vecteur jc au fur et à mesure que le flux thermique se
répartit sur des sphères de rayon croissant, tout comme on avait observé une dilution
de l’amplitude d’une onde sphérique au fur et à mesure qu’elle se propage loin de
sa source : il s’agit dans les deux cas d’assurer la répartition de la même quantité
d’énergie, en l’absence de pertes, cette énergie se répartissant sur une surface de plus
en plus grande.
En particulier, la conductance thermiqueµd’une coquille
¶ sphérique de rayons intérieur
Φc 1 1
r0 et extérieur r1 vérifie T1 − T2 = − ; on en déduit l’expression de la
4πλ r0 r1
14 : Régimes de transfert thermique 313
4πr0 r1
conductance thermique de ce système, Gth = λ ; on vérifie d’ailleurs la forme
r1 − r0
générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 dont voisins, puisque la section
ouverte au passage du flux thermique est alors S⊥ ≃ 4πr02 ≃ 4πr12 et la longueur le
long de laquelle ce flux se répartit est ℓk = r1 − r0 . On retiendra au moins :
4πr0 r1
Coquille sphérique à conduction radiale : Gth = λ (14.13)
r1 − r0
T1
Fluide, T0
O b b b b
x x + dx ℓ x
djc d2 T
−d⊥ = d⊥ λ 2 = h (T (x) − T0 ) (14.14)
dx dx
Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
En présence seulement des phénomènes conductifs et de création locale, on doit
∂T
savoir et savoir retrouver par un bilan local la relation div jc + ρc = plocal ,
∂t
qui exprime localement la non-conservation de l’énergie thermique.
Du fait de la loi de Fourier, l’équation locale de bilan thermique devient alors
∂T plocal
l’équation de diffusion = Dth ∆ T + , où la diffusivité thermique Dth
∂t ρc
se mesure en m2 · s−1 .
En régime permanent, on définit la conductance thermique d’un milieu conduc-
Φc
teur par Gth = . On l’obtient en résolvant l’équation de Laplace
T2 − T1
∆ T = 0 dans le volume du milieu conducteur. Il y a analogie avec les conduc-
Gth G S⊥
tances électriques, = . En général, Gth ∼ λ > 0.
λ γ ℓk
Les solutions de l’équation de Laplace ∆ T = 0 en géométrie unidimensionnelle
sont des fonctions : affines T ∼ ax+b en coordonnées cartésiennes, T ∼ a+b ln r
en coordonnées cylindriques et T ∼ a − b/r en coordonnées sphériques.
Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le flux thermique pariétal permet d’établir une condition aux limites pour la
résolution de l’équation de diffusion thermique, sous la forme jc · n = jp en tout
point de la surface (S) extérieure au système (Σ), jp étant comme n compté
positivement vers l’extérieur de (Σ).
La résolution de l’équation de diffusion thermique en régime variable peut se
résoudre en notation complexe si on recherche des régimes harmoniques ; l’équa-
tion de dispersion est alors celle d’une onde évanescente, caractérisée par un
effet de peau.
On peut aussi rechercher des régimes transitoires, par séparation des variables
sous la forme T (r, t) = T0 + R(r)Θ(t) ; on choisira pour T0 la valeur attendue
en régime permanent. On procède ensuite en explicitant d’abord les conditions
aux limites puis ensuite les conditions initiales.
√
On peut enfin rechercher des fonctions de la variable réduite u = x/2 Dth t,
sous réserve que l’énoncé de la question posée suggère cette méthode.
Chapitre 15
Le rayonnement thermique
B(t′ )
t′ > t
E(t′ )
E(t) E∧B
x
B(t)
c0 1
Ces deux champs se propagent ensemble à la vitesse de phase vϕ = , où c0 = √
n ε0 µ0
est la célérité de la lumière dans le vide, c0 ≃ 3, 00 × 108 m · s−1 .
2 Milieux, indices, longueurs d’onde : nous ne considérons que les milieux matériels
transparents. Ceci peut n’être vérifié que dans un certain domaine de fréquence, hors
318 Physique, MP, MP*
de ce qu’on appelle les bandes ou zones d’absorption ; on peut alors, dans le cadre de
certains modèles, montrer que n > 1 pour les milieux moléculaires non absorbants.
L’indice optique n dépend (c’est le phénomène de dispersion) de la fréquence ν ou de la
pulsation ω = 2πν du champ ; on préfère souvent en pratique décrire ces oscillations au
c0 2π
moyen de la longueur d’onde dans le vide du rayonnement, définie par λ0 = = ,
ν k
si k = ku est le vecteur d’onde. Un abus de langage courant consiste à parler souvent
de longueur d’onde du rayonnement, alors que la (( vraie )) longueur d’onde de l’onde
électromagnétique dépend bien sûr de l’indice optique n.
Les ondes électromagnétiques sont réparties en divers domaines, selon la valeur de
cette longueur d’onde λ0 ; cette répartition est rappelée dans le tableau 15.2.
8 × 10−7
4 × 10−7
λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques
Rayons X
Rayons γ
Rayons
Ondes
Micro
ondes
radio
U.V.
Lumière
I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014
4 × 1014
ν (Hz)
Z
E (r, t) ∧ B (r, t)
Pém (t) = R (r, t) · ndS avec R (r, t) = (15.1)
(S) µ0
La grandeur R (r, t), qui porte le nom de vecteur de Poynting, est donc une densité
volumique de flux d’énergie, complètement analogue au vecteur jc pour le transport
d’énergie par conduction. On peut d’ailleurs rappeler l’étude dimensionnelle qui avait
déjà
I été proposée à propos de cette grandeur, en notant que le théorème d’Ampère
R UI
B · dr = µ0 I et la relation E · dr montrent que R à la dimension de 2 si ℓ est
ℓ
une longueur ; le vecteur de Poynting se mesure bien, comme jc , en watt par mètre
carré.
L’analogie avec les vecteurs densités de courant se poursuit puisqu’on montrera aussi,
pour une onde de direction de propagation u, la relation entre vecteur de Poynting et
densité volumique d’énergie électromagnétique wém (r, t) :
15 : Le rayonnement thermique 319
ε0 E2 B2
R (r, t) = c0 wém (r, t) u avec wém (r, t) = + (15.2)
2 2µ0
où la vitesse de transport de l’énergie est donc ici égale à vg = c0 u. Là aussi, on peut
brièvement évoquer l’analyse dimensionnelle
I des deux termes formant la Z somme wém ,
Q
en notant que le théorème d’Ampère E · ndS = et la relation E · dr = U
ε0
2
ε0 E QU
imposent pour l’unité de où ℓ est une longueur et S une surface ; on vérifie
2 Sℓ
immédiatement qu’il s’agit bien s’une énergie volumique.
Signalons dès à présent que, si on emploie une notation complexe pour l’étude
du champ électromagnétique associé à une onde, on doit se garder de l’appli-
quer aux grandeurs énergétiques (quadratiques) R (r, t) et wém (r, t); seul le calcul
E ∧ B∗
des valeurs moyennes reste possible, selon les relations hRi = Re et
ε E ∧ E∗ B ∧ B∗ 2µ0
0
hwém i = Re + . Tout autre calcul, en particulier de gran-
4 4µ0
deurs instantanées, doit être conduit en revenant au préalable aux grandeurs réelles.
Notons ici que jr est algébrique ; on le compte positivement pour un courant énergé-
tique radiatif sortant de la surface fermée (S) qui limite le système thermodynamique
(Σ). C’est donc l’emploi des conventions thermodynamiques pour δQ qui explique
le signe − dans la relation ci-dessus.
Le rayonnement joue ainsi dans certains cas le même rôle que les transferts pariétaux
dans l’étude des transferts thermiques : il sert à établir les conditions aux limites
sur la surface (S) qui limite le corps étudié, en termes de continuité des courants
thermiques.
jr = ϕ↑ − ϕ↓ (15.4)
|{z} |{z}
émergent de (S) incident sur (S)
Notons que, par hypothèse, ϕ↑ > 0 et ϕ↓ > 0 ; le signe de jr dépend du bilan thermique
local. On remarquera la notation ϕ, associée à la dénomination courant hémisphérique
pour ces grandeurs qui ne concernent que la somme des puissances transportées par le
rayonnement électromagnétique dans un seul sens, au contraire du courant thermique
total jr .
2 Absorption, réflexion : à l’abord de la surface extérieure (S) du système opaque
(Σ), le flux énergétique incident est soit réfléchi, soit absorbé : ϕ↓ = ϕréfl. + ϕabs. .
Le phénomène microscopique responsable de l’absorption du rayonnement électroma-
gnétique est l’excitation des modes de vibration des atomes du système (Σ), sous
l’effet du champ électromagnétique incident. C’est d’ailleurs ce couplage entre ondes
électromagnétiques et agitation thermique qui permet d’inclure le flux radiatif dans
les flux thermiques, à côté des flux conductif et pariétal.
La réflexion totale que l’on rencontre en Optique dans l’étude des miroirs représente
un cas exceptionnel ; plus généralement, la réflexion ne suit les lois de Snell-Descartes
que pour les matériaux à état de surface idéalement régulier. Nous étudierons donc
dans ce qui suit que les relations entre flux hémisphériques, sans nous préoccuper de
la direction de propagation de ces flux.
2 Émission : en plus des phénomènes de réflexion et d’absorption, que l’on rencontre
ordinairement en Optique par exemple, la surface d’un corps opaque peut aussi émettre
du rayonnement électromagnétique, en particulier en liaison avec la température de
ce corps émetteur.
15 : Le rayonnement thermique 321
Émission de rayonnement
X La désexcitation des atomes du système thermodynamique (Σ) peut
conduire à l’émission de rayonnement électromagnétique par la surface
extérieure (S) de (Σ). Ce rayonnement émis s’ajoute au rayonnement
réfléchi pour former le rayonnement total partant de la surface (S).
Ainsi, si on étudie le flux hémisphérique partant (ou émergent) ϕ↑ de l’élément de
surface du corps opaque (Σ), on constate qu’il est, en général, supérieur au seul flux
réfléchi ; le supplément est appelé courant thermique radiatif émis ϕémis par unité de
surface du corps opaque, avec la relation ϕ↑ = ϕréfl. + ϕémis .
2 Bilans radiatifs : on peut visualiser sur la figure 15.3 les bilans des phéno-
mènes d’absorption, de réflexion et d’émission. Chaque flux hémisphérique (ϕréfl. ,
ϕabs. , ϕémis ) est supposé positif dans les définitions ci-dessus. Sur ce schéma, les croix
désigne la conversion d’énergie électromagnétique en agitation thermique locale, c’est-
à-dire en énergie interne (dans le cas de l’absorption) ou réciproquement la création
d’une onde électromagnétique à partir de la vibration des particules chargées dues à
l’agitation thermique du matériau près de sa surface (dans le cas de l’émission).
ϕ↓ ϕ↑
ϕabs. ϕémis
système (Σ)
dϕx
Le flux hémisphérique spectral par unité de longueur d’onde se mesure en watts
dλ0
par mètre carré et par mètre ; on évitera de confondre cette unité avec celle d’une
dϕ volumique même si on peut dans les deux cas faire l’analyse dimensionnelle
puissance
x
= W · m−3 = [wém ].
dλ0
Le tableau 15.1 montre quelques valeurs de coefficients d’absorption pour divers ma-
tériaux, pour deux longueurs d’onde : λ0 = 600 nm, qui correspond au maximum
de sensibilité de l’œil humain, dans le domaine visible, et λ0 = 9, 3 µm, située dans
le domaine de l’infrarouge lointain. Nous verrons bientôt que cette longueur d’onde
correspond au maximum d’émission des objets terrestres, lorsqu’ils sont chauffés à
une température de l’ordre de 310 K.
Sur ce tableau, on remarque que des objets qui paraissent blancs ou transparents dans
le domaine visible (marbre, verre ou papier) sembleraient noirs pour une observation
dans l’infrarouge (ce sont quasiment des absorbeurs intégraux).
Dans le cas particulier d’une planète, le coefficient de réflexion calculé pour le maxi-
mum de sensibilité de l’œil porte le nom d’albédo, et on le note A = r(600 nm) soit
aussi A = 1 − a(600 nm). L’albédo dépend de la nature de la surface de la planète
(état de l’atmosphère, nature du sol, etc). L’albédo terrestre moyen est de l’ordre de
A ≃ 0, 34.
15 : Le rayonnement thermique 323
Nous verrons dans la suite comment on peut, dans certains cas, déterminer un flux
dϕ0
hémisphérique émis théorique, que nous noterons ; les bilans radiatifs ne se pla-
dλ0
çant pas toujours dans le cas du rayonnement idéal d’équilibre, on définit de même
un coefficient d’émission :
dϕémis dϕ0
= e(λ0 ) (15.7)
dλ0 dλ0
Le cas d’un émetteur idéal, tel qu’il sera décrit plus bas, correspond à e = 1 (par
définition) donc aussi à a = 1 et r = 0 : on parlera donc d’absorbeur intégral (pour
toutes les longueurs d’ondes) ou encore de corps noir ; la loi donnant l’expression
dϕ0
de en fonction de la longueur d’onde λ0 et de la température de surface T de
dλ0
l’émetteur porte le nom de loi du corps noir.
Un absorbeur ou un émetteur réel, pour lequel on a toujours a < 1 donc e < 1, porte
parfois le nom de corps gris.
2 Flux hémisphérique spectral et global : on peut repasser Z au flux hémisphérique
∞
dϕx
global à partir d’un flux hémisphérique spectral par ϕx = dν ou, selon le
Z ∞ ν=0 dν
dϕx
cas, ϕx = dλ0 . On peut bien sûr accompagner ces définitions de celles de
λ0 =0 dλ0
coefficients de réflexion ou d’émission intégraux ou moyens, seuls utiles pour un bilan
énergétique global :
Dans cette expression, ϕ0 (T ) est le flux hémisphérique surfacique, intégré sur toutes
les longueurs d’ondes, émis par un émetteur idéal à la température T .
Nous nous placerons dans la suite dans le cas où cette relation d’équilibre thermody-
namique local est réalisée pour tout intervalle de fréquence ou de longueur d’onde, ce
dϕ↓ dϕ↑ dϕémis dϕabs.
qui permet d’écrire = et = .
dλ0 dλ0 dλ0 dλ0
2 Loi de Planck : nous allons ici préciser l’expression de la valeur commune des
flux ci-dessus, dans le cas d’un corps noir (absorbeur intégral). En effet, dans le cas
d’un absorbeur intégral, a = 1 pour toute longueur d’onde donc le flux hémisphérique
dϕréfl.
réfléchi est nul.
dλ0
dϕ↓ dϕ↑
Les flux hémisphériques radiatifs spectraux incident et partant d’un corps
dλ0 dλ0
noir à l’équilibre radiatif local sont égaux entre eux, et aussi égaux aux flux hémisphé-
dϕémis dϕabs.
riques radiatifs spectraux émis et absorbé par la surface de ce corps
dλ0 dλ0
dϕ0
noir. Cette valeur commune, , est la loi de Planck‡ , ou loi du corps noir. Elle
dλ0
sera pour l’instant seulement affirmée, sous la forme :
dϕ0 2πhc20 1
= (15.10)
dλ0 λ50 hc0
exp −1
λ0 kB T
dϕ0 2πhν 3 1
= (15.13)
dν c20 hν
exp −1
kB T
f (u)
u
b
u0 = 4.9651
u5
Figure 15.4 – Tracé de f (u) =
exp (u) − 1
df u5
Le tracé de f est aisé ; sa dérivée vaut = (5 − u − u exp (−u)) soit
du (exp (u) − 1)2
df u5
encore, si exp (u) ≫ 1, ≃ (5 − u) qui s’annule lorsque u0 ≃ 5 (en
du (exp (u) − 1)2
fait, pour u0 = 4, 9651). On en déduit la forme de f (u), et donc de la loi de Planck,
à une température donnée ; f (u) est tracée sur la figure 15.4.
2 Loi du déplacement de Wien : comme le montre l’étude ci-dessus, le flux hémi-
sphérique spectral admet un maximum pour une certaine longueur d’onde λmax qui
vérifie la loi de déplacement de Wien‡ :
hc
λmax T = = 2, 8978 × 10−3 m · K (15.14)
kB u0
On n’oubliera pas non plus que, si le maximum de f (u) est fixé à f (u0 ) ≃ 21, 2, le
5 5
dϕ0 2πkB T
maximum du flux hémisphérique d’équilibre = f (u) varie aussi avec la
dλ0 h4 c30
5
température, proportionnellement à T .
La figure 15.5 illustre la double influence de la température sur le flux hémisphérique
d’équilibre : déplacement de la valeur λmax et de la valeur de l’énergie maximale (ou
totale) émise.
dϕ0
dλ0
T = 5 000 K
T = 3 500 K
λ0
b b
579 nm 827 nm
dϕ0
Figure 15.5 – Tracé de pour deux températures différentes
dλ0
2π 5 kB
4
ϕ0 (T ) = σT 4 σ= = 5, 6704 × 10−8 W · m−2 · K−4 (15.15)
15h3 c20
2 Flux pariétal équivalent : considérons une surface (S), d’aire S, d’un corps porté
à la température T , dont le rayonnement est donné par la loi de Planck. Les échanges
thermiques par rayonnement entre ce corps et son environnement se font par l’inter-
médiaire du flux émis (donc négatif), Φémis
r = −SσT 4 .
On peut souvent considérer l’extérieur du système étudié (par exemple l’atmosphère
qui l’entoure) comme un autre émetteur thermique, rayonnant à travers la même sur-
face S selon la loi de Stefan, mais avec une autre température T ′ , de sorte que le
flux thermique reçu par (S) s’écrit Φreçu
r = SσT ′4 . Dans le cas d’un faible écart de
température, on peut recopier le flux total reçu sous la forme Φr = Sσ(T ′4 − T 4 )
15 : Le rayonnement thermique 327
donc Φr ≃ 4SσT 3 (T ′ − T ), ce qui montre que les échanges thermiques par rayonne-
ment peuvent se mettre sous une forme équivalente aux transferts pariétaux convecto-
conductifs, avec le coefficient pariétal équivalent :
hr = 4σT 3 (15.16)
dϕ0
dλ0
0, 98 × σT 4
λ0
b b b
λmax /2 λmax 8λmax
On peut, compte tenu de la loi de Wien, donner quelques valeurs numériques de limites
d’étendue spectrale, conformément au tableau 15.3 :
La première ligne (T = 2, 7 K), dans le domaine des ondes radio et centimétriques,
correspond au rayonnement électromagnétique fossile (rayonnement cosmologique)
considéré aujourd’hui comme un des indices essentiels prouvant la réalité des modèles
cosmologiques d’explosion initiale (big bang) de l’Univers.
Les deux lignes suivantes (T = 310 K et T = 2 500 K) relèvent essentiellement
du domaine infrarouge, mais à la température 2 500 K qui est celle des filaments
328 Physique, MP, MP*
planète
dS⊥
dΩ
2RS b b 2Rp
dS⊥
dΩ = (15.17)
r2
15 : Le rayonnement thermique 329
dΩ dΩ
dP = Pisotrope = Pisotrope (15.18)
Ωtotal 4π
r 1/4
Rs 1 − A
Pp′ = (1−A)PS soit Tp = TS . Avec α ≃ 0, 45, on trouve Tp ≃ 288 K,
2r 1 − α
soit 15 ◦ C, valeur plus raisonnable.
Le coefficient α dépend significativement de la composition chimique de la planète ; la
présence de certains gaz (CO2 , CH4 , etc.) augmente α donc tend à augmenter la tempé-
rature d’équilibre de la planète : c’est la lente dérive de l’effet de serre atmosphérique
qui est accompagnée de changements climatiques durables.
Sf
b
Ω
(Σ) T Tf
Lors de l’étude du bilan thermique du système (Σ), il est clair que la totalité du
rayonnement thermique émis par la surface Sf du four ne doit pas être prise en
Ω
compte ; en un point donné de la paroi du four, seule une fraction du rayonnement
2π
atteint effectivement l’objet chauffé, le reste atteint d’autres parties du four. Ainsi,
tout se passe comme si la puissance effectivement reçue par le corps chauffé devrait
être écrite P = S ′ σTf4 , avec S ′ < Sf .
2 Cas de l’émission isotrope par les parois du four : il est possible de montrer,
dans le cas où l’émission est isotrope, et si le four entoure totalement le corps (Σ),
que la surface équivalente à prendre en compte est exactement la surface S du corps
chauffé (Σ) : S ′ = S. Dans ces conditions, le bilan thermique du chauffage de (Σ),
dT
traité comme un absorbeur integral, s’écrit Preçu − Pémis = C , où C est la capacité
dt
thermique du corps (Σ), avec Preçu = σSTf4 et Pémis = σST .
C dT
On obtient l’équation non linéaire Tf4 − T 4 = ; la résolution exacte de cette
σS dt
équation est bien sûr possible mais mène à des expressions difficiles à interpréter. Dans
le cas simple où T reste voisin de Tf , on peut se contenter de l’expression approchée
C dT
Tf4 − T 4 ≃ 4Tf3 (Tf − T ), ce qui conduit à l’équation plus simple Tf − T ≃ ,
4σTf3 S dt
t
dont la solution T (t) = Tf + a exp − fait apparaı̂tre une durée caractéristique de
τ
C
chauffage, τ = .
4σTf3 S
15 : Le rayonnement thermique 331
dS
z
c0 dt
Nous considérerons ici une situation d’équilibre radiatif local du solide (Σ) avec son
environnement : le rayonnement électromagnétique environnant la surface extérieure
(S) de (Σ) est alors isotrope, le rayonnement incident et le rayonnement émergent
ayant en tout point même intensité.
Étudions par exemple le rayonnement incident sur l’élément de surface dS du système
(Σ). L’énergie totale reçue par dS pendant la durée dt est δQ = ϕ↓ dSdt. Cette énergie
parvient sur dS en provenance de toutes les directions de l’hémisphère z > 0 situé
au-dessus de dS, de manière isotrope.
332 Physique, MP, MP*
c0
Équilibre radiatif local : ϕ↓ = ϕ↑ = wém (15.19)
4
On notera que cette relation est d’origine exclusivement géométrique ; elle s’étend
donc automatiquement aux grandeurs spectrales, par unité de fréquence comme par
unité de longueur d’onde :
mode 1
mode 4
mode 2 mode 3
dwém
dν
dwém 8πν 2 kB T
modèle de Rayleigh et Jeans, =
dν c40
dwém 8πhν 3 1
loi de Planck, =
dν c40 exp (hν/kB T ) − 1
(qui portera plus tard le nom de photon) emportait l’énergie hν, les modes de haute
fréquence, donc de haute énergie, étant moins probable dans un gaz de photons ther-
malisé
à la température
T , du fait de l’apparition du facteur statistique de Boltzmann,
hν
exp − .
kB T
en , notamment par le français Kastler, dans le domaine visible : on parle alors
de laser pour light amplification by stimulated emission of radiation.
La difficulté technique qui a retardé l’observation du phénomène d’émission stimu-
lée trouve son explication dans la condition d’équilibre thermique : tous les photons
émis (spontanément ou de façon stimulée) sont aussitôt réabsorbés. Pour observer un
quantité significative de photons provenant de l’émission stimulée, il faut que ce phé-
nomène l’emporte sur l’absorption, donc que B21 N2 ̟ ≫ B12 N1 ̟, ou N2 ≫ N1 , ce
qui est incompatible avec la condition d’équilibre thermique N2 = N1 exp (−hν/kB T ).
L’effet laser (ou maser ) ne peut donc être observé qu’hors équilibre thermique, en pré-
sence d’un apport énergétique permanent (on parle de pompage) qui assure l’inversion
de population avec N2 ≫ N1 . Un émetteur laser est l’association de trois éléments :
• une cavité résonante (formée de deux miroirs), donc la longueur est accordée sur la
fréquence ν0 à laquelle l’effet laser est possible ;
• un milieu présentant les deux états d’énergie E1 et E2 , avec E2 − E1 = hν0 , qui
constituera le milieu amplificateur dans lequel l’onde circulera lors de ses allers
et retours entre les deux miroirs de la cavité ;
• un dispositif de pompage, assurant l’inversion de population donc l’amplification
cohérente de lumière par émission stimulée.
Un des miroirs de la cavité est très faiblement transparent ; la faible partie du faisceau
qui émerge de cette cavité est le faisceau laser.
15 : Le rayonnement thermique 337
Le potentiel chimique
On notera qu’une grandeur molaire partielle est intensive ; ainsi, le volume molaire
partiel viψ de l’espèce Ai dans la phase ψ s’exprime en mètres cube par mole.
La définition (16.2) permet ainsi de définir une énergie interne molaire partielle upi si,
une enthalpie molaire partielle hpi si et une entropie molaire partielle spi si pour l’espèce
∂U ∂H ∂S
Ai dans la phase ψ, respectivement par uψ i = ψ
, hψ
i = ψ
et sψi = , chaque
∂ni ∂ni ∂nψi
dérivée partielle se calculant en gardant constantes toutes les autres variables de
Gibbs.
2 Théorème d’Euler : considérons une fonction f (x, y) de deux variables x et
y (on généralisera aisément le résultat à un nombre quelconque de variables). La
fonction sera dite homogène de degré q relativement à ses variables si, pour tout réel
λ, f (λx, λy) = λq f (x, y).
Ainsi, une grandeur thermodynamique extensive est fonction homogène de degré 1
des variables nψ i ; une grandeur thermodynamique intensive est fonction homogène
de degré 0 des mêmes variables. Dans d’autres domaines de la Physique, on rencontre
d’autres fonctions homogènes : dans une interaction newtonienne, l’énergie potentielle
est homogène de degré −1 en fonction des coordonnées d’espace ; l’énergie potentielle
élastique est homogène de degré 2 des mêmes coordonnées, etc.
La relation f (λx, λy) = λq f (x, y) est, à x et y fixés, vraie pour tout λ ; dérivée
∂f ∂f ∂f ∂f
relativement à λ, elle mène à x +y = qλq−1 f (λx, λy), les dérivées et
∂x ∂y ∂x ∂y
devant être calculées pour le couples de valeurs (λx, λy). Cette égalité peut s’écrire
∂f ∂f
pour λ = 1 sous la forme x +y = qf (x, y).
∂x ∂y
Dans le cas particulier d’une grandeur extensive, q = 1 si la liste des variables com-
prend toutes les quantités de matière, et exclusivement celles-ci ; nous écrirons donc
X ψ ∂E
le théorème d’Euler des fonctions extensives ni = E, les dérivées partielles
i,ψ ∂nψ
i
étant calculées à p et T constant. On notera donc encore :
16 : Le potentiel chimique 341
φ
N X
X
E= nψ ψ
i ei (16.3)
i=1 ψ=1
Cette relation, qui est la marque de l’extensivité de E, est la forme particulière de la loi
d’addition pour les grandeurs extensives ; on notera toutefois que l’addition concerne
des grandeurs molaires partielles, dérivées partielles calculées dans les conditions du
mélange, et non pas relatives aux corps purs qu’on aurait pu mélanger.
La loi d’addition simplifiée rencontrée pour l’énergie interne et l’enthalpie, au moins
de manière approchée, dans le cours de Thermochimie, ne s’applique pas dans le cas
général. On remarque expérimentalement, par exemple, qu’il n’y a pas addition des
volumes lors d’un mélange. La loi d’addition est encore moins vérifiée dans le cas des
grandeurs entropiques, du fait du caractère irréversible de l’opération de mixage.
φ
N X
X p ∂E
∆r Ep = νi,ψ xψ
i = (16.4)
i=1 ψ=1
∂ξp T,p,ξq ,q6=p
G = U + pV − T S = H − T S (16.5)
Ainsi, G = G∗ dans l’état initial comme dans l’état final, donc ∆G = ∆G∗ ; on pour
donc écrire la condition d’évolution spontanée ∆G 6 W ′ ou encore −W ′ 6 −∆G′ :
cette relation se lit ainsi :
Dans la suite, nous nous intéresserons d’abord au cas où δW ′ = 0 ; alors, toute trans-
formation spontanée s’accompagne d’une diminution de G, ∆G 6 0, le cas d’égalité
correspondant à la condition d’équilibre.
16 : Le potentiel chimique 343
On peut encore affirmer que l’enthalpie libre est le potentiel des transformations mo-
nobares et monothermes.
Dans la définition de G, on constate qu’une évolution spontanée doit réaliser un
compromis entre une diminution de H (critère énergétique) et une augmentation de
S (critère entropique).
2 Identités thermodynamiques : à partir de l’identité dU = T dS − pdV , la transfor-
mation U (S, V ) → H(S, p) = U + pV mène à l’identité dH = T dS + V dp, remplaçant
la variable V par p en à la fonction de départ U le terme de transformation
ajoutant
∂U
de Legendre pV = −V . On peut généraliser cette méthode de transformation
∂V S
pour définir quatre fonctions thermodynamiques mathématiquement équivalentes, se-
lon le schéma 16.1.
dU = T dS − pdV −pV dH = T dS + V dp
+
pV
−
−T S +T S −T S +T S
−
pV
T
+
S
T
S
Ce schéma montre que G, fonction de Gibbs, est fonction des variables intensives (de
Gibbs) T et p, avec l’identité thermodynamique dG = −SdT + V dp. Toutefois, cette
identité a été établie pour un système ne subissant que des variations des paramètres
thermodynamiques T et p ; nous devons généraliser cette identité au cas où les autres
variables de Gibbs nψ i évoluent.
φ
N X
X
dG = −SdT + V dp + µψ ψ
i dni (16.6)
i=1 ψ=1
Ce potentiel chimique est une grandeur intensive qui se mesure en joules (ou plus
souvent kilojoules) par mole. La localité des interactions chimiques (qui ne dépendent
souvent que des termes d’interaction à courte distance) explique que le potentiel chi-
mique µψi est en général une fonction de la seule composition chimique de la phase
ψ, en plus des grandeurs intensives p et T : il ne dépend pas de la présence ou de la
composition des autres phases.
2 L’enthalpie libre en fonction des potentiels chimiques : la fonction G étant extensive,
on peut aussi réécrire la relation générale d’extensivité 16.3 sous la forme :
φ
N X
X
G= nψ ψ
i µi (16.7)
i=1 ψ=1
Remarquons qu’on
X peut encore évaluer la différentielle dG à partir de (16.7) sous la
forme dG = ψ ψ
dni µi + nψ ψ
i dµi et, en comparant le résultat obtenu à (16.6), on
i,ψ
obtient l’identité de Gibbs-Duhem :
φ
N X
X
dµψ ψ
i ni = −SdT + V dp (16.8)
i=1 ψ=1
16.3.1 Définition
2 Affinité : la relation générale (16.4) devient, dans le cas particulier de l’enthalpie
XN X φ
p
libre, ∆r Gp = νi,ψ µψ
i . Toutefois, comme on s’intéresse à une condition de
i=1 ψ=1
diminution de l’enthalpie libre, on s’intéresse à l’opposé de la dérivée de Lewis, qui
prend le nom d’affinité chimique de la réaction numéro p :
φ
N X
∂G X p
Ap = −∆r Gp = − Ap = − νi,ψ µψ
i (16.9)
∂ξp T,p,ξq ,q6=p i=1 ψ=1
16 : Le potentiel chimique 345
2 Cas d’une réaction unique : dans le cas très courant d’une réaction chimique
unique, la relation (16.9) prend la forme :
∂G
A = −∆r G = − (16.10)
∂ξ T,p
Cette propriété justifie la dénomination (( affinité chimique )) : on peut dire que les
réactifs ont une affinité (positive) les uns pour les autres lorsque la réaction progresse,
donc lorsque A > 0.
2 Exemple : reprenons l’exemple de la réaction CH2 = CH2 +Cl2 ⇋ CH2 Cl − CH2 Cl,
pour laquelle on peut écrire A = µCH2 CH2 + µCl2 − µCH2 ClCH2 Cl ; la réaction évoluera
dans le sens direct −→ si la somme des potentiels chimiques des réactifs dépasse le
potentiel chimique du produit, donc dans le sens d’une diminution de cette somme de
potentiels chimiques : c’est cette circonstance qui justifie l’emploi du terme (( potentiel
chimique )) pour la dérivée partielle µψ
i .
φ
N X
X
dGT,p fixés = µψ ψ
i dni 6 0 (16.11)
i=1 ψ=1
Dans cette expression, l’égalité correspond soit à une évolution réversible, soit au cas
où G atteint son minimum, c’est-à-dire à la condition d’équilibre.
2 Cas d’un, corps sous deux phases : on peut en particulier s’intéresser au cas d’un
seul corps A (N = 1) pouvant changer d’état, c’est-à-dire en général présent dans
deux phases (φ = 2), que nous noterons α et β. La condition (16.11) prend alors la
β β
forme simple dG = µα α
A dnA + µA dnA 6 0. Comme de plus la conservation
de la matière
β β β
impose dnα α
A + dnA = 0, la condition d’évolution s’écrit dnA µA − µA > 0.
Ainsi, l’espèce A quittera la phase où son potentiel chimique est le plus élevé puisque
dnβA > 0 correspond à µα β
A > µA et réciproquement ; enfin, l’équilibre entre les deux
phases sera atteint si G atteint son minimum, donc si dG = 0 :
nψ nψ
xψ
i = P N
i
= i
(16.12)
j=1 nψ
j
ni
Bien qu’il soit formellement possible d’étendre la définition ci-dessus à une réunion
de plusieurs phases, voire au système tout entier, nous ne le ferons pas dans la suite :
les fractions molaires ne sont définies qu’à l’intérieur d’une phase donnée.
On a alors la relation évidente entre fractions molaires :
N
X
xψ
i =1 pour toute phase ψ (16.13)
i=1
2 Variance : les potentiels chimiques sont des fonctions d’état intensives, dont on
a vu qu’elles imposent, à l’équilibre, certaines relations entre les paramètres intensifs
formés de la température T , de la pression p, et des N φ paramètres intensifs de
nψ
composition que sont les fractions molaires xψ i = i
.
nψ
i
Variance
X On appelle variance v d’un système physico-chimique le nombre maxi-
mum de paramètres intensifs, choisis parmi T , p et les fractions molaires
xψi , qu’un opérateur peut librement fixer sans rompre nécessairement
l’équilibre.
Il est important de remarquer que ce décompte ne concerne que les paramètres in-
tensifs. Il n’est pas possible de faire un décompte analogue des paramètres extensifs,
puisque par exemple un opérateur peut librement doubler toutes les quantités de
matière du système physico-chimique sans modifier aucunement l’équilibre.
v =N −r+2−φ−k (16.14)
où on note parfois c = N −r ; cette relation est connue sous le nom de règle des phases
de Gibbs.
2 Exemples : considérons un système physique formé d’une seule espèce présente
sous deux phases, en l’absence de toute réaction chimique et de toute relation spéci-
fique ; on aura donc N = 1, φ = 2, r = k = 0 donc v = 1 ; on dit que le système est
monovariant. Ainsi, l’opérateur peut fixer seulement la pression p, l’équilibre imposera
la valeur de la température de changement d’état T ∗ (p). Il n’y a ici pas de variable de
composition puisque le corps est pur dans chacune des deux phases où il est présent.
Considérons maintenant les deux équilibres chimiques de déshydratation des hy-
droxydes de cuivre et d’argent, à savoir 2Ag(OH)2 solide ⇋ Ag2 Osolide + 2H2 Ogaz et
348 Physique, MP, MP*
2Cu(OH)2 solide ⇋ Cu2 Osolide + 2H2 Ogaz ; à haute température, la vapeur d’eau forme
une phase gazeuse et les deux oxydes et les deux hydroxydes forment quatre phases
solides non miscibles ; en présence des deux réactions indépendantes, N = 5, φ = 5 et
r = 2 donc v = 0 ; on dit que le système est zérovariant ou nilvariant. Un opérateur
ne peut rien imposer à l’équilibre puisque les deux conditions d’équilibre chimique
p2 p2
imposent respectivement K1 (T ) = ◦ 2 et K2 (T ) = ◦ 2 , p désignant la pression par-
p p
tielle de vapeur d’eau qui, en l’absence de toute autre espèce dans la phase gazeuse,
se confond avec la pression totale. Cette double condition n’est possible que pour une
valeur fixée de T , qui à son tour impose une valeur fixée de p.
Considérons par exemple une réaction de dissolution d’une espèce ionique dans l’eau,
H2 O
par exemple de bilan NaClsolide −→ Na+ + Cl+ . Cette réaction est spontanée, ce qui
se traduit par une forte diminution de G lors de la dissolution. L’étude quantitative
montre que cette diminution ne peut pas s’interpréter seulement par une diminution
de l’enthalpie H ; il y a aussi une forte augmentation de l’entropie S.
CV dT + pdV Cp dT − V dp
Si on se rappelle les expressions dS = ou dS = établies
T T
pour un gaz parfait, on retrouvera donc une forte augmentation d’entropie dans divers
cas :
• dans le cas de la dissolution d’un solide ionique, lors de la dispersion des ions qui
le formaient dans le solution aqueuse ;
• pour un gaz en évolution isotherme, lors d’une augmentation de volume (ou d’une
diminution de pression) qui disperse les molécules du gaz à une plus grande
distance moyenne les unes des autres ;
• pour un gaz en évolution isobare ou isochore, lors d’une augmentation de la tem-
pérature, qui augmente l’agitation thermique des molécules du gaz.
Nous admettrons la généralisation de ces affirmations sous la forme générale :
16 : Le potentiel chimique 349
Dans certains cas, cette interprétation qualitative permet de justifier les sens d’évo-
lution physique ou chimique calculés à partir des propriétés des potentiels chimiques.
2 Macroétats et microétats : lorsqu’on affirme qu’un système thermodynamique,
donc macroscopique, se trouve dans un macroétat M donné (défini par un certain
ensemble de variables d’état), on ne précise en fait pas complètement son état mi-
croscopique puisqu’il peut se trouver dans n’importe lequel des Ω(M ) microétats m
correspondant à M , macroscopiquement indiscernables.
L’hypothèse fondamentale de la thermodynamique statistique est l’équiprobabilité
de tous les microétats possibles d’un système isolé, c’est-à-dire compatibles avec les
différentes lois mécaniques décrivant le système. Ainsi, un système (Σ) isolé d’énergie
interne totale U peut se trouver, à un certain instant, dans n’importe quel microétat
N
X
tel que l’énergie totale des particules soit égale à U , ǫi = U .
i=1
b4
b3
b2
b1 b5 b6
S = k ln Ω (16.15)
pour toute constante positive k ; de façon générale, l’entropie statistique mesure ainsi
l’étendue de l’ignorance relativement à l’état microscopique d’un système, pour un ob-
servateur qui n’en connaı̂t que l’état macroscopique ; c’est ce qu’on appelle en général
la mesure du désordre moléculaire sous-jacent à la donnée d’un macroétat.
Cette interprétation statistique de l’entropie est due à Boltzmann‡ ; on va mon-
trer qu’on peut l’identifier à l’entropie classique sous réserve du choix pour k de la
constante de Boltzmann kB .
2 Constante de Boltzmann : considérons à nouveau le système de la figure 16.2, et
imaginons qu’il décrit un gaz parfait qui subit une détente de Joule, Gay-Lussac qui
double son volume. Dans l’état initial, toutes les N molécules sont du même côté de la
paroi et l’entropie du système vérifie Si = k ln Ω(0) = k ln 1 = 0. Par contre, dans l’état
final, l’entropie du système peut s’écrire Sf = k ln Ω(N/2) = k [ln(N !) − 2 ln ((N/2)!)].
Vu les valeurs élevées de N pour tous les systèmes thermodynamiques, on se contentera
ici de l’expression approchée de Stirling : pour n assez grand, ln n! ≃ n ln n − n.
Ainsi, la variation d’entropie lors de la détente de Joule,Gay-Lussac s’exprime selon
N
∆S = Sf − Si soit ∆S = k N ln N − N − N ln + N ou enfin S = kN ln 2.
2
Un calcul classique de la même variation d’entropie se fait selon dU = T dS − pdV
p dV
soit, la détente de Joule- Gay-Lussac étant isotherme, dS = dV = nR ; l’aug-
T V
mentation d’entropie lors de la détente envisagée ici vaut ∆S = nR ln 2 = N kB ln 2
où kB est la constante de Boltzmann.
Ce résultat, conforté par des études menées notamment dans le cadre quantique per-
mettent de montrer que l’entropie statistique coı̈ncide bien avec l’entropie classique à
R
condition de choisir pour k la constante de Boltzmann k = kB = .
NA
échantillon macroscopique, d’une liste d’états d’énergie croissante, on réalise que, plus
l’énergie totale est élevée, plus le nombre de façons de la réaliser l’est aussi.
Prenant pour exemple un système de N particules dont tous les états d’énergie sont
régulièrement espacés de ǫ. Il existe une seule façon de réaliser l’état d’énergie mini-
male U = 0 : toutes les particules doivent être dans l’état fondamental. Il existe N
façons de réaliser l’état d’énergie U = ǫ, selon la particule qu’on place au premier
N (N − 1) N2
niveau excité ; de même, il existe ≃ façons de réaliser l’état d’énergie
2 2
U = 2ǫ, etc.
Inversement, la quasi totalité de systèmes thermodynamiques condensés en phase
cristalline réalisent, à basse température, un état d’entropie minimale, voire nulle
dans certains cas, avec un seul microétat correspondant au macroétat de plus basse
énergie possible : si U = Umin alors Ω(U ) → 1 et donc S → 0.
2 Énoncé du principe : l’ensemble des considérations qualitatives ci-dessus justifie
le principe de Nernst ou principe de limite thermique (aussi appelé troisième principe
de la thermodynamique), dont nous admettrons la généralisation à tous les systèmes
thermodynamiques :
Principe de limite thermique
X L’entropie S de toutes les phases condensées tend vers zéro lorsque la
température du système tend vers zéro.
Ainsi, l’entropie n’est pas définie à une constante arbitraire près ; il existe un état de
référence d’entropie nulle, même s’il est impossible à réaliser en pratique et ne peut
donc être déterminé que par extrapolation.
Remarquons que, s’il n’en allait pas ainsi, l’enthalpie libre G = H −T S, qui dépendrait
des états de référence choisis pour H et pour S, serait définie à une fonction affine
arbitraire de T près ! Il n’en est rien et nous verrons ultérieurement comment la donnée
d’une seule constante arbitraire, relative à l’enthalpie H, suffit à déterminer G. Cette
constante a d’ailleurs déjà été définie dans le cours de Thermochimie : c’est l’enthalpie
de formation.
µψ
i = µ◦,ψ
i +RT ln aψi (16.16)
|{z} |{z}
état de référence acivité
avec dans le cas d’un gaz parfait les expressions de l’activité et de l’état de référence :
2 Mélange idéal de gaz parfaits : considérons (cf. figure 16.3) n1 moles du gaz parfait
G1 , sous la pression p1 , à la température T ; ce gaz occupe le volume V = n1 RT /p1 .
Avant de le mélanger à n2 moles du gaz parfait G2 , on va porter celui-ci à la même
température T et sous la pression p2 telle que le gaz occupe lui aussi le volume V ;
ainsi on doit avoir p2 V = n2 RT .
S
p1 , V, n1 , T p2 , V, n2 , T
v
P
2 Potentiel chimique en mélange idéal : dans un tel mélange de deux gaz on peut
écrire, conformément à ce qui précède, G = G1 + G2 , où G1 et G2 sont déterminées
n1 p n2 p
avant mélange, soit G = n1 µ◦1 (T )+n1 RT ln +n2 µ◦2 (T )+n2 RT ln . On
n 1 + n2 n1 + n2
∂G
en déduit alors µ1 = où on dérive la somme des trois termes n1 µ◦1 (T ),
∂n1 n2 ,T,p
n1 RT ln(n1 p) et −(n1 + n2 )RT ln(n1 + n2 ) pour obtenir respectivement les dérivées
µ◦1 (T ), 1 + RT ln(n1 p) et −1 − RT ln(n1 + n2 ). Sommant les trois termes, on obtient
n1 p
µ1 = µ◦1 (T ) + RT ln , ce qui permet d’identifier la forme générale (16.16) avec
n1 + n2
les expressions de l’activité et de l’état de référence :
Potentiel chimique d’un gaz parfait en mélange idéal
État de référence Activité ai
X Gaz pur µ = µ◦ G
(T ) γi
pi p
= γi xi ◦
p◦ p
p = p◦ = 1 bar, T
16 : Le potentiel chimique 355
Le coefficient d’activité de tous les constituants d’un mélange de gaz réels tend vers
1 lorsque la pression du mélange tend vers zéro : tout mélange devient un mélange
idéal de gaz parfaits à basse pression.
On remarquera que, dans toutes les phases gazeuses, l’état de référence se confond
avec l’état standard à la température T : corps pur et pression p = p◦ = 1 bar.
2 Solutions idéales : les mélanges liquides (quand ils sont possibles ; tous les liquides
ne sont pas miscibles) s’éloignent en général beaucoup des mélanges idéaux de gaz
parfaits. Toutefois, il existe certaines situations exceptionnelles pour lesquelles les
propriétés physiques des molécules des deux liquides mélangées sont assez semblables
pour qu’on puisse parler de mélange idéal.
Un tel mélange idéal sera l’analogue d’un mélange idéal de gaz parfaits pour ce
qui concerne l’influence des concentrations (c’est-à-dire, des fractions molaires) ; par
contre, il ne le sera pas pour ce qui concerne l’influence de la pression qui est,
comme on l’a vu, bien plus réduite pour les phases condensées. Ainsi, nous défini-
rons le mélange idéal réalisé à la pression p par l’expression du potentiel chimique
µi (T, p, xi ) = µ◦i (T, p) + RT ln xi ; ainsi, l’état de référence, atteint pour xi = 1, est le
corps pur seul dans sa phase liquide.
Son potentiel chimique µ◦i (T, p) dépend toujours de la température, mais très peu de
la pression puisqu’on peut écrire
G◦ = nµ◦i (T, p) pour n moles de ce corps pur, et
∂µi
dG = −SdT + V dp impose ici = vi◦ , volume molaire de ce liquide pur.
∂p T
Le volume molaire d’un liquide reste en général faible, et souvent constant ; par
exemple pour l’eau liquide, v ◦ = 18 × 10−3 L · mol−1 donc la variation de poten-
Z p′
tiel chimique associée est µ◦i (T, p′ ) = µ◦i (T, p) = vi◦ dp ≃ vi◦ (p′ − p) ; elle sera
p
souvent négligeable devant les termes de l’ordre de RT puisque, avec T = 300 K, il
RT
faudrait une variation de pression p′ − p de l’ordre de ◦ ∼ 1 400 bar pour qu’il n’en
vi
aille pas ainsi.
Le cas des solutions liquides réelles peut être pris en compte, comme dans le cas des
gaz, par la définition et la mesure d’un coefficient d’activité ; on écrira alors :
356 Physique, MP, MP*
2 Solutions diluées : une telle solution est formée d’un solvant S majoritaire (xS / 1)
et d’un (ou plusieurs) soluté(s) A fortement dilué(s) (xA ≪ 1). Nous pouvons consi-
dérer que l’environnement chimique de chaque molécule du solvant est suffisamment
semblable à celui du corps pur pour qu’on puisse le traiter comme une solution idéale,
et nous écrirons donc µS (T, P, xS ) = µ◦S (T, p) + RT ln xS :
C’est une erreur courante que d’oublier de prendre en compte le solvant et les
variations de son potentiel chimique dans l’étude de l’enthalpie libre G =
X
ni µi
i
du mélange liquide ; en effet, même si le solvant n’apparaı̂t pas dans les bilans des
équations chimiques qui ont lieu dans la solution, sa quantité de matière est toujours
prépondérante. Du fait de la valeur élevée de nS , le coefficient nS µS n’est jamais
négligeable, pas plus que les variations dues au terme RT ln xS .
2 Cas de non-miscibilité : dans la majorité des cas, les solides ne sont pas miscibles
entre eux. Dans ce cas de non-miscibilité absolue, chaque solide reste seul dans sa
phase ; s’agissant d’un corps pur, il est dans un état confondu avec l’état de référence
et son activité est égale à l’unité :
β
Lors du changement d’état d’un corps pur, l’équilibre est donné par µα i = µi ;
hors équilibre, l’évolution se fait dans le sens qui diminue le potentiel chimique.
Lors d’une
réaction
chimique, l’équilibre est donné par A = 0, où on a défini
∂G
A=− = −∆r G ; hors équilibre, l’évolution se fait dans le sens donné
∂ξ T,p
X
par le signe de A. Puisque dnψ
i = νi,ψ dξ, on a aussi A = − νi,ψ µψi .
i,ψ
Pour les solutions et mélanges réels, on multiplie l’activité du cas parfait par
un coefficient d’activité γi . Par convention, C ◦ = 1 mol · L−1 et p◦ = 1 bar.
Chapitre 17
correspond à un point pour lequel on a aussi l’égalité µS (T, p) = µV (T, p) : cette inter-
section est commune avec l’équilibre liquide–vapeur ; on parle de point triple. L’allure
de l’ensemble des trois courbes associées aux trois états solide, liquide et vapeur figure
sur le diagramme 17.1.
p Fluide
bC
solidification ⇋ fusion Liquide
⇋ vaporisation
liquéfaction
Solide AL
T b AV Gaz
⇋ sublimation
condensation T
Sur ce diagramme, le point T est le point triple où coexistent les trois états liquide,
vapeur et solide ; avec φ = 3, il s’agit d’un état zérovariant dont la pression et la
température sont fixées ; c’est d’ailleurs un tel état qui sert de référence pour l’échelle
légale de température, le point triple de l’eau ayant pour température TT = 273, 16 K
ou encore tT = 0, 01 ◦ C. À titre documentaire, la pression d’équilibre du même point
triple de l’eau est particulièrement faible, pT = 612 Pa = 6, 12 mbar.
Pour des températures supérieures à celle TC du point critique C (ou, ce qui revient
au même, pour des pressions supérieures à celle pC du point critique), il n’existe plus
de changement d’état liquide–vapeur, mais un seul état qui porte le nom de fluide
hypercritique. Dans le cas de l’eau, les coordonnées du point critique sont pC = 218 bar,
tC = 375 ◦ C. Signalons aussi les coordonnées du point critique de CO2 , beaucoup plus
facile à atteindre avec pC = 73 bar et tC = 32 ◦ C ; c’est pour ce gaz que la notion de
point critique a été mise en évidence pour la première fois par Andrews en .
2 Diagramme (p, V ) : considérons, sur le diagramme de la figure 17.1, une ligne
verticale correspondant à une température donnée, comprise entre le point triple et le
point critique. À cette température, l’évolution par augmentation de pression permet
de passer progressivement de l’état gazeux (au point AV ) à l’état liquide (au point
AL ). On peut étudier l’évolution du volume et de la pression d’un système fermé au
cours de cette évolution ; la courbe p = p(V ) correspondante porte le nom d’isotherme
d’Andrews et l’allure de trois isothermes d’Andrews est tracée sur la figure 17.2.
p
Cb T > TC
psat (T ) b b b T = TC
A0 A A1
ion
ros
ée
llit
T < TC
ébu
équilibre L ⇋ V V
Les isothermes d’Andrews sont parfois tracées pour l’unité de masse (V est alors
remplacé par le volume massique 1/ρ) ou pour l’unité de quantité de matière (en
fonction du volume molaire v). L’interprétation de principe du diagramme est in-
changée. Pour un tracé numérique, il est en tous cas indispensable de préciser la
qualtité de matière totale étudiée.
Pour T > TC , il n’y a pas de changement d’état et l’isotherme est une courbe mo-
notone décroissante,
dont la pente est reliée à la compressibilité isotherme du fluide
∂p 1
hypercritique par =− .
∂V T χT V
Pour T = TC , le passage par le point critique se manifeste par
un point d’inflexion à
∂2p
∂p
dérivée nulle, donc par la double condition = 0 et = 0.
∂V TC ∂V 2 TC
On peut aussi remarquer qu’en ce point,les variations dedensité
en fonction de la
∂ρ m ∂V
pression sont extrêmement rapides, avec =− 2 → 0 ; les rapides
∂p TC V ∂p TC
fluctuations qui en résultent se traduisent expérimentalement par un aspect particulier
du fluide au point critique ; cet aspect (( laiteux )) porte le nom d’opalescence critique.
Pour T < TC , le fluide est soit liquide (à haute pression ou faible volume) soit gazeux
(à basse pression ou pour un un grand volume) le changement d’état étant marqué
par un palier de pression, pour la valeur égale à la pression d’ébullition péb (T ) à cette
température. Lors d’un changement d’état isotherme par abaissement de pression,
l’ébullition commence donc par l’apparition de la première bulle de vapeur au point
A0 et se termine par la disparition de la dernière goutte de liquide au point A1 .
L’ensemble des points A0 porte le nom de courbe d’ébullition ; l’ensemble des points
A1 le nom de courbe de rosée. Les deux courbes se coupent au point critique C et
forment ensemble la courbe de saturation. La courbe de saturation et l’isotherme
critique divisent le plan (p, V ) en quatre domaines :
• à haute température (T > TC ), on a le domaine du fluide hypercritique, tandis qu’en
dessous de cette température, on a les domaines du liquide et de la vapeur ;
• à basse température (T < TC ) :
• à gauche de la courbe d’ébullition, on a le domaine du liquide ;
• à droite de la courbe de rosée, on a le domaine de la vapeur ;
• enfin, sous la courbe de saturation, on a le domaine du système diphasé ; un
point A de ce domaine s’interprète en terme de théorème des moments.
2 Théorème des moments : au point A du palier de changement d’état de la figure
17.2, le volume du mélange est donné par la relation d’extensivité (théorème d’Euler)
V = nL v ◦L (T, p) + nV v ◦V (T, p), en notant nL et nV les quantités de matière sous
forme liquide et vapeur, et v ◦L (T, p) et v ◦V (T, p) les volumes molaires partiels du
liquide et de la vapeur à la température T de l’isotherme et à la pression p = péb (T )
correspondante ; comme toute grandeur intensive, donc locale, ces volumes molaires
partiels ne dépendent que de paramètres intensifs, c’est-à-dire qu’ils sont indépendants
de nL et nV .
Les volumes molaires partiels ayant même valeur en tout point de l’isotherme de
changement d’état, on peut les déterminer aux points A0 et A1 , où la totalité de la
matière se retrouve respectivement sous forme liquide et vapeur, avec donc les volumes
V0 = (nL + nV ) v ◦L (T, p) et V1 = (nL + nV ) v ◦V (T, p).
364 Physique, MP, MP*
On en déduit immédiatement les différences V − V0 = nV v ◦V (T, p) − v ◦L (T, p) et
V1 − V = nL v ◦V (T, p) − v ◦L (T, p) , d’où le quotient, connu sous la nom de théorème
des moments, qui exprime le rapport des quantités de matière dans les deux phases :
nL V1 − V V A1 − V A
= = (17.1)
nV V − V0 V A − V A0
A0 A A1
nV
nL
Toutefois, Gm = Hm − T Sm pour chacune des deux phases, mais l’égalité des en-
thalpies libres ne signifie pas l’égalité des enthalpies ni des entropies molaires ; on
définira donc indifféremment l’enthalpie molaire de changement d’état par une des
deux relations :
α→β β α
β α
Lm (T ) = Hm (T ) − Hm (T ) = T Sm (T ) − Sm (T ) (17.2)
α→β
Qp = ∆H = Lm (T ) pour une mole de réaction α → β (17.3)
17 : Changement d’état des corps purs 365
α→β
δQp = dH = Lm (T ) × dξ (17.4)
Le changement d’état étant aussi une transformation réversible lorsqu’il est mené
aux conditions T, p∗ (T ) de la courbe d’équilibre, on peut écrire lors d’une mole de
changement d’état la seconde relation :
Qp Lα→β (T )
∆S = = m pour une mole de réaction α → β (17.5)
T T
δQp Lα→β (T )
dS = = m × dξ (17.6)
T T
Le caractère extensif de la chaleur latente qui apparaı̂t dans (17.4) et (17.6) permet
aussi de définir une chaleur latente de changement d’état massique ℓα→β , avec la
Lα→β (T )
relation ℓα→β (T ) = m , si M est la masse molaire de l’espèce qui change
M
d’état.
Le tableau 17.1 présente quelques valeurs de chaleurs latentes massiques de change-
ment d’état ; on notera la valeur très élevée de la chaleur latente de vaporisation de
l’eau (en particulier si on la compare à celle de son analogue structurel H2 S). L’abon-
dance de l’eau sur terre, et ces propriétés thermiques exceptionnelles, liées aux liaisons
intermoléculaires spécifiques entre molécules d’eau (on parle de liaisons hydrogène),
expliquent le rôle de l’eau comme volant thermique de régulation dans les systèmes
industriels, comme d’ailleurs à la surface de la biosphère terrestre.
Comme dans le cas de l’isotherme d’Andrews, on rencontre sur le plan pratique des
tracés en fonction de l’entropie massique ou de l’entropie molaire.
C p < pC
b
ll.
u
éb
T éb (p) b b b
A0 A A1 ros
ée
équilibre L ⇋ V S
Dans ce diagramme, la disposition relative des zones monophasées liquide et vapeur est
identique au diagramme d’Andrews : pour p < pC , les zones de faible température ou
de faible entropie correspondent au domaine du liquide, tandis qu’à haute température
ou pour les grandes valeurs de l’entropie on retrouve les gaz.
Bien sûr, pour p > pC , il n’y a pas de changement d’état et les courbes d’évolution sont
des isobares du fluide hypercritique, courbes S(T ) toujours monotones croissantes.
Notons que les diagrammes d’Andrews p(V ) et entropique T (S) sont analogues
en ceci que δW = −pdV et δQ = T dS pour une transformation réversible, les
aires dans les deux diagrammes étant donc respectivement l’opposé du travail ou le
transfert thermique fourni au système. Dans les deux cas, le diagramme exprime un
paramètre intensif (p ou T ) en fonction d’une grandeur extensive (V ou S).
On remarque alors que les potentiels chimiques µ◦α et µ◦β sont ceux d’un corps pur ;
l’identité thermodynamique dG = −SdT + V dp peut donc s’écrire, pour une mole
du corps dans une des deux phases, sous la forme dµ◦ = −s◦ dT + v ◦ dp, soit encore
∂µ◦α ∂µ◦β
= −s◦α et = −s◦β en fonction des entropies molaires des deux phases, et
∂T ∂T
∂µ◦α ∂µ◦β
= v ◦α et = v ◦β en fonction des volumes molaires des deux phases.
∂p ∂p
On réécrit donc encore −s◦α dT + v ◦α dp = −s◦β dT + v ◦β dp ; en tenant compte de la
relation (17.5), qui peut s’écrire aussi sous la forme Lα→β = T s◦β − s◦α , il vient la
relation de Clapeyron :
dp∗ 1 Lα→β(T )
= (17.8)
dT T v ◦β − v ◦α
Tf
m × ℓf
Q
17.5 ; les pentes de part et d’autre du palier de changement d’état sont simplement
les capacités thermiques isobares CpL et CpS des échantillons solide et liquide.
On peut d’ailleurs aussi observer (en pointillés sur la figure 17.5) un retard au chan-
gement d’état : la solidification ne se produit pas dès la température de changement
d’état atteinte, mais un peu plus tard, et on observe un liquide surfondu métastable
pour T < T f , jusqu’à ce qu’une perturbation provoque l’apparition d’un premier
cristal de solide et la solidification rapide avec retour au palier de changement d’état.
b
Tf
La seule marque du changement d’état est donc la rupture de pente lors du changement
d’état ; il est donc nettement plus difficile à mettre en évidence, sur le seul plan
thermique, qu’un changement d’état de première espèce.
L’équilibre entre les deux phases de A se faisant, pour le corps pur A, à la température
T ∗ , on écrit aussi l’équation d’équilibre dans ces conditions µLA ◦ (T ∗ ) = µSA ◦ (T ∗ ). Il
reste à comparer les deux équations en en faisant la différence ; on suppose pour
cela que T = T ∗ + ∆T , avec |∆T | ≪ T ∗ , ce qui permet par exemple d’écrire de
façon approchée µLA ◦ (T ) − µLA ◦ (T ∗ ) ≃ −sLA ◦ (T∗ )∆T puisque l’entropie molaire de A,
L ◦
∂µ
liquide et seul dans sa phase, vérifie sLA ◦ = − A
.
∂T p=p◦
On a donc obtenu −sLA ◦ (T ∗ )∆T +RT ln(1−xX ) ≃ −sSA ◦ (T ∗ )∆T , où on doit continuer
le développement limité en se limitant au premier ordre seulement, sous la forme
RT ln(1 − xX ) ≃ −R(T ∗ + ∆T )xX ≃ −RT ∗ xX si on suppose que xX et ∆T sont du
même ordre. Il reste donc sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) ∆T = −RT ∗ xX .
On réécrit cette expression en fonction de la chaleur molaire de changement d’état
du solvant pur A, calculée à la température du changement d’état du corps pur T ∗ ,
L∗
sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) = ∗ , pour obtenir la loi de Raoult de la cryométrie, sous la
T
RT ∗ 2
forme ∆T = − ∗ xX .
L
2 Applications : on peut considérer la relation obtenue comme une méthode de
détermination de l’abaissement du point de congélation (puisque ∆T < 0 dans tous
les cas), par exemple de l’eau salée par rapport à l’eau pure. La propriété ∆T < 0 se
généralise d’ailleurs à des fractions molaires xX non nécessairement faibles, comme on
le montre plus loin ; cet abaissement est mis à profit :
– dans la protection des routes contre la formation de verglas lors des pluies d’hiver,
par un salage préventif ;
– pour la réalisation de thermostats à des températures Celsius négatives, en présence
de glace fondante dans de l’eau salée.
On peut aussi remarquer que la mesure de ∆T permet d’accéder à une fraction molaire
xX , alors qu’un opérateur contrôle habituellement une fraction massique en réalisant
une solution diluée avec une balance de précision. La relation entre ces grandeurs,
l’une mesurée et l’autre préparée, permet d’accéder aux valeurs (relatives) des masses
molaires des espèces que l’on peut mettre en solution ; ce type de mesure est donc à la
base des méthodes d’analyse chimique pour la détermination des formules chimiques
brutes du composé X.
Pour déterminer la masse molaire d’une espèce X, il suffit de trouver un solvant A de
cette espèce et d’observer l’abaissement du point de congélation, ou bien l’élévation
du point d’ébullition de cette phase liquide (A majoritaire, X minoritaire).
2 Interprétation chimique : en réalisant une solution de X dans A, on abaisse le
potentiel chimique du liquide A, ce qui impose un changement dans l’équilibre entre
phases de A : la phase liquide est stabilisée par la baisse de son potentiel chimique.
Le domaine de stabilité en température de cette phase liquide s’élargit lorsque la
température de fusion s’abaisse et la température d’ébullition augmente.
Le chapitre suivant généralise l’étude des propriétés colligatives en décrivant les chan-
gements d’état de mélanges, sans faire obligatoirement d’hypothèse restrictive sur la
nature de ces mélanges.
17 : Changement d’état des corps purs 371
V′ b b
T′
L′
V b b
T
L
xL1 ou xV
1
Le même principe permet bien sûr de construire de la même façon les courbes p = p(xL1
et p = p(xV
1 si c’est la variable T que l’on fixe pour l’étude de l’équilibre.
Diagrammes binaires
X On parle de diagramme binaire isobare si on fait une étude à pression p
fixée ; un tel diagramme est formé de deux courbes, T = T xL1 qui est
Il est facile de mémoriser les noms des deux courbes si on réfléchit à la signification
de ces courbes. Ainsi, étudier un paramètre (p ou T ) en fonction de xL1 signifie impli-
citement que xL1 est connu, donc qu’on a préparé un mélange liquide de composition
précise et qu’on étudie la pression ou la température à laquelle il se mettra en équilibre
avec la phase vapeur ; le point de la courbe d’ébullition est donc un point de début
d’ébullition, ou de formation d’une première bulle de vapeur.
Les diagrammes binaires isobares sont les plus courants et les plus conformes à
l’expérience usuelle : pour réaliser l’ébullition d’un mélange, on augmente sa tempé-
rature, souvent à pression constante égale, par exemple, à la pression atmosphérique.
Toutefois, on peut aussi réaliser la même ébullition par abaissement de la pression à
température constante, par exemple à la température ambiante : on doit alors faire
appel aux diagrammes isothermes.
éb
tio
e
ro
u
sé
lli
lli
sé
ro
tio
u
e
éb
L ) p=
x1
T( p(x V
T2éb b T= 1 )
b psat
1
x2 x1 x2 x1
isotherme (à droite), on a au contraire une pression de vapeur saturante plus élevée
pour ce composé A2 plus volatil.
Nous reviendrons bien sûr plus en détail sur ces diagrammes et sur leur interprétation ;
remarquons pour l’instant qu’on a choisi de tracer des fuseaux de courbes monotones
en fonction de xL1 ou xV
1 ; nous allons étudier cette propriété.
Théorème de Gibbs-Konovalov
X Dans un diagramme binaire, les deux courbes d’ébullition et de rosée
ne peuvent présenter que des extrema communs, situés au même point
(mêmes valeurs de la pression, de la température et de la composition
des deux phases). Un tel extremum porte le nom de point azéotrope.
Notons bien que l’établissement des propriétés développées ici n’est pas exigible ; le
résultat par contre (le théorème de Gibbs-Konovalov) doit être connu.
On remarque qu’un mélange ayant, dans les phases solide ou vapeur, la composition
du point azéotrope se comporte comme un corps pur : la température de début d’ébul-
lition et celle de début de rosée sont confondues, à une valeur T1Z qui simule donc une
température d’ébullition d’un corps pur.
T T
p fixé
b
TZ
b T éb
1
T2éb b
x2 xZ1 x1
90 ◦ C
Méthanol
80 ◦ C
70 ◦ C
64, 0 ◦ C
60 ◦ C
Eau
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
100 ◦ C
95 ◦ C
90 ◦ C
Éthanol
85 ◦ C
80 ◦ C
78, 8 ◦ C
Eau
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
d’une phase supplémentaire diminue d’une unité la variance et on pourra donc ren-
contrer trois cas :
• la présence simultanée des trois phases (A1 liquide, A2 liquide et le mélange gazeux
de A1 et A2 ) ; cette situation, monovariante, impose une valeur unique de la
composition de la phase vapeur et de la température, si la pression est fixée ou,
de manière analogue, une valeur unique de la composition de la phase vapeur
et de la pression, si c’est la température qui est fixée.
Cette composition particulière de la phase vapeur porte le nom de point hété-
roazéotrope.
• la présence simultanée de deux phases seulement, le liquide A1 étant seul présent
en équilibre avec le mélange gazeux de A1 et A2 , forme un système divariant ;
• de même, la présence simultanée de deux phases seulement, le liquide A2 étant seul
présent en équilibre avec le mélange gazeux de A1 et A2 , forme aussi un système
divariant.
Nous retiendrons donc le résultat :
Mélange binaire avec miscibilité nulle
X Dans le cas où les deux corps A1 et A2 sont présents dans la phases β
mais ne sont pas miscibles dans la phase α, on peut observer :
• l’équilibre entre A1 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
1 (T, p, x1 = 1) = µ1 (T, p, x1 ) ;
• l’équilibre entre A2 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
2 (T, p, x2 = 1) = µ2 (T, p, x2 ) ;
ou enfin le point hétéroazéotrope, les trois phases étant présentes, à l’in-
tersection des deux conditions définies ci-dessus.
pxV1
La condition d’équilibre µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln , écrite dans l’hypothèse d’un
p◦
mélange idéal de gaz parfaits, est l’équation de la seule courbe d’équilibre qu’on puisse
définir ici : la pression p ou la température T en fonction de xV 1 , donc la courbe de
rosée.
Il n’y a pas de courbe d’ébullition à proprement parler, car il n’y a pas de mélange
liquide à faire bouillir, seulement une ou deux phases liquides qui ne se mélangent
pas.
On voit clairement qu’à T fixé, cette partie de la courbe de rosée a pour équation
pxV1 = Cte ; c’est une branche d’hyperbole, au moins dans l’approximation d’un mé-
lange idéal de gaz. On peut même préciser l’expression de la constante, en remarquant
que l’équilibre du corps pur A1 impose, lorsqu’il est réalisé à la température T , la rela-
psat
1 psat
1
tion µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln ; la courbe de rosée a donc pour équation p ≃
p◦ xV1
psat
2
en présence de A1 liquide pur, et donc p ≃ en présence de A2 liquide pur.
1 − xV 1
p p
T fixé
ébullition b pZ
rosé
e, A L b psat
1 ⇋V 1
L V
psat b A2 ⇋
2 rosée,
x2 xZ1 x1
b
TZ
ébullition
x2 xZ1 x1
2 Exemples : les espèces qui sont miscibles à l’état solide comme à l’état liquide
sont très rares ; il s’agit toujours d’espèces ayant de fortes analogies de structures
électroniques. On peut dans ce cas observer des diagrammes binaires en fuseau, ou
éventuellement avec azéotropie.
Toutefois, le cas le plus fréquent est celui des corps non miscibles en phase solide ;
les diagrammes correspondants sont alors semblables à celui de la figure 18.7 ; on
18 : Mélanges et diagrammes binaires 381
70 ◦ C
idus
Liqu
56, 0 ◦ C
b Solidus 31, 9 ◦ C
30 ◦ C
Eutectique
N
P
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Le même type de diagramme décrit les mélanges cristallins étudiés en Géologie ; le dia-
gramme de la figure 18.8 est celui du mélange d’anorthite (CaAl2 Si2 O8 ) et de diopside
(CaMg2 Si2 O8 ).
1 600 ◦ C
1 557 ◦ C
1 500 ◦ C Liqu
idus
Eutectique
1 400 ◦ C 1 391 ◦ C
1 300 ◦ C
Solidus b 1 270 ◦ C
D
A
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
On remarque bien sûr la valeur très élevée des températures de fusion mises en jeu dans
ce second diagramme ; les matériaux concernés sont des roches, étudiés en particulier
pour leur importance dans la minéralogie des champs pétroliers.
T T
p fixé bM
4
b T éb
1
M3
b b T3
VAPEUR rosée L3
V2 b
M2 b b T2
V1 L2
b b T1
M1
T2éb b ébullition M0 b
LIQUIDE
x2 x1 x1
Cette interprétation justifie évidemment que, même en cas d’intersection des courbes
(par exemple dans le cas d’azéotropie), l’ordre de ces courbes est fixé : il ne saurait
y avoir de croisement des courbes de rosée et d’ébullition.
On remarque que la première bulle de vapeur qui se forme est fortement enrichie (par
rapport au mélange initial en train de bouillir) dans le composé A2 qui, ici, est le
composé de plus basse température d’ébullition, et qui est donc aussi le composé le
plus volatil. Comme la phase liquide a conservé la composition du mélange de départ,
la conservation de la matière impose la formation d’une bulle de vapeur en quantité
infinitésimale à la température T1 . L’ébullition ne peut donc se poursuivre de manière
quantitative que par augmentation de la température.
2 Poursuite de l’ébullition : lorsque la température a atteint la valeur T2 , les com-
positions des phases liquide et vapeur ne sont plus identiques ; elles sont données par
les abscisses des points L2 et V2 , disposés respectivement sur la courbe d’ébullition et
sur la courbe de rosée. Le point M2 ne représente plus qu’un rappel de la composition
initiale du mélange.
18 : Mélanges et diagrammes binaires 383
À la température T2 , la vapeur formée est toujours plus riche que le mélange initial
dans le composé le plus volatil, mais cette différence est moins marquée qu’au début
de l’ébullition, car la quantité de vapeur formée est de plus en plus importante. Au
contraire, la composition du liquide restant est de plus en plus riche dans le composé
A1 qui est le moins volatil : ceci signifie bien sûr aussi qu’il reste de moins en moins
de liquide.
Lorsque la température atteint la valeur T3 , l’ébullition de termine : la composition
de la phase vapeur a repris la valeur de la composition du mélange initial au point M3
tandis que le point L3 désigne la composition d’une dernière goutte de liquide, qui
prend une composition très enrichie en composé moins volatil avant de disparaı̂tre. Un
chauffage ultérieur ne concerne plus qu’une phase vapeur homogène, jusqu’au point
M4 par exemple.
On pourrait bien sûr reprendre l’étude de l’évolution en sens inverse par refroidisse-
ment isobare de la phase vapeur donnée par M4 :
• la première goutte de liquide apparaı̂t à la température T3 ; sa composition, donnée
par l’abscisse du point L3 , est fortement enrichie dans le composé le moins
volatil ;
• plus tard, en cours de liquéfaction, les compositions des phases liquide (L2 ) et
vapeur (V2 ) sont différentes entre elles et de celle du mélange initial (M2 ) ; ces
compositions dépendent de la température T2 et varient de façon continue avec
celle-ci ;
• la dernière bulle de vapeur disparaı̂t à la température T1 , avec une composition
donnée par l’abscisse du point V1 , très riche dans le composé le moins volatil.
FE
T3
Ébullition
DE
T1
M2 L2 nV
= L (18.1)
V 2 M2 n
18.2.3 Généralisations
2 Fractions massiques : certains diagrammes isobares ou isothermes sont tracés en
termes de fractions massiques au lieu des fractions molaires ; ils se lisent et s’inter-
prètent exactement de la même façon que les diagrammes en fractions molaires, mais
toutes les lectures d’abscisse sur l’axe horizontal se font en termes de masses.
En particulier, le théorème des moments s’interprète comme un rapport de masses
dans les deux phases, liquide et vapeur. La figure 18.12 fournit par exemple le dia-
gramme binaire du mélange d’eau et d’acide nitrique, tracé à pression constante p = p◦
L V
et en termes de fractions massiques wHNO 3
(pour la courbe d’ébullition) et wHNO 3
(pour
la courbe de rosée). Ce diagramme présente un azéotrope.
130 ◦ C
120 ◦ C b
Rosée
HNO3
110 ◦ C
ion
Ébullit
100 ◦ C
90 ◦ C Azéotrope
H2 O
wHNO3
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
p p
b T fixé bM
psat
2
0
LIQUIDE
ébullition
rosé M1
e b b p1
V1 M2 L
b b b 2 p2
V2
L
b b 3 p3
M3 b psat
1
M4 b
VAPEUR
x2 x1 x1
M2 L2 nV
= L (18.2)
V 2 M2 n
L’expression du théorème est exactement identique quel que soit le diagramme utilisé.
De même, l’étude d’une ébullition isotherme par diminution de pression se fait par
lecture des points successivement parcourus sur le diagramme, à composition globale
constante pour un système fermé, donc sur une verticale dont l’abscisse indique la
composition x1 du système que l’on fait bouillir ; on observe :
• au point M0 , le mélange initial est totalement liquide et se trouve dans le domaine
monophasé, en grisé sur la figure 18.13 ;
• en diminuant la pression, la première goutte de vapeur apparaı̂t à la pression p1 ;
sa composition, donnée par l’abscisse du point V1 , est nettement enrichie, par
rapport au mélange de départ, dans le composé A2 le plus volatil ;
• au fur et à mesure que l’ébullition se poursuit, la pression diminue et la composition
de la phase vapeur (l’abscisse du point V2 à la pression p2 ) se rapproche de celle
du mélange de départ. Au contraire, la composition du liquide restant s’éloigne
de celle du mélange initial et ce liquide s’enrichit dans le composé le moins volatil
A1 , comme on le voit en lisant l’abscisse du point L2 à cette même pression p2 ;
• la dernière goutte de liquide disparaı̂t à la pression de fin d’ébullition p3 ; cette
dernière goutte était très fortement enrichie dans le composé le moins volatil,
et au même moment la composition de la phase vapeur est devenue identique à
celle du mélange de départ ;
• une diminution ultérieure de la pression ne modifie plus l’état du mélange gazeux,
qui évolue dans le domaine monophasé vapeur (grisé sur la figure) à faible pres-
sion.
2 Cas d’azéotropie : l’existence d’un point azéotrope, qu’il s’agisse d’un diagramme
isobare ou isotherme, ne modifie pas non plus l’interprétation des courbes du dia-
gramme. Considérons par exemple le diagramme isobare de la figure 18.14 : l’ébullition
d’un mélange de composition x1 par augmentation de température.
Lors de l’ébullition, on retrouve en particulier les températures et compositions suc-
cessives des deux phases par lecture des points (M1 , V1 ) pour le début d’ébullition,
18 : Mélanges et diagrammes binaires 387
T M4 T
p fixé b
VAPEUR
b M3
b b
L3 M2 V2
b b b
ée
ros L2 V1
b b
n
itio
M1
b T éb
ull 1
éb
M0 b
T2éb b
x2 LIQUIDE x1
b b b
x′1 xZ1 x1
(L2 , M2 , V2 ) pour un point en cours d’ébullition puis (V3 , M3 ) pour la fin d’ébul-
lition. Le théorème des moments s’applique bien sûr toujours pour déterminer le
rapport des quantités de matière dans les deux phases en cours d’ébullition, selon
nL /nV = M2 V2 /L2 M2
La seule particularité à noter dans le cas des diagrammes avec azéotrope est l’exis-
tence, dans certains cas, de plusieurs intersections des courbes de rosée ou d’ébullition
avec une horizontale (isotherme) donnée. Le système évolue bien sûr continûment,
donc en restant toujours sur la même branche des courbes de rosée et d’ébullition.
Par exemple, dans le cas de l’ébullition décrite sur la figure 18.14, tout se passe
comme si on réalisait l’ébullition d’un mélange du corps A1 et du corps fictif Z formé
du mélange azéotrope ; seul un fuseau du diagramme est utilisé, et les compositions
des deux phases restent toujours, au cours de l’évolution, supérieures à celle xZ1 de
l’azéotrope. Au contraire, si on avait réalisé l’ébullition d’un mélange de composition
initiale donnée, sur la figure 18.14, par l’abscisse x′1 , les compositions des deux phases
en cours d’ébullition seraient à tout instant restées inférieures à celle de l’azéotrope.
2 Cas de non-miscibilité : nous allons à nouveau montrer comment l’étude du
changement d’état d’un système binaire peut se faire par simple lecture du diagramme,
y compris dans le cas d’absence de miscibilité à l’état liquide.
Le diagramme étudié (isobare) est celui de la figure 18.15 ; compte tenu que le système
triphasé formé du mélange des gaz et des deux phases liquides ne peut exister qu’au
seul point hétéroazéotrope, ce diagramme fait apparaı̂tre cinq zones du plan :
• les zones monophasées liquide et vapeur, grisées sur la figure ;
• les zones diphasées pour l’équilibre de la vapeur avec un seul des liquides purs, en
blanc sur la figure ;
• la zone triphasée d’équilibre des deux phases liquides et de la phase vapeur, qui se
réduit au point hétéroazéotrope H.
Considérons par exemple l’ébullition isobare d’un système liquide préparé avec une
nL
composition donnée par l’abscisse x1 = L 1 L du point M0 de la figure 18.15.
n1 + n2
On remarquera que le système de départ n’est pas un mélange, mais seulement la
juxtaposition de deux phases liquides non mélangées. Pour cette raison, x1 n’est pas
une fraction molaire.
388 Physique, MP, MP*
T T
M4 b p fixé
VAPEUR
T2éb
M3
L3 b b
ée
b
M2
b
V
b 2 ros
L2
A2 , L ⇋ V A1 , L ⇋ V
M1 Hb
L1 b b T1éb
b ébullition
x2
M0 LIQUIDES x1
b b
x1 H
x1
Lors de l’élévation de température, on va comme dans les autres cas observer plusieurs
phases dans l’évolution du système :
T diphasé
18.3 Distillation
Considérons la distillation isobare d’un mélange binaire sans azéotrope, dont le dia-
gramme binaire est représenté sur la figure 18.17. Lors du début de l’ébullition, la
composition du résidu est celle du mélange de départ (point R1 ) tandis que les pre-
mières bulles de vapeur, formées à la composition du point D1 , vont fournir un distillat
très enrichi dans le composé le plus volatil.
évolue également, formant une moyenne des compositions des vapeurs évacuées sur la
courbe de rosée.
Si la distillation pouvait être menée à son terme, elle aboutirait à un résidu pur,
constitué uniquement du composé le moins volatil (ici, A2 ). Comme on va le voir,
cette purification est en fait impossible.
De plus, la présence éventuelle d’un azéotrope avec maximum sur les courbes de
rosée et d’ébullition limite l’opération ; si cet azéotrope est présent, la composition
limite du résidu est celle de l’azéotrope.
La figure 18.18 montre un montage destiné à la distillation simple au laboratoire de
Chimie.
La distillation simple est aussi utilisée pour modifier la composition d’un mélange, sans
provoquer de purification totale ; la distillation des alcools alimentaires (la figure 18.19
montre un alambic traditionnel) s’accompagne de réactions chimiques catalysées par
le cuivre des cuves de l’alambic, qui contribuent à la modification de la composition
chimique de l’alcool distillé.
18 : Mélanges et diagrammes binaires 391
C’est ce principe qui est adopté pour la distillation du pétrole brut ; de la base au
sommet des tours de distillation, la composition chimique des produits extraits varie
depuis les huiles lourdes jusqu’au méthane, en passant par le gazole, le kérosène,
l’essence, le butane et le propane.
2 Loi de Raoult : dans le cas d’un mélange binaire idéal, on peut écrire le potentiel
chimique de l’espèce A1 dans les deux phases sous la forme µL1 = µ◦L 1 (T ) + RT ln x1
L
394 Physique, MP, MP*
p1
et µV ◦V
1 = µ1 (T ) + RT ln ; la condition d’équilibre des deux phases est µL1 = µV
1,
p◦
L p 1
donc µ◦L ◦V
1 (T ) + RT ln x1 = µ1 (T ) + RT ln ◦ .
p
On explicite cette loi en la comparant à la définition de la pression de vapeur saturante
du corps A1 pur, pression d’équilibre au-dessus du liquide pur à la même température,
sat(T )
p1
ce qui impose µ◦L1 (T ) = µ ◦V
1 (T ) + RT ln . La comparaison des deux relations
p◦
permet d’écrire la loi de Raoult, caractéristique des mélanges idéaux :
p1 = xL1 psat
1 (T ) (18.3)
n
litio
ébul
rosée
psat
2
VAPEUR
x2 x1
L’équilibre diphasé d’un mélange binaire est divariant ; les deux relations entre
L V
les quatre paramètres intensifs T , p, xL1 et xV
1 sont les deux égalités µ1 = µ1
L V
et µ2 = µ2 .
On traduit ces relations par le tracé de deux courbes. Pour la courbe d’ébullition,
T est tracé en fonction de xL1 (dans le cas des diagrammes à p fixé) ou bien p
est tracé en fonction de xL1 (dans les diagrammes à T fixé). Pour la courbe de
rosée, le même paramètre intensif est tracé en fonction de xV
1.
Les deux courbes sont monotones et toujours disposées dans le même ordre
entre deux points d’intersection ; elles ne se coupent que dans le cas des corps
purs et des éventuels mélanges azéotropes.
Les deux courbes délimitent des régions monophasées : le domaine du liquide
pur (T faible ou p élevé) est limité par la courbe d’ébullition, qui permet de
déterminer le début de l’ébullition d’un mélange, tandis que le domaine de la
vapeur pure (T élevé ou p faible) est limité par la courbe de rosée, qui permet
de déterminer la fin de l’ébullition.
T p fixé M4 T
b
VAPEUR
b M3
b b
e V2
sé L3 b M2
ro R 1
b b
b b
V1
C1 L2 b b
n
itio
M1 b T éb
1
ull
C2
b b
éb
M0 b
T2éb b LIQUIDE x1
x′1 xZ1
b b b