Cours de Physique - Lycee Claude Fauriel - Eléctricité - Optique

Chapitre 1
Électricité dans les réseaux linéaires
1.1 Réseaux linéaires
1.1.1 Introduction
2 L’électrocinétique : il s’agit de l’étude du transport d’information (faible puis-
sance) ou du transport de puissance dans des réseaux électriques. On parle éventuel-
lement d’électronique pour le transport d’information ; ce terme prend son origine
dans l’emploi, aujourd’hui en général dépassé, de tubes à vide (à déplacement d’élec-
trons) pour la réalisation des appareils de génération, codage, transport réception
ou décodage des informations. Ces tubes (électronique à lampes) ont en général été
remplacés par de l’électronique à semi-conducteurs, sauf pour certaines applications
spécifiques (amplificateurs acoustiques de puissance, de haut de gamme).
2 Cadre de l’étude : l’étude de l’électrocinétique (passage du courant électrique dans
les réseaux de dipôles) se fait dans le cadre de l’Approximation des régimes quasi-
permanents ou A.R.Q.P. Nous développerons ultérieurement (dans le cours d’élec-
tromagnétisme) les conditions et les conséquences de cette approximation ; pour le
moment, nous nous contenterons d’affirmer ce qui suit :
L’approximation des régimes quasi-permanents consiste à limiter l’étude des réseaux
électrocinétiques à des dimensions maximales ℓmax et à des durées minimales τmin
vérifiant la condition (1.1) :
ℓmax
≪ c0 c0 = 2, 99792458 × 108 m · s−1 (1.1)
τmin
Dans ce cadre, on peut négliger tout phénomène de propagation dans le réseau élec-
trocinétique ; en particulier, la modification d’une grandeur électrique en un point du
circuit a pour conséquence des modifications instantanées des grandeurs analogues
caractérisant les autres points du réseau.
2 Exemples : pour un circuit de dimension ℓmax = 3 m, on trouve τmin ≫ 10−8 s ;
on pourra donc se placer dans le cadre de l’A.R.Q.P. pour l’étude d’un signal de
fréquence fmax ≪ 108 Hz = 100 MHz, ce qui correspond à tout ce qu’on appelle élec-
tronique basse fréquence. Par contre, l’électronique de haute fréquence peut imposer
la miniaturisation des circuits, sous peine de sortir du domaine de l’A.R.Q.P. ; ainsi
à la fréquence de réception des signaux de téléphonie cellulaire (f = 1 800 MHz donc
τmin = 5, 6 × 10−10 s), l’A.R.Q.P. impose ℓmax ≪ 17 cm, ce qui est nettement plus
restrictif.
4 Physique, MP, MP*
Prenons encore l’exemple du courant industriel, à la fréquence f = 50 Hz, donc avec

τmin = 20 ms ; la condition d’A.R.Q.P. impose donc ℓmax ≪ 6 000 km : cette condi-
tion est aisément remplie pour un réseau domestique ou une installation industrielle.
Par contre, dans un réseau d’alimentation de puissance à l’échelle continentale, il est
indispensable de prendre en compte les effets de propagation.
2 Signaux, tensions, courants : lorsque la forme d’une grandeur électrique importe,
car elle transporte de l’information, elle portera le nom de signal. Un signal électrique
peut être transporté par un courant électrique i ou par une tension électrique (ou
différence de potentiel u.
Lorsqu’un signal électrique transporte ainsi une information, elle peut être de nature
analogique (l’information est contenue dans la forme du signal) ou numérique (l’in-
formation est codée et une déformation limitée du signal n’altère pas son contenu).
Dans certains cas, les grandeurs électriques ne transportent aucune information, mais
seulement de la puissance : on parle de courants d’alimentation. C’est le cas du courant
industriel, oscillant de manière sinusoı̈dale à la fréquence de 50 Hz (60 Hz aux États-
Unis et au Japon).
2 Mesures : l’appareil essentiel des mesures électriques et électroniques réalise des
mesures de tension. Nous utiliserons deux types d’appareil :
– les voltmètres, susceptibles de faire des mesures instantanées – mode DC – ou des
mesures de tensions efficaces vraies en courant alternatif (quelle que soit sa forme,
voir plus loin) – mode AC ou RMS – ; ils sont caractérisés par :
– une précision (écart maximal entre la valeur lue et la valeur vraie), qui est en
général la somme d’une précision relative et d’une valeur intrinsèque, par exemple
0, 025 % + 2 chiffres ;
– une résolution (écart minimal entre deux valeurs distinguées par l’appareil), qui
est donnée par le nombre de chiffres (ou digits) affichés (5 ou 6 chiffres par
exemple pour une gamme complète) ;
– un appel de courant qui doit être aussi faible que possible pour que l’appareil
ne perturbe pas les circuits étudiés ; on utilise en général un modèle de Norton,
avec une résistance d’entrée, de l’ordre de 10 MΩ en parallèle avec un courant
d’erreur de l’ordre de 30 pA ;
– enfin, par les diverses limites d’utilisation : choix de gammes, bande passante en
fréquence pour les mesures en alternatif, etc.
– les oscilloscopes, susceptibles de faire des mesures instantanées d’un signal quel-
conque – mode DC – ou de sa seule partie variable, déduction faite de la moyenne
– mode AC – ; ils sont caractérisés par :
– une précision qui est en général donnée en valeur relative, 1 % à 5 % par exemple
selon les gammes ;
– une résolution qui ne dépend que du nombre de points à l’affichage ;
– un appel de courant faible, avec en général un modèle formé d’une résistance
d’entrée, de l’ordre de 1 MΩ en parallèle avec une capacité d’entrée de l’ordre de
25 pF ;
– enfin, par sa sensibilité (en mV par division), ses fréquences de balayage, etc.
On utilise aussi parfois d’autres appareils : ampèremètres, ohmmètres, capacimètres,
wattmètres ; tous exigent de débrancher un circuit pour être utilisés, ce qui explique
leurs usage moindre. On leur préfère des mesures indirectes.
1.1.2 Lois de Kirchhoff

2 Réseau électrocinétique : on appelle ainsi un ensemble de N points, ou nœuds du
réseau, numérotés A0 , . . . , AN −1 ; chaque point Ak est caractérisé par un potentiel Vk .
1 : Électricité dans les réseaux linéaires 5
Rappelons ici que, ces potentiels étant définis à une constante additive près, on ne
définit ici que N − 1 inconnues indépendantes ; on peut préciser cette indétermination
en choisissant pour nœud A0 la masse conventionnelle du réseau, assurant ainsi V0 = 0.
L’étude d’un tel réseau électrocinétique se ramène alors à la détermination des N − 1
tensions (relatives à la masse) V1 , . . . , VN −1 .
Deux nœuds Ak et Ap d’un même réseau sont (éventuellement) reliés par une branche ;
celle-ci est parcourue par un courant ipk , algébrisé du nœud p vers le nœud k. Notons
que, s’il n’existe pas de branche reliant Ap et Ak , on notera ipk = 0. Enfin, par
convention, on notera ikk = 0 pour tout k.
2 Loi des nœuds : l’A.R.Q.P. impose l’absence d’accumulation de charge électrique
en tout point du réseau ; la somme
X des courants parvenant en un nœud est nulle à
chaque instant. On notera donc ipk = 0 pour tout k la loi des nœuds écrite au
p
nœud Ak .
Contrairement aux apparences, ceci ne fournit pas N mais bien N −X 1 relations
X in-
dépendantes ; en effet, la somme de toutes les lois des nœuds s’écrit ipk = 0
k p
où
Xla Xsomme contient pour chaque couple (p, k) le terme ikp + ipk qui est nul, donc
ipk = 0 et ces relations ne sont pas indépendantes.
k p
2 Loi des mailles : puisqu’on a fait X

l’hypothèse de l’existence d’un potentiel Vp pour
tout nœud Ap du réseau, la somme (Vp − Vk ) le long d’un contour fermé fournit
X
automatiquement zéro, ce qu’on peut écrire upk = 0 avec upk = Vp − Vk : cette
maille
loi, même si elle est souvent commode pour l’analyse effective d’un circuit, ne fournit
pas d’équation particulière pour la résolution d’un problème électrocinétique.
1.1.3 Dipôles linéaires

2 Dipôles électrocinétiques : un dipôle électrocinétique est un dispositif relié au
reste du réseau par deux bornes, dites borne d’entrée E et borne de sortie S. Par
convention (cf. figure 1.1), le courant traversant i un tel dipôle est dont mesuré dans
le sens E → S.
i ur
Eb Sb
ug
Figure 1.1 – Dipôle électrocinétique
Ce dipôle est alors caractérisé par la tension à ses bornes ; cette tension peut être
définie selon deux conventions (voir la figure 1.1) : la convention générateur (tension
ug ) et la convention récepteur (tension ur ). On parle aussi respectivement de remontée
de tension ug ou de chute de tension ur .
Après le choix d’une orientation (entrée et sortie) et d’une convention (générateur ou
récepteur), le comportement d’un dipôle électrocinétique est connu si on sait relier i
et u :
– soit par la donnée d’une caractéristique courant-tension, relation donnée sous la
forme d’une courbe i = i(u), si elle existe ;
6 Physique, MP, MP*
– soit, si le courant ne dépend pas seulement de u, par la donnée d’une méthode de

détermination de i à partir de u. On rencontre cette situation dans deux cas :
– les systèmes présentant un hystérésis : l’état électrique du système dépend de son
état antérieur ;
– les systèmes présentant un comportement fréquentiel, comme les condensateurs
dur diL
ou les bobines d’induction avec respectivement iC = C ou ur = L , mais
dt dt
aussi par exemple les systèmes filtrés, etc.
2 Dipôles linéaires : on appelle ainsi un dipôle qui présente, au moins dans un certain
domaine de fonctionnement, une caractéristique affine.
Utilisant la convention des générateurs, on choisit en général de noter cette relation
linéaire sous l’une des formes équivalentes :
1
i = η − gug ug = e − ri avec g= e = rη (1.2)
r
Dans ce modèle (on parle de modèle de Thévenin dans le premier cas, de modèle de
Norton dans le second), η porte le nom de courant de court-circuit, e celui de force
électro-motrice ; g et r sont respectivement la conductance et la résistance internes
du dipôle.
i = η − gug
η ug = e − ri
η
b b e
i r
b b b b b
b b
g gug
e ri
ug
Figure 1.2 – Modèles de Thévenin et de Norton
On utilise dans ce cas les schémas de Thévenin et de Norton présentés sur la figure 1.2.
Lorsque de plus g → 0, il n’existe pas de modèle de Thévenin et on parle de générateur
idéal de Norton ou générateur idéal de courant ; si au contraire r → 0, il n’existe pas de
modèle de Norton et on parle de générateur idéal de Thévenin ou générateur idéal de
tension. Les générateurs idéaux ne sont que des modèles limites, utilisés pour simplifier
des exercices ; nous ne les considérerons pas dans les développements théoriques qui
suivent.
2 Générateurs commandés : on dit que le générateur de Norton idéal défini par η
(ou le générateur de Thévenin défini par e) est un générateur libre si la grandeur η
(ou bien e) est une constante indépendante de l’état électrique du reste du réseau.
Si au contraire cette grandeur dépend de l’état électrique du réseau, on parle de
générateur lié ou générateur commandé. Nous ne considérerons dans la suite que le
cas des générateurs liés de manière linéaire, pour lesquels on écrira par exemple le
courant de court-circuit
X η sous forme d’une combinaison linéaire des potentiels dans
le réseau, η = γj Vj .
j
1.1.4 Quadrupôles linéaires

2 Quadrupôles : on appelle ainsi un dispositif électrocinétique relié au reste du
réseau par deux bornes d’entrée (tension ue , courant ±ie ) et par deux bornes de
sortie (tension us , courant ±is ), conformément au schéma général de la figure 1.3.
ie is
b b
e
ôl
up
ue us
dr
ua
Q
b b
ie is
Figure 1.3 – Courants et tensions d’entrée et de sortie d’un quadrupôle
Il ne s’agit donc pas de n’importe quel dispositif à quatre bornes ! Comme un dipôle,
un quadrupôle est orienté, avec une entrée et une sortie ; par contre, nous choisi-
rons systématiquement la convention de la figure 1.3, qu’on pourrait qualifier de
convention récepteur en entrée et générateur en sortie, ce qui est bien sûr adapté à
un appareil électronique destiné à faire partie d’une chaı̂ne d’appareils successifs.
2 Quadrupôles linéaires : un quadrupôle est linéaire s’il existe une relation linéaire
entre les quatre grandeurs ue , us , ue et is , permettant d’exprimer deux d’entre elles
en fonction des deux autres sous forme matricielle. La relation en question étant en
général inversible, le choix des grandeurs exprimées est a priori arbitraire ; on choisira
donc une des quatre matrices de l’équation (1.3) :

ue ie ie ue
= [Z] = [Y ]
us |{z} is is |{z} us
matrice impédance matrice admittance
(1.3)
us ue us ue
= [T ] = [H]
is |{z} ie ie |{z} is
matrice transfert matrice hybride
2 Modèle équivalent : c’est le modèle de la matrice hybride qui est le plus utilisé en
électronique ; on note alors ses composantes sous la forme (1.4) :

us H −Zs ue us = Hue − Zs is
= (1.4)
ie Ye k is ie = Ye ue + kis
En effet, une telle écriture permet de représenter le quadrupôle comme une association
de dipôles, comportant deux termes passifs et deux générateurs commandés, selon la
us
figure 1.4. La grandeur H = porte le nom de gain en tension en boucle ou-
u
e is =0
us
verte ; la grandeur Zs = − porte le nom d’impédance de sortie du montage.
is ue =0
8 Physique, MP, MP*
ie b b b is
b
b
Zs
ue Ye kis Hue us
b b
b
b
Figure 1.4 – Montage équivalent à un quadrupôle linéaire
De nombreux montages électroniques ne génèrent une tension que s’ils sont eux-mêmes
alimentés, ce qui signifie que ue = 0 impose us = 0 ; on a alors Zs = 0, ce qui permet
aussi d’écrire simplement us = Hue ; dans un tel cas, H s’identifie à la fonction de
transfert déterminée en première année.
Il est souvent inutile de calculer l’impédance de sortie ; le seul fait qu’un calcul
général de tension à la borne de sortie mène à us = Hue , sans avoir fait d’hypothèse
particulière sur la valeur de is , montre automatiquement que Zs = 0.

ie
La grandeur Ye = porte le nom d’admittance d’entrée ; enfin, la grandeur
is =0 ue

ie
k=− porte le nom de coefficient de retour ; ce terme est nul dans tous les
us ue =0
montages unidirectionnels. Dans un tel cas, on écrit encore ue = Ze ie où Ze = 1/Ye
porte le nom d’impédance d’entrée.
1.1.5 Théorèmes généraux des réseaux linéaires
X en série et en parallèle : l’association en série (même courant i, tension

2 Associations
totale u = ul ) de plusieurs dipôles linéaires, modélisés selon le schéma de Thévenin,
l X P
est un dipôle linéaire de caractéristiques e = el , r = l rl . Pour cette raison, le
l
modèle de Thévenin est aussi appelé modèle série (voir la figure 1.5).
e1 e2 e3
R1 R2 33
b b b b b b b
Figure 1.5 – Associations de générateurs en série
b
b
η1 η2 η3 η4
g1 g2 g3 g4
b
Figure 1.6 – Associations de générateurs en parallèle

X
De même, l’association en parallèle (même tension u, courant total i = il ) de
l
plusieurs dipôles linéaires,
XmodélisésPselon le schéma de Norton, est un dipôle linéaire
de caractéristiques η = ηl , g = l gl . Pour cette raison, le modèle de Norton est
l
aussi appelé modèle parallèle (voir la figure 1.6).
2 Diviseurs de tension et de courant : considérons une association en série de dipôles
linéaires passifs (ek = 0), selon la figure 1.7 : on parle alors de diviseur de tension :
rk X
uk = u r= rk (1.5)
r
k
i=0
r1 r2 ... rN
b b b b b
u1 u2 ... uN
u
Figure 1.7 – Diviseur de tension
On remarque sur la figure 1.7 qu’une association se comporte comme un diviseur de

tension alors même qu’un n’œud peut y être intercalé, sous réserve que celui-ci prélève
un courant négligeable (noté i = 0 sur le schéma).
Considérons de même une association en parallèle de dipôles linéaires passifs, selon la
figure 1.8 : on parle alors de diviseur de courant :
gk X
ik = i g= gk (1.6)
g
k
i1
b b
g1
i2
i b b
b g2 ... b
b b
...
iN
b b b
gN ǫ=0
Figure 1.8 – Diviseur de courant
On remarque sur la figure 1.6 qu’une association se comporte comme un diviseur de

courant alors même qu’une dipôle, assurant une tension négligeable (notée ǫ = 0 sur
le schéma) peut y être inséré.
2 Théorème de Millman : considérons maintenant une association en parallèle de
générateurs modélisés en série, reliant un nœud et la masse, comme sur la figure
10 Physique, MP, MP*
1.9 à gauche ; l’ensemble est encore équivalent à un générateur linéaire, qu’on peut
X ek X 1
modéliser par ses caractéristiques de Norton η = et g = , ce qui permet
rk rk
k k
X ek X 1
de relier la tension u0 et le courant i0 sous la forme i0 = − u0 , soit
rk rk
k k
encore :
P
gk ek − i0
u0 = k P (1.7)
k gk
i0 i0
b
b
...
...
rN
rN
r1
r1
u0 u0
b
b
...
eN
e1
e1 ... eN
b b b b b b
b
Figure 1.9 – Théorème de Millman
Dans le cas du circuit de la figure 1.9 à droite, le lien entre u0 et i0 reste évidemment
le même ; il constitue alors le Théorème de Millman. Dans le cas particulier où i0 = 0,
on remarque que ce théorème peut se relire ainsi : la tension u0 est le barycentre des
tensions ek , affectés des poids gk .
2 Théorème de Helmholtz : considérons enfin un réseau linéaire quelconque, formé
de N nœuds dont on cherche à déterminer les potentiels V1 , V2 , . . . , VN −1 (avec par
choix de masse V0 = 0). Ce réseau est entièrement constitué de branches linéaires
(dipôles, quadrupôles) que nous décrirons tous dans le modèle de Norton, en écrivant
donc ikp = ηkp − gkp (Vp − Vk ) le courant circulant du nœud Ak vers le nœud Ap .
Dans le cas où la branche Ap Ak est passive, on posera ηkp = 0 ; si elle est absente, on
posera ηkp = 0 et gkp = 0.
Enfin, si le générateur ηkp n’est pas X
un générateur libre, on développera son courant
de court-circuit sous la forme ηkp = αjkp Vj . Finalement, on peut dans tous les cas
j
X
écrire la loi des nœuds ikp = 0 sous la forme matricielle :
p
[G] [V ] = [J] (1.8)
où [V ] est la matrice colonne des N − 1 potentiels indépendants, [G] est une matrice
carrée de dimension N −1 qui ne dépend que des conductances et, éventuellement, des
caractéristiques αjkp des générateurs liés, et [J] est une matrice colonne de dimension
N − 1 qui ne dépend que des générateurs libres.
Dans le cas (dont nous admettrons qu’il est général, sauf pour des réseaux mal confor-
−1
més) où la matrice [G] est inversible, on peut donc écrire [V ] = [G] [J], qui constitue
le théorème de Helmholtz‡ ou théorème de superposition :
Théorème de Helmholtz
X Le potentiel Vk en un nœud quelconque
X Ak d’un réseau linéaire est une
combinaison linéaire Vk = δki ηi des caractéristiques ηi (ou ei )
générateurs i
des générateurs linéaires du réseau. Les coefficients δki de la combinaison
linéaire ne dépendent que des éléments passifs du réseau (conductances,
résistances) ou des caractéristiques des générateurs liés.
On peut bien sûr utiliser une forme pratique du théorème de superposition : en pré-
sence de plusieurs générateurs, on calcule chaque potentiel en présence d’un seul
générateur libre, puis on somme les résultats obtenus.
On prendra garde, dans une telle application du théorème de Helmholtz, à ne pas

modifier les coefficients de la combinaison linéaire, c’est-à-dire à ne pas modifier la
répartition des éléments passifs pas plus qu’on ne modifiera les générateurs liés.
2 Théorème de Thévenin-Norton : considérons (cf. figure 1.10 à gauche) un réseau

entièrement formé de dipôles linéaires, débitant un courant i dans une certaine branche
A0 A1 , sous la tension u = V1 puisque on a choisi V0 = 0 en A0 .
i
bA A1
1
b
ire
ire
éa
éa
lin
lin
D u i u
u
u
ea
ea
és
és
R
bA bA
0 0
b
Figure 1.10 – Théorème de Thévenin-Norton
Quel que soit le dipôle D dans lequel ce réseau débite, la répartition des courants et
des tensions ne sera pas modifiée si on remplace D par un générateur idéal de courant
i (cf. figure 1.10 à droite) ; dans le réseau entièrement linéaire ainsi formé, on peut
−1
écrire la première ligne de la relation [V ] = [G] [I] sous la forme V1 = u = e − ri, où
−1
−r est le terme de ligne 1, colonne 1 de la matrice [G] , tandis que e est une certaine
combinaison linéaire des courants de court-circuit des générateurs libres intérieurs au
réseau linéaire.
On peut déterminer e comme la valeur particulière prise par la tension u lorsque i = 0,
tous les autres générateurs étant inchangés.
On peut déterminer r comme la valeur particulière prise par le rapport −u/i lorsque
e = 0, c’est-à-dire lorsqu’on éteint tous les générateurs libres du réseau linéaire.
On reconnaı̂t là le théorème de Thévenin :
Théorème de Thévenin
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Thévenin de caractéristiques (e, r) :
• r est la résistance équivalente au réseau passivé, c’est-à-dire dans lequel
on a éteint tous les générateurs libres ;
• e est la tension à vide (en remplaçant D par un circuit ouvert) aux
bornes du réseau linéaire.
On peut bien sûr en donner la forme équivalente :
Théorème de Norton
X Tout réseau de dipôles linéaires débitant dans une branche extérieure D
quelconque est, du seul point de vue de cette branche, équivalent à un
générateur de Norton de caractéristiques (η, g) :
• g est la conductance équivalente au réseau passivé, c’est-à-dire dans
lequel on a éteint tous les générateurs libres ;
• η est le courant de court-circuit (en remplaçant D par un fil) aux bornes
du réseau linéaire.
Dans les deux cas, on n’oubliera pas que passiver le réseau, c’est annuler les carac-
téristiques e ou η des générateurs libres, tandis qu’on ne modifie pas les générateurs
liés du réseau linéaire.
1.2 Régimes transitoires
1.2.1 Régimes d’évolution

2 Réseau linéaire en régime transitoire : on appelle ainsi un réseau électrique dans
lequel chaque grandeur électrique x(t) (tension, courant) est solution d’une équations
p
X dk x
différentielle linéaire d’ordre p > 0, que nous écrirons ak k = f (t), avec ap 6= 0.
dt
k=0
On rencontre une telle situation en présence de bobines d’induction ou de conden-
sateurs, mais aussi de composants actifs vérifiant eux-même une équation différen-
tielle ; c’est notamment le cas des amplificateurs opérationnels (cf. figure 1.11) ; on
sait en effet que ceux-ci vérifient, dans le domaine linéaire (|vs | < Vsat ), la relation
dvs
vs (t) + τ = µ0 ε(t), avec µ0 ∼ 105 et τ ∼ 10 ms.
dt
b
+
ε(t) b
b - vs (t)
b
Figure 1.11 – Amplificateur opérationnel de différence
p
dk x X
2 Régime libre, régime forcé : la solution générale de l’équation = f (t) ak
dtk
k=0
est la somme d’une solution particulière, dépendant de la forme de la fonction f (t),
p
X
et de la solution générale λi exp (ri t) de l’équation sans second membre, où les ri
i=0
p
X
sont les racines complexes de l’équation caractéristique ak rk = 0.
k=0
La solution générale de l’équation sans second membre, qui ne dépend pas de f (t),
porte le nom de régime libre ; on parle de régime forcé pour une solution particulière
de l’équation complète qui a la même forme que la fonction f (t).
2 Systèmes stables : on dit qu’un réseau électrique en régime variable est stable
si les parties réelles Re(ri ) de toutes les racines ri de l’équation caractéristique sont
négatives. Ainsi, chacune des exponentielles exp (ri t) qui intervient dans le régime
libre vérifie |exp (ri t)| → 0 quand t → ∞.
La solution de régime libre est alors bornée et tend vers zéro au bout d’une certaine
1
durée ; on dit aussi que le régime libre est transitoire. Notons alors ri = − ± jωi
τi
(j 2 = −1) une de cesracines de l’équation caractéristique ; on peut encore écrire
t
|exp (ri t)| = exp − et la grandeur τi est une des constantes de temps du régime
τi
transitoire.
dx
Si l’équation différentielle est d’ordre 1, l’équation de régime libre a + bx = 0 a
dt
pour seule racine de l’équation caractéristique r = −b/a qui est réelle ; il faut donc
que a et b soient de même signe. Dans ce cas, la constante de temps est τ = a/b et
dx 1
l’équation différentielle s’écrit encore + x = 0.
dt τ
Formes canoniques des systèmes du premier ordre
X Dans le cas d’une équation du premier ordre, on utilisera la notation
dx 1
+ x(t) = f (t) ; τ > 0 est la constante de temps du régime transitoire.
dt τ
d2 x dx
Si l’équation différentielle est d’ordre 2, l’équation a 2
+b + cx = 0 admet des
dt dt
solutions réelles ou complexes (conjuguées).
– Dans le premier cas, elles sont toutes deux négatives si leur produit c/a est positif
et leur somme −b/a négative, ce qui revient à affirmer que les trois coefficients a, b
et c ont même signe.
– Dans le second cas, la partie réelle commune des solutions est −b/2a qui doit être
négatif (donc a et b sont encore de même signe) tandis que b2 − 4ac < 0 impose
ac > 0 et a et c sont encore de même signe.
On ramène alors l’équation à une forme canonique en divisant par a avant de noter
c/a = ω02 , b/a = 2ξω0 et Q = 1/2ξ.
Formes canoniques des systèmes du second ordre

X Dans le cas d’une équation du second ordre, on utilisera la notation
d2 x dx
+ 2ξω0 + ω02 x(t) = f (t) ; ω0 > 0 est la pulsation caractéristique
dt2 dt
du régime libre, ξ le coefficient d’amortissement et Q = 1/2ξ le facteur
de qualité.
Il est important de noter que la condition de stabilité ci-dessus (a, b et c de même

signe) n’a pas de rapport avec le signe du discriminant de l’équation caractéristique.
Stabilité des systèmes du premier et du second ordre

X Un système différentiel du premier ou du second ordre correspond à un
régime libre stable si tous les coefficients de l’équation différentielle sont
du même signe.
2 Nature des régimes du second ordre : le discriminantréduit de l’équation carac-

téristique d’un régime du second ordre étant δ = ξ 2 − 1 ω02 , on peut observer trois
types de régimes transitoires du second ordre :
– si ξ < 1, l’amortissement est faible et le régime
est pseudo-périodique amorti ; on
t
écrira le régime transitoire x(t) = x0 exp − cos (ωt + ϕ) avec pour constante
τ
1 2Q p
de temps τ = = et pour pseudo-pulsation ω = ω0 1 − ξ 2 . La forme
ξω0 ω0
correspondante figure sur la figure 1.12.
x
A
b
B
b
Figure 1.12 – Régime transitoire pseudo-périodique

t
Les points de contact successifs de la courbe x(t) avec ses enveloppes ± exp −
τ
2π
se situent à des intervalles de temps égaux à la pseudo-période T = ; le rapport
ω
de l’amplitude de deux tels points de contact successifs (comme A et B ci-dessus)
xA πω0
vérifie ln = δ = ; δ est le décrément logarithmique et, pour un système
xB Qω
π
faible amorti, ξ ≪ 1 donc ω ≃ ω0 et δ ≃ .
Q
t
– si ξ = 1, le régime est dit critique et x(t) = (x0 + v0 t) exp − avec pour
τ
1
constante de temps τ = . Pour des conditions initiales données, c’est en gé-
ω0
néral le régime qui assure le rapide le plus retour à l’équilibre et pour cette raison
de nombreux appareils de mesure sont réglés pour fonctionner dans ces conditions.
L’allure de la réponse x(t) d’un réseau en régime critique est très peu différente de
celle du régime apériodique, présenté ci-dessous.
– si ξ > 1, l’amortissement est fort et le régime
est avec
apériodique, pour forme géné-
t t
rale du régime transitoire x(t) = x1 exp − + x2 exp − et pour constantes
τ1 τ2
2 1
de temps τ1/2 = p . La forme correspondante figure sur la figure 1.13,
ω0 ξ ± ξ 2 − 1
où on a fait apparaı̂tre les deux termes de constantes de temps τ1 et τ2 > τ1 .
x
exp
(−t
/τ
2)
1)
/τ
−t
p(
ex
Figure 1.13 – Régime transitoire apériodique
1.2.2 Conditions initiales

2 Principe de l’étude : nous considérerons dans cette partie un réseau stable du
d2 x dx
second ordre régi par l’équation différentielle 2
+ 2ξω0 + ω02 x(t) = f (t), où
dt dt
le terme de second membre f (t) dépend de la tension, ou du courant, imposés par
l’opérateur à partir de t = 0+ .
À t = 0, on impose une perturbation au système en choisissant la forme de f (t). On
+ dx
cherche alors à relier x(t = 0 ) et aux valeurs analogues, supposées connues,
dt 0+
pour t = 0− , afin d’en déduire les deux constantes d’intégration qui apparaissent dans
l’expression du régime transitoire.
dx dx
On notera alors ∆x0 = x(t = 0+ ) − x(t = 0− ) et ∆ẋ0 = − les dis-
dt 0+ dt 0−
continuités de x et de sa dérivée au moment de l’établissement du régime transi-
toire en t = 0 ; on cherche à les déterminer en fonction de la grandeur analogue
∆f = f (t = 0+ ) − f (t = 0− ).
2 Discontinuités à t = 0 : pour déterminer celles-ci, considérons l’équation dif-
férentielle et réalisons-en d’abord l’intégration (après multiplication par dt) entre
Z +ε 2
d x
t = −ε et t = +ε ; on obtient donc, en faisant tendre ε → 0, 2
dt = ∆ẋ0
−ε dt
Z +ε Z +ε
dx
et dt = ∆x0 . D’autre part, x(t)dt → 0 si ε → 0 ; pour montrer cette
−ε dt −ε
propriété, il suffit de supposer qu’on cherche une solution x(t) bornée.
Z +ε
On obtient donc la première relation ∆ẋ0 + 2ξω0 ∆x0 = f (t)dt.
−ε
Une intégration de la primitive de l’équation différentielle, réalisée de même entre −ε
et +ε, montre de la même façon que ∆x0 = ∆F , où F est une primitive de f , avec
dF
donc = f (t).
dt
Finalement, la détermination de ∆x0 et ∆ẋ0 revient seulement à préciser la forme
du terme de second membre de l’équation différentielle, au voisinage de t = 0. Nous
rencontrerons essentiellement deux formes : l’échelon de Heaviside‡ y(t) = y0 H(t)
et l’impulsion de Dirac‡ y(t) = y0 δ(t).
2 Échelon et Impulsion : on appelle échelon de Heaviside la fonction définie par
H(t) = 0 pour t < 0 et H(t) = 1 pour t > 0 (cf. figure 1.14 à gauche). On peut
d’ailleurs la considérer comme la limite de la suite de fonctions H∆t continues, affines
par morceaux, représentées en pointillés sur la figure. Notons que H∆t (t) est constante
(nulle ou égale à 1) si |t| > ∆t/2, et qu’elle a une pente constante 1/∆t dans l’intervalle
[−∆t/2 , ∆t/2].
H δ
1 1/∆t
∆t
∆t
t t
0 0
Figure 1.14 – Distributions de Heaviside et de Dirac
Ainsi définie, la suite des fonctions H∆t est dérivable, et leurs dérivées δ∆t sont
représentées en pointillés sur la figure 1.14, à droite. Il s’agit de fonctions nulles
sauf sur l’intervalle [−∆t/2 , ∆t/2], intervalle où elles prennent une valeur telle que
Z A
δ∆t (t)dt = H(A) − H(−A) = 1 pour A > ∆t/2.
−A
Nous admettrons qu’il existe un cadre mathématique, la théorie des distributions de
Schwartz‡ , dans lequel la fonction (( limite )) H de Heaviside est dérivable, sa dérivée
portant le nom d’impulsion de Dirac ou distribution de Dirac.
Distributions de Heaviside et de Dirac
dH
X On note ainsi les distributions H et δ, reliées par
dt
= δ, qui vérifient :
• H(t) = 1 pour t > 0 et H(t) = 0 pour t < 0 ;
• δ(t) = 0 pour t 6= 0 ;
Z ∞
• δ(t)dt = 1.
−∞
H modélise les tensions et courants en échelon à l’instant t = 0 ; δ
modélise les tensions et courants en impulsion au même instant.
Bien sûr, aucun générateur réel ne délivre de tensions représentées exactement pas des
grandeurs proportionnelles à H(t) ou à δ(t) ; il ne s’agit que de modèles limites, que
nous utiliserons cependant couramment, en électrocinétique comme dans d’autres do-
maines de la Physique, pour décrire des grandeurs physiques présentant des variations
rapides.
On prendra garde aux unités : si H est une grandeur sans dimension, la distribution
de Dirac δ se mesure comme l’inverse d’un temps.
2 Applications : considérons d’abord le réseau de la figure 1.15 ; D est un dipôle

quelconque, mais la tension uD (t) à ses bornes est une fonction du temps supposée
bornée, tout comme la tension uC d’ailleurs. Puisque le courant dans le réseau vérifie
duC duC
i = C , la tension aux bornes de C vérifie aussi uC + τ + uD = e(t) avec
dt dt Z + 0
τ = RC donc, par intégration entre t = 0− et t = 0+ , on obtient τ ∆uC = e(t)dt.
0−
Z 0+
L’intégrale e(t)dt est nulle sauf si la tension e(t) est proportionnelle une impul-
0−
Z 0+
sion de Dirac ; en effet, dans ce cas, e(t) = Kδ(t) impose e(t)dt = K. Sinon, on
0−
C
b b b
b
R
uC
e(t) D uD
b
Figure 1.15 – Réseau R, C série
constate que la variation ∆uC = uC (0+ ) − uC (0− ) est nulle sauf si τ → 0, ce qu’on
obtient par exemple lorsque R → 0. Finalement, on retiendra le résultat général :
Continuité de la tension uC
X La tension uC aux bornes d’un condensateur est en général une fonction
continue du temps, même lorsque le réseau qui comporte ce condensateur
subit des variations brutales d’alimentation, sous réserve que :
• le condensateur doit être connecté par l’intermédiaire d’au moins une
résistance en série ;
• la tension d’alimentation ne doit pas comporter d’impulsion de Dirac.
Considérons alors le réseau de la figure 1.16 ; ce réseau est en quelque sorte l’(( image ))
de celui de l’étude précédente, en remplaçant les modèles série par des modèles paral-
lèle, et D est un dipôle dont le courant iD (t) est supposé borné.
b
iR iL iD
η(t) R L D
b
b
Figure 1.16 – Réseau R, L parallèle
diL
Puisque la tension aux bornes de l’inductance pure L vérifie uL = L , et du fait
dt
diL
de la loi des mailles RiR = uL , on peut écrire la loi des nœuds η(t) = iL + τ + iD
dt
L
où on a posé pour constante de temps τ = .
R
Z 0+
− +
Par intégration entre t = 0 et t = 0 , on obtient τ ∆iL = η(t)dt. Cette inté-
0−
grale est nulle sauf si la tension e(t) est proportionnelle une impulsion de Dirac ; on
en déduit un résultat général, moins utile que celui qui concerne les condensateurs
ci-dessus : le courant iL dans une bobine est en général une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine subit des variations bru-
tales d’alimentation. Ce résultat ne s’applique pas à une bobine idéale si la courant
d’alimentation comporte une impulsion de Dirac.
Ce résultat est plus utile si on considère le montage de Norton formé de η(t) et R

en parallèle par l’association d’un générateur de Thévenin de tension e(t) = Rη(t) et
de la résistance R, en série avec L. L’ensemble formé de R et L modélise alors une
bobine réelle, dont la résistance interne R ne peut en pratique jamais être négligée.
Nous retiendrons donc ce résultat pratique important :
Continuité du courant iL
X Le courant iL dans une bobine est toujours une fonction continue du
temps, même lorsque le réseau qui comporte cette bobine condensa-
teur subit des variations brutales d’alimentation, car la résistance interne
d’une bobine ne peut jamais être négligée.
Ce résultat s’applique sauf si le courant d’alimentation comporte une
impulsion de Dirac.
1.3 Régime harmonique forcé des réseaux linéaires
1.3.1 Principes d’étude

2 Régime transitoire et régime forcé : considérons un réseau de dipôles linéaires (y
compris les dipôles C et L) alimenté par un générateur libre imposant une tension ou
un courant sinusoı̈dal de pulsation ω. Toute grandeur électrique dans le réseau est
X dk x
alors régie par l’équation différentielle ah k = f (t), où f (t) = f0 cos (ωt + ϕ0 ).
dt
k
La solution générale de ce type d’équation comporte une solution générale de l’équa-
tion homogène associée ; nous supposerons ici le réseau stable et cette solution (régime
libre) est donc un régime transitoire, c’est-à-dire qu’il tend vers zéro au bout d’un cer-
tain temps, qui sera en pratique de l’ordre de quelques τ , si τ est la plus longue des
constantes de temps du circuit. On utilise parfois une évaluation à 3τ ou 5τ , tenant
compte du fait que exp (−3) = 5 × 10−2 et exp (−5) = 7 × 10−3 ; tout dépend en
réalité des conditions initiales.
Toutefois, une fois que ce régime transitoire a disparu, il ne reste qu’à déterminer une
solution particulière de l’équation complète. On recherchera cette solution sous forme
sinusoı̈dale, de même pulsation ω que celle à laquelle le réseau est forcé.
2 Impédances : considérons une grandeur sinusoı̈dale, x(t) = x0 cos (ωt + ϕ), solu-
X dk x
tion de l’équation différentielle ah k = f0 cos (ωt + ϕ0 ). La même égalité reste
dt
k
T π
vraie un quart de période plus tard, avec cos α + ω = cos α + = − sin α ;
4 2
X dk x′
ainsi, x′ (t) = x0 sin (ωt + ϕ) est solution de l’équation ah k = f ′ (t) avec
dt
k
f ′ (t) = f0 sin (ωt + ϕ0 ).
Combinant x = x(t) + jx′ (t) avec j 2 = −1, on constate la possibilité de remplacer
toute grandeur harmonique par une grandeur complexe :
X(t) = Xmax cos (ωt + ϕ) −→ X(t) = X 0 exp (jωt)

(1.9)
X 0 = Xmax exp (jϕ) X(t) = Re X(t)
En particulier, tout dipôle linéaire est soumis à une tension définie par u(t), parcouru
dk
par un courant i(t) ; puisque une dérivée relativement au temps k est représen-
dt
tée par (jω)k , toutes les équations différentielles linéaires deviennent des équations
algébriques linéaires, avec :
u=Zi Z = |Z| (1.10)
Dans la relation 1.10, Z porte le nom d’impédance complexe et Z celui d’impédance

réelle du dipôle étudié. On définit aussi les admittances, complexe et réelle, inverses
des impédances :
i=Y u Y = |Y | (1.11)
En particulier, les dipôles R = 1/G, L et C sont caractérisés par les relations :
1
ZR = R Z L = jLω ZC = (1.12)
jCω
2 Généralisation des théorèmes généraux : les règles de calcul dans C pour les impé-
dances complexes Z sont les mêmes que dans R pour les résistances ; tous les théorèmes
généraux établis plus haut :
X association de générateurs ;
X diviseurs de tension et de courant ;
X théorème de Millman ;
X théorème de superposition de Helmholtz ;
X théorème de Thévenin-Norton ;
restent donc valables dans le cadre des régimes harmoniques, à condition de remplacer
les forces électro-motrices e, courants de court circuits η, résistances r et conductances
g par leurs équivalents complexes e, η, Z et Y .
1.3.2 Diagrammes de Bode

2 Définitions : la représentation d’un quadrupôle linéaire en régime permanent est
maintenant donné par le schéma de la figure 1.17.
ie b b
i
b s
b
b
b
Zs
ue Ye kis Hue us
b b
b
b
b
Figure 1.17 – Quadrupôle linéaire en régime harmonique

us
Les grandeurs complexes H(ω) = (gain en tension en boucle ouverte, ou
u
e is =0
us
fonction de transfert), Z s (ω) = − (impédance de sortie, souvent nulle),
is u =0
e

ie i
Y e (ω) = (admittance d’entrée) et k(ω) = − e (coefficient de
ue i =0 us u =0
s e
retour, toujours nul dans les montages unidirectionnels) sont maintenant des fonctions
de la pulsation ω.
On appelle diagrammes de Bode‡ les deux représentations donnant le module et
l’argument de H(ω) en fonction de la pulsation ω ; pour des raisons de commodité,
on trace en fait deux diagrammes logarithmiques :
Diagrammes de Bode
X Les diagrammes de Bode d’un quadrupôle linéaire en régime harmonique
sont constitués du tracé :
• en gain, défini par G = 20 lg |H(ω)| en fonction de lg ω (en fait, on
ω
utilise presque toujours l’abscisse sans dimension lg x où x = , où ω0
ω0
est une pulsation caractéristique du système) ;
• en phase, défini par ϕ = arg (H(ω)) en fonction de lg ω (ou encore en
fonction de lg x).
Bien que G soit sans dimension, on lui attribue toujours le nom de déciBel (symbole
dB), unité nommée en hommage à Bell‡ .
2 Filtres du premier ordre : deux filtres simples du premier ordre doivent être iden-
H0
tifiés immédiatement, le filtre passe-bas H(ω) = où x = ω/ω0 et H0 > 0 et le
1 + jx
H0 jx
filtre passe-haut H(ω) = ; les diagrammes correspondants en gain et en phase
1 + jx
sont tracés sur les figures 1.18 et 1.19.
G G
0 lg x 0 lg x
G0 G0
−3 dB −3 dB
pe
dB
nt
20
e
+
−
20
e
nt
dB
pe
Passe-bas Passe-haut
Figure 1.18 – Diagrammes en gain de filtres du premier ordre
On y a noté G0 = 20 lg H0 et on remarque que, lorsque x = 1 donc ω = ω0 (c’est la

H0 π
pulsation de coupure), |H(ω)| = √ donc G ≃ G0 − 3 dB et ϕ = − .
2 4
1 dus
2 Lien avec les régimes transitoires : l’équation différentielle us + = H0 ue est
ω0 dt
H0
associée à la fonction de transfert du filtre passe-bas H(ω) = , et l’équation
1 + jω/ω0
1 dus H0 due H0 jω/ω0
différentielle us + = au filtre passe-haut H(ω) = ; dans les
ω0 dt ω0 dt 1 + jω/ω0
ϕ ϕ
0 lg x
+π/2
lg x
−π/2
Passe-bas 0 Passe-haut
Figure 1.19 – Diagrammes en phase de filtres du premier ordre
deux cas, la constante de temps τ de l’équation homogène associée au régime libre

vérifie donc la relation :
ω0 τ = 1 (1.13)
2 Filtres du second ordre : on doit encore identifier les formes canoniques de trois
fonctions de transfert du second ordre, correspondant respectivement aux filtres :
H0
– passe-bas H(ω) = , avec toujours H0 > 0 et x = ω/ω0 ; on pose ici
1 + 2jξx − x2
aussi ξ = 1/2Q ;
H0 2jξx H0
– passe-bande H(ω) = , qu’on écrit encore H(ω) =
1 + 2jξx − x2 1 + jQ (x − 1/x)
avec les mêmes notations que pour le passe-bas ;
−H0 x2
– passe-haut H(ω) = , qu’on peut obtenir à partir du filtre passe-bas
1 + 2jξx − x2
en faisant le changement jx → 1/jx, c’est-à-dire en changeant simplement le sens
de l’axe des abscisses en lg x, avec un déphasage de π.
L’allure du diagramme de Bode correspondant dépend de la valeur du coefficient
d’amortissement ξ ou, si on préfère, du facteur de qualité Q. Les tracés de la figure
1.20 détaillent le cas du filtre passe-bas du second ordre.
G ϕ
lg x lg x
G0 ξ = 0, 1 ξ = 0, 1
ξ = 10 ξ = 10
−π/2
p en
b
te −
ξ=1 ξ=1
40
B d
−π b
Figure 1.20 – Filtre passe-bas du second ordre

Le changement de facteur de qualité influe exclusivement sur le comportement au voi-

sinage de ω = ω0 ; en particulier, on observe la possibilité d’une résonance seulement
df
si la fonction f (x2 ) = (1 − x2 )2 + 4ξ 2 x2 présente un maximum, donc si 2
s’annule,
dx
1 1 p
ce qui impose ξ < √ ou Q > √ et x = x0 = 1 − 2ξ 2 .
2 2
On en déduit simplement l’allure (figure 1.21) des diagrammes correspondant au filtre
passe-haut, avec la même influence du facteur d’amortissement ; nous poursuivrons
donc l’étude des seuls filtres passe-bas, puisque les résultats concernant les filtres
passe-haut s’en déduisent.
G ϕ
lg x
bπ
ξ = 0, 1 G0 ξ = 0, 1
ξ = 10 ξ = 10
π/2
B
b
d
40
ξ=1 ξ=1
te +
pen
lg x
Figure 1.21 – Filtre passe-haut du second ordre
Lorsque le filtre passe-bas est non résonant, c’est-à-dire pour ξ assez élevé, on peut
H0
factoriser la fonction de transfert H(ω) = , avec donc deux
(1 + jω/ω1 ) (1 + jω/ω2 )
1 1
pulsations de coupure successives ω1 = et ω2 = , où τ1 et τ2 sont aussi les
τ1 τ2
constantes de temps du régime transitoire apériodique associé à l’équation différen-
ξ dus 1 d2 us
tielle us +2 + = H0 ue ; on retrouve ainsi le lien entre régime transitoire
ω0 dt ω02 dt2
et régime forcé, analogue au cas des filtres d’ordre 1 :
ω 1 τ1 = ω 2 τ2 = 1 (1.14)
Lorsque le filtre passe-bas est résonant, pour ξ assez faible, on peut définir une bande
Hmax
passante à −3 dB en cherchant les valeurs de x = ω/ω0 telles que H = √ , avec
2
H = |H|. Rappelons d’abord que le maximum de H est atteint pour x = ωr /ω0
p H0
donné par x = 1 − 2ξ 2 ≃ 1 donc Hmax ≃ ; on cherche donc les solutions de
2ξ
(x2 − 1)2 + 4ξ 2 x2 = 8ξ 2 ; les deux solutions vérifient sont proches de 1, de part et
ω0
d’autre de x0 avec pour écart ∆x ≃ 2ξ, ce qu’on peut encore écrire ∆ω ≃ : le
Q
facteur de qualité mesure l’acuité de la bande passante.
Dans ce cas, le régime transitoire est pseudo-périodique amorti, de pseudo-pulsation

p 2Q
ω = ω0 1 − ξ 2 , avec la constante de temps d’amortissement τ = , ce qui montre
ω0
encore une fois le lien entre le régime harmonique forcé et le régime transitoire :
ω0 2
ω ≃ ωr ≃ ω0 ∆ω ≃ ≃ (1.15)
Q τ
On peut faire à part l’étude du filtre passe-bas, car celui-ci est toujours résonant, avec
une pulsation de résonance ωr exactement égale à ω0 , et une bande passante à −3 dB
ω0
exactement égale à ∆ω = , quelle que soit la valeur du facteur de qualité ou du
Q
coefficient d’amortissement ξ. Toutefois, celui-ci influe notablement sur la forme du
diagramme de Bode, comme le montre la figure 1.22.
G ϕ
lg x lg x
G0
ξ = 0, 1
ξ = 10
−π/2
b
dB
pe
ξ = 0, 1
nt
ξ=1
20
e
+
−
20
e
nt
dB
pe
−π b
Figure 1.22 – Filtre passe-bande du second ordre
Le régime transitoire associé à ces diagrammes de Bode est, selon la valeur du facteur
de qualité, apériodique, critique ou pseudo-périodique ; dans ce dernier cas, il existe
un lien simple entre pseudo-pulsation ω et pulsation de résonance ωr d’une part, et
entre constante de temps τ et facteur de qualité Q d’autre part, sous la forme :
ω0 2
ω ≃ ωr = ω0 ∆ω = = (1.16)
Q τ
1.4 Puissance et énergie électriques
1.4.1 Échanges d’énergie d’un dipôle

2 Couplage énergétique au réseau : considérons un dipôle D modélisé dans la conven-
tion des récepteurs. Lors de la durée dt, la charge électrique dq = idt traverse ce dipôle
et son potentiel passe de VE à VS = VE − ur , avec donc une variation d’énergie po-
tentielle des charges égale à dEp = −dqur (voir la figure 1.23).
dq
E
b
Générateur D ur
b
dq
Figure 1.23 – Échanges de puissance
L’énergie perdue par les charges électriques est, pour assurer la conservation de l’éner-
gie totale, transférée au dipôle D, qui reçoit dont le travail électrique δWr = −dEp et
δWr
une puissance électrique Pr = .
δt
On retiendra, en convention des récepteurs, les expressions de l’énergie et de la puis-
sance électrique reçues par un dipôle :
δWr = Pr × dt Pr = u r × i (1.17)
En convention des générateurs, les expressions analogues δWg = Pg × dt et Pg = ug i

désignent bien sûr le travail et la puissance fournis par le dipôle au reste du réseau.
2 Quelques cas particuliers : envisageons les échanges d’énergie des résistances R,
condensateurs C et bobines d’induction L.
Dans le cas d’un dipôle résistif, ur = Ri donc Pr = Ri2 > 0 : la puissance est
exclusivement fournie au dipôle par le reste du réseau, avant que le dipôle ne la
dissipe sous forme thermique. On parle alors d’effet Joule pour cette dégradation de
l’énergie électrique.
dur dEe
Dans le cas d’un condensateur, i = C donc Pr = où on a noté l’énergie
dt dt
1 1 q2
électrostatique emmagasinée par le condensateur Ee = Cu2 = . Le condensateur
2 2C
peut donc être considéré comme un accumulateur d’énergie (pendant les phases de
charge, lorsque ur et i sont de même signe), susceptible de restituer cette énergie
(pendant les phases de décharge, lorsque ur et i sont de signes contraires).
di dEm
De même, dans le cas d’une bobine, ur = L donc Pr = où on a noté l’énergie
dt dt
1
magnétique emmagasinée par la bobine Em = Li2 . La bobine peut aussi être consi-
2
dérée comme un accumulateur d’énergie (pendant les phases de montée du courant),
susceptible de restituer cette énergie par la suite.
Échanges énergétiques des dipôles

X Une résistance R reçoit en permanence la puissance P = Ri2 de la part
du reste du réseau. Cette puissance est ensuite dissipée sous forme ther-
mique ; c’est l’effet Joule.
Un condensateur et une bobine sont des accumulateurs réversibles d’éner-
1 1
gie, avec les expressions Ee = Cu2 et Em = Li2 respectivement pour
2 2
les énergies électrostatique et magnétique.
Malgré leur ressemblance apparente, on ne doit jamais confondre P = Ri2 (une

1 1
puissance, en watt) avec Ee = Cu2 ou Em = Li2 (des énergies, en joule).
2 2
2 Énergie et conditions initiales : en régime variable, on a vu que, sauf cas particulier,

la tension uC aux bornes d’un condensateur et le courant iL dans une bobine sont
des fonctions continues du temps. On peut donner une interprétation énergétique de
ce résultat : une discontinuité de uC ou de iL se traduisent par une discontinuité de
l’énergie Ee ou Em correspondante, ce qui ne peut exister qu’en cas d’apport d’une
puissance infinie.
On ne peut envisager une telle puissance infinie que dans le cadre d’une modélisation
excessivement simplifiée d’un réseau électrique ; ainsi, l’absence de toute résistance
permet le passage d’un courant infini ; ou encore l’emploi d’un générateur fournissant
une impulsion idéalisée (impulsion de Dirac) se traduit par une tension infinie.
Si on exclut ces cas de figure, on doit bien observer des variations continues au cours
du temps des grandeurs énergétiques Ee et Em , donc de uC et iL .
1.4.2 Puissance en régime harmonique

2 Puissance instantanée et puissance moyenne : considérons un dipôle linéaire quel-
conque alimenté en régime harmonique de pulsation ω, de sorte que la tension à ses
bornes (en convention récepteur) et le courant qui le traverse s’expriment sous la
forme u(t) = Umax cos (ωt + ϕu ) et i(t) = Imax cos (ωt + ϕi ).
La puissance instantanée fournie à ce dipôle par le reste du réseau prend alors la
forme P (t) = Umax Imax cos (ωt + ϕu ) cos (ωt + ϕi ), ce qu’on peut encore écrire comme
Umax Imax
somme de deux termes, P (t) = [cos (2ωt + ϕu + ϕi ) + cos (ϕu − ϕi )].
2
T π
Le premier terme est périodique, de période = ; il est de moyenne nulle. Le second
2 ω
terme correspond donc à la puissance moyenne consommée par le dipôle, qu’on écrit :
Umax Imax
hP i = √ √ cos |ϕu − ϕi | (1.18)
2 2
√
√ efficaces : dans l’expression (1.18), les termes Ueff = Umax / 2 et
2 Grandeurs
Ieff = Imax / 2 portent respectivement les noms de tension efficace ou courant efficace.
On utilise aussi la notation URMS = Ueff et IRMS = Ieff , où RMS désigne la racine du
carré moyen (root of the mean square) ; plus généralement, pour toute fonction, réelle
ou complexe, T -périodique, on définit ainsi :
Z τ +T
2 1 2
fRMS = f (t) dt (1.19)
T τ
En effet, dans le cas particulier d’une grandeur sinusoı̈dale f (t) = f0 cos ωt, on re-
f0
trouve bien fRMS = √ ; toutefois, on prendra garder à ne pas généraliser à d’autres
2
formes de signaux (cf. figure 1.24), périodiques mais de moyenne f¯ non nulle.
2 Facteur de puissance : on peut alors réécrire l’expression (1.18) en faisant intervenir
le facteur de puissance cos ϕ selon :
f f f
f¯ f¯ f¯
fa t fa t fa t
r q r
f2 f2
fRMS = f¯2 + a fRMS = f¯2 + fa2 fRMS = f¯2 + a
2 3
Figure 1.24 – Grandeurs RMS pour différents signaux périodiques
hP i = Ueff Ieff cos ϕ ϕ = ϕ u − ϕi (1.20)
2
Ainsi, dans le cas d’un dipôle résistif, ϕ = 0 et Ueff = RIeff donc hP i = RIeff ; pour
une bobine ou un condensateur, ϕ = ±π/2 donc hP i = 0.
On peut généraliser ces résultats en notant que l’impédance Z = u/i du dipôle a
Umax Ueff
pour module Z = = et pour argument arg Z = arg u − arg i = ϕ ; ainsi,
Umax Ieff
2
hP i = ZIeff cos ϕ, où on reconnaı̂t Z cos ϕ = Re(Z) ; on montre de même une relation
analogue avec Y = 1/Z :
2 2
hP i = Re(Z)Ieff = Re(Y )Ueff (1.21)
On peut encore exprimer la puissance moyenne consommée par le dipôle en remar-

quant que u = Umax exp (j(ωt + ϕu )), i∗ = Imax exp (−j(ωt + ϕi )) d’où on déduit
ui∗ = Umax Imax exp (j(ϕu − ϕi )), ce qui permet d’écrire :
1 ∗
hP i = Re(P ) P = ui (1.22)
2
On remarquera que le produit ui est dépourvu de toute signification physique. Plus

généralement, on n’utilisera les notations complexes que pour les grandeurs linéaires,
jamais pour les produits ou plus généralement pour les grandeurs énergétiques.
Notons que la plupart des appareils électriques sont conçus pour fonctionner à fré-
quence et tension efficaces donnés (par exemple, f = 50 Hz et Ueff = 220 V pour le
réseau domestique) ; la valeur de cos ϕ dépend alors exclusivement de leur constitution
électrocinétique, c’est-à-dire de leur impédance.
Ainsi, un moteur électrique est constitué de bobinages (stator) et son inductance est
essentiellement celle d’une bobine donc Im(Z) > 0 et ϕ > 0.
La conséquence d’une valeur élevée de |ϕ| (donc cos ϕ < 1) pour hP i et Ueff don-
nés, c’est une valeur plus élevée que nécessaire de Ieff et, donc, des pertes par effet
Joule dans les fils d’amenée du courant. C’est pour limiter ces pertes en ligne que les
fournisseurs d’électricité imposent des valeurs minimales de cos ϕ à toute installation.
2 Adaptation d’impédance : considérons enfin un montage quadrupôle linéaire uni-
directionnel quelconque, alimenté par la sortie d’un autre montage de ce type, et
alimentant lui-même l’entrée d’un montage ultérieur (cf. figure 1.25).
ie,n is,n
b b b b
b
Z s,n−1 Z s,n
ue,n
us,n
H n−1 ue,n−1 Y e,n H n ue,n Y e,n+1
b b b
b
Étage n − 1 Étage n Étage n + 1
Figure 1.25 – Transferts de puissance entre étages successifs
Dans une telle installation, le courant de sortie is,n de l’étage n est le courant d’entrée
ie,n+1 de l’étage ultérieur, et de même pour les tensions us,n = ue,n+1 . Il n’en va pas de
même pour les puissances : ce qui est fourni par le générateur de tension en = H n ue,n
est en partie dissipé dans l’impédance de sortie Z s,n de l’étage n, et en partie seulement
utilisé dans l’admittance d’entrée Y e,n+1 de l’étage n + 1.
On assure l’adaptation d’impédance de la chaı̂ne électronique si, pour chaque étage,
l’impédance d’entrée Z e,n+1 est choisie de sorte à recevoir la plus grande puissance
possible de la part du générateur (en , Z s,n ) qui l’alimente. On peut écrire la puissance
1
moyenne transférée d’étage en étage sous la forme hP i = Re (ui∗ ) avec u = Z e,n+1 i
2
en
et i = .
Z e,n+1 + Z s,n
Notons alors en = e0 exp (jψ), Z s,n = Xg +jYg et Z e,n+1 = X +jY , de façon à obtenir

e2 X + jY
hP i = 0 Re : le problème de l’adaptation d’impédance
2 (X + Xg )2 + (Y + Yg )2
X
consiste à rechercher le maximum de la fonction f (X, Y ) = ,
(X + Xg )2 + (Y + Yg )2
sachant qu’en pratique X > 0, Xg > 0 tandis que Y comme Yg sont quelconques.
Un maximum sera évidemment toujours atteint en fonction de Y si Y = −Yg ; il reste
X df
alors à rendre maximal f (X) = ; la solution de = 0 est X = Xg . Dans
(X + Xg )2 dX
e2
ce cas, la puissance transférée à l’étage n + 1 est égale à hP i = 0 , exactement égale
2X
à celle dissipée dans l’impédance de sortie de l’étage n puisque les deux impédances
ont même partie réelle.
Adaptation d’impédance
X Il y a transfert maximal de puissance du générateur de sortie d’un étage
à l’impédance d’entrée de l’étage suivant lorsque les deux impédances
(de sortie et d’entrée) successives sont des complexes conjugués.
En pratique, ces impédances sont choisies si possibles toutes réelles, donc
toutes égales.
On dispose alors de chaı̂nes électroniques normalisées, comme par exemple avec les va-
leurs Z e = Z s = 50 Ω en électronique de laboratoire (connecteurs BNC, électronique
aux normes IEEE, etc.) ou Z e = Z s = 75 Ω (télévision, vidéo).
Il est important de retenir la valeur Z e = Z s = 50 Ω ; elle correspond aux impé-

dances de sortie de tous les générateurs que nous utiliserons en travaux pratiques,
aux impédances de câbles, etc.
Ce qu’il faut absolument savoir
Dans un réseau linéaire, toute grandeur électrique vérifie une équation différen-
X dk x
tielle ak k = f (t) ; si f (t) = 0 le régime est libre.
dt
k
Pour un réseau stable, toutes les racines rj de l’équation caractéristique vérifient

Re(rj ) < 0 ; pour les ordres 1 ou 2, tous les ak ont alors même signe.
On définit l’échelon de Heaviside H(t < 0) = 0, H(t > 0) = 1 ou de l’impulsion
dH R +β
de Dirac δ(t) = , avec δ(t 6= 0) = 0 et −α δ(t)dt = 1.
dt
dx
Une équation stable d’ordre 1 s’écrit τ + x(t) = f (t) ; τ est la constante de
dt Z ǫ
temps et la variation de x à l’instant t = 0 vérifie τ ∆x = lim f (t)dt.
ǫ→0 −ǫ
d2 x dx
Une équation stable d’ordre 2 s’écrit 2
+ 2ξω0 + ω02 x(t) = f (t) ; ω0 est
dt dt
la pulsation propre et ξ = 1/2Q le coefficient d’amortissement, Q le facteur de
qualité. Les variationsZ de x et de ẋ à l’instantZt = 0 vérifient les deux équations
ǫ ǫ
dF
∆ẋ + 2ξω0 ∆x = lim f (t)dt et ∆x = lim F (t)dt, où f = .
ǫ→0 −ǫ ǫ→0 −ǫ dt
uC (t) et iL (t) sont continus, sauf branchement direct ou impulsion en entrée.
H0 H0 jx
Filtres du premier ordre : H = passe-bas, H = passe-haut, avec
1 + jx 1 + jx
x = ω/ω0 . Pulsation de coupure à −3 dB, ω0 .
H0 −H0 x2
Filtres du second ordre : H = 2
passe-bas, H =
1√+ 2jξx − x 1 + 2jξx − x2
passe-haut, résonants si ξ < 1/ 2 ; dans ce cas, ωr ≃ ω0 et ∆ω ≃ ω0 /Q.
H0
Hc = passe-bande, ωr = ω0 et ∆ω = ω0 /Q.
1 + jQ(x − 1/x)
Zk
En régime permanent ou forcé, diviseurs de tension (série) uk = u ; diviseurs
Z
P
Y Y k uk − i0
de courant (parallèle) ik = k i ; théorème de Millman u0 = kP
Y kYk
pour le potentiel u0 en un nœud relié à des points de potentiels uk fixés (i0 est le
courant de fuite) ; théorème de superposition pour plusieurs générateurs libres ;
théorème de Thévenin-Norton, eeq = uvide , η eq = icourt-circuit et Z eq = Z passivé .
Pour un quadrupôle linéaire :
b b b
b
b
b
ie Zs is
ue Ye kis Hue us
b b
b
b
b
Puissance : instantanée P = u(t) × i(t), moyenne hP i = Re(P ) en régime har-

2 2
monique avec P = u × i∗ /2, donc hP i = Ueff Ieff cos ϕ = Re(Z)Ieff = Re(Y )Ueff .
Chapitre 2
Électronique
2.1 Signaux et opérateurs
2.1.1 Signaux
x
2 Signaux analogiques : l’objectif de l’électronique (( signal ))
est le transport, éventuellement à longue distance, d’informa-
tions contenues dans la forme de la fonction x(t) ; nous pren-
drons ici pour exemple le signal x(t) ci-contre.
t
Il peut arriver que la tension u(t) = u0 x(t) ou le courant
i(t) = i0 x(t) représentent directement le signal à transporter ; toutefois, ce cas est
exceptionnel car les fréquences d’oscillation du signal ne sont a priori pas adaptées
au support de transport de l’information (ondes hertziennes, câble, fibre optique, etc.) ;
de plus, on peut souhaiter effectuer de plus un multiplexage, c’est-à-dire transporter
sur la même ligne plusieurs signaux simultanément.
On utilise alors la modulation d’une grandeur électrique choisie en fonction du sup-
port physique, grandeur dite porteuse, par le signal x(t). À l’arrivée, l’opération de
démodulation restitue le signal x(t).
2.1.2 Modulation
2 Modulation d’amplitude : supposons par exemple que le support de transport

d’information soit transparent à la fréquence fp , dite fréquence porteuse ; ce terme si-
gnifie que le support transporte l’information avec une atténuation et une déformation
négligeables.
U0 = cte cos ωp t réalisé par oscillateur, cf. + loin
+ × u(t) = (U0 + αx(t)) cos ωp t

αx(t)
Figure 2.1 – Modulation d’amplitude

On appellera porteuse la tension u(t) = U0 cos ωp t avec ωp = 2πfp . On transporte le

signal en modulation d’amplitude (AM) en réalisant u(t) = (U0 + αx(t)) cos ωp t, où α
sera choisi assez faible pour que l’amplitude Um (t) = U0 +αx(t) soit toujours positive.
Après modulation, le signal x(t) présenté plus haut prend alors l’allure de la figure 2.2 ;
on remarque qu’il est impératif que les variations d’amplitude du signal modulant x(t)
doivent rester lentes devant les variations de la porteuse, pour que les deux parties
du signal modulé u(t) (fréquence et amplitude) restent faciles à distinguer lors de
l’opération de démodulation.
u
signal modulant x(t)
signal modulé u(t)
Figure 2.2 – Signal modulé en amplitude
Si la porteuse est assez peu déformée par la modulation, on pourra montrer qu’elle
peut être considérée comme une combinaison linéaire de signaux sinusoı̈daux dont les
fréquences s’étendent de part de d’autre de la fréquence fp de la porteuse. L’étendue
ainsi occupée dans l’espace des fréquences porte le nom de largeur de bande ; plus
celle-ci est réduite, plus on peut utiliser le même support pour transporter un grand
nombre de signaux simultanés.
2 Démodulation : le schéma de démodulation (pour restituer x(t) à partir d’un
signal comportant plusieurs grandeurs simultanément modulées en amplitude) figure
sur le schéma 2.3 ; on utilise un filtre passe-bande sélectif (ou tuner ) pour sélectionner
la fréquence fp , un détecteur de crête DtC (pour mesurer l’amplitude Um = U0 +αx(t)
à partir de u(t)) puis un filtre passe-haut (pour éliminer la composante constante U0
et restituer la partie variable αx(t)).
u(t) = (U0 + αx(t)) cos ωp t DtC αx(t)
Figure 2.3 – Démodulation d’amplitude
Le schéma de modulation (pour obtenir u(t) à partir de x(t)) figure sur le schéma
2.1 ; on utilise un additionneur et un multiplieur.
Le principe même de l’ensemble modulation, démodulation en amplitude explique
l’utilité de divers montages linéaires (additionneurs, soustracteurs, filtres) ou non
linéaires (détecteur de crête, multiplieurs) qui seront présentés ou étudiés plus loin.
2 : Électronique 31
2 Modulation de fréquence : la modulation d’amplitude est de moins en moins

utilisée dans le domaine industriel car les signaux modulés AM sont détériorés par
toute diminution accidentelle d’amplitude du signal transporté (par exemple, par le
passage sous un tunnel lors de la réception hertzienne, etc.)
On utilise à la place la modulation de fréquence (FM), dans laquelle le signal porteur de
pulsation ωp est modulé en un signal de la forme u(t) = U0 cos (ωp + αx(t)) t, le taux
de modulation α étant assez faible pour que la pulsation instantanée Ω(t) = ωp +αx(t)
reste voisine de ωp ; ainsi, le signal peut continuer à n’occuper qu’une largeur de bande
réduite en fréquence.
u
signal modulant x(t)
signal modulé u(t)
Figure 2.4 – Signal modulé en fréquence
La modulation de fréquence consiste donc à réaliser un oscillateur à fréquence variable,

celle-ci étant contrôlée par le signal x(t) ; contrairement au cas de la modulation
d’amplitude, on ne reconnaı̂t pas aisément dans la forme du signal modulé en fréquence
(cf. figure 2.4) la forme exacte de x(t).
La démodulation de fréquence consiste en fait à réaliser une mesure de fréquence : la
pulsation Ω(t) ainsi mesurée contient dans sa partie variable αx(t) le signal désiré.
2.1.3 Opérateurs
2 Opérateurs non linéaires : certains ont été cités ci-dessus : multiplieurs et détecteurs
de crête en particulier. On sait aussi réaliser, par exemple au moyen d’amplificateurs
opérationnels, des comparateurs à hystérésis. Certains montages non linéaires seront,
dans ce qui suit, présentés à titre d’exercice seulement ; ils ne figurent toutefois pas
en tant que tels au programme.
2 Opérateurs linéaires : les opérateurs linéaires évoqués ci-dessus peuvent tous,
au moins en principe, être réalisés au moyen d’amplificateurs opérationnels, même si
on utilise aussi d’autres composants pour pallier aux limitations des amplificateurs
opérationnels. Rappelons que ces limitations sont de deux ordres :
– limitation en fréquence ; la bande passante à −3 dB de l’amplificateur opérationnel
lui-même est très basse (inférieure à 1 kHz) ; pour les montages à base d’amplifi-
cateur opérationnel, on peut augmenter la fréquence d’utilisation jusqu’à environ
100 kHz, la contrepartie de la montée en fréquence étant une diminution du gain
en amplitude. Cette perte de gain n’est pas en général une contrainte sévère.
– limitation en courant, donc en puissance : le courant de sortie d’un amplificateur
opérationnel ne peut pas dépasser 10 à 20 mA, sous peine de saturation ; sous une
tension de sortie elle-même limitée à environ 10 V, l’appareil ne peut pas délivrer

plus de 100 mW.
2 Filtres et spectres de fréquence : l’importance du filtrage (passe-bas, passe-bande
ou passe-haut) est déjà apparue plus haut lors de la présentation de principe de la
démodulation d’amplitude par exemple. Considérons le signal modulé le plus simple
possible, le signal x(t) à transmettre étant lui-même sinusoı̈dal, x(t) = x0 cos ωt, ce qui
correspond à un signal modulé u(t) = (U0 + αx0 cos ωt) cos ωp t avec, conformément à
la remarque faite plus haut, ωp ≫ ω.
Une simple opération trigonométrique montre qu’on peut aussi écrire ce même signal
αx0
sous la forme u(t) = U0 cos ωp t + [cos(ωp + ω)t + cos(ωp − ω)t]. On peut alors
2
représenter (cf. figure 2.5) le spectre en fréquence du signal modulé, faisant apparaı̂tre
l’amplitude de chaque terme harmonique en fonction de la fréquence correspondante.
a
U0
αx0 /2
f
fp
fp − f fp + f
Figure 2.5 – Spectre en fréquence d’un signal simple modulé AM
Ce spectre fait apparaı̂tre la largeur de bande occupée par le signal (de largeur 2f de
part et d’autre de la fréquence centrale fp ). Nous verrons ultérieurement comment les
méthodes d’analyse de Fourier permettent de généraliser le principe de cette étude à
des formes de signaux plus complexes.
Les filtres (passe-bande, passe-bas ou passe-haut) permettent d’opérer des modifica-
tions sur le spectre de fréquences d’un signal ; on peut simplement comprendre le
rôle du filtre en superposant l’allure du diagramme de Bode en gain d’un filtre avec
le spectre de fréquence du signal filtré ; ainsi, pour économiser de la bande passante
tout en transportant la même quantité d’information, on peut appliquer à un signal
modulé en amplitude un filtre passe-haut non résonant, comme sur la figure 2.6 ; sa
fréquence de coupure sera choisie entre fp − f et fp .
Il est à noter que le schéma de la figure 2.6 est strictement qualitatif. En particulier,
le filtrage est considéré comme presque idéal : les composantes filtrées disparaissent
complètement, les composantes non filtrées sont maintenues presque intégralement.
Ce n’est pas le genre de situation auquel nous a habitué l’étude des filtres du second
ordre (coupure à ±40 dB par décade au maximum). On n’oubliera pas ici que les
filtres réels de l’électronique industrielle peuvent être d’ordre bien plus élevé. Un filtre
d’ordre 8 peut ainsi réaliser une coupure à ±160 dB par décade.
Le signal obtenu en sortie
n du montage dont le principe
o est décrit sur la figure 2.6
αx0
s’écrit alors u(t) ≃ H0 U0 cos ωp t + cos(ωp + ω)t , si H0 est le gain (constant)
2
du filtre dans sa partie passante. on dit ici qu’on a récupéré une bande latérale unique
(BLU) du signal modulé.
a a
Diagramme de
Bode du filtre
f f
fp fp
fp − f fp + f fp + f
avant filtrage après filtrage
Figure 2.6 – Exemple de filtrage : modulation BLU
Plus généralement, si on applique un filtre linéaire de fonction de transfert complexe

H(ω) = H(ω) exp (jϕ(ω)) à un signal composite, c’est-à-dire comportant plusieurs
pulsations
Xdifférentes, on pourra appliquer le théorème de superposition à ce signal
ue (t) = ak cos(ωk t + φk ) pour déterminer le signal de sortie correspondant, chaque
k
pulsation étant filtrée, c’est-à-dire, amplifiée d’un facteur H(ωk ) et déphasée d’un
facteur ϕ(ωk ), indépendamment des autres :
Filtrage d’un signal composite

X L’application d’un dispositif linéaire, défini par sa fonction de transfert
H(ω) =X H(ω) exp (jϕ(ω)) à un signal d’entrée composite, de la forme
ue (t) = ak cos(ωk t+φk ) fournit en sortie du dispositif un autre signal
k
composite, chaque fréquence étant amplifiée (si |H(ωk )| > 1) ou atténuée
(si |H(ωk )| < 1) et déphasée
X (si ϕ(ωk ) 6= 0) séparément, avec pour signal
de sortie global us (t) = H(ωk )ak cos(ωk t + φk + ϕ(ωk )).
k
2 Oscillateurs : la réalisation d’oscillateurs spontanés fait aussi partie des fonctions

de l’électronique analogique. Un oscillateur spontané est un dispositif qui génère en
sortie un signal périodique, par exemple sinusoı̈dal ; on trouve aussi des oscillateurs
fournissant des signaux périodiques en créneaux, en dents de scie, etc.
u u
t t
Osc xe OC
T = T (xe )
Figure 2.7 – Oscillateurs sinusoı̈daux électroniques
Un tel montage ne présente pas forcément de bornes d’entrée (oscillateur spontané

Osc, cf. figure 2.7 à gauche), ou bien le signal d’entrée permet de contrôler certaines
caractéristiques (amplitude, fréquence, phase) du signal de sortie généré (oscillateur

contrôlé OC, par exemple en fréquence, cf. figure 2.7 à droite).
On peut réaliser un oscillateur sinusoı̈dal à partir d’un filtre quelconque du second
N (ω)
ordre, régi par la fonction de transfert H(ω) = , si on peut
1 + 2jξω/ω0 − ω 2 /ω02
contrôler la valeur de ξ ; en effet, l’équation différentielle qui régit le régime libre
1 d2 us 2ξ dus
associé s’écrit 2 2
+ + us (t) = 0.
ω0 dt ω0 dt
Si l’amortissement est assez faible, la solution générale de cette équation prend la
forme d’un régime pseudo-périodique très faiblement amorti, caractérisé par la pseudo-
pulsation ω ≃ ω0 (figure 2.8 à gauche) ; si ξ = 0, on réalise un oscillateur harmonique
strictement sinusoı̈dal, c’est-à-dire que le système cesse d’être stable ; on parle d’ac-
crochage des oscillations (figure 2.8 au centre).
u u u
t t t
ξ > 0, faible ξ=0 ξ<0
Figure 2.8 – Effet de l’amortissement sur un régime libre du second ordre
Ce cas (( idéal )) ξ = 0 ne peut en pratique jamais être réalisé de manière durable, car
on ne peut pas réaliser une égalité parfaite de paramètres physiques ; dès qu’on pense
y être arrivé, de petites modifications inévitables nous en éloignent. Ces modifications
sont dues par exemple aux oscillations elles-mêmes : le réseau dissipe de la puissance
par effet Joule dans ses résistances internes, s’échauffe, et perd l’accrochage.
À partir de là, soit ξ redevient légèrement positif, et les oscillations s’atténuent, soit ξ
redevient légèrement négatif. Dans le cas où ξ < 0, les oscillations sont alors amplifiées
avec une amplitude exponentiellement croissante (figure 2.8 à droite) ; il intervient
en général des comportements non linéaires (saturations, par exemple) qui limitent
la croissance de ces oscillations, et c’est en général dans ce cadre que sont réalisés
les oscillateurs quasi-sinusoı̈daux les plus simples. L’allure d’un signal oscillant avec
amplification et saturation est représenté sur la figure 2.9.
u
Figure 2.9 – Oscillateur quasi-sinusoı̈dal avec amplification et saturation

L’étude de la condition d’accrochage des oscillations revient en pratique à l’étude du

1 d2 us 2ξ dus
signe des différents termes de l’équation différentielle 2 2
+ + us (t) = 0,
ω0 dt ω0 dt
et en particulier au changement de signe du terme du premier ordre. On ne s’étonnera
pas de ce résultat si on garde en mémoire le réseau du second ordre le plus simple
possible, à savoir un réseau R, L, C série pour lequel la charge q d’une des armatures
d2 q dq q
du condensateur vérifie l’équation de régime libre L 2 + R + = 0. L’étude
dt dt C
formelle réalisée ci-dessus montre que :
– si R > 0, ce réseau est stable et présente des oscillations amorties ;
– si R = 0 (situation qui ne peut être réalisée physiquement sans l’apport d’un réseau
actif), ce réseau est instable et présente des oscillations spontanées ; ces oscillations
elles-mêmes ne sont en général pas durables du fait de la difficulté de maintenir la
relation exacte R = 0.
– si enfin on sait simuler R < 0, le bilan énergétique montre que le réseau équivalent
à R < 0 fournit de l’énergie au réseau (puissance Pr = Ri2 6 0, ∀t) qui dissipe
cette énergie en fournissant des oscillations amplifiées de son signal de sortie.
On remarque que le régime d’oscillation étudié est un régime libre, totalement in-
dépendant d’un éventuel signal d’entrée ue ; le résultat ne dépend d’ailleurs pas du
numérateur N (ω) de la fonction de transfert. On peut aussi retrouver les conditions
d’oscillations en considérant simplement cette fonction H(ω) ; la condition d’accro-
chage (ξ = 0, ω = ω0 ) est en effet équivalente à l’annulation du dénominateur de
la fonction de transfert 1 + 2jξω/ω0 − ω 2 /ω02 ; qualitativement, on dira que lorsque
H = |H(ω)| → ∞, un montage électronique devient instable et réalise un oscillateur
spontané pour la seule pulsation ω qui réalise cette condition.
On peut d’ailleurs considérer que ces oscillations ont pour origine l’amplification in-
définie des inévitables petites variations des grandeurs électriques du montage (par
exemple dues à la présence d’une alimentation, aux effets d’antenne, etc.) ; cette ampli-
fication infinie n’a lieu que pour la seule pulsation ω pour laquelle H = |H(ω)| → ∞.
2.1.4 Généralisation : régimes harmonique et transitoire
2 Équations différentielles et fonction de transfert : l’évolution d’une grandeur élec-

trique x(t) dans un réseau
X linéaire est en général régie par une équation différentielle ;
toutefois, si x(t) = ak cos (ωk t + φk ) est une somme de grandeurs sinusoı̈dales,
k
chaque composante harmonique xk = ak cos (ωk t + φk ) peut être traitée en utilisant
le formalisme complexe (impédances, admittances, etc.), c’est-à-dire en remplaçant
les dérivées par une multiplication par jωk et les primitives par une division par jωk .
Nous montrerons au prochain chapitre le cadre (séries et transformées de Fourier)
dans lequel on peut montrer l’équivalence entre les deux points de vue ; en particu-
lier, on peut retrouver l’équation différentielle à partir de la fonction de transfert, en
remplaçant chaque terme jω par une dérivée.
Lien entre régime transitoire et régime harmonique
X Si les deux grandeurs complexes xe et xs sont reliées par une fonction de
transfert, fraction rationnelle
P en jω, alors on peut passer de la fonction
k
xs N k (jω)
de transfert H(ω) = = Pk k
à l’équation différentielle reliant
xe k Dk (jω)
X dk xs X dk xe
xe (t) et xs (t) en régime quelconque, Dk k = Nk k .
dt dt
k k
2 Stabilité d’un système linéaire : adoptons la notation de PLaplace p = jω pour

k
N k p
écrire la fonction de transfert d’un système linéaire, H(p) = Pk k
. Alors, l’équa-
k Dk p
tion différentielle d’évolution de la sortie en régime libre (donc pour xe = 0) s’écrit
X dk xs X
Dk k = 0 ; l’équation caractéristique associée s’écrit donc Dk pk = 0 et ses
dt
k k
solutions sont les nombres complexes pi , où i = 1, . . . , n si n est le degré de l’équation
différentielle.
2 Pôles de la fonction de transfert : l’identité des outils mathématiques utilisés en
Électronique et dans le cours de Sciences Industrielles de l’Ingénieur peut être illustrée
dans le cadre de l’étude générale de la stabilité des systèmes linéaires.
On appelle pôles de la fonction de transfert les n nombres complexes wi annulant le
dénominateur de H(ω), c’est-à-dire tels que |H(wi )| → ∞. Ces nombres ne s’inter-
prètent en termes de pulsations ωi = wi que si wi ∈ R+ .
Notant aussi jωi = pi et pi = ai + jbi (parties réelle et imaginaire) pour i = 1, . . . , n,
on vient de montrer que le régime libre (solution générale de l’équation homogène
associée) est une combinaison linéaire de termes exp (pi t) = exp (ai t) exp (jbi t) ; la
stabilité du système impose donc ai < 0 ; ceci revient à dire que Im(wi ) > 0.
Stabilité d’un système linéaire
X • En Physique : un système linéaire de fonction de transfert H(ω) est
stable si et seulement si les pôles wi de la fonction de transfert ont tous
leur partie imaginaire strictement positive.
• En Sciences Industrielles de l’Ingénieur : un système linéaire de fonction
de transfert H(p) est stable si et seulement si les pôles pi de la fonction
de transfert ont tous leur partie réelle strictement négative.
Remarquons qu’une seule partie imaginaire nulle impose l’instabilité ; en effet, pour
la pulsation particulière ωi ∈ R, on aura |H(ωi )| → ∞ : on a vu que le système
constitue alors un oscillateur spontané à la pulsation |ωi |.
2.2 Montages à base d’amplificateur opérationnel
2.2.1 L’amplificateur opérationnel

2 Présentation : l’amplificateur opérationnel de différence est un dispositif qui se
présente en général sous la forme d’un boı̂tier à huit broches, dont sept sont connectées
(cf. figure 2.10).
ip+
b
is
+
+Vcc ǫ b
b - vs
− + −Vcc ip− b
Figure 2.10 – Amplificateur opérationnel
Nous ne nous intéresserons ici qu’à 5 de ces bornes ; deux d’entre elles sont alimentées
en continu au moyen d’une source de puissance fournissant les tensions constantes
±Vcc , où Vcc est en général de l’ordre de 10 V à 15 V ; cet apport énergétique permet
à l’appareil de fonctionner en amplificateur.
La présence d’une alimentation symétrique définit aussi une référence interne de ten-
sion à l’amplificateur opérationnel, point de potentiel nul relativement auquel la ten-
sion de sortie vs est définie. On note v+ et v− les potentiels des deux entrées, dites
non inverseuse et inverseuse de l’amplificateur, et ǫ = v+ − v− .
2 Caractéristique de transfert : un amplificateur opérationnel idéal ne consomme
aucun courant en entrée : ip+ = ip− = 0 ; de plus, la tension vs dépend seulement de
ǫ, selon la caractéristique de transfert de la figure 2.11.
vs
Vsat b
pente µ0
−ǫm ǫ
b b
ǫm
b −V
sat
Figure 2.11 – Caractéristique de transfert d’un amplificateur opérationnel
Il existe un domaine linéaire dans lequel on peut écrire vs = µ0 ǫ, avec un coefficient

d’amplification en boucle ouverte µ0 ≃ 105 ; cette relation linéaire n’est garantie que
si |vs | 6 Vsat , où la tension de saturation vérifie Vsat . Vcc ; en pratique, pour une
alimentation ±Vcc = ±15 V, on constate en général Vsat ≃ 14, 5 V.
Compte tenu de la valeur très élevée de µ0 , la plus grande valeur de la tension d’entrée
en régime linéaire vérifie ǫm ∼ Vsat /µ0 ∼ 0, 14 mV ; en pratique, on posera souvent
µ0 → ∞ et ǫm → 0 ; on parle de modèle d’amplificateur idéal.
2 Saturation en courant : en plus de la limite vs 6 Vsat , il existe une seconde limite
au régime linéaire de fonctionnement des amplificateurs opérationnels : la saturation
en courant. Le régime linéaire est ainsi limité par la condition |is | 6 isat , avec un
courant de saturation en sortie isat ≃ 20 mA en général.
2 Limitations en fréquence : en régime variable, la relation vs (t) = µ0 ǫ(t) ne s’ap-
plique que pour les variations très lentes des signaux d’entrée ǫ(t) et de sortie vs (t) ;
dans le cas général, on doit remplacer cette relation par l’équation différentielle d’évo-
dvs
lution τ + vs (t) = µ0 ǫ(t), où la constante de temps τ est très élevée, τ ≃ 15 ms
dt
en général.
On peut aussi recopier cette relation sous forme complexe dans le cas des régimes
vs µ0
harmoniques forcés, sous la forme = µ = ; l’amplificateur opérationnel
ǫ 1 + jωτ
se comporte donc comme un filtre passe-bas du premier ordre, de gain statique (très
1
élevé) µ0 et de pulsation de coupure (très basse) ω0 = soit une fréquence de coupure
τ
ω0 1
= ≃ 10 Hz.
2π 2πτ
Cette fréquence de coupure peut sembler très basse, mais il ne faut pas oublier la
valeur élevée de µ0 . On peut en particulier continuer à considérer que l’amplificateur
µ0 µ0
opérationnel est idéal tant que |µ| > 100 ≫ 1, donc tant que √ ≃ > 100
1+ω τ 2 2 ωτ
ω
ou encore 6 10 kHz : c’est ce qu’on appelle le domaine des basses fréquences en
2π
électronique.
2 Défauts des amplificateurs opérationnels : en plus des limitations signalées ci-dessus

(saturations en tension et en courant, limitations en fréquence), les amplificateurs
opérationnels réels présentent certains défauts, parmi lesquels on peut citer :
– le décalage en tension ou offset ; il se traduit par une caractéristique de transfert
de la forme vs = µ0 ǫ + ed en régime permanent, avec |ed | de l’ordre de quelques
mV en général. Il est possible de compenser ce défaut ci nécessaire sur certains
amplificateurs opérationnels ; c’est le rôle des deux bornes que nous n’avons pas
décrites plus haut ;
– les courants d’entrée ip+ et ip− ne sont pas exactement nuls ; leur valeur commune
ip ≃ ip+ ≃ ip− vérifie en général |ip | . 100 nA pour des amplificateurs à base de
transistors (séries 741) ou |ip | . 1 nA pour des amplificateurs à base de transistors
à jonction (séries 081).
Amplificateurs opérationnels
X Un amplificateur opérationnel idéal est caractérisé par deux propriétés :
• les courants d’entrée sont toujours nuls ;
• si |us | < Vsat ∼ 15 V et |is | < isat ∼ 20 mA, le régime est linéaire.
En régime de fonctionnement linéaire, un amplificateur opérationnel
idéal est caractérisé par la relation us = µ0 ǫ = µ0 (v+ − v− ), où
µ0 ∼ 105 ≫ 1 permet toujours de faire l’approximation v+ ≃ v− .
En régime de saturation en tension, un amplificateur opérationnel idéal
adopte en sortie la tension us = ±Vsat , où us a le signe de ǫ = v+ − v− .
Les amplificateurs opérationnels réels présentent un certain nombre de
défauts. En particulier, en régime variable, la tension de sortie est régie
dus µ0
par les équations τ + us = µ0 ǫ ou us = ǫ, où τ ∼ 15 ms.
dt 1 + jωτ
On prendra garde à ne pas confondre idéal et linéaire : un amplificateur opérationnel

idéal peut parfaitement fonctionner en régime non linéaire, c’est-à-dire en saturation.
2.2.2 Montages linéaires usuels

2 Montage non inverseur : considérons le montage de la figure 2.12. En l’absence
de tout courant d’entrée, le groupe Z 1 , Z 2 forme un diviseur de tension ; en régime
Z1
linéaire, on a donc ue = v + = v − = u d’où l’expression de la fonction de
Z1 + Z2 s
Z
transfert H(ω) = 1 + 2 . Puisque us ne dépend pas de is , l’impédance de sortie est
Z1
nulle. On remarque aussi que le courant d’entrée ie est nul, donc l’impédance d’entrée
est infinie et le coefficient de retour est nul. Le schéma équivalent au montage, dans
le domaine linéaire, figure sur le schéma.
Z2
Montage non inverseur : H(ω) = 1 + Ze = ∞ (2.1)
Z1
R2
Si Z 1 = R1 et Z 2 = R2 , H(ω) = 1 + et il s’agit d’un amplificateur non inverseur :
R1
si Z 1 = ∞ (circuit ouvert) et Z 2 quelconque (on choisit souvent de mettre simplement
un fil, Z 2 = 0), H(ω) = 1 et il s’agit d’un suiveur.
2 Montage inverseur : considérons maintenant le montage de la figure 2.13.
b b is
+
ie b b
b - b b
b
ue b b us ue H(ω)ue
b
Z2
Z1 b b b
b
b b b
b
Figure 2.12 – Montage non inverseur
b b
ie Z1 Z2 b b
b
b b is
-
b b ue Ze H(ω)ue
ue b +
us
b b b
b
b
b b b
Figure 2.13 – Montage inverseur
En régime linéaire, v + = v − = 0 et le théorème de Millman permet d’affirmer

u /Z + us /Z 2 Z
v− = e 1 ; on en déduit H(ω) = − 2 ; comme us ne dépend pas de
1/Z 1 + 1/Z 1 Z1
ue , l’impédance de sortie est encore nulle. Par contre, le courant d’entrée n’est plus
nul, avec ie = ue /Z 1 ; l’impédance d’entrée du montage est donc Z 1 , et le coefficient
de retour est nul.
Z2
Montage inverseur : H(ω) = − Ze = Z1 (2.2)
Z1
Ce montage présente aussi de nombreuses applications ; parmi celles-ci, on peut citer :

R2
– si Z 1 = R1 et Z 2 = R2 , H(ω) = − ; il s’agit d’un amplificateur inverseur ;
R1
1 1
– si Z 1 = R et Z 2 = , H(ω) = − et le montage est en principe un
jCω jRCω
intégrateur ; toutefois, l’intégration des composantes continues pose un problème
de dérive et donc de saturation ; pour ce qui est de la fonction de transfert, ce
problème est signalé par le fait que |H(ω)| → ∞ lorsque ω → 0. En pratique, on
remplace donc le condensateur C par sa mise en parallèle avec une grande résistance
ρ 1
ρ, de façon à obtenir H(ω) = − . Ce filtre passe-bas du premier ordre
R 1 + jρCω
1
redevient un intégrateur dès que ω ≫ , pulsation qu’on peut choisir aussi faible
ρC
que nécessaire. Par contre, les composantes continues et de très basse fréquence
ρ
sont simplement amplifiées puisque H(0) = − .
R
1
– si Z 1 = et Z 2 = R, H(ω) = −jRCω et le montage est un dérivateur.
jCω
2 Additionneur, soustracteur et déphaseur : considérons maintenant le montage formé
de trois entrées représenté sur la figure 2.14. Les différents potentiels indiqués sont
relevés par rapport à la masse.
2R R
u1 b b b
u2 b b
-
2R b us
b +
u0 b b
b
Y
αY
b
b
Figure 2.14 – Montage à trois entrées
En régime linéaire, v + = v − ; d’autre part, une double application du théorème de

u0 u + u2 + 2us
Millman fournit v + = et v − = 1 ; on en déduit l’expression de la
1+α 4
(1 + α)(u1 + u2 ) − 4u0
tension de sortie du montage, us = − . Sur cette base, on peut
2(1 + α)
distinguer divers cas particuliers :
• Si u0 = 0, les valeurs de Y et α sont indifférentes (on peut choisir deux fils, ce qui
u + u2
revient à mettre la borne + à la masse) ; on a alors us = − 1 et il s’agit
2
d’un circuit additionneur (à un coefficient multiplicatif près).
• Si u1 = u2 , tout se passe comme si la borne − était reliée par une résistance
égale (à R) d’une part à l’entrée u1 , d’autre part à la sortie u2 ; on a alors
(1 + α)u1 − 2u0
us = − .
1+α
♦ avec α = 1, on obtient us = u0 − u1 ; il s’agit d’un circuit soustracteur.
1
♦ avec Y = et αY = jCω, donc α = jRCω, et si on relie les deux entrées
R
1 − jRCω
pour imposer u1 = u0 = ue , on obtient us = u ; la fonction
1 + jRCω e
us
de transfert H(ω) = vérifie alors |H| = 1 pour tout ω : il s’agit d’un
ue
circuit déphaseur. Le déphasage apporté par un tel circuit est arg H(ω) =
arg(1 − jRCω) − arg(1 + jRCω) = −2 arctan RCω.
Le diagramme de Bode en phase est reporté sur la figure 2.15 ; le déphasage
varie le plus rapidement en fonction de ω pour RCω ∼ 1.
lg RCω
b −π/2
−π b
Figure 2.15 – Montage déphaseur
2 Filtres de Butterworth : considérons maintenant la structure présentée sur la figure

2.16, réalisée au moyen de quatre admittances Y 1 , Y 2 , Y 3 et Y 4 et d’un potentiomètre.
b b
Y4
b b b b
b
+
Y1 Y2 b b
Y3 b -
ue u
us
b
b b b b b b
r r′
Figure 2.16 – Filtres de Butterworth
Posant r′ + r = kr, on remarque d’abord que us = kv − ; d’autre part, le théorème

Y u + Y 2 v + + Y 4 us Y2
de Millman impose u = 1 e ; enfin, v + = u ; si on écrit
Y1+Y2+Y4 Y2+Y3
finalement en régime linéaire v + = v − , on obtient l’expression générale de la fonction
kY 1 Y 2
de transfert H(ω) = .
(1 − k)Y 2 Y 4 + (Y 1 + Y 4 )(Y 2 + Y 3 )
On peut alors proposer plusieurs applications :
k
• Si Y 1 = Y 2 = 1/R, Y 3 = Y 4 = jCω, H(ω) = ; il
1 + (3 − k)jRCω − R2 C 2 ω 2
s’agit d’un filtre passe-bas du second ordre, avec pour pulsation caractéristique
1 3−k
ω0 = et pour coefficient d’amortissement ξ = .
RC 2
−kR2 C 2 ω 2
• Si Y 1 = Y 2 = jCω, Y 3 = Y 4 = 1/R, H(ω) = ; il
1 + (3 − k)jRCω − R2 C 2 ω 2
s’agit d’un filtre passe-haut du second ordre, avec les mêmes pulsation caracté-
ristique et coefficient d’amortissement.
jkRCω
• Si Y 1 = Y 3 = jCω, Y 2 = Y 4 = 1/R, H(ω) = ;
1 + (3 − k)jRCω − R2 C 2 ω 2
il s’agit enfin d’un filtre passe-bande du second ordre, avec encore les mêmes
pulsation caractéristique et coefficient d’amortissement.
r′
• Dans les trois cas, k = 1 + varie de 1 à +∞, donc le coefficient d’amortissement
r
varie de 1 à −∞, en passant pas la valeur critique 0 ; pour ξ 6 0, le système
est donc instable. En particulier pour ξ = 0 (k = 3), on obtient la condition
d’accrochage d’un oscillateur sinusoı̈dal de pulsation ω0 .
2 Montages adaptateurs d’impédance : on peut utiliser divers montages pour adapter

l’étage d’entrée d’un circuit à l’étage de sortie du circuit précédent dans un montage
électronique en cascade. La situation la plus simple consiste parfois à utiliser un
suiveur ; comme on l’a vu, c’est un montage d’impédance d’entrée infinie (donc sans
appel de courant) qui réalise en sortie une image de la tension d’entrée, us = ue .
Son utilisation s’impose dès qu’on veut utiliser la valeur d’une tension en un point
d’un réseau sans appeler de courant, par exemple pour ne pas perturber le réseau en
question.
On peut aussi utiliser d’autres montages, permettant de réaliser entre un point et la
masse l’équivalent d’une impédance de correction ; considérons par exemple le montage
de la figure 2.17.
ie ie
b b b
r
b
+
ue b
b -
R r
b b b
b
i
ue
Figure 2.17 – Montage équivalent à une impédance
Le courant d’entrée circule en fait dans r puisque i+ = 0 ; en régime linéaire, v + = v −

donc v + − us = rie = ri = v − − us et les deux résistances r sont parcourues par
le même courant ie ; finalement, on voit aussi que ue = −Rie , d’où la valeur de
l’impédance d’entrée du quadrupôle Z e = −R. Le montage est qualifié de résistance
négative ; il peut compenser une partie de la résistance d’un réseau, par exemple pour
augmenter un facteur de qualité ou limiter un phénomène dissipatif.
Notons que dans ce cas l’effet Joule est (( inversé )) : de la puissance est fournie au reste
du réseau ; elle trouve son origine dans l’alimentation continue ±Vcc de l’amplificateur
opérationnel.
2.2.3 Stabilité d’un montage

2 Stabilité des montages à amplificateur opérationnel : on a vu que le composant
lui-même (l’amplificateur opérationnel) doit être considéré comme un filtre passe-bas
d’ordre 1. Même en présence de circuits purement résistifs et alimentés en régime per-
manent, l’étude complète d’un tel montage passe impérativement par l’établissement
d’une équation différentielle de régime libre ; on dira alors que le montage est stable
si sa solution est transitoire.
Dans le cas contraire, la solution de régime libre contient un terme exponentiel crois-
sant (en valeur absolue), qui devrait donc tendre vers ±∞ au bout d’un certain temps.
On n’atteint bien sûr jamais de tensions ou de courants infinis, car les saturations (en
tension ou en courant) de l’amplificateur opérationnel interviennent avant. On dira
dans ce cas que le montage fonctionne en régime saturé ; il n’est pas toujours possible
de prévoir s’il s’agira de saturation positive ou négative.
2 Amplificateur inverseur et comparateur : considérons à nouveau le montage non
inverseur de la figure 2.12, réalisé avec Z 1 = R1 et Z 2 = R2 . Si on tient compte du
caractère non idéal de l’amplificateur opérationnel, on doit écrire v+ − v− = ǫ(t) avec
dus R1
τ + us (t) = µ0 ǫ(t), v+ (t) = ue (t) et v− (t) = us (t). L’équation différen-
dt R1 + R2
dus µ0 (R1 + R2 )
tielle du régime libre est donc τ ′ +us = H ′ ue , où on a posé H ′ =
dt (µ0 + 1)R1 + R2
′ R1 + R2
et τ = τ .
(µ0 + 1)R1 + R2
R1 + R2 τ H′
Étant donné que µ0 ≫ 1, on peut écrire H ′ ≃ et τ ′ ≃ . La solution
R1 µ0
particulière de cette équation (si ue est constant) correspond à un montage amplifi-
cateur non inverseur de gain en tension H ′ : ce résultat est donc presque le même que
celui qu’on obtenait pour un amplificateur idéal. Cette solution est atteinte après une
durée de l’ordre de grandeur de τ ′ ; comme on a vu que τ ≃ 15 ms, µ0 ≃ 105 , alors
un montage ayant un gain H ′ = 100 sera en régime permanent au bout d’une durée
de l’ordre de 15 µs.
On peut faire une remarque supplémentaire, en notant que la bande passante (à
dus
−3 dB) du filtre passe bas associé à l’équation différentielle τ + us (t) = µ0 ǫ est
dt
∆ω = 1/τ ; de même, le montage non inverseur a une bande passante ∆ω ′ = 1/τ ′ . On
a donc établi plus haut la relation :
µ0 × ∆ω = H ′ × ∆ω ′ (2.3)
Ainsi, le bouclage de l’amplificateur opérationnel, c’est-à-dire l’établissement d’un lien

électrique entre la sortie et l’entrée − de l’amplificateur, par le pont diviseur R1 , R2 se
traduit pas une forte chute du gain (qui passe de µ0 à H ′ ) accompagnée par une forte
augmentation de la bande passante (qui passe de ∆ω à ∆ω ′ ), tandis que le produit
gain × bande passante reste constant : c’est une propriété qu’on a déjà eu l’occasion
de citer.
Considérons maintenant le même montage, dans lequel on a inversé le branchement
des bornes d’entrée de l’amplificateur opérationnel (figure 2.18).
La permutation des bornes revient à échanger v+ et v− dans ce qui précède ou, ce qui
revient au même, à changer µ0 en −µ0 . On obtient donc la nouvelle équation de régime
dus −µ0 (R1 + R2 ) R1 + R2
libre τ ′′ +us = H ′′ ue , avec H ′′ = et τ ′′ = τ .
dt (−µ0 + 1)R1 + R2 (−µ0 + 1)R1 + R2
R1 + R2 R1 + R2
Puisque µ0 ≫ 1, on peut écrire H ′′ ≃ ≃ H ′ mais aussi τ ′′ ≃ −τ .
R1 µ0 R1
′′ ′ ′′
On trouve donc τ ≃ −τ ; le signe négatif de τ impose un comportement du régime
t
libre en exp − ′′ → ∞ lorsque t → ∞ : le montage est instable.
τ
Cette instabilité est limitée par le passage en saturation en tension, qui se fera au
bout d’une durée de l’ordre de |τ ′′ |, c’est-à-dire en quelques dizaines de microsecondes.
Après cette durée, le montage adoptera donc en régime permanent de fonctionnement
une tension de sortie us = ±Vsat .
b b
-
Vsat
b b us
+Vsat
b +
2
+ R1R+R
1
ue b b us
b ue
R2 b b
R1
− R1R+R 2
Vsat
b b b
b
1
−Vsat
Figure 2.18 – Montage comparateur à hystérésis
Le signe de us est déterminé par la caractéristique de transfert 2.11 ; us aura le signe

de ǫ = v+ − v− . Puisque, même en régime de saturation, les bornes d’entrée de
R1
l’amplificateur opérationnel n’appellent pas de courant, on aura v+ = us
R1 + R2
R1
tandis que v− = ue . Finalement, il vient ǫ = us − ue .
R1 + R2
Le montage fonctionnera donc en saturation positive si ǫ > 0 avec us = +Vsat ,
R1
donc si ue < Vsat ; il fonctionnera en saturation négative si ǫ < 0 avec
R1 + R2
R1
us = −Vsat , donc si ue > − Vsat . La caractéristique de transfert us = f (ue )
R1 + R2
correspondante figure sur le tracé 2.18.
Ce montage est qualifié de comparateur puisque l’état de la sortie us dépend de
la comparaison de la tension d’entrée aux bornes d’un certain intervalle. Il pré-
sente le phénomène d’hystérésis, c’est-à-dire que dans certains cas, son état n’est
pas défini
de manière instantanée mais dépend de son histoire antérieure ; ainsi, pour
R1 R1
ue ∈ − Vsat , + Vsat , la tension de sortie us peut a priori prendre
R1 + R2 R1 + R2
n’importe laquelle des deux valeurs ±Vsat . En pratique, on constate que, sauf en pré-
sence de perturbations très importantes, la sortie reste en permanence dans l’état
électrique où elle se trouvait lorsque ue est entré dans cet intervalle, et ceci dure
jusqu’à ce que ue quitte cet intervalle.
2 Généralisation : on peut d’abord donner une interprétation qualitative du passage
ou non en régime de saturation. Supposons par exemple qu’une perturbation électrique
quelconque donne naissance à une petite augmentation de us . La présence de la boucle
de retour R1 , R2 sur le montage comparateur 2.18 provoque une augmentation de v+ ,
elle-même à son tour amplifiée d’un facteur µ0 : l’augmentation de us ne diminue pas,
bien au contraire.
Par contre, dans le cas d’un bouclage à la borne −, comme pour le montage non
inverseur 2.12, l’augmentation de us se traduit par une augmentation de v− ; elle est
donc automatiquement modérée par l’amplificateur opérationnel.
Ce raisonnement suppose en fait un certain délai entre les perturbations en sortie d’un
montage et leur influence en retour après bouclage ; ce délai est en pratique assuré
par l’existence d’une constante de temps de l’amplificateur opérationnel.
On peut généraliser ce raisonnement dans le cadre d’une théorie générale du bouclage.
Considérons le cas de la figure 2.19, dans laquelle un amplificateur de gain complexe

H est bouclé par deux chaı̂nes de retour, de gains β+ et β− , de sorte que la gran-
deur d’entrée de l’amplificateur s’écrive x′e = xe + β+ xs − β− xs . Une telle situation
est évidemment plus complexe que celle d’un montage (( simple )) à amplificateur
opérationnel, pour lequel us = µ v + − v − , ce qui correspond au cas particulier où
β+ = β− = µ et xe = 0.
β+ xs
β+
+
xe x′e xs
H b
β−
β− xs
Figure 2.19 – Schéma d’un amplificateur bouclé
Dans le cadre plus général de la figure 2.19, la grandeur de sortie du montage vérifie
xs = Hx′e = H (xe + βxs ), où on a posé β = β+ − β− . On peut donc définir pour le
x H
montage bouclé le gain effectif H b = s = .
xe 1 − βH
Considérons maintenant le cas où l’amplificateur est un filtre passe-bas du premier
H0
ordre, H = , tandis que les deux opérateurs de bouclage ont un gain réel
1 + jω/ω0
1 1 + jω/ω0 1 + jω/ωb0
positif : β+ > 0, β− > 0. On peut alors écrire = −β + =
Hb H0 Hb0
H0
où on a posé Hb0 = et ωb0 = ω0 (1 − βH0 ).
1 − βH0
Ainsi, la chaı̂ne bouclée se comporte elle-même comme un filtre passe bas du premier
ordre, mais avec une valeur différente du gain statique H0 et de la bande passante
ω0 ; seul le comportement asymptotique (pour ω → ∞) est identique pour les deux
montages bouclé et non bouclé.
On remarque à nouveau que, lors du bouclage, le produit du gain par la bande passante
est constant :
H0 × ω0 = Hb0 × ωb0 (2.4)
On peut donc représenter les diagrammes de Bode en gain des systèmes bouclé et non
bouclé, sur la figure 2.20, en fonction de la valeur de β par rapport au cas critique
1
βc = , avec d’ailleurs βc ∼ 0 souvent.
H0
Un bouclage négatif (ou rétroaction) est caractérisé par β− ≫ β+ et donc par une
diminution du gain avec augmentation de la bande passante.
Le système est alors stabilisé ; en particulier, l’équation différentielle du régime libre
Hb0 dus
associée à la fonction de transfert H b = s’écrit us + τb0 = 0 avec
1 + jω/ωb0 dt
1 1 1
τb0 = donc τb0 = . Puisque β+ ≪ β− , τb0 > 0 et le régime
ωb0 ω0 1 − (β+ − β− ) H0
β1 > βc ∼ 0
H
ω
β2 < βc ∼ 0
pe
nt
e
−
β3 < β2
20
dB
Figure 2.20 – Bouclage, gain et bande passante
libre est stable, avec même une durée de régime transitoire nettement plus courte
1
qu’en l’absence de bouclage : τb0 ≪ .
ω0
Au contraire, un bouclage positif (ou réaction positive), caractérisé par β+ ≫ β− ,
s’accompagne d’une augmentation du gain, mais pour une bande passante réduite ;
dans le cas extrême, la gain peut devenir infini pour une fréquence unique : le système
devient instable ; il forme par exemple un oscillateur spontané pour cette fréquence.
On peut aussi comprendre cette perte de stabilité du système en notant que, dans
dus 1
l’équation différentielle du régime libre us + τb0 = 0 avec τb0 = , la condition
dt ωb0
β+ ≫ β− impose τb0 < 0 et un régime libre instable.
Nous admettrons finalement la généralisation suivante :
Stabilité des montages à amplificateur opérationnel

X Un montage comportant un amplificateur opérationnel sera en général
stable (et fonctionnera donc en régime linéaire) s’il n’existe qu’un seul
lien électrique entre la sortie et la borne − (ou borne inverseuse).
Au contraire, s’il n’existe qu’un bouclage de la sortie à la borne + (ou
borne non inverseuse), ou bien aucun bouclage, le montage est instable
et l’amplificateur fonctionne en régime de saturation.
Dans le cas où il existe plusieurs bouclages (comme pour les filtres de Butterworth
de la figure 2.16), on ne peut pas conclure a priori ; toutefois, le contexte de l’énoncé
permet souvent de savoir quel est le type de régime à étudier.
Pour être transporté, un signal s(t) doit être modulé ; il est transporté à la
fréquence fp du signal porteur sp (t).
En modulation d’amplitude, sp (t) = (A + ks(t)) cos 2πfp t. En modulation de
fréquence, sp (t) = A cos 2π (fp + ks(t)) t.
Un montage linéaire est caractérisé par une fonction de transfert, fraction
N (ω) u
rationnelle en ω, H(ω) = = s . On passe de la notation complexe
D(ω) ue
d 1
Z
D(ω)us = N (ω)ue à l’équation différentielle en faisant ↔ jω et dt ↔ .
dt jω
Lorsque D(ω) = 0, le système forme un oscillateur spontané.
X
Un signal composite xe (t) = ak cos (ωk t + φk ), après traversée d’un montage
k
linéaire de fonction de transfert
X H(ω) = H(ω) exp (jϕ(ω)), forme un nouveau
signal composite xs (t) = H(ωk )ak cos (ωk t + φk + ϕk ).
k
Un amplificateur opérationnel idéal n’appelle pas de courant à ses bornes.

Un amplificateur opérationnel fonctionne en régime linéaire sous réserve que
µ0
|us | < Vsat ∼ 15 V et |is | < isat ∼ 20 mA ; dans ce cas, us = ǫ où
1 + jωτ
µ0 ∼ 105 et τ ∼ 15 ms ; en pratique, ǫ ∼ 0.
En saturation de tension, us = ±Vsat . 15 V, avec le signe de ǫ.
Les montages à amplificateur opérationnel sont stables en cas de bouclage ex-
clusif à la borne −, saturés en cas de bouclage exclusif à la borne +.
Résultats à savoir retrouver très rapidement :
Z2
Pour le montage non inverseur, H(ω) = 1 + et Z e = ∞.
Z1
Z2
Pour le montage inverseur, H(ω) = − et Z e = Z 1 .
Z1
Résultat à savoir identifier très rapidement :
1 − jω/ω0
Un montage déphaseur correspond à H(ω) = H0 ; le déphasage vaut
1 − jω/ω0
alors arg(H(ω)) = −2 arctan ω/ω0 .
Chapitre 3
Analyse de Fourier
3.1 Décomposition en séries de Fourier
3.1.1 Introduction
2 Signaux périodiques : pour l’étude des signaux (par exemple électriques) pério-
diques, nous serons amenés à décomposer toute fonction du temps sur une base for-
mée de fonctions harmoniques (c’est-à-dire sinusoı̈dales), de pulsation ω. On pourra
prendre pour exemple le signal tracé sur la figure 3.1, composé de deux fonctions har-
moniques : u(t) = u1 cos ω0 t + u1 cos ω1 t ; dans le cas de l’exemple proposé, u1 = u0 /2
et ω1 = 3ω0 .
u
u(t)
u1 cos ω1 t u0 cos ω0 t
Figure 3.1 – Exemple de signal à deux composantes harmoniques
L’intérêt d’une telle décomposition, si elle est possible, est évident : pour chaque com-
posante harmonique de pulsation ωk , on pourra appliquer tous les résultats développés
dans le cours concernant les régimes harmoniques forcés : calculs d’impédance Z(ωk ),
de fonctions de transfert H(ωk ), etc. Dans le cas d’un réseau linéaire, l’existence d’un
théorème de superposition permet alors de considérer le comportement du système
en sommant les contributions des différents termes harmoniques.
À titre d’exemple, supposons que la tension u(t) soit filtrée par un filtre passe haut
jω/ω0
du premier ordre, de fonction de transfert H(ω) = ; cette fonction de
1 + jω/ω0
transfert prend deux valeurs bien différentes pour les deux composantes harmoniques
j 1
de u(t), puisque H(ω0 ) = , de norme √ = 0, 71 et d’argument π/4 = 45◦ , et
1+j 2
3j 3
H(ω1 ) = , de norme √ = 0, 95 et d’argument 18◦ . Le signal de sortie us (t),
1 + 3j 10
représenté sur la figure 3.2, montre bien l’atténuation relative de la composante de
basse fréquence, et le déphasage correspondant. Le signal complet est alors totalement
déformé.
us
0.71u0 cos(ω0 t + 45◦ )
us (t)
0.95u1 cos(ω1 t + 18◦ )
Figure 3.2 – Filtrage différentiel de deux composantes harmoniques
Imaginons maintenant que cette même tension u(t) alimente une bobine, de résistance
R et d’inductance propre L, ces deux grandeurs étant choisies de sorte que R = Lω0 .
Le courant électrique i(t) qui parcourt la bobine s’obtient alors comme somme de deux
composantes, i0 cos(ω0 t + ϕ0 ) et i1 cos(ω1 t + ϕ1 ), avec, du fait de la notation complexe
u0 u0 u1 u1
u = Zi = (R + jLω)i, les expressions i0 = =√ et i1 = =√ ;
|Z(ω0 )| 2R |Z(ω1 )| 10R
de même, ϕ0 = − arg(Z(ω0 )) = −45◦ et ϕ0 = − arg(Z(ω0 )) = −18◦ .
L’allure du courant iL qui parcourt la bobine est reporté sur la figure 3.3 ; on remarque
au contraire du tracé précédent que c’est cette fois-ci la composante de haute fréquence
qui est atténuée.
iL
iL (t) u0 cos(ω0 t − 45◦ )
√
R 2
u1 cos(ω1 t − 18◦ )
√
R 10
Figure 3.3 – Courant dans une bobine alimenté par deux tensions harmoniques
2 Notations : une fonction harmonique de pulsation ω > 0 pourra écrire sous la

forme fω (t) = α cos (ωt + ϕ), c’est-à-dire aussi fω (t) = a cos ωt + b sin ωt, avec les
p a b
relations α = a2 + b2 , cos ϕ = et sin ϕ = − . Une telle fonction est évidemment
α α
2π
T -périodique, avec T = .
ω
On peut encore écrire la même fonction fω (t) = c exp (jωt) + c′ exp (−jωt), où on a
a − jb a + jb
noté j 2 = −1 et c = et c′ = . Naturellement, on choisira la notation
2 2
3 : Analyse de Fourier 51
complexe (c, c′ ) ou la notation réelle (a, b ou bien α, ϕ) en fonction des circonstances

particulières, en particulier selon que les grandeurs étudiées sont complexes ou réelles.
Ici et dans toute la suite, on remarquera l’intervention de termes du type exp (−jωt),
qui semblent avoir une pulsation négative. En réalité, il n’existe que des pulsations
positives, et ce type de terme n’intervient que dans la décomposition formelle d’une
fonction cos ωt ou sin ωt, à pulsation strictement positive.
3.1.2 Séries de Fourier

+∞
X
2 Définitions : on appelle série de Fourier toute somme f (t) = ck exp (jkωt),
k=−∞
si cette somme converge. Il s’agit d’une somme de fonctions harmoniques, de pulsations
toutes proportionnelles, ωk = kω ; le terme d’ordre k est donc périodique de période
2π 2π
et la somme est donc T -périodique, avec T = .
kω ω
Les termes k = ±1, de pulsation ω, portent le nom de terme fondamental ; les termes
±k avec k > 1 portent le nom d’harmoniques d’ordre k. Enfin, l’unique terme k = 0
est constant ; il s’agit donc automatiquement de la valeur moyenne de la série f (t).
Compte tenu des remarques qui précèdent, la même série de Fourier peut s’écrire
∞
a0 X
sous la forme trigonométrique f (t) = + (ak cos kωt + bk sin kωt) ; l’origine du
2
k=1
a0
la notation pour le terme constant apparaı̂tra ultérieurement. La même série peut
2
∞
a0 X
d’ailleurs aussi s’écrire sous la forme f (t) = + αk cos (kωt + ϕk ).
2
k=1
a0
Les termes et ak cos kωt sont les termes pairs de la série ; les termes bk sin kωt en
2
sont les termes impairs.
Il est essentiel de ne pas confondre le caractère pair et impair des fonctions cos kωt
et sin kωt, avec la parité éventuelle de l’entier k ! Ainsi, un harmonique pair (avec
k pair) contient un terme pair ak cos kωt et un harmonique impair bk sin kωt.
On retiendra les relations entre les différentes notations des séries de Fourier :
a0 = 2c0 ak = ck + c−k bk = j(ck − c−k ) (3.1)
2 Notations : dans la suite, nous noterons φk (t) = exp(jkωt)

P les fonctions complexes
qui servent de base à l’écriture des séries de Fourier : f = k ck φk .
De plus, nous ne chercherons pas à développer ici l’ensemble des propriétés des séries
de Fourier
X ; nous nous contenterons donc d’étudier des sommes finies de la forme
f (t) = ck exp (jkωt), où I est un certain intervalle fini.
k∈I
Le fait d’étudier des séries tronquées présente l’énorme avantage de ne manipuler que
des sommes finies, sans se préoccuper de problèmes de convergence, d’interversion de
sommes, etc. De plus, négliger les termes correspondant à k → ∞ est légitime en
électronique, puisque tout dispositif réel présente toujours une bande passante limitée
et ne permettra pas le passage de composantes de très haute fréquence.
La largeur de l’intervalle I ne dépend que du degré de précision attendu sur la repré-

sentation d’un signal authentique par une série de Fourier ; nous ne nous poserons pas
ce problème ici.
3.1.3 Norme sur l’espace des fonctions

2 Moyenne quadratique : lors de l’étude de la puissance en régime harmonique,
nous avons défini la valeur efficace d’une fonction T -périodique quelconque par la
1 T
Z
2
relation feff = |f (t)|2 dt ; on peut montrer que la relation qui, à la fonction f ,
T 0
associe sa valeur efficace feff , est une norme (sur l’espace E des fonctions continues,
T -périodiques).
Cette valeur efficace porte aussi le nom de moyenne quadratique (puisque c’est la
moyenne du carré de la norme de f ) ; on utilise encore l’abréviation anglaise RMS
(pour root of the mean square) et on la notera indifféremment (en rappelant que z ∗
est le conjugué du complexe z) :
s
T
1
Z
kf k = feff = f (t) f ∗ (t) dt (3.2)
T 0
À cette norme, on associe l’équivalent d’un produit scalaire, défini par la relation :
s
T
1
Z
hf |gi = f (t) g ∗ (t) dt (3.3)
T 0
Il s’agit d’une forme (fonction de E × E → C) sesquilinéaire, c’est-à-dire qu’elle est

linéaire pour la première fonction et antilinéaire pour la seconde ; ainsi, pour tout
nombre complexe λ, hλf |gi = λ hf |gi tandis que hf |λgi = λ∗ hf |gi. De même, on
∗
notera que hf |gi = hg|f i pour tout couple de fonctions (f, g).
D’autre part, hf1 + f2 |gi = hf1 |gi + hf2 |gi, et hf |g1 + g2 i = hf |g1 i + hf |g2 i, de façon
évidente, pour toutes fonctions f , f1 , f2 , g, g1 et g2 .
Enfin, par construction, kf k2 = hf |f i.
2 Caractère orthonormé des fonctions φk : considérons à nouveau les fonctions φk
définies plus haut, φk (t) = exp (jkωt) ; cette famille de fonctions est orthonomée. En
1 T
Z
2
effet, hφk |φl i = exp (j(k − l)ωt) dt ; si k = l, la fonction intégrée vaut 1 et
T 0
Z T T
exp (j(k − l)ωt)
hφk |φk i = 1 ; sinon, exp (j(k − l)ωt) dt = = 0 d’où on déduit
0 j(k − l)ω 0
hφk |φl i = 0 pour k 6= l.
Cette propriété peut être mise à profit pour expliciter les coefficientsX
ck d’une série de
Fourier. Considérons en effet la série de Fourier (tronquée) f (t) = ck exp (jkωt) ;
k∈I
on remarque immédiatement que hf |φk i = ck et donc que hφk |f i = c∗k : les coefficients
de la décomposition de f sont aussi les (( produits scalaires )) de f avec les vecteurs
de base φk .
C’est exactement la même situation qu’un vecteur r = xex + yey + zez pour lequel
les composantes x, y et z s’identifient aux projections r · ex , r · ey et r · ez .
3.1.4 Approximation d’un signal périodique

2 Approximation d’un signal : considérons une
X fonction F , T -périodique, et cherchons
à quelle condition la série de Fourier f = ck φk en constitue une approximation
k X
satisfaisante, de façon à pouvoir écrire F (t) ≃ f (t) = ck exp (jkωt). On veut pour
k∈I
cela que la différence ∆F = F − f soit (( électriquement )) petite, c’est-à-dire corres-
ponde à un signal transportant peu d’énergie. Nous chercherons donc à minimiser la
grandeur efficace associée k∆F k.
Il ne s’agit en fait que d’une situation mathématiquement
X très ordinaire ; chercher la
convergence éventuelle de la série f (t) = ck exp (jkωt), c’est étudier si la forme
k∈I
k∆F k de l’écart ∆F entre f et son éventuelle limite F tend bien vers zéro.
* +
X X
2
Par définition, k∆F k = F − ck φk F − cl φl soit, en développant ce pro-

k l
duit pseudo-scalaire au moyen
X des propriétés de sesquilinéarité
X citées plus haut, l’ex-
pression k∆F k2 = kF k2 − (ck hφk |F i + c∗k hF |φk i)+ ck c∗l δkl . La dernière somme
k k,l
X X
∗ 2
peut être réécrite ck cl δkl = |ck | ; les deux sommes intermédiaires font appa-
k,l k
raı̂tre les projections Ck = hF |φk i deX
la fonction F étudiée
Xsur la base des φk , et on
2 2
peut encore écrire k∆F k = kF k − ∗ ∗
(ck Ck + ck Ck ) + |ck |2 .
k k
Puisque nous (( soupçonnons )) que les coefficients ck de la meilleure approximation

de F doivent être proches des projections Ck de F sur la base des φkX , calculons aussi
2
la somme des carrés des écarts entre ces deux suites de termes, soit |Ck − ck | ; il
k
2 2 2
X X X X
vient facilement |Ck − ck | = |Ck | + |ck | − (Ck c∗k + c∗k Ck ).
k k k k
X
La comparaison des deux expressions permet d’écrire k∆F k2 = kF k2 − |Ck |2 + ǫ,
k
2
X
|Ck − ck | . Pour un signal F donné, kF k2 et 2
P
où on a posé ǫ = k |Ck | sont fixés ;
k
rendre l’écart minimal, c’est donc rendre ǫ minimal, ce qui est possible en choisissant,
comme on s’y attendait, ck = Ck pour tout k ∈ I ; alors, ǫ = 0.
Approximation d’un signal périodique

X La meilleure approximation d’un signal F , T -périodique, par une série
(tronquée) de Fourier de pulsation ω = 2π/T est obtenue sous la forme :
T
1
X Z
F (t) ≃ ck exp (jkωt) ck = F (t) exp (−jkωt) dt
T 0
k∈I
Si l’approximation est satisfaisante, k∆F k ≪ kF k, et on montrera même dans le cours

de Mathématiques sous quelles conditions k∆F k → 0 lorsque l’intervalle I s’étend de
−∞ à +∞ ; nous retiendrons donc que l’écart entre kF k2 et k |Ck |2 est d’autant
P
plus faible que l’approximation est bonne.
Théorème de Parseval
X
X
Si ck exp (jkωt) est une bonne approximation d’un signal F , la valeur
k∈I
X
efficace de F est la somme kF k2 = Feff
2
≃ |ck |2 .
k∈I
On peut aisément interpréter ce résultat en remarquant que |ck |2 est la valeur efficace
de l’harmonique k, c’est-à-dire de la fonction ck φk ; ainsi, le théorème de Parseval
s’interprète en termes énergétiques, la puissance transportée par le signal F étant la
somme des puissances transportées par chacun de ses harmoniques.
On peut illustrer ce résultat dans le cas du courant circulant dans une bobine présenté
u0 u1
en 3.1.1 ; on avait alors écrit iL (t) = √ cos (ω0 t + ϕ0 ) + √ cos (ω1 t + ϕ1 ), avec
2R 10R
ω1 = 3ω0 et u1 = u0 /2. La puissancedissipée dans la bobine ne dépend que de sa
2 u20 2 1 2
résistance, avec P (t) = RiL (t) = cos (ω0 t + ϕ0 ) + cos (ω1 t + ϕ1 ) + f (t),
2R 20
u2
où la fonction f (t) = √0 cos (ω0 t + ϕ0 ) cos (ω1 t + ϕ1 ) est de moyenne nulle.
R 20
La figure 3.4 présente l’allure des deux termes dont la somme forme la puissance P (t) ;
on voit que le passage au carré renforce encore l’importance relative du terme de basse
u20

1
fréquence ; en moyenne, il ne reste que hP i = 1+ , somme des deux termes
4R 20
du théorème de Parseval.
P
ω0
ω1
Figure 3.4 – Puissance dissipée dans une bobine
2 Série trigonométrique : la relation (3.1) permet d’exprimer les coefficients ak et

bk de la série trigonométrique qui réalise la meilleure approximation d’un signal F
donné ; on obtient facilement les relations :
T
a0 1
Z
= F (t)dt
2 T 0 (3.4)
T T
2 2
Z Z
ak = F (t) cos(kωt)dt bk = F (t) sin(kωt)dt
T 0 T 0
On remarque que le facteur 2 dans la définition de a0 permet d’obtenir une expression

unique pour a0 et les ak .
Dans toute la suite, nous admettrons la convergence de la série de Fourier de F vers
la fonction F ; on montrera en Mathématiques que cette convergence est uniforme si
F est continue, et nous écrirons donc :
∞
a0 X
F (t) = + ak cos(kωt) + bk sin(kωt) (3.5)
2
k=1
3.1.5 Calcul des séries de Fourier

2 Domaine d’intégration : le terme qui figure sous le signe somme des trois relations
Z T
(3.4) est T -périodique ; on peut donc remplacer cette somme par une intégrale
Z τ +T 0
sur n’importe quel intervalle de largeur T , .

τ
2 Parité : considérons un signal pair, c’est-à-dire que F (−t) = F (t). Dans ce cas, les
2 T /2
Z
coefficients bk = F (t) sin(kωt)dt sont des intégrales d’une fonction impaire
T −T /2
sur un domaine symétrique, donc bk = 0. La décomposition de F ne comporte donc
que des fonctions paires, cos(kωt).
2 T /2
Z
De même, un signal impair vérifie F (−t) = −F (t) et ak = F (t) cos(kωt)dt ;
T −T /2
ce sont des intégrales d’une fonction impaire sur un domaine symétrique, donc ak = 0.
La décomposition de F ne comporte donc que des fonctions impaires, sin(kωt), et sa
valeur moyenne a0 est nulle.
Parité et série de Fourier

X La décomposition de Fourier d’un signal de parité donnée ne contient
que des termes de même parité ; ainsi, ak = 0 pour un signal impair et
bk = 0 pour un signal pair, ∀k.
2 Dérivation : dans le cas d’un signal F dérivable, la convergence uniforme de la série

permet la dérivation terme à terme de celle-ci (ce résultat est en fait immédiat si on se
contente d’une approximation de F par une série tronquée, c’est-à-dire par une somme
∞
a0 X dF
finie) ; si on écrit F (t) = + ak cos(kωt) + bk sin(kωt) , la dérivée F ′ (t) =
2 dt
k=1
′ ∞
a X
s’écrira donc F ′ (t) = 0 + a′k cos(kωt) + b′k sin(kωt) avec les relations :
2
k=1
a′0 = 0 a′k = kωbk b′k = −kωak (3.6)
2 Intégration : si un signal comporte une partie continue a0 /2, celle-ci s’intègre sous
la forme a0 t/2 + cte, qui n’est pas périodique et ne peut être traitée dans ce cadre.
Dans tout autre cas, la primitive d’une somme de fonctions harmoniques est aussi une
somme de fonctions périodiques, et on peut aussi en proposer une intégration terme
∞
a0 X
Z
à terme. Ainsi, si F (t) = + ak cos(kωt) + bk sin(kωt) et Φ = F (t)dt, on
2
k=1
∞
α0 X
aura Φ(t) = + αk cos(kωt) + βk sin(kωt) avec les relations :
2
k=1
bk ak
αk = − βk = (3.7)
kω kω
On ne peut évidemment pas déterminer α0 , qui joue le rôle de constante d’intégration.

2 Exemple : fonction créneau : il s’agit de la fonction CrT , de période T , impaire,
définie par CrT = 1 si 0 < t < T /2 et CrT = −1 si T /2 < t < T . Elle est représentée
sur la figure 3.5. S’agissant d’une fonction impaire, on peut se contenter de calculer
2 T /2 4 T /2
Z Z
les coefficients bk = CrT (t) sin(kωt)dt soit bk = sin(kωt)dt ou, après
T −T /2 T 0

4 kωT
calcul, bk = 1 − cos .
kωT 2
CrT ak
1
k
b b b b b b
−T /2 t
bk
T /2
k
−1 b b
0 1 2 3 4 5
Figure 3.5 – Série de Fourier d’un créneau
Comme on n’oublie pas par ωT = 2π, on peut encore écrire ces coefficients :
4
Créneau impair : b2p = 0 b2p+1 = (3.8)
(2p + 1)π
Le spectre correspondant est tracé sur la figure 3.5 ; on remarque qu’il ne contient que
des termes impairs (c’est-à-dire en sin kωt), eux-mêmes d’ordre impair (b2p = 0). On
notera aussi que la suite des b2p+1 décroı̂t lentement : il faut beaucoup d’harmoniques
pour former une bonne approximation de la fonction créneau. Cette circonstance est
due aux discontinuités de la fonction, qui correspondent à des transitions rapides,
c’est-à-dire à des termes de haute fréquence, qui sont justement des harmoniques de
rang élevé.
Cr′T ak
1
b b
k
−T /2 T /2 t
b b bk
−1 b b b b b b
k
0 1 2 3 4 5
Figure 3.6 – La fonction créneau définie de manière paire

On pourrait éventuellement définir une fonction créneau décalée d’un quart de période,
donc paire ; elle est représentée sur la figure 3.6, avec son spectre en fréquence. Le
décalage fait que la nouvelle série ne contient que des termes pairs (en cos kωt) mais
toujours seulement des harmoniques d’ordre impair.
On peut enfin représenter quelques termes de la série de Fourier de la fonction créneau,
pour montrer qualitativement comment la série converge vers CrT ; les trois premiers
termes (harmoniques 1, 3 et 5) ainsi que leur somme sont représentés sur la figure 3.7.
harmonique 1
harmonique 5
harmonique 3
Figure 3.7 – Premiers harmoniques de la fonction créneau impaire
2 Exemple : fonction triangle (ou dents de scie) : il s’agit de la fonction TrT , de

période T , impaire, définie par TrT = 4t/T si −T /4 < t < T /4 et TrT = 2 − 4t/T si
T /4 < t < 3T /4. Elle est représentée sur la figure 3.8.
TrT ak
1
k
b b b b b b
−T /2 t 0 1 2 3 4 5
b b bk
T /2
b b
k
−1
Figure 3.8 – Série de Fourier d’un triangle
Au lieu de calculer directement sa série de Fourier, nous remarquerons qu’il s’agit

d’une primitive de la fonction créneau, à un simple facteur multiplicatif près ; en ef-
dTrT 4 dTrT 4
fet, = si −T /4 < t < T /4 et = − si T /4 < t < 3T /4. On peut
dt T dt T
∞
dTrT 4 ′ ′
X 4(−1)p+1
donc écrire = CrT (t), où CrT (t) = cos ((2p + 1)ωt). L’inté-
dt T p=1
π(2p + 1)
gration terme à terme, avec une constante d’intégration nulle puisque le triangle est
∞
X 16(−1)p+1 sin ((2p + 1)ωt)
de moyenne nulle, fournit TrT (t) = ; finalement on
p=1
T π(2p + 1) (2p + 1)ω
obtient les coefficients bk , qui sont d’ailleurs représentés sur la figure 3.8 :
8(−1)p+1
Triangle impair : b2p = 0 b2p+1 = (3.9)
(2p + 1)2 π 2
On remarque bien sûr la décroissance plus rapide des coefficients b2p+1 avec le rang
2p + 1 : le triangle présente des variations beaucoup moins brutales que le créneau.
Il faut donc moins d’harmoniques de haute fréquence pour en réaliser une bonne
approximation ; la convergence rapide de la série de Fourier du triangle est illustrée
sur la figure 3.9.
harmonique 1
harmonique 5
t
harmonique 3
Figure 3.9 – Premiers harmoniques de la fonction triangle impaire
On retiendra impérativement les propriétés suivantes :
Fonctions créneau et triangle

X Les fonctions créneau et triangle ne contiennent que des harmoniques
d’ordre impair k = 2p + 1 ; pour un créneau, le spectre des harmoniques
décroı̂t comme 1/k ; pour un triangle, ce spectre décroı̂t comme 1/k 2 .
2 Autres exemples : le calcul de nombreuses séries de Fourier sera effectué en cours de

Mathématiques ; en principe, ce calcul ne fait pas à proprement parler du programme
de Physique. On peut toutefois souvent utiliser des coefficients de Fourier donnés,
ou calculés au moyen d’un logiciel de calcul formel. Nous donnerons seulement ici,
à titre d’exemple, le spectre de Fourier d’une fonction (( redressée )), définie par la
partie positive d’un terme harmonique, F (t) = max (0 , sin ωt) ; une telle situation
correspond, en électricité, lorsqu’on veut produire une tension continue à partir d’une
alimentation alternative.
On peut alors déterminer les coefficients de Fourier au moyen de la syntaxe Maple
suivante :
> a0:=omega/Pi*int(sin(omega*t),t=0..Pi/omega);
> a:=k->omega/Pi*int(sin(omega*t)*cos(k*omega*t),t=0..Pi/omega);
> b:=k->omega/Pi*int(sin(omega*t)*sin(k*omega*t),t=0..Pi/omega);
On obtient alors les ak au moyen des commandes :
> a0; a(1); a(2); a(3); a(4);
a0 1 2 2
qui fournissent = , a2 = − , a4 = − , les autres termes étant nuls, et :
2 π 3π 15π
> b(1); b(2); b(3); b(4);
1
qui fournissent b1 = , les autres termes étant nuls. Finalement, on peut écrire ce
2
1 1 2 2
signal redressé sous la forme F (t) ≃ f (t) = + sin(ωt)− cos(2ωt)− cos(4ωt) ;
π 2 3π 15π
la convergence de cette série à trois termes seulement est illustré sur la figure 3.10.
F (t) f (t)
t t
Figure 3.10 – Série tronquée d’un signal redressé
3.1.6 Applications des séries de Fourier

2 Opérateurs linéaires : on a vu ci-dessus que de nombreux signaux peuvent être
représentés de manière très satisfaisante au moyen d’un petit nombre d’harmoniques,
c’est-à-dire au moyen d’une série de Fourier tronquée. L’avantage de cette représenta-
tion est évident : lors du passage du signal par un opérateur linéaire, on peut traiter
chaque composante séparément, en notation complexe.
Opérateurs linéaires et série de Fourier

X Un opérateur linéaire de fonction de transfert H(ω) = H(ω) exp (jϕ(ω))
2π
transforme un signal d’entrée xe (t) périodique, de période , de série
ω
a0e X
de Fourier xe (t) = + αke cos(kωt + φke ), en un signal de sortie
2
k
2π
xs (t) périodique, de même période , dont la série de Fourier peut
ω
a0s X
être écrite xs (t) = + αks cos(kωt + φks ), avec α0s = H(0)α0e ,
2
k
αks = H(kω)αke et φks = φke + ϕ(kω).
Il ne faut surtout pas oublier de traiter chaque composante (ak , bk ) avec sa pulsation
ωk = kω, au lieu par exemple de traiter tous les termes comme s’ils avaient la même
pulsation ω que le fondamental !
2 Grandeurs efficaces : considérons enfinun signal périodique F (t), décomposable

a0 X
en série de Fourier selon F (t) = + ak cos kωt + bk sin kωt ; le théorème de
2
k
X a0 ak − jbk
2
Parseval affirme que la grandeur Feff est égale à |ck |2 avec c0 = , ck =
2 2
k
ak + jbk a2 b2
et c−k = ; on a donc |ck |2 + |c−k |2 = k + k . Finalement, la grandeur
2 2 2
2
efficace Feff peut s’écrire comme la somme quadratique des termes efficaces associés
séparément à chacune des composantes de Fourier de F :
∞ 2
b2
a 2
0
X a k
2
Feff = + + k (3.10)
2 2 2
k=1
3.2 Transformées de Fourier
3.2.1 Définition
2 Généralités : au contraire de l’étude des séries de Fourier, les notions dévelop-
pées dans ce chapitre ne seront pas traitées en cours de Mathématiques. Nous nous
contenterons donc de justifications qualitatives, dont la formalisation complète relève
de la théorie des distributions de Schwartz‡ et figure en général au programme de
l’enseignement du second cycle universitaire.
Nous considérerons dans tout ce qui suit des fonctions f à valeurs complexes d’une
variable réelle, absolument intégrables sur R, c’est-à-dire telles que l’intégrale impropre
Z +∞
|f (t)| dt converge. Les propriétés présentées ici s’étendent aussi à certaines
t=−∞
distributions, et notamment à la distribution de Dirac‡ , dont nous rappellerons plus
loin les propriétés.
sin x
2 Sinus cardinal : nous définirons la fonction sinus cardinal par sinc(x) = ;
x
cette notation sera utilisée dans toute la suite du cours de Physique, avec le prolon-
gement par continuité sinc(0) = 1.
sinc(u)
1

5π
b b sinc = 0, 13
2
2π
b b
−2π 2π b u
b b b b b0 b b b
b b
−π π
b b

3π
sinc = −0, 21
2
Figure 3.11 – La fonction sinus cardinal

Le tracé de cette fonction est reporté sur la figure 3.11, avec quelques points re-
marquables Z ; ajoutons aux propriétés qui sont indiqués sur cette figure la valeur des
∞ Z ∞
intégrales sinc(u)du = π et sinc2 (u)du = π.
−∞ −∞
La fonction tracée sur la figure 3.11 présente un maximum principal en u = 0 ; celui-ci
(grisé sur la figure) est souvent caractérisé par sa largeur à la base égale à 2π.
On parle aussi parfois de largeur à mi-hauteur du maximum principal ; elle est ici
assez proche de la demi-largeur à la base du même maximum, donc de π.
Les points indiqués sur la figure 3.11 correspondent aux points de contact de la fonc-
1
tion sinc avec les enveloppes ± ; ils sont immédiatement voisins des maxima secon-
u
daires de la fonction.
2 Transformée de Fourier directe : considérant une fonction quelconque f , non né-
cessairement périodique,√on généralise la définition (3.4) des coefficients de Fourier en
posant (le coefficient 1/ 2π est conventionnel) :
+∞
1
Z
fˆ(ω) = √ f (t) exp(−jωt) dt (3.11)
2π t=−∞
La fonction transformée est aussi une fonction complexe d’une variable réelle, mais
l’unité de mesure de sa variable est changée ; si t se mesure en seconde, ω est une
pulsation en radian par seconde. Ainsi, la transformée de Fourier passe de l’espace
direct (des variables temporelles t) à l’espace réciproque (des pulsations ω).
3.2.2 Propriétés fondamentales

2 Premier exemple : intéressons nous au calcul de la transformée de Fourier d’une
impulsion de faible durée, de valeur élevée, centrée en t = 0, définie (cf. figure 3.12)
1 ∆t
par f (t) = si |t| < , et f (t) = 0 sinon. Cette fonction est construite pour
∆t 2 Z +∞
assurer une aire unité (grisée) sous la courbe f (t) dt = 1.
t=−∞
f fˆ
1
∆t
∆t ω
t
b
0 2∆ω
Figure 3.12 – Impulsion centrée en t = 0 et sa transformée de Fourier

+∆t/2
1
Z
La transformée de Fourier de f est donc fˆ(ω) = √
exp (−jωt) dt, que
∆t 2π −∆t/2
+∆t/2
ˆ 1 exp (−jωt) 1 ω∆t
l’on peut écrire f (ω) = √ = √ sinc .
∆t 2π −jω −∆t/2 2π 2
Sur la figure 3.12, on a représenté à côté de f sa transformée de Fourier, Re(fˆ(ω)), avec

2π
sa demi-largeur à la base ∆ω = ; elle ne dépend que de la durée de l’impulsion.
∆t
Sur le tracé de la fonction fˆ, comme ce sera souvent le cas lors d’études dans l’espace
des pulsations, on voit apparaı̂tre des composantes à pulsation négative. Il ne s’agit
que d’un artifice de calcul, les termes exp (+jωt) et exp (−jωt) n’ayant en général
de sens physique que par leurs parties réelles, qui sont identiques et correspondent
bien à une pulsation positive.
2 Généralisation : considérons maintenant le cas de la figure 3.13, impulsion de

même largeur et de même durée que la précédente, mais décalée en t = t0 .
Z t0 +∆t/2
1
La transformée de Fourier de f est donc fˆ(ω) = √ exp (−jωt) dt, que
∆t 2π t0 −∆t/2
1 ω∆t
l’on peut écrire fˆ(ω) = √ exp (−jωt0 ) sinc .
2π 2
Sur la figure 3.13, on a représenté à côté de la fonction
f la partie réelle de sa trans-
1 ω∆t
formée de Fourier, Re(fˆ(ω)) = √ cos (ωt0 ) sinc ; la partie imaginaire est
2π 2
semblable à un décalage d’un quart de période près.
f fˆ ω0
1 b
∆t
∆t ω
b
t
t0
2∆ω
Figure 3.13 – Impulsion et sa transformée de Fourier
La demi-largeur à la base ∆ω = 2π/∆t de l’enveloppe de fˆ est inchangée par rapport

au cas précédent ; la période ω0 = 2π/t0 de la fonction cos (ωt0 ) est manifestement
accidentelle puisqu’elle ne dépend que du choix de l’origine des instants.
2 Largeurs de f et fˆ : nous retiendrons, comme un résultat général, que les largeurs
à mi-hauteur d’une fonction quelconque f (t) et de sa transformée de Fourier fˆ(ω)
varient en sens inverse l’une de l’autre :
∆t × ∆ω ∼ 2π (3.12)
Étendues dans les espaces direct et réciproque

X Une fonction f (t) de courte durée a une transformée de Fourier fˆ qui
s’étend sur un grand domaine de fréquences ; à la limite, une impulsion
instantanée contient toutes les fréquences de 0 à +∞.
Réciproquement, une fonction de longue durée présente forcément une
certaine périodicité, et son spectre de fréquences est limité à un petit
intervalle.
2 Théorème de Parseval : pour donner une interprétation énergétique à une fonction

f (t) quelconque, on calculera en électricité la puissance |f (t)|2 associée et l’énergie
Z +∞
transportée prend donc la forme |f (t)|2 dt. Dans le cas de l’impulsion décrite
t=−∞
Z +∞
1
plus haut, on obtient immédiatement |f (t)|2 dt = .
∆t
Z +∞ t=−∞ Z +∞
1 ω∆t
Calculons l’intégrale analogue |fˆ(ω)|2 dω = sinc2 dω soit,
ω=−∞ 2π ω=−∞ 2
Z +∞ Z +∞
ω∆t 1
en notant u = , |fˆ(ω)|2 dω = sinc2 (u) du. On remarque donc
2 ω=−∞ ∆tπ u=−∞
Z +∞ Z +∞
la relation |f (t)|2 dt = |fˆ(ω)|2 dω dont on admet la généralisation :
t=−∞ ω=−∞
Théorème de Parseval
X Une fonction f (t) et sa transformée de Fourier fˆ vérifient le théorème
Z +∞ Z +∞
de Parseval, |f (t)|2 dt = |fˆ(ω)|2 dω : l’énergie totale trans-
t=−∞ ω=−∞
portée par le signal f est la somme des énergies transportées par chacune
des fréquences qui le composent.
3.2.3 Inversion de la transformée de Fourier

2 Distribution de Dirac : l’impulsion de courte durée définie ci-dessus admet, au
sens des distributions, une limite quand ∆t → 0 : la distribution de Dirac‡ . Pour
compléter les propriétés déjà affirmées à son sujet, remarquons d’abord que l’impulsion
f représentée en 3.13 n’est pas centrée à l’instant 0 mais à l’instant t0 ; sa limite quand
∆t → 0 est donc la distribution t → δ(t − t0 ), décalée dans le temps. Z ∞
Soit aussi une fonction g quelconque. Le calcul de l’intégrale I = g(t) f (t) dt se
−∞
Z t0 +∆t/2
1
ramène à l’expression I = g(t)dt, c’est-à-dire à la valeur moyenne gm (t0 )
∆t t0 −∆t/2
sur un intervalle de largeur ∆t centré en t0 . Lorsque la largeur de cet intervalle tend
vers 0, on a bien sûr gm (t0 ) → g(t0 ), ce qui permet d’écrire la propriété fondamentale
qui définit la distribution de Dirac :
Distribution de Dirac
X Pour toute Z ∞fonction g, la distribution de Dirac est l’objet qui assure
l’égalité g(t)δ(t − t0 )dt = g(t0 ).
−∞
Z ∞
Avec g(t) = 1 et t0 = 0 on retrouve bien sûr la propriété déjà énoncée, δ(t)dt = 1.
−∞
2 Transformée de Fourier de la distribution de Dirac : considérons

maintenant la
ˆ 1 ω∆t
limite de la fonction f (ω) = √ exp (−jωt0 ) sinc lorsque ∆t → 0, donc
2π 2
ω∆t 1
sinc → 1 ; on trouve alors fˆ → √ exp (−jωt0 ). La transformée de Fourier
2 2π
de la distribution de Dirac (impulsion de durée nulle) est une exponentielle (de module
1 quelle que soit la pulsation ω, donc s’étendant sur toutes les fréquences) :
1
f (t) = δ(t − t0 ) ⇒ fˆ(ω) = √ exp (−jωt0 ) (3.13)
2π
En particulier, la transformée de Fourier de la distribution de Dirac δ(t) est la fonction,

1
constante δ̂ = √ .
2π
K
2 Sinus cardinal et distribution de Dirac : étudions les fonctions fK (t) = sinc(Kt).
π
Par construction, fK prend des valeurs faibles dès que |Kt| ≫ π, et prend la valeur
Z +∞
K
pour t = 0 ; de plus, on a toujours fK (t) dt = 1.
π t=−∞
Si on fait tendre K vers l’infini, la suite de fonctions fK (t) tend donc vers une fonction
nulle pour tout t 6= 0, infinie en t = 0 et d’intégrale égale à 1 sur R : on reconnaı̂t la
distribution de Dirac et on écrira :
K
lim sinc(Kt) = δ(t) (3.14)
K→∞ π
2 Transformée inverse : définissons, par analogie avec la transformée de Fourier

directe (3.11), la transformée de Fourier inverse d’une fonction de la pulsation g(ω),
permettant de repasser de l’espace réciproque (espace des pulsations) à l’espace direct
(temporel) :
+∞
1
Z
ǧ(t) = √ g(ω) exp(+jωt) dω (3.15)
2π ω=−∞
On peut noter dans (3.15) le changement de signe dans l’exponentielle par rapport
à (3.11) ; on peut aussi relire cette définition en notant que ǧ est une combinaison
1
linéaire de termes harmoniques exp(+jωt), avec une amplitude √ g(ω) pour la
2π
composante de pulsation ω.
2 Lien avec la transformée directe : considérons enfin le cas où g(ω) = fˆ(t) est
ˇˆ
elle-même une transformée
Z +∞ Z de Fourier directe. On peut alors écrire la ǧ = f sous la
+∞
1
forme ǧ(t) = f (t′ ) exp(−jωt′ ) dt′ exp(jωt) dω ou, en admettant
2π ω=−∞ t′ =−∞
Z +∞ Z +∞
1 ′
l’interversion des sommes, ǧ(t) = f (t ) exp (jω(t − t )) dω dt′ .
′
2π t′ =−∞ ω=−∞
Z K
Puisque hK (t − t′ ) = exp (jω(t − t′ )) dω = 2Ksinc(K(t − t′ )) l’intégrale en ω est
−K
lim h∞ (t − t′ ) = 2πδ(t − t′ ), compte tenu de (3.14).
K→∞
Z +∞
Revenant au calcul précédent, ǧ(t) = f (t′ )δ(t − t′ ) dt′ = f (t). On montre ainsi
t′ =−∞
que la combinaison de deux transformées de Fourier successives, directe et inverse,
ramène à la fonction de départ :
TF directe TF inverse
f (t) −→ fˆ(ω) = g(ω) g(ω) −→ ǧ(t) = f (t)
(3.16)
TF inverse TF directe
g(ω) −→ ǧ(t) = f (t) f (t) −→ fˆ(ω) = g(ω)
Comme on l’a noté en (3.16), le résultat est évidemment le même quel que soit l’ordre
des transformations.
Ainsi, on peut passer de l’espace direct (temporel) à l’espace inverse (fréquentiel) et
réciproquement, ce qui justifie enfin pleinement l’emploi des notations complexes pour
d
les dérivations et vice-versa ⇋ jω, quelle que soit la forme du signal étudié.
dt
3.2.4 Réponse impulsionnelle d’un système linéaire

2 Réponse impulsionnelle : nous étudions ici un système linéaire qui transforme
une grandeur d’entrée xe (t) en une grandeur de sortie xs (t). On peut bien sûr en
x
faire l’étude par l’intermédiaire de la fonction de transfert complexe H(ω) = s ;
xe
en pratique, cela revient à faire une série de mesures pour de nombreuses valeurs de
ω judicieusement choisies. Nous allons montrer qu’une mesure unique peut suffire à
caractériser complètement le système linéaire.
Lorsque xe = aδ(t), c’est-à-dire lorsqu’on impose à l’entrée du système une impulsion
a
de très courte durée ∆t, et de grande amplitude x0 = à l’instant t = 0, la sortie
∆t
du système prend le nom de réponse impulsionnelle et on la notera axis (t). C’est cette
réponse impulsionnelle qui contient toute l’information recherchée : elle permet de
déterminer la fonction de transfert H(ω) et donc aussi la réponse xs (t) à une entrée
xe (t) quelconque.
2 Décomposition en impulsions : pour montrer ce résultat, décomposons un signal
d’entrée quelconque xe (t) en une somme d’impulsions successives. Cette décomposi-
tion peut être illustrée qualitativement sur la figure 3.14. Cette décomposition corres-
Z +∞
pond à l’écriture xe (t) = xe (t′ )δ(t − t′ ) dt′ : à l’instant t′ on doit prendre en
t′ =−∞
compte une impulsion de hauteur xe (t′ ) ; c’est le terme xe (t′ )δ(t − t′ )dt′ de la somme.
xe
xe (t)
b
t
t′
Figure 3.14 – Décomposition en impulsions d’un signal quelconque
On a vu que, à l’entrée impulsionnelle xe (t′ )δ(t − t′ )dt′ correspond la sortie impul-

sionnelle xe (t′ )xis (t − t′ )dt′ ; compte tenu du caractère linéaire du système étudié,
la sortieZdu montage est donc une somme de réponses impulsionnelles, qu’on écrira
+∞
xs (t) = xe (t′ )xis (t − t′ ) dt′ .
t′ =−∞
Il est donc possible de déterminer xs (t) par le calcul de cette intégrale, qui porte le
nom d’intégrale de convolution (ou produit de convolution) des fonctions xe et xis ,
avec la notation générale xs = xe ∗ xis .
2 Lien avec la fonction de transfert : le calcul effectif des intégrales de convolution

est possible, mais le passage par les transformées de fourier rend le résultat beaucoup
plus explicite. Nous voulons représenter Z +∞le signal de sortie comme une somme de
1
grandeurs sinusoı̈dales, xs (t) = √ x̂s (ω) exp (jωt) dω ; on reconnaı̂t bien
2π ω=−∞
x̂s (ω)
sûr ici xs (ω) = √ , amplitude complexe de la composante de pulsation ω.
2π
Il reste à déterminer la transformée de Fourier x̂s , qu’on écrit en combinant la dé-
finition de la transformée
Z +∞ de ZFourier directe et l’intégrale de convolution ci-dessus,
+∞
1 ′ i ′ ′
selon x̂s (ω) = √ xe (t )xs (t − t ) dt exp (−jωt) dt ou, au moyen
2π t=−∞ t′ =−∞
d’une permutationZ +∞ des sommes et en introduisant
Z +∞ un facteur multiplicatif adéquat,

1 ′ ′ i
x̂s (ω) = √ xe (t ) exp (−jωt ) xs (t − t′ ) exp (−jω(t − t′ )) dt dt′ .
2π t′ =−∞ t=−∞
À un changement de variables près, l’intégrale sur t définit la transformée de Fourier
Z +∞
directe de xis , et x̂s (ω) = x̂is (ω) xe (t′ ) exp (−jωt′ ) dt′ . Enfin, en changeant de
t′ =−∞
notation
√ t′ → t, on reconnaı̂t
√ la transformée de Fourier du signal d’entrée xe au facteur
2π près et x̂s (ω) = 2πx̂is (ω)x̂e (ω).
x̂e (ω)
Finalement, on note aussi xe (ω) = √ l’amplitude complexe de la composante de
2π
pulsation ω du signal d’entrée, pour obtenir :
xs √
H(ω) = = 2π × x̂is (3.17)
xe
La fonction de transfert H(ω) est proportionnelle à la transformée de Fourier de la

réponse impulsionnelle. Nous n’utiliserons ce résultat que dans une optique qualita-
tive :
Réponse impulsionnelle et fonction de transfert

X Une réponse impulsionnelle de longue durée correspond à une fonction
de transfert de faible largeur (avec donc un pic étroit et un facteur de
qualité élevé) ; réciproquement, un régime transitoire bref correspond à
une fonction de transfert de faible facteur de qualité, donc à un amortis-
sement élevé.
Cette propriété générale est parfaitement illustrée dans le cas d’une fonction de trans-
fert d’ordre 2 ; considérons par exemple un filtre passe-bas, de fonction de transfert
H0
normalisée H(ω) = . L’équation différentielle correspondante est donc,
jω ω2
1+ − 2
Qω0 ω0
d 1 d2 xs 1 dxs
compte tenu du passage automatique ⇋ jω, 2 + + xs = H0 xe .
dt ω0 dt2 Qω0 dt
La forme générale de la solution de régime permanent est un régime transitoire apé-
riodique, critique ou pseudo-périodique selon les valeurs de Q relativement à la valeur
critique Qc = 2.
On a vu que pour Q ≫ Qc , le régime transitoire est pseudo-périodique, donc de grande
durée et de pseudo-pulsation ω ≃ ω0 ; la fonction de transfert présente alors un pic
étroit centré sur ωr ≃ ω0 .
Réciproquement, pour Q ≪ Qc , le régime transitoire est apériodique, de courte durée ;

la fonction de transfert présente alors une grande largeur dans l’espace des pulsations.
On peut proposer (cf. figure 3.15) le principe d’une mesure de fonction de transfert
effectuée par ce moyen sur un système linéaire.
Générateur Système linéaire Oscilloscope et

d’impulsions H(ω) module de calcul
Figure 3.15 – Principe de détermination de H par une mesure impulsionnelle
Dans ce schéma, un oscilloscope permet de représenter simultanément, dans l’espace

temporel, les grandeurs xe (t) (impulsion imposée à l’entrée du système linéaire) et
xs (t) (signal de sortie, ici pseudo-périodique amorti). Ces deux tracés sont proposés
sur la figure 3.16.
Un module de calcul (transformée de Fourier rapide ou FFT, fast Fourier transform),
aujourd’hui associé à de nombreux oscilloscopes, permet de tracer l’allure de la trans-
formée de Fourier de ce signal de sortie (ici, on reconnaı̂t un filtre passe-bande).
xe (t)
xs (t)
Tracés temporels Résultat de la FFT
Figure 3.16 – Signaux d’entrée et de sortie dans une mesure impulsionnelle
Contrairement au tracé simple de la figure 3.16, les oscilloscopes utilisent en général

un tracé logarithmique pour l’amplitude H = |H|, en ordonnée, et une graduation
en fréquence f = ω/2π pour l’abscisse. L’allure de la FFT tracée est alors bien sûr
légèrement modifiée.
Tout signal de période T = 2π/ω peut être décomposé en série de Fourier,

∞
2 T

a0 X Z
f (t) = + ak cos kωt + bk sin kωt , où ak = f (t) cos kωtdt et
2 T 0
k=1
2 T
Z
bk = f (t) sin kωtdt.
T 0
∞
2 a20 X a2k + b2k
La valeur efficace d’un signal périodique est feff = + .
4 2
k=1
Si le signal f (t) est appliqué à l’entrée un système linéaire de fonction de trans-

fert H(ω) = H(ω) exp (jϕ(ω)), le signal de sortie est obtenu sous la forme
∞
a0 X
H(0) + H(kω) ak cos kωt + ϕ(kω) + bk sin kωt + ϕ(kω) .
2
k=1
Un signal créneau périodique ne contient que des harmoniques d’ordre k impair ;

leur amplitude décroı̂t comme 1/k.
Un signal triangle (ou dents de scie) périodique ne contient que des harmoniques
d’ordre k impair ; leur amplitude décroı̂t comme 1/k 2 .
On passe du calcul en régime harmonique (fonction de transfert H) au régime
d
quelconque (équation différentielle) en remplaçant partout jω par .
dt
Un système linéaire est stable si les pôles ωi , annulateurs du dénominateur de
la fonction de transfert H(ω), ont tous une partie imaginaire Im(ωi ) > 0.
Z +∞
ˆ 1
La transformée de Fourier de f (t) est f (ω) = √ f (t) exp (−jωt) dt ;
Z +∞2π t=−∞
1
on retrouve f à partir de fˆ par f (t) = √ fˆ(ω) exp (jωt) dω.
2π ω=−∞
Les largeurs de f et fˆ varient en sens inverse : ∆t × ∆ω ∼ 2π. En particulier,
la transformée de Fourier d’une impulsion de largeur ∆t est proportionnelle à
ω∆t
la fonction sinc .
2
La réponse d’un système linéaire à une impulsion (régime transitoire impul-
sionnel) et la fonction de transfert ont des largeurs inverses l’une de l’autre.
Chapitre 4
Lignes électriques et propagation d’ondes
4.1 Lignes électriques
4.1.1 Modélisation d’une ligne bifilaire

2 Ligne bifilaire : on appelle ainsi une ligne électrique constituée de deux conducteurs
électriques, de grande longueur. Elle peut être constituée de deux fils (câble plat, câble
coaxial), ou bien d’un seul fil avec un retour du courant par le sol. Dans tous les cas,
on sera amené à se poser le problème de la propagation des signaux électriques le
long de la ligne dès que sa longueur totale L ne vérifie pas les conditions d’A.R.Q.P.,
2π
c’est-à-dire si L & c0 τ , avec pour durée caractéristique τ = , où c0 est la célérité de
ω
propagation des ondes élecromagnétiques et ω la pulsation des signaux dans la ligne.
Nous ne pourrons donc pas appliquer les lois de Kirchhoff à la ligne toute entière, mais
seulement à un élément de longueur dx de ligne, que l’on pourra choisir arbitrairement
court.
2 Résistivité, conductivité : considérons donc un brin de fil, assimilé à un conducteur
cylindrique de longueur ℓ et de section droite s. On sait que la résistance électrique de
deux éléments identiques, placés en série, est Req = 2R : lorsque la longueur double,
la résistance double. Plus généralement, la résistance électrique est proportionnelle à
la longueur du conducteur.
De même, l’association en parallèle de deux conducteurs identiques conduit à une
R
résistance équivalente Req = : ainsi, lorsque la section du fil double, la résistance
2
est divisée par deux. Plus généralement, la résistance électrique est inversement pro-
portionnelle à la section du conducteur.
Nous regrouperons ces deux résultats sous la forme :
1 ℓ 1ℓ
R= =̺ = (4.1)
G s γs
Le coefficient ̺, qui ne dépend que de la nature du conducteur (et de sa température)

porte le nom de résistivité du conducteur ; son inverse γ porte le nom de conductivité.
La tableau 4.1 indique la conductivité de divers métaux à la température ambiante.

On notera que, pour un câble de cuivre de 1 mm2 de section, la résistance unitaire
1
(résistance par unité de longueur) a pour valeur Ru = = 1, 7 Ω · m−1 .
γs
cuivre argent aluminium

γ 5, 97 × 107 6, 30 × 107 3, 77 × 106 S · m−1
Table 4.1 – Conductivité électrique des métaux
2 Caractéristiques de ligne : considérons un élément de ligne bifilaire de longueur dx ;

on supposera par exemple qu’elle est formée d’un fil (de résistance unitaire Ru ) avec
retour du courant par le sol ; cet élément de longueur a une résistance dR = Ru dx.
D’autre part, l’influence électromagnétique entre le fil et le sol se traduit par la création
d’un champ électrique et d’un champ magnétique.
La création du champ E s’accompagne d’une accumulation de charges électriques sur
les faces en regard des deux conducteurs : c’est un effet capacitif.
Considérons deux brins de ligne de longueur ℓ, leur association, de longueur 2ℓ, peut
être traitée comme la mise en parallèle des deux condensateurs. Puisque deux conden-
sateurs en parallèle ont des capacités qui s’ajoutent, la capacité de ligne est propor-
tionnelle à la longueur considérée.
Pour une longueur élémentaire dx, on écrira donc dC = Cu dx, où Cu est la capacité
unitaire de ligne (appelée aussi capacité par unité de longueur). Nous montrerons ul-
térieurement que les capacités unitaires de ligne sont en général de l’ordre de grandeur
de la constante ε0 = 8, 85 × 10−12 F · m−1 .
La création du champ B s’accompagne d’une force électro-motrice induite par les
variations du courant : c’est un effet inductif.
Considérons encore deux brins de ligne de longueur ℓ, leur résultante, de longueur 2ℓ,
peut être traitée comme la mise en série des deux bobines d’induction équivalentes.
Puisque deux bobines en série ont des inductances propres qui s’ajoutent, l’inductance
de ligne est proportionnelle à la longueur considérée.
Pour une longueur élémentaire dx, on écrira donc dL = Lu dx, où Lu est l’inductance
unitaire de ligne. Nous montrerons ultérieurement que les inductances unitaires de
ligne sont en général de l’ordre de grandeur de la constante µ0 = 4π × 10−7 H · m−1 .
Enfin, le milieu isolant qui sépare les deux fils de la ligne peut présenter des fuites
électriques ; l’association de deux brins de fil étant une association en parallèle, la
conductance de fuite est encore proportionnelle à la longueur de l’élément considéré,
et on notera dG = Gu dx, où Gu est la conductance unitaire de fuite.
Finalement, le schéma électrique électrique équivalent à un élément infinitésimal de
ligne bifilaire est représenté, à une date t quelconque, sur le schéma 4.1.
i(x, t) dL = Lu dx i(x + dx, t)

b b b b b
b
dG = Gu dx
dC = Cu dx
dR = Ru dx
u(x, t) u(x + dx, t)
b b
b
Figure 4.1 – Schéma d’un élément de ligne
2 Lignes idéales : nous traiterons essentiellement dans la suite des lignes idéales,
dans lesquelles on peut négliger les effets résistifs : Ru = 0 (pas de résistance des fils
de la ligne) et Gu = 0 (ou, ce qui revient au même, 1/Gu → ∞ : la résistance de fuite
à travers l’isolant qui sépare les deux fils est infinie ; il s’agit d’un isolant parfait).
4 : Lignes électriques et propagation d’ondes 71
En ce qui concerne Ru , on peut évaluer les conditions de validité de cette approxi-

mation en affirmant qu’on peut négliger la partie résistive de l’impédance dR + jdLω
devant la partie inductive dès lors que Ru ≪ Lu ω soit, avec les valeurs proposées plus
ω
haut, pour f = ≫ 200 kHz : cette approximation n’étant pas pleinement satisfai-
2π
sante, nous reviendrons ultérieurement sur l’effet de Ru ; par contre, nous admettrons
que l’approximation Gu = 0 est toujours raisonnable.
Dans ce cas, la ligne est entièrement caractérisée par les grandeurs Lu et Cu . Une
analyse dimensionnelle montre qu’on peut déduire de Lu et Cu deux caractéristiques
essentielles de la propagation des signaux électriques le long de la ligne.
Lu L jLω
Écrivons d’abord = = = ZL ZC ; cette grandeur est donc le carré d’une
Cu C jCω
résistance, que l’on nomme impédance caractéristique de ligne, et qu’on notera Zc :
r
Lu
Zc = (4.2)
Cu
Avec les valeurs proposées plus haut, Zc ∼ 300 Ω ; en général, les impédances des
lignes bifilaires valent quelques dizaines à quelques centaines d’ohm.
[LC]
De même, l’analyse dimensionnelle du produit Lu Cu montre [Lu Cu ] = où d est
[d2 ]
une distance ; faisant intervenir la pulsation ω0 de résonance d’un circuit L, C, on
1
obtient [Lu Cu ] = 2 ; ce produit est donc l’inverse du carré d’une vitesse en on
[dω0 ]
définira une célérité caractéristique de ligne c :
1
c= √ (4.3)
Lu Cu
Avec les valeurs proposées plus haut, c ∼ 3, 0 × 108 m · s−1 ; nous montrerons ultérieu-
rement que la célérité caractéristique d’une ligne vérifie toujours c 6 c0 , où c0 est la
c0
célérité des ondes électromagnétiques dans le vide. On posera éventuellement c = ,
n
où n > 1 porte le nom d’indice pour la ligne étudiée.
4.1.2 Équations des télégraphistes
L’élément de longueur dx de ligne représenté sur la figure 4.1 étant de dimension

arbitrairement faible, les conditions d’A.R.Q.P. s’appliquent localement et on peut
utiliser les lois des nœuds et des mailles ; on les développera au premier ordre en dx.
∂i(x, t)
2 Loi des mailles : elle s’écrit u(x, t) = u(x + dx, t) + dRi(x, t) + dL avec,
∂t
∂u(x, t)
au premier ordre en dx, u(x + dx, t) = u(x, t) + dx. On en déduit la première
∂x
équation des télégraphistes :
∂u(x, t) ∂i(x, t)
= −Ru i(x, t) − Lu (4.4)
∂x ∂t
∂u(x + dx, t)
2 Loi des nœuds : i(x, t) = i(x + dx, t) + dGu(x + dx, t) + dC devient,
∂t
∂i(x, t) ∂u(x + dx, t)
au même ordre, = −Gu u(x + dx, t) − Cu ; toutefois, les deux
∂x ∂t
∂u(x, t)
termes en u(x + dx, t) = u(x, t) + dx doivent, à cet ordre du développement,
∂x
être remplacés par u(x, t). On en déduit la seconde équation des télégraphistes :
∂i(x, t) ∂u(x, t)
= −Gu u(x, t) − Cu (4.5)
∂x ∂t
2 Équation de propagation : la combinaison des deux équations des télégraphistes

mène à une équation de propagation ; pour l’établir, nous utiliserons les notations
simplifiées u et i au lieu de u(x, t) et i(x, t).
L’équation (4.4) traduit la chute de tension (résistive et inductive) sur une longueur
dx ; de même, (4.5) traduit la perte de courant (conductive et capacitive) sur la même
longueur. Il s’agit d’un système d’équations aux dérivées partielles couplées pour les
deux fonctions inconnues u(x, t) et i(x, t).
Le principe du découplage des équations est le même pour toute étude de propagation
d’ondes ; on cherche par exemple à éliminer i(x, t) en dérivant la première équation
par rapport au temps, et la seconde par rapport à x, pour faire apparaı̂tre les dérivées
∂2u ∂2u
secondes 2
et 2 de la fonction qu’on cherche à conserver. On obtient dans (4.4),
∂x ∂t
∂2u ∂2i ∂2u ∂2i

∂i ∂u
2
= −R u − L u ou 2
= R u G u u + Cu − Lu ; de même, dans
∂x ∂x ∂x∂t ∂x ∂t ∂x∂t
∂2i ∂u ∂2u
(4.5), = −Gu − Cu 2 . Sachant qu’on peut intervertir l’ordre de deux
∂t∂x ∂t ∂t
dérivés partielles par rapport aux deux variables indépendantes x et t, on obtient
enfin l’équation de propagation des télégraphistes :
∂2u ∂2u ∂u
= Lu Cu + Ru Gu u + (Ru Cu + Gu Lu ) (4.6)
∂x2 ∂t2 ∂t
Cette équation se simplifie pour une ligne idéale (Ru = 0, Gu = 0) et prend alors la
forme (4.7), qui montre l’importance de la grandeur c définie plus haut :
∂2u 1 ∂2u 1
2
= 2 2 c= √ (4.7)
∂x c ∂t Lu Cu
Il s’agit de ce qu’on appelle l’équation de d’Alembert ; son importance en Physique, et

son intervention dans de nombreux domaines autres que l’Électrocinétique, justifient
qu’on en fasse une étude générale.
La même méthode s’applique si on souhaite déterminer une équation différentielle

vérifiée par le courant i(x, t) ; l’équation obtenue a d’ailleurs la même forme. Toute-
fois, résoudre séparément pour u(x, t) et i(x, t) n’est en général pas souhaitable car
ces grandeurs ne sont pas indépendantes ; par exemple, une fois connue la solution
u(x, t), on en déduira immédiatement i(x, t) par la relation (4.5), à une constante
d’intégration près.
4.2 Étude générale de l’équation de d’Alembert
4.2.1 Ondes planes

2 L’équation de d’Alembert : nous généralisons l’équation différentielle obtenue, en
l’absence de tout terme résistif, pour la tension u(x, t) comme pour le courant i(x, t)
dans une ligne idéale, sous le nom d’équation de d’Alembert‡ à une dimension pour
la fonction inconnue f (x, t) :
∂ 2 f (x, t) 1 ∂ 2 f (x, t)
= (4.8)
∂x2 c2 ∂t2
Dans une telle équation, la grandeur c a forcément la dimension d’une vitesse.

Nous verrons ultérieurement que l’équation de d’Alembert peut être généralisée aux
problèmes à trois dimensions ; elle prend alors la forme :
1 ∂ 2 f (r, t) ∂ 2 f (r, t) ∂ 2 f (r, t) ∂ 2 f (r, t)

∆f (r, t) = ∆f (r, t) = + + (4.9)
c2 ∂t2 ∂x2 ∂y 2 ∂z 2
L’opérateur différentiel du second ordre ∆ porte le nom de laplacien ou opérateur de

Laplace‡ .
Dans la suite de ce chapitre, nous ne traiterons que d’ondes à une dimension ; on
parle aussi d’ondes planes (parfois notées OP), c’est-à-dire de grandeurs f (x, t) qui
ne dépendent que d’une seule variable cartésienne x. Ainsi, la grandeur physique
f (x, t) est une constante, à une date t donnée, dans tout plan x = cte, qui porte alors
le nom de plan d’onde.
2 Ondes planes : la solution d’une équation de d’Alembert à une dimension peut
être déterminée au moyen du changement de variables (x, t) → (α = x−ct, β = x+ct).
∂f ∂f ∂α ∂f ∂β
On réalise le changement de variables au moyen des relations = +
∂x ∂α ∂x ∂β ∂x
∂f ∂f ∂f ∂f ∂f ∂α ∂f ∂β ∂f ∂f
donc = + , = + = −c +c ; le même procédé
∂x ∂α ∂β ∂t ∂α ∂t ∂β ∂t ∂α ∂β
∂2f ∂2f ∂2f ∂2f
appliqué encore une fois fournit les dérivées secondes = + + 2 et
∂x2 ∂α2 ∂β 2 ∂α∂β
2 2 2 2
∂ f ∂ f ∂ f ∂ f
= c2 2 + c2 2 − 2c2 .
∂t2 ∂α ∂β ∂α∂β
∂2f
L’équation de d’Alembert prend alors la forme particulièrement simple = 0;
∂α∂β
∂f
on en déduit que ne dépend pas de α ; c’est donc une certaine fonction h(β).
∂β
∂f
L’intégration de l’équation différentielle = h(β) mène à f (α, β) = H(β) + K(α),
∂β
où H est une primitive de h. La constante d’intégration K(α) ne dépend pas de β ;
toutefois, l’intégration ci-dessus a été faite à α fixé mais rien n’interdit, si on reprend le
même calcul pour une autre valeur de α, de trouver une autre constante d’intégration.
Celle-ci donc été notée K(α), et c’est une fonction de α.
La symétrie du résultat f (α, β) = H(β) + K(α) était prévisible ; si on était parti
∂2f
de l’équation sous la forme = 0 en intervertissant l’ordre des intégrations, on
∂β∂α
obtiendrait le même résultat, les fonctions H et K étant indépendantes et arbitraires.
Structure des ondes planes

X Toute onde plane, c’est-à-dire toute fonction f (x, t) solution de l’équation
∂ 2 f (x, t) 1 ∂ 2 f (x, t)
de d’Alembert 2
= 2 , s’écrit comme la somme de deux
∂x c ∂t2
ondes planes progressives, c’est-à-dire deux fonctions qui ne dépendent
respectivement que de x − ct et x + ct, f (x, t) = f+ (x − ct) + f− (x + ct).
2 Ondes planes progressives : on donne ce nom aux grandeurs qui ne dépendent que
de la variable x ± ct ; nous considérerons ici la fonction f+ (x − ct) puisqu’on obtient
la même interprétation pour f− (x + ct) en changeant le signe de c.
S’agissant d’une fonction quelconque, sa forme ne peut pas être déterminée a priori ;
toutefois, on peut en donner une interprétation graphique en supposant une forme
de fonction quelconque. Puisqu’elle dépend de deux paramètres, nous choisirons de la
représenter par des (( photographies )) successives, à trois instants t < t′ < t′′ , comme
sur la figure 4.2.
f+
à t à t′ à t′′
x
x0 x′0 x′′0
Figure 4.2 – Onde plane progressive
La fonction retrouve en x′0 et à l’instant t′ , la même valeur qu’elle avait à l’instant t

x′ − x0
en x0 si x0 − ct = x′0 − ct′ , ce qu’on peut encore écrire 0′ = c : on reconnaı̂t ici
t −t
la définition d’une vitesse constante ; ainsi, la forme de la grandeur f se propage sans
déformation le long de l’axe (Ox), à la vitesse c.
Cette absence de déformation est liée, dans le cas de la ligne électrique bifilaire, au
caractère idéal de celle-ci (Ru = 0, Gu = 0). En présence de termes dissipatifs, on
peut continuer à voir des phénomènes de propagation, mais avec une atténuation
progressive de l’amplitude de l’onde.
On caractérise au moyen de l’adjectif progressif chacune des deux composantes f+ et
f− de l’onde plane, en précisant dans quel sens cette progression a lieu :
Onde plane progressive

X Une fonction quelconque f+ (x − ct) (ou, respectivement, f− (x + ct))
décrit une grandeur qui se propage sans déformation le long de l’axe
(Ox) à la vitesse +c (respectivement, à la vitesse −c).
On parle alors d’ondes planes progressives (notation OPP), se propa-
geant dans le sens de l’axe (Ox) pour la première f+ (x − ct), et dans le
sens inverse pour la seconde f− (x + ct).
4.2.2 Ondes harmoniques

2 Ondes planes progressives harmoniques : considérons une onde plane progressive
dans le sens de l’axe (Ox) à la célérité c, c’est-à-dire une fonction quelconque de la
variable x − ct ou, ce qui revient au même, de la variable t − x/c. Si cette fonction
est périodique, elle peut être développée
Z +∞ en série de Fourier, et sinon en intégrale de
1 h x i
Fourier selon F+ (t − x/c) = √ F̌ (ω) exp jω t − dω.
2π ω=−∞ c
On retrouve ici encore des composantes qui semblent être de pulsation négative.
Comme on l’a déjà fait remarquer, il ne s’agit que d’un artefact de calcul, par
exemple pour représenter une fonction sinusoı̈dale sous forme complexe, comme
x 1 x x
dans cos ω t − = exp jω t − + exp −jω t − .
c 2 c c
Chacun des termes de cette somme est une onde plane progressive, fonction harmo-
nique (on dit aussi sinusoı̈dale ou, pour emprunter un vocabulaire d’origine optique,
monochromatique) ; on adoptera parfois les notations OPPH, OPPS ou OPPM :
h x i
A± (x, t) = a exp jω t ∓ (4.10)
c
Dans (4.10), la grandeur a = a0 exp (jϕ) avec a0 > 0 est l’amplitude complexe de
l’onde, a0 son amplitude réelle et ϕ sa phase à l’origine. Les deux signes ± corres-
pondent bien sûr aux deux sens possibles de propagation.
Une telle onde est une fonction sinusoı̈dale du temps, de pulsation ω, de fréquence
ω 1 2π
ν= , de période T = = .
2π ν ω
On peut aussi choisir d’écrire cette même ondehsous des formes équivalentes, en modi-
x i
fiant l’écriture de l’exponentielle complexe exp jω t − qui décrit la propagation,
c
par exemple pour l’onde progressive :

t x
exp [j (ωt − kx)] = exp [j2π (νt − σx)] = exp j2π − (4.11)
T λ
ω
Puisque ω est la pulsation, le coefficient k = porte le nom de pulsation spatiale
c
k
ou vecteur d’onde ; de même, σ = porte le nom de fréquence spatiale ou nombre
2π
2π
d’onde ; enfin, λ = est la période spatiale ou longueur d’onde. k et σ se mesurent
k
−1
en m et λ en mètre.
Afin de proposer une première généralisation des expressions (4.11), on peut introduire
le vecteur k = kex , justifiant le terme de vecteur d’onde ; si sa norme k désigne la
pulsation de l’oscillation spatiale, sa direction ex décrit le sens de la propagation.
OPPH
X On appellera onde plane progressive harmonique toute fonction de l’es-
pace et du temps prenant, au point r et à l’instant t, la forme complexe
f (r, t) = a exp [j (ωt − k · r)], où a = a0 exp(jϕ) est l’amplitude com-
plexe de l’onde, ω > 0 sa pulsation, et k = ku avec k > 0 et u2 = 1 est
le vecteur d’onde. u est la direction de propagation de l’OPPH et k sa
pulsation spatiale. Cette onde se propage dans le sens positif de l’axe u
avec la vitesse de phase vϕ = ω/k, vϕ = vϕ u.
Le terme vitesse de phase est employé ici car cette vitesse intervient dans l’écriture

u·r
du terme de phase de l’onde f (r, t) = a exp ϕ (r, t), avec ϕ (r, t) = ω t − .
vϕ
On préférera l’emploi du terme vitesse de phase à celui, plus vague, de vitesse de

propagation. Nous verrons en effet qu’on peut définir d’autres vitesses dans l’étude
générale des ondes, et que, sauf dans le cas simple de l’équation de d’Alembert, ces
différentes vitesses ne sont pas forcément égales.
2 Notations complexes : si on considère une fonction quelconque de x et de t de

la forme (4.11), c’est-à-dire une OPPH, alors on remarque que, conformément aux
règles générales de dérivation des fonctions représentées dans l’espace de Fourier, on
d
peut faire la substitution = jω ; on peut aussi faire la même remarque pour les
dt
d
dérivations relativement à x et écrire = −jk. Dans le cas plus général d’une
dx
OPPH de la forme exp [j (ωt − k · r)] = exp [j (ωt − kx x + ky y + kz z)], on peut écrire
de manière équivalente les trois dérivées relativement à x, y et z et retenir :
∂ ∂ ∂ ∂
= jω = −jkx = −jky = −jkz (4.12)
∂t ∂x ∂y ∂z
Nous utilisons ici la notation complexe f ((r, t)) = a exp [j (ωt − k · r)] pour décrire
une onde plane ; toutefois, les grandeurs physiques (donc réelles) étudiées étant en
général données par Re(f (r, t)), il est a priori équivalent d’utiliser l’autre convention
g (r, t) = a exp [j (k · r − ωt)] ; dans ce cas, on n’oubliera pas de remplacer dans
∂ ∂
tous les calculs intermédiaires (complexes) les dérivées selon = −jω, = jkx ,
∂t ∂x
∂ ∂
= jky , = jkz ; en fin de calcul bien sûr, le retour aux parties réelles assure
∂y ∂z
que le sens physique ne change pas.
4.2.3 Atténuation et dispersion

2 Méthodes d’étude des ondes : nous avons vu que les ondes planes, solution
de l’équation de d’Alembert, se propagent sans s’atténuer ni se déformer (voir par
exemple la figure 4.2). Il ne s’agit toutefois que d’un cas particulier, et nous rencontre-
rons d’autres phénomènes ondulatoires à l’occasion desquels la propagation s’accom-
pagne d’une atténuation de l’amplitude des ondes, ou d’une dispersion (par exemple
un étalement des maxima).
L’atténuation de l’amplitude des ondes lors de leur propagation peut avoir deux
origines, l’une géométrique et l’autre physique. Nous verrons par exemple dans le
cours d’optique qu’une onde lumineuse émise par une source ponctuelle s’écrit sous
a
la forme W (r, t) = exp [j (ωt − kr)] : cette onde voit son amplitude diminuer
r
comme l’inverse 1/r de la distance à la source et on parle de dilution géométrique
de l’amplitude de l’onde. Toutefois, il n’y a ici aucune diminution de l’énergie trans-
portée avec la distance : la puissance surfacique rayonnée est proportionnelle à
|W (r, t) |2 , donc à 1/r2 ; à travers une surface 4πr2 de sphère de rayon r, on
retrouve bien un transport de puissance constant. Par contre, en présence de phéno-
mènes dissipatifs (comme l’effet Joule, entre autres), on assistera à une diminution
plus rapide de l’amplitude de l’onde.
Les ondes que nous étudierons sont solutions d’autres équations différentielles, plus
ou moins semblables à l’équation de d’Alembert. Il n’existe alors pas forcément de
solution générale de l’équation de propagation ; on cherchera alors souvent à résoudre
directement sous la forme d’OPPH, ce qui revient à remplacer les dérivées par des
multiplications complexes, et donc à déterminer une relation simple entre k et ω ;
cette relation prend alors le nom d’équation de dispersion.
∂2f 1 ∂2f

2
Considérons par exemple l’équation de Klein-Gordon = 2 + ω0 f ,
∂x2 c ∂t2
que nous rencontrerons régulièrement lors de l’étude des ondes.
Si une OPPH de la forme f (r, t) = a exp [j (ωt − k · r)] vérifie cette équation, on doit
1
imposer la condition nécessaire −k2 f = 2 −ω 2 f + ω02 f , obtenue en remplaçant

c
chaque dérivée par la multiplication associée conformément à (4.12).
1
La solution f n’est pas nulle seulement si −k2 = 2 −ω 2 + ω02 , qui est l’équation

c
de dispersion recherchée. On résume ici la liste de quelques équations aux dérivées
partielles qu’on rencontrera régulièrement dans la suite du cours de Physique, et les
équations de dispersion associées :
∂2f 1 ∂2f ω2
d’Alembert : = k2 =
∂x2 c2 ∂t2 c2
∂2f 1 ∂2f ω 2 − ω02

2
Klein-Gordon : = + ω 0 f k2 = (4.13)
∂x2 c2 ∂t2 c2
∂2f 1 ∂f ω
Diffusion : = k 2 = −j
∂x2 D ∂t D
Ces équations fournissent k 2 sous forme d’un nombre réel éventuellement négatif, ou
sous forme d’un nombre complexe ; alors qu’on choisira toujours ω ∈ R+ , on se rend
compte qu’en général k ∈ C : on va voir que cette circonstance se traduit par une
absorption de l’onde.
D’autre part, la relation entre k et ω n’est en général pas linéaire ; on va voir que cette
circonstance se traduit par une dispersion de l’onde.
2 Absorption : considérons une OPPH de la forme f = a exp [j (ωt − kx)] où k
est complexe, k = kr + jki , avec kr > 0 et ki ∈ R. On peut encore recopier cette
expression sous la forme f = a exp [ki x] exp [j (ωt − kr x)], ce qui décrit un phénomène
ω
de propagation le long de l’axe (Ox) à la vitesse de phase vϕ = , mais avec une
kr
amplitude de l’onde A(x) = a exp [ki x] qui varie au fur et à mesure de la propagation.
Il existe des milieux amplificateurs, dans lesquels on observera une amplitude crois-
sante au fur et à mesure de la propagation (par exemple dans la cavité d’oscillation
d’un laser) ; toutefois, le cas le plus fréquent est celui des milieux absorbants pour
1
lesquels ki < 0. L’onde porte alors le nom d’onde évanescente et on notera δ = −
ki
la distance caractéristique de son atténuation :
x
f (x, t) = a exp − exp [j (ωt − kx)] (4.14)
δ
Si l’onde se propage dans le sens contraire de l’axe (Ox), on trouvera de même kr < 0
et ki > 0 ; plus généralement, l’absorption de l’onde peut être immédiatement identi-
fiée si Re(k) × Im(k) < 0.
2 Dispersion : considérons maintenant une OPPH pour laquelle k est réel, mais
avec une relation ω = ω(k) non nécessairement linéaire. Dans un tel cas, la vitesse de
ω
phase vϕ = n’est plus une constante caractéristique de l’onde, mais une fonction
k
de la pulsation ω (ou du vecteur d’onde k) : on écrira en général vϕ = vϕ (ω).
Prenons l’exemple d’une onde vérifiant l’équation de Klein-Gordon présentée plus
haut, avec donc ω 2 − ω02 = c2 k 2 . Il n’y aura propagation (sans atténuation) que si
k ∈ R, donc si ω > ω0 (on dit que ω0 est une pulsation de coupure basse) ; nous nous
placerons dans ce cas pour calculer la vitesse de phase.
ω c
Celle-ci vaut vϕ = = p . Dans ce cas, les ondes de plus haute fréquence
k 1 − ω02 /ω 2
sont les plus lentes (avec une vitesse limite égale à c lorsque ω ≫ ω0 ), et une vitesse
limite infinie lorsque ω → ω0+ (mais l’équation de Klein-Gordon perd souvent son sens
physique au voisinage de la pulsation de coupure ω0 ).
Il est en principe toujours possible d’exprimer vϕ en fonction de ω ou bien de k ;

c’est en général la première expression qui est attendue car l’oscillateur qui alimente
le système impose généralement sa pulsation ω.
Plus généralement, des ondes harmoniques de fréquences différentes se propagent a

priori à des vitesses différentes : c’est le sens du terme dispersion (parties ensemble,
ces différentes ondes arriveront en ordre dispersé). Toutefois, une onde parfaitement
harmonique n’a guère de réalité physique ; toute onde réelle sera un peu plus complexe,
et devra être représentée sous forme combinaison linéaire de plusieurs OPPH, ou pour
être plus général sous la forme d’une intégrale de Fourier.
Considérons d’abord le cas simple d’une somme de seulement deux OPPH de même
amplitude, f (r, t) = a0 [cos (ω1 t − k1 x) + cos (ω2 t − k2 x)] ; une simple transformation
trigonométrique permet d’écrire f (r, t) = 2a0 cos (ωm t − km x) cos (δωt − δkx), où on
ω1 + ω2 k1 + k2 ω1 − ω2 k1 − k2
a posé ωm = , km = , δω = et δk = .
2 2 2 2
Le terme 2a0 cos (ωm t − km x) décrit manifestement une propagation (( moyenne )),
tandis que le terme cos (δωt − δkx) varie plus lentement en fonction de t et x puisqu’a
priori |δω| ≪ ωm et |δk| ≪ km ; il s’agit d’un terme d’enveloppe, à variation lente,
comme on le voit sur la figure 4.3, tracée à t fixé.
f
Gb cos (δωt − δkx)
Φb
f (r, t)
− cos (δωt − δkx)
Figure 4.3 – Superposition de deux OPPH
Sur ce tracé, le point G correspond à δωt − δkxG = 2nπ (avec n ∈ Z) ; c’est un point
δω
qui vérifie donc xG = xG0 + t ; il désigne le maximum du groupe ou paquet d’onde,
δk
δω
et se déplace à la vitesse de groupe vg = . Par contre, le point Φ correspond à
δk
ωm
ωm t − km xΦ = 2mπ (avec m ∈ Z), soit xΦ = xΦ0 + t. Ce point, qui correspond à
km
ωm
une valeur particulière de la phase, se déplace à la vitesse de phase vϕ = .
km
Z +∞
Pour être plus général, on pourra noter f (x, t) = A(k) exp [j (ωt − kx)] dk une
k=−∞
onde décrite comme une intégrale de Fourier, avec, dans cette intégrale, ω = ω(k).
Nous nous limiterons alors à l’étude d’ondes pour lesquelles k reste voisin de k0 , la
répartition des amplitudes A(k) prenant la forme de la figure 4.4 : on parlera d’onde
quasi-monochromatique ou de paquet d’onde.
|A(k)|
∆k
b
k
k0
Figure 4.4 – Paquet d’onde quasi-monochromatique : répartition d’amplitude
Si ∆k ≪ k0 , on peut faire un développement limité de la fonction ω(k) au voisinage

dω
de k0 , en posant ω(k0 ) = ω0 et ω(k) = ω0 + (k − k0 ). Dans la suite, nous
dk k0
poserons q = k − k0 et nous définirons la vitesse de groupe vg , en même temps que
nous rappelons la définition de la vitesse de phase :
ω dω
vϕ = vg = (4.15)
k dk
On peut alors écrire ωt−kx = (ω0 +vg q)t−(k0 +q)x, avant de recopier l’expression de
Z +∞
l’onde f (x, t) = exp [j(ω0 t − k0 x)] A(q) exp [jq (vg t − x)] dq, qui apparaı̂t ainsi
q=−∞
comme le produit de deux termes :
• un terme de phase exp [j(ω0 t − k0 x)] = exp [jk0 (vϕ t − x)], qui se propage le long
de l’axe (Ox) à la vitesse de phase vϕ ; ce terme est périodique, avec une période
2π
spatiale λ0 = ;
k0
Z +∞
√
• un terme de groupe A(q) exp [jqξ] dq où ξ = vg t − x ; au facteur 1/ 2π
q=−∞
près, on reconnaı̂t une transformée de Fourier (inverse) de A(q), c’est-à-dire
2π
une certaine fonction F (ξ), de grande largeur (puisque ∆k est petit). Cette
∆k
fonction F (vg t − x) décrit aussi un terme qui se propage, mais à la vitesse de
groupe vg .
2π 2π
Puisque λ0 = ≪ , on peut proposer (figure 4.5) un tracé qualitatif de l’onde
k0 ∆k
quasi-monochromatique, faisant apparaı̂tre les deux termes et leur produit : l’onde
terme de groupe
b vg
terme de phase
b vϕ
λ0
2π/∆k
Figure 4.5 – Termes de phase et de groupe d’une onde quasi-monochromatique
quasi-monochromatique est formée d’un paquet, qui se déplace globalement à la vitesse

vg , tandis que les plans de phase défilent à l’intérieur de ce paquet, à la vitesse vϕ .
Reprenant l’exemple de l’équation de dispersion de Klein-Gordon ω 2 − ω02 = c2 k 2 ,

on calcule facilement la vitesse de groupe enqdérivant cette expression relativement à
dω 2
k, ce qui fournit 2ω = 2c k soit vg = c 1 − ω02 /ω 2 ; on remarque bien que cette
dk
c
expression est différente de celle vϕ = p obtenue pour la vitesse de phase.
1 − ω02 /ω 2
On peut remarquer ici la relation vϕ vg = c2 . Cette relation, qui est une consé-
quence particulière de la seule équation de Klein-Gordon, ne doit en aucun cas être
généralisée.
2 Vitesse de l’énergie : dans le cadre général de l’étude d’une onde quelconque,

nous ne pouvons évidemment pas définir de grandeur énergétique. Toutefois, l’étude
des signaux électriques a montré que la puissance moyenne était proportionnelle à la
1
moyenne temporelle f 2 (t) ou, dans le cas d’une notation complexe, à Re f f ∗ .

2
Dans une moyenne de ce type, les oscillations rapides du terme de phase disparaissent
et il ne subsiste que la variation, plus lente, du terme de groupe.
Nous admettrons donc que la vitesse de transport de l’énergie s’exprime souvent se-
lon vE = vg ; toutefois, il nous faudra établir cette expression pour chaque onde
rencontrée, en fonction des propriétés énergétiques qui sont associées aux grandeurs
physiques qui se propagent.
De plus, cette expression n’est pas exacte dans certains cas : lorsque le paquet d’onde
comporte des fréquences très différentes, ou pour certaines ondes évanescentes par
exemple. La notion de paquet d’onde n’a alors plus de sens, et on doit adopter d’autres
méthodes de description.
2 Célérité limite : nous vérifierons aussi, à chaque fois que ce sera possible, les
relations (issues de la théorie de la Relativité) :
vE 6 c0 donc souvent vg 6 c0 (4.16)

où c0 est la vitesse de la lumière dans le vide, qui est aussi la vitesse limite du transport
de l’énergie ; par contre, on pourra indifféremment trouver vϕ 6 c0 ou vϕ > c0 , car la
vitesse de phase n’est pas associée à un transport d’information ou d’énergie.
2 Le cas de l’équation de d’Alembert : si l’OPPH f (x, t) = exp [j (ωt − kx)] vérifie
∂2f 1 ∂2f 2 ω2
l’équation de d’Alembert = , on obtient la condition nécessaire k = ,
∂x2 c2 ∂t2 c2
donc les vitesses de phase et de groupe sont égales et constantes ; on dit alors que
l’onde n’est pas dispersée.
Équation de d’Alembert ⇒ vϕ = vg = c = cte (4.17)
Toutes les ondes monochromatiques composant le paquet d’onde se propagent à la

même vitesse, et le paquet d’onde ne se déforme donc pas.
4.3 Propagation des ondes électriques
4.3.1 Onde dans une ligne électrique

2 Ligne idéale : revenons maintenant à l’étude particulière des ondes électriques dans
∂u ∂i
une ligne bifilaire idéale, régies par les équations des télégraphistes = −Lu et
∂x ∂t
∂i ∂u 1
= −Cu , donc aussi par une équation de d’Alembert de célérité c = √ . On
∂x ∂t Lu Cu
a vu que la solution générale de cette équation s’écrit sous la forme de la superposition
de deux ondes progressives en sens inverse :
u(x, t) = u+ (x − ct) + u− (x + ct) (4.18)
ou encore, dans le cas particulier d’une onde harmonique de pulsation ω = ck :
u(x, t) = u0+ exp [j (ωt − kx)] + u0− exp [j (ωt + kx)] (4.19)
Déterminons alors le courant i, dans le cas général de l’équation (4.18), au moyen de la

∂i
= Cu cu′+ (x − ct) − cu′− (x + ct)

seconde équation des télégraphistes. On obtient
∂x
∂u+ du+ ∂α
puisque la dérivée de u+ (α) relativement à t est = ; avec α = x − ct il
∂t dα ∂t
∂u+ du+ ∂u−
vient = −c = −cu′+ (x − ct). De même, = cu′− (x + ct).
∂t dα ∂t
L’intégration de cette équation pourrait comporter un terme constant (par rapport à
x) ; ce terme éventuel, qui n’est pas une onde, ne nous concerne pas ici et nous écrirons
donc l’onde de courantr sous la forme i(x, t) = Cu [cu+ (x − ct) − cu− (x + ct)].
Cu
Le terme Cu × c = est l’inverse de l’impédance caractéristique de ligne définie
Lu
en (4.2) ; finalement, le courant dans la ligne prend la forme générale :
u+ (x − ct) − u− (x + ct)
i(x, t) = (4.20)
Zc
Le signe du coefficient d’impédance dépend du sens de propagation de l’onde. Ce

résultat est absolument général pour l’étude des ondes associées à deux variables
couplées : vitesse v et pression p pour les ondes acoustiques, champs E et B pour
les ondes électromagnétiques, etc. L’oubli du signe − à ce niveau a toujours des
conséquences graves.
On peut aussi retrouver plus simplement cette équation dans le cas harmonique en
écrivant sous forme complexe les équations des télégraphistes ; par exemple, la seconde
u k 1
équation impose −j(±k)i = jωCu u donc =± , avec le signe + pour l’onde
i ω Cu
u+ progressant dans le sens de l’axe (Ox) et le signe − pour l’onde u− progressant
en sens contraire. On trouve dans ce cas :
u0+ exp [j (ωt − kx)] − u0− exp [j (ωt + kx)]

i(x, t) = (4.21)
Zc
2 Impédance de ligne : dans le cas particulier du régime harmonique, les relations

(4.19) et (4.21) permettent de définir, en tout point x de la ligne bifilaire, une impé-
dance de ligne, impédance apparente pour le signal transporté à l’abscisse x :
u(x, t) u exp (−jkx) + u0− exp (jkx)

Z(x) = = Zc 0+ (4.22)
i(x, t) u0+ exp (−jkx) − u0− exp (jkx)
4.3.2 Réflexion du signal

2 Coefficients de réflexion : supposons que la ligne soit terminée, à une certaine
abscisse x0 , par un dispositif électrique quelconque (branchement de la ligne sur un
montage électronique par exemple), tandis que le générateur qui alimente la ligne est
disposé à une abscisse x1 < x0 . On considère alors que le générateur crée une onde
incidente ui (x, t) = u0+ exp [j (ωt − kx)], tandis que le dispositif qui clôt la ligne est
la source de l’onde réfléchie ur (x, t) = u0− exp [j (ωt + kx)].
u (x0 , t)
On définit alors le coefficient de réflexion en tension ru = r ; c’est un nombre
ui (x0 , t)
complexe, dont le module mesure l’amplitude de l’onde réfléchie, relativement à l’onde
incidente qui lui a donné naissance.
Choisissant de modifier l’origine de l’axe (Ox) pour que le dispositif réfléchissant soit
u
placé en x0 = 0, on peut alors écrire ru = 0− . On remarque ici qu’on aurait aussi pu
u0+
i (0, t)
définir un coefficient de réflexion en courant ri = r ; on obtient alors immé-
ir (x0 , t)
diatement ri = −ru . Finalement, on peut aussi recopier l’expression de l’impédance
de ligne (4.22) en fonction de ru selon :
u0− exp (−jkx) + ru exp (jkx)

ru = ⇒ Z(x) = Zc (4.23)
u0+ exp (−jkx) − ru exp (jkx)
2 Impédance terminale : le dispositif réfléchissant placé à la fin x = 0 de la ligne

1 + ru
est caractérisé par son impédance terminale Z(x = 0) = Zc ; cette relation
1 − ru
Z(x = 0) − Z c
s’inverse aussi sous la forme ru = .
Z(x = 0) + Z c
On peut alors étudier, selon les valeurs de l’impédance terminale Z(x = 0) disposée
en bout de ligne, distinguer trois cas particuliers :
• Si la ligne est ouverte à son extrémité, le courant i(0, t) est nul à tout instant donc
Z(x = 0) = ∞ et ru = 1. Il y a donc réflexion totale, sans déphasage, de l’onde
de tension incidente.
On remarque aussi bien sûr que ri = −1 ; le courant réfléchi annule, en x = 0,
le courant incident pour assurer l’annulation du courant en bout de ligne.
• Si la ligne est court-circuitée à son extrémité, la tension u(0, t) est nulle à tout
instant donc Z(x = 0) = 0 et ru = −1. Il y a donc réflexion totale avec
déphasage de π de l’onde de tension incidente.
On remarque encore que ri = +1 ; tout le courant incident repart, sans dépha-
sage, après passage par ce court-circuit.
• Enfin, on peut assurer l’absence de réflexion en imposant ru = 0 donc ri = 0, ce
qui impose Z(x = 0) = Zc ; il faut brancher en bout de ligne une résistance de
valeur égale à l’impédance caractéristique de la ligne.
Si on place en bout de ligne une résistance égale à la valeur de l’impédance caractéris-

tique de ligne, on parle d’adaptation d’impédance de la ligne à son utilisation. C’est
cette situation qui est recherchée lorsque on veut transmettre le long d’une ligne des
signaux de manière unidirectionnelle.
Le terme d’adaptation doit être rapproché de le situation décrite précédemment en
Électronique, lorsqu’on choisit de connecter une charge de résistance égale à la ré-
sistance interne du générateur qui l’alimente, pour assurer un transfert maximal de
puissance à la charge.
Remarquons que dans ce cas, l’impédance de ligne vérifie encore Z(x) = Zc pour
tout x : l’adaptation d’impédance, si elle est réalisée, ne dépend pas de la longueur
de câble utilisé. Par exemple, les câbles BNC utilisés en Électronique de laboratoire
et en informatique pour les connexions de cartes réseau vérifient Zc = 50 Ω : on
doit, pour éviter la réflexion du signal, connecter le câble sur un montage électronique
d’impédance d’entrée Ze = 50 Ω.
Finalement, on peut proposer (cf. figure 4.6) une situation d’adaptation d’impédance
complète, en présence de câbles d’impédance caractéristique Zc , d’un générateur d’im-
pédance interne R = Zc et d’étages électroniques dont les impédances d’entrée et de
sortie sont aussi égales à R.
b b b b
b
R b b R b
câble, Zc = R R
b b b
b
b
x=0 x=ℓ
Étage électronique
Figure 4.6 – Adaptation d’impédance en Électronique
Dans un tel montage, l’impédance terminale R est adaptée au câble et il n’y a donc
pas d’onde réfléchie ; de plus, l’impédance du câble vu de son entrée x = 0 est égale
à l’impédance terminale x = ℓ ; le générateur (( voit )) donc une impédance de charge
égale à R, et transfère donc une puissance maximale à ce câble.
4.3.3 Ondes stationnaires
2 Formation d’ondes stationnaires par réflexion : on considère ici une ligne électrique
alimentée en régime harmonique, le générateur situé en x < 0 imposant dans la ligne
une onde de tension incidente ui = u0 exp [j (ωt − kx)] ; un choix adapté de l’origine
des temps permet d’imposer u0 ∈ R+ .
Un dispositif réfléchissant situé en x = 0 assure une réflexion au moins partielle de
l’onde, avec le coefficient de réflexion ru = ρ exp (jϕ), où ρ 6 1. On constate donc
l’apparition d’une onde réfléchie, ur = ru u0 exp [j (ωt + kx)].
L’onde de tension totale dans la ligne peut donc se mettre sous la forme u = ui + ur ,
que l’on décomposera en une somme u = (1 − ρ)u0 exp [j (ωt − kx)] + us , où on a fait
apparaı̂tre us = ρu0 exp [jωt] {exp [−jkx] + exp [jkx + ϕ]}.
Le premier terme u = (1−ρ)u0 exp [j (ωt − kx)] est une onde progressive, qui disparaı̂t
en cas de réflexion totale (ρ = 1). Le second terme peut, lui, se mettre sous la forme
us = 2ρu0 exp [jϕ/2] exp [jωt] cos (kx + ϕ/2), et la tension réelle correspondante vaut
donc Re(us ) = 2ρu0 cos (ωt + ϕ/2) cos (kx + ϕ/2).
La séparation des dépendances en x et t permet d’identifier cette tension comme une
onde stationnaire : la vibration de us (x, t) se fait sur place, sans propagation : cette
onde est en effet la résultante de deux ondes progressives de même amplitude ρu0 , se
propageant en sens inverse. Plus généralement :

 f (x, t) = f0 [cos (ωt − kx) + cos (ωt + kx)]
Onde stationnaire : (4.24)
f (x, t) = 2f0 cos (ωt) cos (kx)

On peut donner une illustration graphique de l’onde stationnaire en représentant, à

plusieurs instants successifs, la tension us (x, t), selon la figure 4.7.
us
tension maximale
tension à t
x
tension à t′
tension minimale
λ/2
Figure 4.7 – Onde stationnaire
En tout point de la ligne tel que cos (kx + ϕ/2) = 0, la tension est en permanence
nulle ; on parle de nœuds de vibration. Deux nœuds consécutifs sont donc séparés d’une
π λ
distance égale à = .
k 2
De même, en tout point de la ligne tel que cos (kx + ϕ/2) = ±1, la tension oscille
avec une amplitude maximale, égale à 2ρu0 ; on parle de ventres de vibration. Deux
λ
ventres consécutifs sont également séparés de .
2
2 Généralisation : il est possible de rechercher a priori une solution d’une équation de

∂2f 1 ∂f
d’Alembert = 2 2 (ou d’une autre équation de propagation) par une méthode
∂x2 c ∂t
dite de séparation des variables : on détermine pour cela les conditions nécessaires
que doivent vérifier deux fonctions des deux variables indépendantes χ(x) et τ (t)
pour que f (x, t) = χ(x)τ (t) soit solution de l’équation de propagation. Si une telle
solution existe, et prend la forme d’une grandeur harmonique, il s’agit nécessairement
d’une onde stationnaire.
Dans le cas de l’équation de d’Alembert, la condition nécessaire imposée à χ(x) et
d2 χ 1 d2 τ
τ (t) peut s’écrire τ (t) = χ(x) ou encore, en procédant à la séparation des
dx2 c2 dt2
2 2
1 d χ 1 1 d τ
variables x et t, 2
= 2 ; on ne s’occupera pas des difficultés mathé-
χ(x) dx c τ (t) dt2
matiques liées à la division par des fonctions qui pourront s’annuler périodiquement.
L’égalité de deux fonctions f (x) = g(t) de deux variables indépendantes impose
alors nécessairement que ces deux fonctions soit simultanément constantes ; en ef-
df (x) dg(t) dg(t) df (x)
fet = = 0, et réciproquement, = = 0. Finalement, notant
dx dx dt dt
2 2
d χ d τ
α cette constante commune, 2
= αχ(x) et 2 = αc2 τ (t), et on pourra distinguer
dx dt
trois cas :
• Si α > 0, les solutions τ (t) et χ(x) sont des combinaisons d’exponentielles réelles.
√ √
Dans l’expression τ (t) = τ1 exp +c αt + τ2 exp −c αt , le terme τ1 est né-
cessairement nul (sinon la solution n’a pas de sens physique lorsque t → ∞) et
la solution τ (t), exponentiellement décroissante au cours du temps, décrit un
phénomène transitoire, qu’on n’étudiera pas plus ici.
De plus, nous verrons ci-dessous que ce type de solution n’est en général pas
compatible avec les conditions aux limites imposées à l’onde.
• Si α = 0, les solutions τ (t) et χ(x) sont des fonctions affines, de la forme at + b
et a′ x + b′ . Nous verrons là encore que ce type de solution n’est pas non plus
compatible avec les conditions aux limites imposées à l’onde.
• Enfin, le cas α < 0 correspond à la seule solution de type ondulatoire ; c’est en
général celle qui nous intéressera dans la suite. Posant α = −k 2 avec k > 0, on
peut alors écrire χ(x) = χ0 cos (kx + ϕ).
De même, on peut écrire, moyennant un choix adapté de l’origine des durées,
τ (t) = τ0 cos ωt, à condition de poser ω = ck. Finalement, cette solution de
l’équation de d’Alembert peut s’écrire f (x, t) = f0 cos (kx + ϕ) cos ωt, où on a
posé f0 = χ0 τ0 : c’est bien une onde stationnaire.
2 Cavités résonantes : considérons enfin une onde stationnaire, écrite sous la forme
f (x, t) = f0 cos (kx + ϕ) cos ωt, disposée dans ce qu’on appelle une cavité résonante
de longueur L, c’est-à-dire un intervalle [0 , L] de l’axe (Ox) avec les conditions aux
limites f (x = 0, t) = f (x = L, t) = 0, ∀t.
On peut rencontrer des cavités résonantes avec bien d’autres conditions aux limites
que la simple annulation aux deux extrémités de la cavité ; l’étude faite ici est
seulement limité au cas le plus simple.
On peut illustrer la notion de cavité résonante dans le cadre optique (une onde lu-
mineuse entre deux miroirs ; nous montrerons ultérieurement qu’un miroir métallique
impose l’annulation de l’onde lumineuse à sa surface) ou dans le cadre hydrodyna-

mique (une onde sonore entre deux parois rigides ; celles-ci imposent l’annulation de
la vitesse de déplacement de l’air sur la surface des parois). La figure 4.8 représente
une de ces situations, avec diverses solutions présentant l’annulation de l’onde sur les
deux limites de la cavité.
n=1
λ/2
b b
x
n=3
n=7 b b
λ/2
Figure 4.8 – Onde stationnaire dans une cavité résonante
La double condition ci-dessus impose cos ϕ = 0 (donc ϕ = π/2 à π près ; le décalage de

π, qui revient à changer f0 en −f0 , n’a pas de sens physique) et cos (kL + ϕ) = 0 donc
sin kL = 0. il existe donc un entier n > 0 tel que kL = nπ. On interprète cette relation
2π
en introduisant à nouveau la longueur d’onde λ = ; la condition d’établissement
k
d’une onde stationnaire est alors :
λ
L=n (4.25)
2
L’interprétation physique du nombre entier n est alors claire (voir la figure 4.8 par
exemple) : la longueur de la cavité est un nombre entier de demi-longueurs d’onde.
On voit graphiquement que cette condition est obligatoirement vérifiée pour imposer
une double annulation de l’onde aux deux extrémités de la cavité.
4.3.4 Transport d’énergie dans une ligne
2 Puissance : dans une ligne électrique le long de laquelle circule une onde de
tension et de courant, on peut déterminer la puissance électrique fournie à l’abscisse
x de la ligne par l’ensemble de ce qui se trouve avant cette abscisse (le générateur
et une partie de la ligne), en écrivant P (x, t) = u(x, t)i(x, t) ; la figure 4.9 montre en
effet que ces grandeurs sont définies en convention générateur pour cet ensemble.
b
b
i(x, t)
ligne électrique u(x, t)
b
b
Figure 4.9 – Puissance fournie par une partie de la ligne
Les expressions (4.18) et (4.20) montrent que la puissance transportée par la ligne
1
u2 (x − ct) − u2− (x + ct) .

peut se mettre sous la forme instantanée P (x, t) =
Zc +
Cette expression montre que les ondes incidente et réfléchie transportent de la puis-
sance indépendamment l’une de l’autre dans les deux sens de propagation ; on pourrait
u2 (x − ct) u2 (x + ct)
par exemple poser P+ (x, t) = + et P− (x, t) = − − .
Zc Zc
Si on utilise une notation complexe avec les expressions (4.19) et (4.21), la puissance
1
moyenne transportée hP i = Re (ui∗ ) s’écrit de même comme une différence de deux
2
|u |2 − |u0− |2
termes, hP i = 0+ ou, en fonction du coefficient de réflexion en x = 0,
2Zc
|u |2
hP i = 0+ 1 − |ru |2 .

2Zc
On définit alors un coefficient de réflexion énergétique R par R = |ru |2 = |ri |2 ; la
puissance totale transportée par l’onde s’annule dans le cas de la réflexion totale,
R = 1. Au contraire, R = 0 dans le cas où la ligne est adaptée à son impédance
terminale ; dans ce cas, aucune puissance n’est réflechie, et toute la puissance de
l’onde incidente est donc dissipée dans cette impédance terminale.
Dans tous les cas, cette puissance transportée ne dépend pas de x : la propagation
dans la ligne ne s’accompagne d’aucune perte d’énergie, puisque le modèle utilisé fait
abstraction de tout terme dissipatif.
2 Ligne avec pertes : reprenons enfin l’étude d’une ligne électrique, avec de faibles
pertes en ligne : nous supposerons donc que Gu = 0 mais nous prendrons en compte
le terme Ru , tout en admettant que son influence reste faible. Les équations des
∂u ∂i ∂i ∂u
télégraphistes deviennent alors = −Ru i−Lu et = −Cu soit, en notations
∂x ∂t ∂x ∂t
−jku + (Ru + jLu ω)i = 0
complexes, le système ; ce système homogène a une
jCu ωu − jki = 0
solution triviale (u = 0, i = 0). Si on veut qu’une onde non nulle se propage dans
la ligne, on devra donc imposer l’annulation de son déterminant, ce qui fournit une
ω2
relation entre ω et k qui n’est autre que la relation de dispersion, −k 2 + 2 = jRu Cu ω.
c
Le terme imaginaire jRu Cu ω étant supposé faible, la solution sera proche de k = ±ω/c
qui correspond à l’absence de pertes. Nous choisirons de poser k = k0 (1 − jǫ) avec
k0 > 0 (ce qui correspond à un choix de sens de propagation) et |ǫ| ≪ 1 ; le signe −
permet d’espérer une solution telle que ǫ > 0, donc Re k × Im k < 0, ce qui décrit
l’absorption de l’onde par dissipation progressive de son énergie par effet Joule.
ω2
On obtient alors k02 (1 − 2jǫ) ≃ 2 − jRu Cu ω ; on en déduit bien que k0 = ω/c
c
Ru
correspond au terme de propagation, tandis que ki = −ǫk0 = < 0. On observera
2Zc
2Zc
bien une onde évanescente, avec une longueur caractéristique d’atténuation δ = .
Ru
Reprenant enfin les ordres de grandeur précédemment cités, une ligne de résistance
par unité de longueur Ru = 1, 7 Ω · m−1 et d’impédance caractéristique Zc = 50 Ω
sera caractérisée par une atténuation de l’onde d’un facteur 1/e ≃ 0, 37 au bout
d’une longueur δ ≃ 59 m. Après quelques centaines de mètres de câble électrique
(( ordinaire )), il est indispensable d’utiliser un dispositif réamplifiant le signal. C’est
là par exemple l’origine de la limite de longueur dans une connexion poste à poste
dans un réseau informatique câblé.
On appelle équation de d’Alembert toute équation aux dérivées partielles de la

1 ∂2f
forme ∆f = 2 2 , où c est une vitesse.
c ∂t
∂2f ∂2f ∂2f ∂2f
En général, ∆f = + + ; à une dimension, ∆f = .
∂x2 ∂y 2 ∂z 2 ∂x2
Dans le cas de l’équation de d’Alembert à une dimension, la solution générale
porte le nom d’onde plane (OP) et s’écrit comme la somme de deux ondes
planes progressives (OPP), se propageant à la vitesse ±c en sens inverse :
f (x, t) = f+ (x − ct) + f− (x + ct).
On appelle onde plane progressive harmonique (OPPH) une grandeur complexe
de la forme f (r, t) = a exp [j (ωt − k · r)], d’amplitude complexe a, de pulsation
ω, de fréquence ν = ω/2π et de période T = 2π/ω ; de vecteur d’onde k = ku,
de nombre d’onde σ = k/2π et de longueur d’onde λ = 2π/k.
ω dω
u est la direction de propagation, vϕ = la vitesse de phase et vg = la
k dk
vitesse de groupe de l’onde, en général égale à la vitesse de l’énergie.
∂ ∂ ∂ ∂
Pour une OPPH, = jω, = −jkx , = −jky et = −jkz .
∂t ∂x ∂y ∂z
La superposition de deux ondes progressives en sens inverse forme une onde
au moins partiellement stationnaire, qui s’écrit comme un terme découplé,
Re(f (x, t)) = f1 (x) × f2 (t).
Dans une onde stationnaire, les nœuds de vibration se succèdent tous les λ/2 ;
il en va de même des ventres de vibration.
Un conducteur cylindrique, de section s et de longueur ℓ, présente une résis-
tance électrique R = ̺ℓ/s, où ̺ = 1/γ est la résistivité du matériau, et γ sa
conductivité.
Un élément de ligne électrique idéale peut être modélisé au moyen de l’in-
ductance par unité de longueur Lu , de la capacité par unité de longueur Cu ;
éventuellement on tient compte des pertes au moyen de la résistance par unité
de longueur de ligne Ru et de la conductance de fuite par unité de longueur
Gu .
Dans une ligne
p idéale, tension et courant
p vérifient une équation de d’Alembert
avec c = 1/ Lu Cu . En notant Zc = Lu /Cu l’impédance caractéristique, une
OPPH vérifie u/i = ±Zc , où le signe est celui du sens de propagation.
En disposant en bout de ligne une impédance terminale Z0 , on fait apparaı̂tre
des ondes réfléchies, les coefficients de réflexion en tension ru , en courant ri et en
1 + ru Z0 − Zc
énergie R vérifiant ri = −ru , R = |ru |2 et Z0 = Zc , soit ru = .
1 − ri Z0 + Zc
Il y a réflexion totale sur une extrémité de ligne ouverte ou court-circuitée ; il
y a adaptation d’impédance et absence de réflexion si Z0 = Zc .
Chapitre 5
L’onde lumineuse
Ce chapitre présente une description rapide de l’ensemble des propriétés associées à

la propagation de la lumière, considérée comme une onde. À l’exception de l’étude de
la polarisation, toutes ces notions seront développées dans les chapitres suivants.
5.1 La nature de la lumière
5.1.1 Historique
2 Lumière et géométrie : la lumière se propage, dans un milieu homogène, en ligne
droite depuis sa source (le Soleil, une lampe) jusqu’à sa réception dans un détecteur
photosensible (l’œil, une photodiode, etc.). Ce fait, qui est aujourd’hui connu de tous,
n’était pas évident pour les penseurs de l’Antiquité.
On doit cette affirmation aux penseurs arabes du moyen-âge, et notamment au ma-
thématicien et physicien irakien ibn al-Haytam (Alhazen) à qui on attribue la pre-
mière affirmation des lois de la réflexion et de la réfraction. On attribue aujourd’hui
la paternité de la redécouverte de ces lois au français Descartes et au néerlandais
Snell Van Royen.
L’anglais Newton contribua à fonder l’optique moderne dans son ouvrage, Opticks,
publié en . On y trouve une description de nombreux phénomènes lumineux,
comme l’arc-en-ciel ou les interférences lumineuses, ainsi que des spéculations sur la
nature de la lumière, hésitant entre une conception purement corpusculaire et une
théorie vibratoire.
Séparément, les physiciens Huygens‡ , Young‡ et Fresnel‡ développent une théorie
purement ondulatoire, qui est pratiquement celle que nous étudions ici.
5.1.2 L’onde lumineuse

2 Réflexion et réfraction : ces phénomènes, qui ont fait l’objet d’une description
géométrique dans le cadre du programme de première année, peuvent s’interpréter
dans le cadre d’une théorie ondulatoire ; il suffit pour cela de considérer la lumière
comme la propagation d’un phénomène doublement périodique, c’est-à-dire présentant
à la fois une périodicité spatiale et une périodicité temporelle.
Conformément à l’étude des ondes électriques, nous noterons λ la période spatiale
(on longueur d’onde) et T la période temporelle du phénomène, sans préciser pour
2π
l’instant sa nature. On utilisera aussi les pulsations associées, k = (le vecteur
λ
2π
d’onde) et ω = . La vitesse de propagation associée (en fait, la vitesse de phase de
T
ω λ
l’onde lumineuse) est alors vϕ = = .
k T
La théorie ondulatoire de Huygens et Fresnel permet de décrire les phénomènes de
réflexion et de réfraction en considérant seulement que la vitesse de phase dépend du
milieu considéré. Adoptant les notations actuelles, on notera cette vitesse de phase :
c0
vϕ = c = c0 = 2, 99792458 × 108 m · s−1 (5.1)
n
où c0 est la vitesse de la lumière dans le vide, et n, qui porte le nom d’indice optique
du milieu étudié, est une caractéristique du milieu. On a déjà eu l’occasion d’affirmer
que vϕ n’est pas forcément inférieur à c0 ; toutefois, dans le domaine optique, on a
toujours n > 1 dans les milieux transparents. La figure 5.1 présente une justification
simple des lois de la réfraction, dans un modèle (( mécanique )) de propagation d’onde.
λ1
v2
b n2
ℓ θ2 z
n1
θ1
b
λ2
(R)
v1
Figure 5.1 – Réfraction d’une onde (modèle mécanique)
L’onde lumineuse est ici représentée par un ensemble de personnages avançant en

parallèle, à la même vitesse (on peut penser à une parade militaire) ; ils sont alignés
sur les lignes pointillées du schéma.
La vitesse commune de ces rangées de personnages représente la vitesse de propa-
gation de l’onde. Deux rangées successives de ces personnages sont séparées par une
longueur d’onde, c’est-à-dire par une période spatiale de l’onde ; ces rangées succes-
sives porteront le nom de plans d’onde. Dans chaque plan d’onde, les personnages
sont équidistants.
La trajectoire d’un de ces personnages est un rayon lumineux (R) ; la réfraction est
le phénomène qu’on observe lorsque le défilé aborde une région où les personnages
doivent se déplacer à une vitesse différente. Sur la figure, la zone grisée est par exemple
une zone de descente, et la vitesse v2 y est plus élevée que la vitesse v1 dans la zone
non grisée.
Pour conserver l’alignement, le défilé doit alors changer de direction ; en effet, la
succession des rangées doit être conservée à l’interface (sur le dioptre) ; la longueur ℓ
λ1 λ2
vaut en effet à la fois ℓ = = .
sin θ1 sin θ2
D’autre part, les personnages du défilé doivent quitter le dioptre au même rythme
qu’ils y arrivent ; les pulsations des deux ondes, arrivant sur le dioptre puis en partant,
doivent être identiques, soit ω1 = ω2 .
On peut relier ce résultat à l’ensemble des propriétés de l’électronique linéaire : un

signal d’entrée de pulsation ω est, en électronique, associé à un signal de sortie de
5 : L’onde lumineuse 93
même pulsation si le montage est linéaire. Il existe bien sûr en Optique des milieux
non linéaires, susceptibles de produire des ondes de pulsation ωs différente de la
pulsation imposée à l’entrée ωe . Le domaine de l’optique non linéaire, vaste et en
plein développement, ne nous concerne pas cette année.
2πv
Enfin, pour une onde de vitesse v, λ = ; d’autre part, on posera ici encore v = c/n,
ω
λ1 n2
c étant une vitesse arbitraire. On en déduit donc = .
λ2 n1
On retrouve donc bien la loi de Snell-Descartes de la réfraction :
n1 sin θ1 = n2 sin θ2 (5.2)
Les relations liant ω1 , ω2 , λ1 , λ2 , n1 et n2 méritent aussi d’être retenues ; nous donne-

rons bien sûr ultérieurement (voir le § 5.4.2) une justification formelle de l’ensemble
de ces résultats.
Onde lumineuse et passage par un dioptre

X Lors du changement de milieu qui accompagne la traversée d’un dioptre,
les ondes lumineuses conservent la même pulsation (ω1 = ω2 ) mais
changent de vitesse de propagation (vϕ = c0 /n) et donc de longueur
d’onde ; on notera λ = λ0 /n, où la grandeur λ0 désigne la longueur
d’onde que l’on observerait si cette onde se propageait dans le vide. On
utilise systématiquement cette longueur d’onde dans le vide dans toute
la suite.
On peut regretter l’abus de langage courant qui consiste à parler de longueur d’onde
(sans préciser dans le vide) pour cette valeur λ0 . Ici et dans toute la suite, on
n’utilisera que la seule grandeur λ0 , même si elle est parfois notée λ.
2 Dispersion : les indices optiques de quelques milieux transparents figurent dans le

tableau 5.1 ; ces indices dépendent en fait de nombreux paramètres, dont la longueur
d’onde λ0 . Ils sont ici donnés pour le doublet de raies jaunes (doublet D) émises
par les lampes spectrales à vapeur de Sodium (λ1 = 589, 0 nm et λ2 = 589, 6 nm
pour les deux raies du doublet ; on utilise en général la longueur d’onde moyenne
λ0 = 589, 3 nm pour décrire ce doublet).
matériau air (1 bar, 273 K) eau verres optiques

indice optique 1,0003 1,33 1,35 à 2,00
Table 5.1 – Indices optiques
Le (( verre optique )) dans ce tableau décrit en fait de nombreux matériaux : les verres
ordinaires (dits verres crown en Optique), essentiellement constitués de Silice SiO2
(70%) et d’oxydes de Sodium (Na2 O, 15%) et de Calcium (CaO, 10%), les verres au
plomb (dits verres flint en Optique et improprement appelés cristal en verrerie, avec
remplacement de l’oxyde de calcium par l’oxyde de Plomb PbO), les verres borosili-
catés (avec adjonction d’oxyde de Bore B2 O3 comme le Pyrex), etc.
Les verres optiques et les autres matériaux transparents ne sont pas seulement carac-
térisés par leur indice mais aussi par le comportement de celui-ci en fonction de la
dn
longueur d’onde λ0 . On définit par exemple la dispersion ; celle-ci est en pratique
dλ0
toujours négative pour les milieux transparents. L’expérience et certaines modélisa-

tions microscopiques mènent à la loi de Cauchy, ou loi de dispersion normale (5.3),
où A, B et C sont des constantes ; on omet souvent le terme C.
B C
n(λ0 ) = A + + 4 (5.3)
λ20 λ0
Du fait de la dispersion, les vitesses de phase vϕ (λ0 ) et de groupe vg (λ0 ) ne sont en

c0 2πc0
général pas égales ; on peut en effet écrire n(λ0 ) = = et, en dérivant
v (λ
ϕ 0 ) λ0 ω
dω c0 λ0 dn
cette expression, vg (λ0 ) = = 1+ .
dk n n dλ0
En général, la différence
entre ces deux vitesses vϕ et vg est faible car la dispersion
dn n c0
reste faible : ≪ donc vg ≃ vϕ = .
dλ0 λ0 n
Dispersion par un milieu transparent

X La donnée de n(λ0 ) est équivalente à la donnée de l’équation de disper-
sion ω(k) puisque n = c0 /vϕ = c0 k/ω et λ0 = cω/2π.
dn
Dans le cas des milieux transparents de faible dispersion, est faible,
dλ0
négatif, donc vg . vϕ = c0 /n.
2 Théories ondulatoire et corpusculaire : une théorie mécanique permet aussi de

prévoir une loi semblable à celle de Snell-Descartes ; c’est ainsi que s’établit la loi de
la réfraction, en considérant que le rayon lumineux de la figure 5.1 est la trajectoire
de particules de lumière, description adoptée par Descartes comme par Newton.
Dans chaque milieu homogène (de part et d’autre du dioptre), les particules avancent
à vitesse constante en l’absence de toute force appliquée ; la traversée du dioptre
s’accompagne d’une force (de freinage ou d’accélération selon le cas), dirigée selon
la normale (Oz) au dioptre, de sorte que la composante tangentielle de la vitesse
est conservée. On obtient ainsi la loi v1 sin θ1 = v2 sin θ2 , et dans ce modèle l’indice
optique est proportionnel à la vitesse et non pas à l’inverse de celle-ci.
Il n’avait pas échappé aux physiciens de l’époque le problème posé par cette définition
de l’indice. Ainsi, Fermat écrit : La démonstration de la réfraction me semble un
véritable paralogisme (. . . ) parce qu’elle suppose que le mouvement de la lumière qui
se fait dans l’air et dans les corps rares est plus lent que celui qui se fait dans l’eau et
dans les autres corps ce qui semble choquer le sens commun. La mesure directe de la
vitesse de la lumière dans le vide et dans l’eau (par Foucault‡ et Fizeau‡ ) achèvera
de discréditer cette description mécaniste de la lumière.
2 Diffraction : considérons maintenant une onde plane, décrite qualitativement sur
la figure 5.2 par la succession de ses plans d’onde (traits pointillés).
Lorsque l’onde se propage vers un obstacle, on peut considérer, dans le point de vue
de Huygens, que chaque point d’un plan d’onde est une source d’ondes sphériques ; la
superposition de ces ondes garde, du fait des symétries, son caractère d’onde plane,
par compensation deux à deux des ondes divergent hors de la direction de l’onde
principale.
Lors du passage par un obstacle (sur la figure 5.2, une fente transparente percée dans
un écran opaque), cette symétrie est perdue et une partie de l’onde se propage hors
de la direction de l’onde incidente. Il s’agit du phénomène de diffraction.
b b
b
∆θ
b b
b ∆θ
b b
Figure 5.2 – Diffraction de la lumière
La diffraction constitue donc un écart aux lois de la propagation rectiligne de l’optique

géométrique. Ce phénomène n’a lieu de façon significative que si les dimensions de
l’obstacle (par exemple, la largeur a de la fente de la figure 5.2) est comparable à la
dimension caractéristique de l’onde, à savoir sa longueur d’onde λ0 .
Nous montrerons en particulier, par le calcul de l’onde résultant de la superposition
des ondes émises sur un intervalle de largeur a, que l’ouverture angulaire du faisceau
diffracté, de part et d’autre de la direction de l’optique géométrique, est de l’ordre de
grandeur de λ0 /a.
Diffraction de la lumière
X La diffraction est un écart aux lois de propagation de l’optique géomé-
trique, qu’on observe lorsque une onde lumineuse traverse une ouverture
de faible dimension a, ou lorsqu’elle est réfléchie par un dispositif de
faible dimension a :
• lorsque a ≫ λ0 , on peut négliger la diffraction et traiter la propagation
dans le cadre de l’optique géométrique ;
• lorsque a et λ0 sont comparables, la diffraction devient significative et
l’ouverture angulaire ∆θ est de l’ordre de grandeur de λ0 /a ;
• enfin, lorsque a ≪ λ0 , la diffraction se fait dans toutes les directions
et l’obstacle peut être considéré comme une source de lumière isotrope.
2 Interférences : un autre phénomène qu’on peut considérer comme une preuve di-
recte du caractère ondulatoire de la lumière réside dans l’observation des interférences
lumineuses. On observe cette situation lorsque deux ondes lumineuses (ou plus), issues
d’une même source, peuvent parvenir au même point en suivant des chemins différents
(cf. figure 5.3 à gauche).
La source S éclaire le point M via deux dispositifs D1 et D2 , déviant la lumière dans
la direction de la zone d’observation. Si on étudie alors le comportement, au cours du
temps, des deux ondes lumineuses qui se superposent en M , on peut observer diverses
situations :
• si le déphasage entre les deux ondes, tel qu’il résulte de la différence de trajet, est
faible (représentation correspondant à la figure 5.3 à droite, en haut), la somme
D1
t
b
Sb M Interférences constructives
D2
Interférences destructives
Figure 5.3 – Interférences lumineuses
des deux ondes qu’on observe en M a une amplitude élevée : on observe une
quantité importante de lumière. On parle alors d’interférences constructives ;
• si au contraire ce déphasage est proche de π (figure 5.3 à droite, en bas), la somme
des deux ondes en M a une amplitude faible (ou nulle) : on n’observe que peu
de lumière. On parle d’interférences destructives.
L’observation de l’alternance de zones sombres et claires, qu’on appelle franges d’in-
terférence, constitue à la fois une preuve du caractère ondulatoire de la lumière et une
méthode métrologique adaptée à la mesure très précise de faibles dimensions.
Interférences lumineuses
X La superposition en un même point de plusieurs ondes provenant d’une
même source peut conduire à la formation de franges d’interférence, jux-
taposition de zones alternativement sombres et claires.
Figure 5.4 – Figures d’interférence
Les photographies de la figure 5.4 montrent des figures d’interférence, juxtaposition

de franges claires et sombres. Sur l’image de gauche, les franges sont de forme assez
complexes ; à droite, elles sont quasiment rectilignes.
Figure 5.5 – Contraste de franges circulaires
On observe aussi la différence de contraste (le contraste désigne l’écart relatif de lu-
minosité entre franges claires et franges sombres) dans le cas des figures d’interférence
de la figure 5.5 ; il s’agit dans les deux cas du même dispositif interférentiel mais les
franges (quasiment circulaires ici) sont bien contrastées à gauche, très peu à droite.
2 Polarisation : on classe habituellement les ondes de toutes natures en deux ca-
tégories : les ondes longitudinales, lorsque la grandeur oscillante vibre le long de la
direction de propagation, et les ondes transverses, lorsque cette grandeur oscillante
vibre perpendiculairement à la propagation.
Dans le cas des ondes sismiques par exemple, on peut rencontrer simultanément les
deux types de vibration ; les ondes longitudinales sont des ondes de compression et
les ondes transverses des ondes de cisaillement ; on peut illustrer cette différence de
comportement au moyen d’un modèle de déformation d’un milieu continu, représenté
par une succession de masses ponctuelles en interaction élastique (fig. 5.6).
Modèle de milieu continu Modèle de milieu continu

b b b b b b b b b b b b
b
b
b b b b b b b b
b
b
Onde de compression Onde de cisaillement
Figure 5.6 – Ondes longitudinale et transversale
Dans le cas des ondes lumineuses, l’identification n’est pas aussi facile ; ce sont les
phénomènes de polarisation qui ont permis cette identification.
On doit leur première description à Huygens‡ et leur première étude quantitative au
français Malus. On se contentera ici de dire qu’un même rayon lumineux, incident
sur certains types de cristaux transparents (par exemple la calcite, qui porte le nom de
spath d’Islande lorsqu’elle est transparente), peut donner lieu à deux rayons émergents
(figure 5.7). On parle de rayon extraordinaire pour celui qui subit une réfraction, même
en incidence normale.
Cristal
Figure 5.7 – Rayon ordinaire et rayon extraordinaire
La présence de deux ondes différentes transportées sur une même direction de pro-
pagation suggère une interprétation en terme d’ondes transverses ; donc un caractère
vectoriel de l’onde lumineuse.
Ainsi, on peut imaginer que, si une onde lumineuse se propage selon la direction ez ,
elle peut avoir deux composantes vectorielles, dirigées selon ex et ey , et qui peuvent se
propager indépendamment. Dans un milieu cristallin, les deux axes (Ox) et (Oy) ne
sont pas nécessairement équivalents et on peut imaginer deux vitesses de propagation
différentes.
Nous ferons la majorité des études ultérieures en Optique dans le cas des milieux
fluides ou des solides amorphes (verres), c’est-à-dire isotropes ; ainsi, la polarisation
ne se manifestera que rarement. Nous préciserons ultérieurement le cadre d’étude
de l’optique, vectoriel (seulement si c’est nécessaire, en présence de phénomènes de
polarisation) ou non (on parlera d’approximation scalaire de l’Optique).
5.1.3 Longueur d’onde des ondes lumineuses
2 La couleur : les récepteurs d’ondes lumineuses ne sont pas sensibles aux ondes
lumineuses (ou plus généralement aux ondes électromagnétiques) de la même façon
selon la pulsation ω ou, ce qui revient au même, selon la longueur d’onde dans le vide
2πc0
λ0 = de ces ondes. On peut aussi dire qu’ils se comportent comme des filtres,
ω
sélectionnant telle ou telle longueur d’onde, et donc caractérisés par des fonctions de
transfert variées.
Ainsi, l’œil humain dispose de quatre types de récepteurs lumineux disposés dans le
plan de la rétine. Les bâtonnets, situés surtout en périphérie de la rétine, permettent
de percevoir la luminosité et le mouvement ; sensibles aux faibles intensités, ils sont
les seuls à être utilisés pour la vision de nuit.
Les cônes, situés surtout dans un zone appelée fovéa, permettent de différencier les
couleurs. Il existe chez l’homme trois types de cônes :
– sensibles surtout dans le rouge (avec un maximum de sensibilité pour λ0 = 570 nm) ;
– sensibles surtout dans le vert (sensibilité maximum pour λ0 = 535 nm) ;
– sensibles surtout dans le bleu (sensibilité maximum pour λ0 = 445 nm).
Ces trois types de cellules photosensibles n’ont pas la même sensibilité aux variations
d’intensité lumineuse ; en particulier, l’œil humain moyen présente une sensibilité
maximale aux alentours de λ0 = 555 nm, dans le jaune. C’est d’ailleurs pour rendre
compte de cette sensibilité particulière que le système international définit des unités
spécifiques pour la mesure des intensités, flux et éclairement lumineux (ces définitions
ne sont pas au programme) ; le candela est l’intensité lumineuse I d’une source à
λ0 = 555 nm qui émet une puissance par unité d’anglessolide dP/dΩ = 1/683 W·sr−1 ;
le lumen est l’unité de flux lumineux intégré, Φ = IdΩ ; enfin, le lux est l’unité
dΦ
d’éclairement, flux par unité de surface, E = .
dS
Les mesures photométriques porteront, selon se cas, sur l’intensité énergétique I
(mesurée en W·m−2 ), ou bien sur l’éclairement E (mesuré en lux, symbole lx). Dans
le cadre de notre programme, il nous suffit de savoir que ces deux grandeurs sont
toujours proportionnelles pour une longueur d’onde donnée, mais que le coefficient
de proportionnalité dépend de la longueur d’onde.
2 Étendue du spectre électromagnétique : les ondes lumineuses ne sont qu’un cas

particulier des ondes électromagnétiques ; celles-ci sont généralement dénommées en
fonction de leur longueur d’onde dans le vide, conformément à la figure 5.8. Les
divisions qui y sont présentées sont en partie arbitraires.
2 L’effet Doppler-Fizeau : il consiste en une modification de la longueur d’onde
apparente d’une onde lorsque l’émetteur et le récepteur sont en mouvement relatif.
L’étude quantitative de cet effet ne fait pas partie du programme ; toutefois, il n’est
pas possible d’éviter de l’évoquer ici, au moins à titre documentaire, tout comme l’ont
fait de nombreux problèmes récents des concours d’entrée dans les Grandes Écoles.
2 Effet Doppler-Fizeau classique : considérons une onde, de nature quelconque, émise
par une source S en mouvement relativement à un certain référentiel galiléen (K) à
la vitesse vS = vS ex . Dans ce cas, la source S peut être décrite comme émettant des
(( tops )) périodiques, le k-ième top étant émis à l’instant tk = kT0 lorsque la source est
au point d’abscisse xS,k = vS tk ; T0 est la période propre du signal émis, c’est-à-dire
sa période pour un observateur qui accompagne S dans son mouvement.
Supposons maintenant que le récepteur R se déplace à la vitesse vR = vR ex ; au
moment de l’émission du k-ième top, le récepteur est en x0 +vR tk mais il ne recevra ce
400
446
500
542
578
600
700
λ0 (nm)
b b b b b b b
orange
violet
rouge
jaune
bleu
vert
b b b b b b b
8 × 10−7
4 × 10−7
λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques
Rayons X
Rayons γ
Rayons
Ondes
Micro
ondes
radio
U.V.
Lumière
I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014
4 × 1014
ν (Hz)
Figure 5.8 – Spectre des ondes électromagnétiques
signal que plus tard, lorsqu’il sera rejoint par le signal qui voyage à la vitesse vϕ , donc
à l’instant t′k défini par la condition d’arrivée xR,k = x0 + vR t′k = xS,k + vϕ (t′k − tk ).
vϕ − vS
On en déduit t′k = tk ; la période apparente de réception est T = t′k+1 −t′k pour
vϕ − v R
vϕ − v S
le récepteur, d’où la relation T = T0 : la modification de période apparente
vϕ − v R
du signal porte le nom d’effet Doppler-Fizeau.
On remarque la compatibilité de la relation obtenue avec la mécanique classique :
cette relation ne dépend pas du choix du référentiel galiléen (K), puisqu’une vitesse
d’entraı̂nement commune ve transforme toutes les vitesses v en v ′ = v + ve et laisse
donc la relation ci-dessus inchangée.
vS
Par exemple, pour un récepteur fixe et une source mobile, on note β = la vitesse de
vϕ
la source rapportée à celle de l’onde, et la pulsation apparente de réception ω = 2π/T
ω0
est reliée à la pulsation d’émission par la relation ω = . Lorsque la source se
1−β
rapproche du récepteur, β > 0 et ω > ω0 (décalage vers les hautes fréquences) ; au
contraire, lorsque la source s’éloigne du récepteur, β < 0 et ω < ω0 (décalage vers
les basses fréquences). Cet effet est mis à profit dans le cas des ondes sonores pour
effectuer des mesures de vitesse.
2 Le cas des ondes lumineuses : les ondes lumineuses (ou des ondes électroma-
gnétiques, de façon plus générale) ne peut être traité dans le cadre de la mécanique
classique, mais dans celui de la théorie relativiste, puisque la vitesse des ondes étu-
diées est c = c0 /n ∼ c0 . Toutefois, on peut montrer que l’expression précédente reste
valable lorsque la vitesse relative de l’émetteur et du récepteur reste faible devant
celle c de la lumière.
Ainsi, si une source S s’éloigne, dans le vide, du récepteur R avec une vitesse v, la
v
f0
θ z
b b
S R
Figure 5.9 – Effet Doppler-Fizeau et ondes lumineuses
composante d’éloignement radiale étant donnée par vz = −v cos θ (cf. figure 5.9), on
peut montrer que la pulsation d’émission ω0 (mesurée dans le référentiel de l’émetteur)
et la pulsation apparente de réception ω (mesurée par le récepteur R) sont reliées par
la relation ω ≃ ω0 (1 − v cos θ/c0 ).
La vitesse c0 étant d’autre part un invariant (c’est-à-dire qu’elle ne dépend pas du
référentiel galiléen utilisé), la longueur d’onde varie, au même ordre d’approximation,
en proportion inverse, λ ≃ λ0 (1 + v cos θ/c0 ). Un éloignement (v > 0) se traduit
donc par une augmentation de longueur d’onde apparente (décalage vers le rouge)
et un rapprochement par une diminution de celle-ci (décalage vers le bleu). Cet effet
trouve son application dans le cadre de l’Astrophysique (pour la mesure des vitesses
radiales d’éloignement des astres et galaxies) mais aussi pour la mesure des vitesses
des véhicules, l’effet Doppler-Fizeau s’appliquant aussi aux ondes radar.
5.1.4 Photons et sources de lumière

2 Quantification de l’énergie du rayonnement : alors que tout modèle corpusculaire
de la lumière était abandonné au profit d’une description ondulatoire, l’étude de la
répartition spectrale des sources thermiques (par exemple, les filaments chauffés de
lampes à incandescence) a amené Planck‡ à retrouver une description quasiment
particulaire des échanges d’énergie du rayonnement avec la matière : l’énergie lumi-
neuse n’est émise ou absorbée que par quanta, unités indivisibles égales à ǫ = hν,
où ν est la fréquence du rayonnement électromagnétique émis ou absorbé et h est la
constante de Planck :
h = 6, 6261 × 10−34 J · s (5.4)
2 Les photons : les travaux de Planck furent complétés en  par ceux d’Einstein,
interprétant l’effet photoélectrique comme une interaction individuelle (et non plus
collective, comme dans une source thermique) entre les électrons d’un métal et des
particules individuelles, appelées ultérieurement photons, présentes dans tout flux lu-
mineux. L’énergie individuelle de ces particules est justement le terme ǫ = hν décrit
par Planck.
D’autres expériences mirent ultérieurement en évidence toutes les caractéristiques mé-
caniques de ces particules, obligeant à adopter une double description (on parle de
dualité onde-corpuscule de la lumière. L’extension par De Broglie de cette descrip-
tion aux particules matérielles est à la base de la théorie quantique.
Les photons se déplacent à la vitesse c0 , qui est celle de la lumière dans le vide. On
doit donc impérativement les décrire dans le cadre relativiste.
Dans ce cadre, on peut montrer que toute particule de masse m et de vitesse v
mv
possède une quantité de mouvement (ou impulsion) p = p et une énergie
q 1 − v 2 /c20
E = p2 c2 + m2 c40 . Ces relations générales admettent deux limites, respectivement
à des vitesses faibles ou voisines de c0 :
• Lorsque v ≪ c0 (particules quasi-classiques), on peut écrire au premier ordre en

1
v/c les expressions p ≃ mv et E ≃ mc20 + mv 2 ; le terme mc20 , qui subsiste seul
2
dans tous les cas pour une particule au repos (p = 0) porte le nom d’énergie au
repos de la particule.
• Lorsque v → c0 , l’impulsion d’une particule ne pouvant être infinie, on doit avoir
m → 0 ; c’est en particulier le cas des photons, particules de masse nulle mais
dont l’énergie ǫ et l’impulsion p ne sont pourtant pas nulles, avec en particulier
hν
ǫ = hν donc p = .
c0
Propriétés des photons

X Les photons sont les quanta du rayonnement électromagnétique. Ces
particules, de masse nulle, ont pour énergie ǫ = hν = hc0 /λ0 et pour
quantité de mouvement p = hν/c0 = h/λ0 dans un rayonnement élec-
tromagnétique de fréquence ν et de longueur d’onde (dans le vide) λ0 .
2 Sources spectrales : la quantification est une propriété naturelle de toute onde

confinée par des conditions aux limites, comme on l’a montré lors de l’étude des ondes
électriques. L’étude des structures atomiques montre la même quantification, et les
niveaux d’énergie d’un atome appartiennent à une série dénombrable de valeurs Ek .
Lors d’une transition énergétique, un atome émet ou absorbe donc un photon d’énergie
hν = |Ef − Ei |, en fonction des énergies initiale et finale d’un atome.
Lorsque les transitions énergétiques dans une source ont lieu exclusivement de façon
individuelle entre atomes de la source et rayonnement émis, seules certaines valeurs de
la fréquence sont possibles pour le photons émis ; on parle alors de sources spectrales.
Ces sources n’émettent de la lumière que pour des longueurs d’onde très précises, avec
seulement de faibles largeurs de raies dues, par exemple, à l’agitation thermique des
atomes de la source et à l’effet Doppler-Fizeau qui l’accompagne. L’allure du spectre
énergétique émis par une telle source est présenté sur la figure 5.10.
dI
546 nm
dλ0
577 nm
579 nm
405 nm
436 nm
492 nm
λ0
Figure 5.10 – Spectre d’émission d’une lampe à vapeur de Mercure
2 Sources thermiques : lorsque l’émission lumineuse ne s’effectue pas dans une va-
peur peu dense et transparente, mais à la surface d’un solide, les échanges d’énergie
entre l’émetteur et le rayonnement sont collectifs et décrits par un modèle statistique.
Dans le cas limite du corps noir idéal (qui sera décrit dans le cours d’Électromagné-
tisme), on prévoit un spectre énergétique continu d’émission, dont la forme générale
est universelle et dont les caractéristiques ne dépendent que de la température T de

la source. Ce spectre de rayonnement thermique est présenté sur la figure 5.11.
dI
dλ0
98 % × Itotal
λm /2
8λm
λ λ0
b m
Figure 5.11 – Spectre d’émission d’une source thermique (corps noir)
Nous montrerons ultérieurement que la longueur d’onde λm à laquelle on observe le

C
maximum d’émission vérifie la loi de Wien‡ , λm = , où la constante universelle C
T
vérifie C = 2, 895 × 10−3 m · K.
L’intensité totale émise par unité de surface du corps rayonnant vérifie la loi de
I
Stefan‡ , = σT 4 , où la constante universelle σ (constante de Stefan) vérifie
S
σ = 5, 67 × 10−8 W · m−2 · K−4 . Ainsi, plus la température de l’émetteur est élevée,
plus il émet une puissance totale importante, concentrée vers les courtes longueurs
d’onde.
On remarque (zone grisée sur la courbe de la figure 5.11)
que 98 % de l’intensité émise
λm
par un tel émetteur sont concentrés dans l’intervalle , 8λm .
2
Un corps noir chauffé à T = 1 500 K émet ainsi à raison de 287 kW · m−2 avec un
maximum d’émission pour la longueur d’onde 1, 93 µm, dans le proche infrarouge ; la
quasi-totalité de ce rayonnement est concentrée dans l’intervalle [0, 96 µm ; 15, 4 µm].
Le Soleil peut aussi être considéré comme un émetteur thermique, de température de
surface T ≃ 5 780 K, avec un maximum d’émission vers 500 nm, dans le visible. Son
émission se concentre dans l’intervalle [250 nm ; 2, 0 µm], qui couvre notamment tout
le domaine visible, mais comporte aussi des composantes infrarouges et ultraviolettes.
5.2 L’onde électromagnétique
5.2.1 La nature des ondes lumineuses

2 La théorie électromagnétique de la lumière : l’astronome danois Rømer proposa
la première détermination de la vitesse de la lumière en  par une méthode astro-
nomique (cf. figure 5.12) basée sur les occultations de Io, satellite de Jupiter, par le
cône d’ombre de la planète autour de laquelle Io est en mouvement.
Rømer a constaté que la période apparente de révolution de Io autour de Jupiter
variait en fonction de la position de la Terre au moment de la mesure ; il faut en effet
tenir compte d’un temps de parcours différent par la lumière pour parvenir à la Terre
selon que sa position est, sur la figure, en T1 ou en T2 . Les mesures encore peu précises
de Rømer fournirent c0 ≃ 2, 1 × 108 m · s−1 ; les méthodes ultérieures citées plus haut
Cône d’ombre
Soleil
bT T1 b
2
o r b ite de I
o
Jupiter
Figure 5.12 – Détermination par Rømer de la vitesse de la lumière
permirent d’améliorer progressivement la précision de la mesure pour s’approcher de

la valeur aujourd’hui connue à c0 ≃ 3, 00 × 108 m · s−1 .
En , le physicien écossais Maxwell développa une théorie électromagnétique
unifiée, montrant la capacité des champs électromagnétiques à vérifier une équation
de propagation (équation de d’Alembert) dans le vide :
∂2E ∂2B
∆E = ε0 µ0 ∆B = ε0 µ0 (5.5)
∂t2 ∂t2
1
avec pour vitesse de propagation c0 = √ ≃ 3, 0 × 108 m · s−1 . Sur la base de cette
ε0 µ0
identification numérique, Maxwell proposa d’interpréter les ondes lumineuses comme
un cas particulier d’ondes électromagnétiques, affirmant ainsi que le lumière consiste
en ondulations transverses du support des phénomènes électriques et magnétiques,
c’est-à-dire en fait de ce qu’on identifie aujourd’hui comme l’espace vide lui-même.
2 Géométrie du champ électromagnétique : nous admettrons provisoirement les pro-
priétés du champ électromagnétique associé à une onde lumineuse se propageant dans
un milieu transparent d’indice n ; ces propriétés seront établies dans le cours d’Élec-
tromagnétisme.
L’onde électromagnétique plane progressive décrite sur la figure 5.13 se propage dans
la direction de l’axe (Ox) ; elle a pour vecteur d’onde k = kex , pour pulsation ω avec
c0 ω
pour vitesse de phase vϕ = = .
n k
Les champs électrique et magnétique sont en permanence perpendiculaires à la direc-
tion de propagation : il s’agit d’ondes transverses. L’onde représentée sur la figure 5.13
est de plus polarisée rectilignement selon (Oy), c’est-à-dire que le champ électrique
oscille au cours du temps tout en gardant une direction fixe ; nous verrons ultérieu-
rement que ce n’est pas un cas général puisque la direction de E peut être variable
dans le plan (Oyz). On notera (sur la figure 5.13, E0 = E 0 ey ) :
E = E0 exp [j (ωt − kx)] (5.6)
Le champ magnétique est en permanence perpendiculaire au champ électrique et au

vecteur d’onde, le trièdre (k, E, B) étant direct et l’amplitude du champ magnétique
vérifie B0 = E0 /vϕ ; on peut donc écrire :
z
y
B(t′ )
t′ > t
E(t′ )
E(t) E∧B
x
B(t)
Figure 5.13 – Onde électromagnétique
n
B= ex ∧ E0 exp [j (ωt − kx)] (5.7)
c0
Les expressions (5.6) et (5.7) sont évidemment des notations complexes, commodes
pour le calcul mais dépourvues de sens direct ; on pourra les remplacer, pour une
interprétation physique, par l’étude des champs électrique et magnétique réels, à savoir
E = Re (E) et B = Re (B).
5.2.2 Transport d’énergie lumineuse

2 Propagation de l’énergie : l’onde électromagnétique décrite ci-dessus transporte
évidemment l’énergie dans la direction du vecteur d’onde, donc dans la direction
de E ∧ B. On peut analyser simplement l’unité de mesure de ce produit vectoriel
[U ]
en remarquant que [E] = , si U est une tension et L une longueur, tandis que
[L]
[µ0 ] [I] [U I]
[B] = , si I est un courant. On en déduit que [E ∧ B] = [µ0 ] 2
[L] [L ]
On notera bien que le produit vectoriel E ∧ B est défini à partir des vecteurs réels
E et B, et non pas à partir des grandeurs complexes. Plus généralement, les nota-
tions complexes ne s’appliquent qu’aux grandeurs linéaires, et jamais aux grandeurs
quadratiques, notamment énergétiques.
2 Vecteur de Poynting : on voit apparaı̂tre ci-dessus une densité surfacique de puis-

sance, qui s’exprime en watt par mètre carré, en définissant le vecteur de Poynting :
E∧B
R= (5.8)
µ0
Ce vecteur a pour interprétation la puissance P rayonnée par l’onde électromagnétique

à travers une surface (S), qui s’exprime comme le flux du vecteur de Poynting :
x
P = R · ndS (5.9)
(S)
La variation temporelle rapide de cette expression (avec des pulsations de l’ordre de

1014 rad · s−1 ) explique qu’on ne s’intéresse qu’exceptionnellement à cette grandeur
P ; on se contente en général de calculer sa moyenne car aucun détecteur ne peut
suivre des évolutions aussi rapides.
2 Puissance moyenne d’une onde lumineuse : le vecteur de Poynting moyen associé
à l’onde électromagnétique déjà écrite prend, conformément aux méthodes générales
d’étude des grandeurs harmoniques, la forme :
E ∧ B∗

1
hRi = Re (5.10)
2 µ0
La puissance
x moyenne transportée par l’onde à travers une surface (S) s’écrit alors
hP i = hRi · ndS. Au vu de 5.6 et 5.7, et puisque E ∧ (ex ∧ E∗ ) = ex E · E∗ , on
(S)
n
écrira encore le vecteur de Poynting moyen hRi = Re (E · E∗ ) ex .
2µ0 c0
Puissance transportée par une onde

X La puissance moyenne transportée par une onde électromagnétique à
travers une section droite d’aire S est P = α × n × S × Re(E · E∗ ), où la
constante α est universelle (α = 1/2µ0 c20 ).
On se contente en général en Optique de retenir la relation de proportionnalité

P ∝ S × Re(E · E∗ ), sans mémoriser la constante de proportionnalité.
5.3 Polarisation de la lumière
5.3.1 États de polarisation

2 Polarisation : on appelle direction de polarisation d’une onde électromagnétique
la direction du champ électrique E ; c’est donc un vecteur du plan perpendiculaire à la
direction de propagation, direction qui était notée (Ox) ci-dessus. Cette polarisation
est donc entièrement définie par la direction du champ électrique E(t) à tout instant
t. Elle ne dépend donc que des seules projections non nulles du champ complexe E
dans le plan (Oyz). On notera en général :
 
0
E 0y
E =  E 0y  exp [j (ωt − kx)] = E0J (5.11)
E 0z
E 0z
où le vecteur J est un vecteur complexe, unitaire, appelé vecteur de Jones. Ce vec-
teur permet de déterminer la direction du champ électrique réel et fournit donc une
nomenclature simple de tous les états de polarisation possibles.

1
2 Polarisation rectiligne : considérons d’abord le cas simple où J = , donc aussi
0
E = E 0 ey exp [j (ωt − kx)] et E = Re (E) = |E 0 |ey cos (ωt − kx + arg(E 0 )) : il s’agit
d’un champ identique à celui représenté sur la figure 5.13, avec une direction fixe pour
le champ électrique, alignée sur l’axe (Oy) : on parle de polarisation rectiligne.
On peut aussi rencontrer des ondes lumineuses polarisées rectilignement

selon
d’autres

0 cos α
directions, avec par exemple les vecteurs de Jones J = ou J = ,
1 sin α
respectivement pour une onde polarisée rectilignement selon (Oz) ou selon un axe
arbitraire du plan de polarisation (Oyz), faisant l’angle α avec (Oy).
On notera que la phase commune arg(E 0 ) des deux composantes de E 0 ne joue aucun
rôle ici puisqu’on peut l’annuler par changement de l’origine des durées ; on n’hésitera
pas à faire ce type de choix dans la suite.
2 Polarisation circulaire : considérons maintenant le cas d’un vecteur de Jones présen-
tant deux composantes de même amplitude, mais déphasées  de π/2, avec par  exemple
0
1 1 E0
J= √ ; le champ électrique Re(E) est E = √  cos (ωt − kx) , ce qu’on
2 j 2 − sin (ωt − kx)
peut représenter sur la figure 5.14 (à gauche), à différents instants successifs mais pour
une même valeur de x.
z z
t′ & t t′ & t
ci
t )′
rc
E(
ire droite
ω(t′ − t)
u la
x E(t) y x y
i re g a u
b b
E( ω(t − t) ′ E(t)
ula
t ′) he
circ
c

1 1 1 1
J= √ J= √
2 j 2 −j
Figure 5.14 – Polarisations circulaires

√
Le champ électrique correspondant tourne donc sur un cercle de rayon E0 / 2 à la
vitesse angulaire ω dans le sens des aiguilles d’une montre pour un observateur qui
regarde l’onde se propager vers lui ; on parle donc ici de polarisation circulaire droite.

1 1
Considérons de même le cas où J = √ ; le champ électrique réel s’écrit
  2 −j
0
E0
alors E = √  cos (ωt − kx) , représenté sur la figure 5.14 (à droite) ; on parle
2 sin (ωt − kx)
logiquement de polarisation circulaire gauche.
L’identification des signes ±j avec le sens droite ou gauche de la polarisation cir-

culaire doit être fait avec précaution ; en particulier, cette conclusion serait inversée
pour une onde se propageant dans le sens opposé de l’axe (Ox). Il est donc vivement
conseillé de toujours procéder en deux étapes : d’abord représenter le champ élec-
trique réel pour deux instants successifs, puis identifier la polarisation en se plaçant
dans le cas d’un observateur qui regarde l’onde se propager vers lui.

1 1 1 1 0
On peur remarquer que √ =√ ±j ; ainsi, toute onde po-
2 ±j 2 0 1
larisée circulairement peut être considérée comme la superposition de deux ondes
polarisées rectilignement selon deux directions orthogonales, déphasées de ±π/2.

1 1 1 1 1 1
De même, = √ √ +√ ; toute onde polarisée rectiligne-
0 2 2 j 2 −j
ment est la superposition de deux ondes polarisées circulairement en sens inverse.
2 Polarisation elliptique : revenons maintenant au cas le plus général d’un vecteur
de Jones quelconque, ses deux composantes étant de norme et de phase arbitraires.
On peut choisir l’origine des durées pour rendre réelle l’une des composantes (nous
la noterons
A ∈ R+ +
) mais pas l’autre (notée donc B exp (jϕ) avec B ∈ R ) ; ainsi,
A
J= donc le champ électrique réel a pour composantes instantanées
B exp (jϕ)
Ex = E0 A cos (ωt − kx) et Ey = E0 B cos (ωt − kx + ϕ). C’est l’équation paramé-
trique d’une ellipse, dont les grand et petit axes ainsi que le sens de parcours dé-
pendent des valeurs de A, B et ϕ.
La polarisation la plus générale d’une onde électromagnétique est donc une polarisa-
tion elliptique, dont les cas rectiligne et circulaire ne sont que des dégénérescences.
Sous réserve de choisir les axes (Oy) et (Oz) alignés avec respectivement de grand
axe (de longueur 2a) et le petit axe (de longueur 2b) del’ellipse, le vecteur
de Jones
1 a cos α
le plus général peut alors être écrit J = √ ou encore J = ,
a2 + b2 ǫjb ǫj sin α
avec ǫ = ±1 et 0 6 α 6 π/2. En effet, le champ électrique correspondant a pour com-
posantes Ey = E0 cos α cos (ωt − kx) et Ey = ∓E0 sin α sin (ωt − kx), qui correspond
à une vibration de polarisation elliptique droite (ǫ = −1) ou gauche (ǫ = +1), sauf si
α = 0 ou π/2 (polarisation rectiligne) ou si α = π/4 (polarisation circulaire).
2 Polarisation naturelle : la plupart des sources lumineuses naturelles (en particu-
lier, les sources thermiques et les lampes spectrales) émettent des ondes qui sont la
superposition aléatoire d’un grand nombre d’ondes indépendantes, de polarisations
différentes. Il n’est en général pas possible de suivre les évolutions de la direction du
champ électrique E dans le plan de polarisation ; cette direction semble évoluer de
manière aléatoire dans ce plan.
Dans une telle situation, on parle de polarisation naturelle ; on dit encore que la
lumière observée est non polarisée. On n’observera donc d’effets liés à la polarisation
de l’onde électromagnétique qu’en présence de dispositifs polarisants, ou en présence
de sources particulières (les lasers sont des sources de lumière polarisée).
5.3.2 Dispositifs polarisants

2 Polariseur : on appelle polariseur rectiligne ou, plus simplement, polariseur, un
dispositif qui réalise la projection du champ électrique incident sur une direction
particulière u : l’onde résultante est donc polarisée rectilignement selon la direction
u. Le premier polariseur rectiligne a été découvert par Malus et perfectionné par
Nicol ; le principe en est représenté figure 5.15 à gauche : le cristal de calcite présente
deux indices différents pour les deux polarisations rectilignes qui constituent la lumière
naturelle incidente (I). La géométrie du cristal est calculée de sorte qu’un des deux
rayons parvienne sur la mince couche séparant les deux parties du cristal sous une
incidence supérieure à l’angle limite de réfraction totale. Le faisceau émergent (P) est
donc polarisé.
On utilise plus couramment des polariseurs dichroı̈ques, formés de lames minces uti-
lisées en incidence normale (cf. figure 5.15 à droite). Ils sont formés de matériaux
qui présentent une anisotropie d’absorption, les lames couramment utilisées absor-
bant plus de 80 % de l’intensité pour une des deux polarisations rectilignes et moins
de 1 % pour l’autre ; la lumière résultante est donc presque complètement polarisée.
Les polariseurs dichroı̈ques les plus courants sont des polaroı̈ds, formées d’une feuille
(P)
(P)
(I)
(I)
Figure 5.15 – Polariseurs rectilignes
de polyvinyle étirée mécaniquement. Les chaı̂nes polymères longues sont alors étirées
et des molécules polarisables (de l’iode I2 ) sont alors fixées le long de ces chaı̂nes,
provoquant l’absorption de lumière dans la direction d’alignement.
Dans les deux cas, on peut décrire l’effet d’un polariseur rectiligne idéal comme une
projection du vecteur de Jones sur la direction du vecteur u. On peut décrire cette
projection par une matrice de Jones ; par exemple, pour un polariseur qui aligne le
champ électrique sur la première direction (Oy) du plan de polarisation, la matrice
1 0
de Jones du polariseur est [M ] = et le polariseur transforme la polarisation
0 0
définie par J en une polarisation définie par J′ = [M ]J.
2 Analyseur et loi de Malus : un polariseur rectiligne de direction de polarisation
quelconque dans (Oyz), u = cos θey + sin θez est caractérisé par J′ =
u (J · u) donc,
cos2 θ cos θ sin θ
après calcul, par la matrice de Jones [M ] = .
cos θ sin θ sin2 θ
Analyseur
Lumière à analyser
Mesure de I
Polariseur
Figure 5.16 – Analyse d’une polarisation
Un tel dispositif peut être utilisé pour déterminer la nature de la polarisation d’une
onde quelconque qui traverse ce polariseur, sous réserve d’effectuer une mesure d’in-
tensité (ou d’éclairement, ce qui revient au même) après traversée de ce polariseur
(( tournant )). L’ensemble (polariseur rectiligne et mesure de lumière) porte le nom
d’analyseur et est représenté sur la figure 5.16.
Considérons d’abord le cas où la lumière à analyser est polarisée ; nous
considérerons
le
cos α
cas général d’une polarisation elliptique de vecteur de Jones J = . Après
±j sin α
passage par l’analyseur, le champ électrique est proportionnel au vecteur de Jones
cos θ
[M ]J = (cos α cos θ ± j sin α sin θ) . L’intensité lumineuse mesurée sera alors
sin θ
proportionnelle à E · E , donc à | cos α cos θ ± j sin α sin θ|2 = sin2 α + cos 2α cos2 θ.
∗
Le tracé de la courbe donnant I(θ) = I0 sin2 α + cos 2α cos2 θ est reporté sur la figure
5.17 dans trois cas : α = 0 (polarisation rectiligne), α = π/4 (polarisation circulaire)
et α quelconque (polarisation elliptique). L’étude des variations de I(θ) nous renseigne
donc sur la nature de la polarisation étudiée. Dans le cas d’une polarisation rectiligne
(α = 0), la relation I(θ) = I0 cos2 θ porte le nom de loi de Malus de la polarisation.
Considérons à nouveau ci-dessus l’exemple de la polarisation circulaire. Le champ
électrique tournant rapidement, avec une longueur constante, dans le plan d’analyse,
il est naturel d’obtenir une projection moyenne constante sur toute direction u du plan
(Oyz). Cependant, on obtiendrait le même résultat en projetant sur le même vecteur
I(θ)
Polarisation rectiligne
Polarisation
circulaire
Polarisation
elliptique θ
π 2π 3π 4π 5π
Figure 5.17 – Analyse d’une polarisation inconnue
u un champ électrique de polarisation aléatoire : il n’est pas possible de distinguer

une polarisation naturelle et une polarisation circulaire par cette méthode.
2 Lames biréfringentes : nous admettrons l’existence de dispositifs polarisants sus-

ceptibles d’introduire un déphasage arbitraire entre deux composantes rectilignes du
plan de polarisation. L’étude de ces dispositifs, qui ne figure par au programme, est
ici présentée de manière très succincte, et seulement à titre documentaire.
Si le dispositif en question déphase la composante (Oz) relativement
à la composante
1 0
(Oy), la matrice de Jones associée est [M ] = .
0 exp (jϕ)
En particulier, on parlera de lame demi-onde (ou lame λ/2) lorsque le déphasage ϕ
correspond à la propagation sur la moitié d’une longueur d’onde, soit ϕ = π ; on
parlera de même de lame quart d’onde (ou lame λ/4) lorsque ϕ = π/2.
On remarque que la lame n’aura pas d’autre effet qu’un déphasage global lorsque le
champ incident est aligné sur un des axes (Oy) ou (Oz) ; pour cette raison, ces deux
axes portent le nom d’axes neutres de la lame.
À titre d’exemple d’application, une lame quart d’onde
transforme
une
polarisation
1 0 1 1
circulaire en polarisation rectiligne puisque = ; le champ ré-
0 j j −1
sultant est aligné sur la seconde bissectrice des axes (Oyz). Cette propriété permet
de distinguer polarisation circulaire et polarisation naturelle, au contraire de l’emploi
d’un simple analyseur.
1 0 1 1
Remarquons encore que = : une lame quart d’onde trans-
0 j ±1 ±j
forme aussi une polarisation rectiligne (alignée une bissectrice de ses axes neutres) en
polarisation circulaire ; c’est même ce type de dispositif qui permet de créer une onde
polarisée circulairement.
5.4 L’approximation scalaire
5.4.1 La grandeur lumineuse

2 Conditions de l’approximation : la polarisation de l’onde électromagnétique peut
n’avoir aucun effet sur un dispositif optique, par exemple parce que celui-ci ne mo-
difie pas l’état de polarisation naturelle de la lumière. Dans ce cas, les observations
faites au moyen de ce dispositif font intervenir des mesures d’intensité lumineuse (ou
d’éclairement), proportionnel à E · E∗ , que l’on peut aussi écrire |E y |2 + |E z |2 ; les
deux composantes E y et E z sont indépendantes mais vérifient les mêmes relations

pour la propagation, l’atténuation, le déphasage, etc.
Tout se passe donc comme si on pouvait ne considérer qu’une seule de ces deux
composantes, quitte à multiplier ensuite tous les résultats par deux : c’est ce qu’on
appelle l’approximation scalaire, dans laquelle on décrit la grandeur lumineuse par
l’oscillation d’une seule onde, scalaire et non plus vectorielle.
Approximation scalaire
X Lorsqu’un dispositif optique n’introduit aucun effet de polarisation et est
utilisé en lumière non polarisée, on remplace l’étude du champ électro-
magnétique (E (r, t) , B (r, t)) par celle d’une grandeur vibrante unique,
appelée grandeur lumineuse, que nous noterons W (r, t).
On rencontre aussi le terme amplitude lumineuse, et les notations A (r, t) ou S (r, t)

pour décrire la grandeur lumineuse.
2 La grandeur lumineuse : la notion d’onde lumineuse est antérieure à la détermina-

tion de la nature électromagnétique des ondes lumineuses ; on ne précisera donc pas
dans la suite si la grandeur W (r, t) est proportionnelle, ou égale, à une composante
du champ électrique.
Comme précédemment, on utilisera éventuellement une notation complexe W (r, t),
de sorte que l’onde réelle vérifie W (r, t) = Re(W (r, t)).
′
Enfin, on ne précisera pas l’expression des constantes

2 α et α qui interviennent dans
l’écriture de l’intensité lumineuse I(r) = α W (r, t) ou dans celle de l’éclairement
E(r) = α′ W 2 (r, t) ; dans ces expressions, la notation hf (t)i désigne la moyenne

temporelle de la grandeur variable f (t) au cours d’une durée suffisamment longue ;

l’intervention de cette moyenne temporelle rend compte de la limite des appareils
de mesure (qu’il s’agisse de l’œil ou de dispositifs électroniques), qui ne peuvent pas
suivre les oscillations extrêmement rapides des ondes lumineuses.
Dans le cas des ondes sinusoı̈dales (c’est-à-dire, des ondes monochromatiques, avec
donc une longueur d’onde λ0 fixée), on pourra utiliser la notation complexe avec
k k′
I(r) = Re (W (r, t) W ∗ (r, t)) et E(r) = Re (W (r, t) W ∗ (r, t)). Puisque dans ce
2 2
cadre la dépendance temporelle est harmonique, on écrira W (r, t) = w(r) exp (jωt),
k k′
ce qui permet d’écrire encore I(r) = |w(r)|2 et E(r) = |w(r)|2 .
2 2
L’onde lumineuse
X Dans le cadre de l’approximation scalaire, l’onde lumineuse est une gran-
deur vibrante, W (r, t) ; l’intensité I et l’éclairement E sont proportion-
nels à la moyenne temporelle W 2 (r, t) du carré de cette grandeur.

Les ondes monochromatiques s’écrivent W (r, t) = w(r) exp (jωt) (en

notation complexe) ; I et E sont proportionnels à |w(r)|2 .
2 Équation de propagation : l’onde lumineuse est réputée vérifiée l’équation de

d’Alembert à la vitesse c (dans le milieu étudié), à savoir :
1 ∂2
∆W (r, t) = W (r, t) (5.12)
c2 ∂t2
ou encore, pour une onde sinusoı̈dale W (r, t) = w(r) exp (jωt) :
ω2
∆w(r) = − w(r) (5.13)
c2
ω
Dans cette expression, le vecteur d’onde k dans le milieu étudié vérifie k = tandis
c
ω 2π
que, pour une onde de même fréquence dans le vide, on écrirait k0 = = . On
c0 λ0
c0
pourra donc faire intervenir l’indice optique n = sous la forme :
c
ω 2π
k = nk0 = n avec k0 = (5.14)
c0 λ0
5.4.2 Ondes planes, ondes sphériques

2 Structure des ondes planes : une onde lumineuse plane est une solution de (5.12)
qui ne dépend que d’une seule variable d’espace, W (r, t) = W (x, t). Dans ce cas, on
sait que la solution générale de l’équation est la somme de deux ondes progressives en
sens inverse, W (x, t) = W+ (x − ct) + W− (x + ct).
Dans le cas particulier des ondes planes monochromatiques, l’équation (5.13) devient
d2 w(x)
= −k02 w(x) d’où w(x) = w+ exp (−jk0 x)+w− exp (jk0 x) ; on retrouve bien la
dx2
somme de deux ondes planes progressives monochromatiques en sens inverse, puisque
W (x, t) = w+ exp [j (ωt − k0 x)] + w− exp [j (ωt + k0 x)].
Plus généralement, si une onde lumineuse plane progressive monochromatique se pro-
page dans un milieu transparent et dans une direction qui n’est pas dans la direction
d’un des axes de coordonnées, nous la noterons selon la forme générale (5.15), en
fonction de l’amplitude w0 de l’onde, et du vecteur d’onde k = ke, où e est le vecteur
unitaire de la direction de propagation de l’onde lumineuse.
W (r, t) = W (x, y, z, t) = w0 exp [j (ωt − k · r)] (5.15)
2 Lois de Snell-Descartes : considérons une onde lumineuse plane progressive se

propageant dans un milieu d’indice n1 en direction du dioptre (localement assimilé à
un plan) (Oxy) séparant ce milieu du milieu d’indicen2 . On pourra noter cette onde
sin θ1
n1 ω 
incidente w1 = w01 exp (−jk1 · r), avec k1 = 0  ; l’angle θ1 est ainsi
c0
cos θ1
l’angle d’incidence de cette onde sur le plan du dioptre, tandis que (Oxz) est le plan
d’incidence (figure 5.18).
Nous admettrons l’existence d’une onde transmise w2 = w02 exp (−jk2 · r) dans le
milieu d’indice n2 et d’une onde réfléchie w′1 = w′01 exp (−jk′1 · r) réfléchie vers le
milieu d’indice n1 , et chercherons à quelle condition ces ondes peuvent vérifier la
relation de passage imposée par la continuité de l’onde w de part et d’autre du dioptre :
w1 (z = 0− ) + w′1 (z = 0− ) = w2 (z = 0+ ) ; les justifications théoriques à la base de
cette relation de passage seront établies ultérieurement.
Écrivantcette relation en un point quelconque (x, y, 0) du plan du dioptre, on aura
n1 ω
sin θ1 x + w′01 exp −j k1x
′ ′

w01 exp −j x + k1y y = w02 exp (−j [k2x x + k2y y]).
c0
n2
θ2
θ1′ z
n1
θ1
Figure 5.18 – Réfraction et réflexion d’une onde sur un dioptre
Cette relation doit être vérifiée ∀(x, y) ; les fonctions x 7→ exp (ax) pour diverses
′
valeurs de a formant une famille libre, cette relation impose k1y = k2y = 0, mais aussi
′ n 1 ω
k1x = k2x = sin θ1 : on dira que la composante tangentielle du vecteur d’onde se
c0
conserve.
′
La relation k1y = k2y = 0 montre que les deux ondes réfléchie et transmise se pro-
pagent dans le plan d’incidence (c’est la première loi de Descartes), ce qui permet de
faire le tracé de la figure 5.18 définissant les angles de réflexion θ1′ et de réfraction θ2 .
′ n1 ω n2 ω
On en déduit alors k1x = sin θ1′ et k2x = sin θ2 , d’où il découle immédiate-
c0 c0
′
ment θ1 = θ1 et n1 sin θ1 = n2 sin θ2 : on retrouve ainsi la deuxième loi de Descartes.
Ces propriétés nous incitent à considérer que le rayon lumineux de l’Optique géo-
métrique est bien représenté par la direction du vecteur d’onde de l’onde lumineuse
w (r, t).
Lois de Snell-Descartes
X La continuité (admise) de l’onde lumineuse de part et d’autre d’un
dioptre impose la conservation de la composante tangentielle du vec-
teur d’onde ; on en déduit les deux lois de Snell-Descartes de la réflexion
et de la réfraction :
• l’onde réfléchie et l’onde réfractée se propagent dans le plan d’incidence,
défini par l’onde incidente et la normale au dioptre au point d’incidence ;
• l’onde réfléchie est symétrique de l’onde incidente par rapport à la
normale ; lors de la réfraction, l’onde traverse la normale et vérifie la
relation n1 sin θ1 = n2 sin θ2 .
2 Ondes sphériques : si une onde lumineuse se propage dans le vide depuis un point
source O, on peut la chercher sous la forme w(r) = w(r) en coordonnées sphériques ;
ω2

1 d dw
on peut aussi montrer l’expression du laplacien ∆w = 2 r2 = − 2 w et on
r dr dr c
a(r) d2 a ω2
en trouve la solution en écrivant w(r) = , qui mène à = − 2 a, d’où une
r dr2 c
solution pour a(r) en somme de deux exponentielles complexes conjuguées, avec donc
exp [j (ωt − k0 r)] exp [j (ωt + k0 r)]
W (r, t) = a+ + a− .
r r
exp [j (ωt − k0 r)]
On parle d’onde sphérique divergente depuis O pour W (r, t) = a+
r
exp [j (ωt + k0 r)]

(qui se propage dans le sens des r croissants), tandis que a− est
r
convergente vers O (puisqu’elle se propage dans le sens des r décroissants).
Dans les deux cas, on remarque un facteur d’amplitude (proportionnel à 1/r) dont on
néglige souvent en général les variations tant qu’on reste à grande distance de O.
2 Les ondes de l’optique géométrique : considérons des ondes qui se propagent dans
les conditions de Gauss, c’est-à-dire telles que la direction de propagation fait en tout
endroit un angle faible avec l’axe optique (Ox) ; la figure 5.19 présente la propagation
d’une onde plane (à gauche) et d’une onde sphérique (à droite) dans ces conditions.
y y
α x S x
b
Figure 5.19 – Ondes plane et sphérique dans les conditions de Gauss
Sur cette figure, les traits pleins désignent les directions de propagation, et les traits
pointillés les surfaces à phase constante ; pour une onde plane, exp [j (ωt − k · r)] = cte
définit des plans perpendiculaires à k.
Pour une onde sphérique, exp [j (ωt − kr)] = cte définit des sphères centrées sur S.
Dans les deux cas, on parle de surfaces d’onde ou de surfaces équiphase.
Dans les deux cas, les surfaces d’onde sont perpendiculaires aux rayons lumineux.
Nous généraliserons bientôt ce résultat sous le nom de théorème de Malus.
2 Caractérisation des ondes planes et sphériques : pour l’onde plane de la figure 5.19,
k = nk0 (cos αex + sin αey ) donc w(r) = w0 exp [j (ωt − nk0 (x cos α + y sin α))] ou,
dans les conditions de Gauss, w(r) = w0 exp [j (ωt − nk0 (x + yα))]. Nous noterons
encore ce résultat sous la forme w(r) = w0 exp [j (ωt − Φ(x, y))], la phase Φ d’une
onde plane variant en raison affine de y à x fixé, Φ(x, y) = nk0 (x + yα).
Considérons de même l’onde sphérique de la figure 5.19, pour laquelle nous écrirons
a
w(r) = 0 exp [j (ωt − Φ(x, y, z))], où Φ(x, y, z) = ±nk0 r, avec le signe + pour une
r
onde divergente p et le signe − pour une onde convergente. La distance r de S au point
(x, y, z) est r = (x − xS )2 + y 2 + z 2 .
y2
Dans le plan de figure (z = 0), on peut écrire r ≃ |x − xS | + dans les
2|x − xS |
conditions de Gauss ; d’autre part, |x−xS | = ±(x−xS ) avec la même signification pour
les signes + et − que ci-dessus. Finalement, on obtient dans tous les cas Φ(x, y, z) =
y2

nk0 (x − xS ) + .
2(x − xS )
Finalement, dans un plan de front (plan perpendiculaire à l’axe optique (Ox)), la

phase d’une onde dépend des coordonnées (y, z) dans ce plan, ainsi que de la longueur
d’onde λ0 dans le vide, et de l’indice n du milieu.
Phase d’une onde plane dans les conditions de Gauss

X Si la phase s’écrit (à x fixé et à une constante additive près) sous la
2π
forme Φ = n [αy + βz], l’onde est plane et se propage dans la direction
λ0
définie par les cosinus directeurs α et β, définis par e·ey = α et e·ez = β,
où e est le vecteur unitaire qui dirigé k.
Phase d’une onde sphérique dans les conditions de Gauss

X Si la phase s’écrit (à x fixé et à une constante additive près) sous la forme
2π ρ2
Φ=n , avec ρ2 = y 2 + z 2 , l’onde est sphérique et passe par
λ0 2(x − xS )
un point de convergence en x = xS .
2 Approximation plane d’une onde sphérique : considérons le cas d’une onde plane
émise depuis l’origine O d’un système de coordonnées (Oxy), et atteignant le point
M0 de coordonnées (x0 , ǫ) (cf. figure 5.20).
y onde
plane
onde M1
b
sphérique r = OM1
ǫ
M0
b b
x0 x
Figure 5.20 – Onde plane et onde sphérique
2π
q
L’onde sphérique a pour phase en M1 ϕ(M1 ) = nr avec r = x20 + ǫ2 soit, si
λ0
ǫ2 ǫ2

2π
x0 ≫ ǫ, ϕ(M1 ) = n x0 + . On peut aussi écrire ϕ(M1 ) = ϕ(M0 ) 1 + 2 ,
λ0 2x0 2x0
où M0 est le projeté de M1 sur l’axe (Ox).
De même, on peut comparer l’amplitude de l’onde en M1 et en M0 ; ces amplitudes
w(M1 ) x0 ǫ2
variant comme l’inverse de la distance à la source, = ≃ 1 − 2 . Dans les
w(M0 ) r 2x0
deux cas, on constate que les écarts sont du second ordre en ǫ/x0 ; on pourra donc
éventuellement, si ǫ ≪ x0 , écrire que l’onde émise de O prend en M0 et en M1 la même
valeur (même amplitude et même phase) ; c’est l’approximation des objets à l’infini,
pour lesquels on remplace l’onde sphérique issue de O par une onde plane parallèle à
l’axe optique (Ox) du système ; en effet, une telle onde plane vérifie exactement, par
construction, w(M0 ) = w(M1 ).
Toutefois, les conditions de cette approximation doivent être précisées quantitative-

ment, selon l’usage qu’on veut en faire :
• Si on ne s’intéresse donc qu’à l’amplitude de l’onde, il suffit que ǫ ≪ x0 pour
pouvoir assimiler une onde sphérique à une onde plane. Par exemple, pour une
zone éclairée de largeur ǫmax ≃ 1 cm, un objet placé à quelques mètres peut
très raisonnablement être considérée comme à l’infini, du point de vue de la
répartition de l’amplitude lumineuse obtenue.
• Par contre, si on prend en compte la phase de l’onde, la condition peut être beaucoup
plus restrictive ; en effet, l’écart de phase entre onde plane et onde sphérique
π nǫ2
est de l’ordre de ϕ(M1 ) − ϕ(M0 ) ≃ ; cet écart n’est négligeable (par
p λ0 x0
exemple devant π) que si ǫ ≪ x0 λ. Ainsi, si on éclaire dans le domaine visible
(λ0 ∼ 500 nm) un dispositif optique de largeur ǫmax ≃ 1 cm, on ne pourra
traiter la source comme disposée à l’infini que si x0 ≫ 200 m.
Ainsi, une source ponctuelle S disposée à un mètre de distance d’une lentille (voir plus
bas) éclaire celle-ci de manière quasiment uniforme, mais on ne peut pas assimiler
l’onde à une onde plane, puisqu’on sait bien que l’image S ′ de S est en général
différente de celle F ′ qu’on obtient à partir d’un objet à l’infini.
2 Optique géométrique et transformation de phase : l’optique géométrique peut être
considérée comme l’étude des appareils (lentilles, miroirs, etc.) ayant pour but de
transformer une onde sphérique en une autre onde sphérique (stigmatisme pour un
couple de points à distance finie), une des deux ondes pouvant être remplacée par une
onde plane (si l’objet ou l’image est à l’infini).
Tout dispositif optique dans les conditions de Gauss peut donc être assimilé à un
système plan, perpendiculaire à l’axe optique, réalisant une transformation de phase.
y Π1 Π2
I1 I2 e(ρ)
b b
e(ρ) α
C2 S x
b b b 2 b
S1 C1
e0
Figure 5.21 – Lentille sphérique mince
Considérons par exemple une lentille mince, milieu d’indice nV , disposée dans l’air
(pour lequel nous prendrons n ≃ 1), séparée de l’extérieur par deux surfaces sphériques
de centres C1 et C2 et de rayons R1 et R2 (cf. figure 5.21). Un rayon lumineux qui
traverse cette lentille doit, pour passer du plan de front Π1 eu plan de front Π2 , se
e(ρ)
propager à travers la lentille (indice nV , distance parcourue ≃ e(ρ) dans les
cos α
conditions de Gauss ; α est l’angle du rayon dans la lentille avec l’axe (Ox)) mais
aussi dans le vide (indice n ≃ 1, distance parcourue ≃ e0 − e(ρ)).
2π
Cette traversée augmente donc la phase de l’onde de ∆Φ(ρ) = (e0 + (nV − 1)e(ρ)).
λ0
On calcule facilement e(ρ) en déterminant les abscisses x1 et x2 de I1 et I2 . Prenant
2 ρ2
pour x1 l’origine en S1 , il vient (x1 − R1 ) + ρ2 = R12 donc x1 ≃ ; en effet, la
2R1
condition cos α ≃ 1 impose x1 ≪ R1 .
ρ2
De même, x2 ≃ − avec l’origine en S2 . Enfin, e(ρ) = e0 − x1 + x2 et le déphasage
2R2
2π nV − 1 1 1
apporté par la lentille est ∆Φ(ρ) = nV e0 + + ρ2 ; on choisit
λ 0 2 R 1 R 2
1 1
de noter V = (nV − 1) + .
R1 R2
Une onde sphérique arrivant sur la lentille (supposée mince, coupant l’axe optique
au point origine x = 0), divergente depuis le point source d’abscisse xS = p, donc
2π ρ2
de phase Φi = , sera donc transformée en une onde émergente, dont la phase
λ0 2p
2π ρ2 1

varie en fonction de ρ selon Φe = + V ; on peut donc définir un point de
λ0 2 p
′ 1 1 1
convergence sur l’axe, d’abscisse p telle que + V = ′ . V = ′ est la vergence de la
p p f
lentille, f ′ sa distance focale
image. Larelation qui définit V peut se généraliser sous
1 1
la forme V = (nV − 1) − à toutes les lentilles minces sphériques, quel
S1 C1 S2 C2
que soit le caractère convexe ou concave de leurs faces.
5.4.3 Propagation de l’onde optique

2 Propagation dans un milieu quelconque : le parcours de la lumière dans un dispo-
sitif optique réel impose de nombreuses réfractions et réflexions successives ; le milieu
constituant un système optique est en général hétérogène, même s’il est souvent formé
d’une succession de milieux homogènes, et la trajectoire est une certaine courbe, sou-
vent formée de segments de droite.
Considérons une courbe quelconque C, susceptible d’être éventuellement parcourue
par la lumière dans un milieu non nécessairement homogène. Ce milieu est caractérisé
par l’indice optique n(r) au point r. Le temps de trajet par la lumière sur un élément
n(r)
de longueur ds de la courbe C peut être écrit sous la forme dt = ds ; on choisira
c0
1
de le noter dt = dL où on a défini le chemin optique élémentaire dL, grandeur
c0
algébrique qui généralise aux trajets optiques la notion d’abscisse curviligne définie
pour les trajectoires mécaniques :
dL = n(r)ds (5.16)
Pour un trajet fini de A à B, on écrira encore, en choisissant de noter (AB) le chemin

optique total L de A à B :
Z B
L = (AB) = n(r)ds (5.17)
A
Si l’élément de longueur ds est assez court, l’onde lumineuse peut être considérée
comme localement plane, de vecteur d’onde k = nk0 et où et désigne le vecteur unitaire
k
tangent à la courbe C ; on peut encore écrire dL = · dr puisque ds = et · dr.
k0
L’onde lumineuse en deux points voisins r et r + dr vérifie donc la relation de pro-
pagation W (r + dr, t) = W (r, t) exp (−jk · dr) ≃ W (r, t) (1 − jk0 dL) en fonction
du chemin optique. C’est une équation différentielle, de la forme dW = −jk0 dLW
dont la solution générale, en un point M quelconque atteint à partir d’une source S
arbitraire, s’écrit :
W (M, t) = W (S, t) exp (−jk0 L) = W (S, t) exp [−jk0 (SM )] (5.18)

Phase de l’onde optique

X La phase de l’onde optique en un point M est, relativement à sa phase
2π
au point d’émission S, augmentée de ∆ϕ = (SM ) :
λ0

2π
w(M ) = w(S) exp −j k0 (SM )
λ0
2 Le théorème de Malus : considérons un faisceau lumineux issu d’une source ponc-

tuelle S. On appellera surface d’onde ou surface équiphase de ce faisceau l’ensemble
des points M tels que (SM ) = constante ou L = constante.
Déterminer la forme d’une surface d’onde, c’est déterminer la direction de sa normale
grad L, qu’on obtient par définition selon dL = net · dr = grad L · dr pour tout
déplacement dr. Cette égalité impose grad L = net : la normale des surfaces équiphase
(dirigée par grad L) est donc la direction de et (la tangente aux rayon lumineux).
Théorème de Malus
X Les rayons lumineux sont orthogonaux aux surfaces d’onde.
L’onde optique est caractérisée par une grandeur vibrante W (M, t) ; dans le
cas des ondes monochromatiques, on l’écrit W (M, t) = w(M ) exp (jωt). L’onde
se propage à la vitesse de phase c = c0 /n, où n est l’indice optique du milieu
(n > 1 en général). On retiendra c0 ≃ 3, 00 × 108 m · s−1 .
L’intensité et l’éclairement lumineux sont proportionnels à W (M, t)2 ou, dans

le cas monochromatique, à |w(M )|2 .

On caractérise l’onde par sa longueur d’onde dans le vide λ0 = 2πc0 /ω. Pour
la lumière visible, λ0 varie de 400 nm (bleu) au 700 nm (rouge). En général,
l’indice n dépend de λ0 , souvent sous le forme n(λ0 ) = a + b/λ20 , sauf pour le
vide (n = 1).
Lors de sa propagation, une onde optique se déphase progressivement ; on écrira
w(M ) = w(S) exp (−jΦ) où le déphasage entre la source S et le point M est
2π
Φ= (SM ), où (SM ) est le chemin optique parcouru.
λ0
Pour une onde plane, la phase Φ varie comme k · r ; en particulier, si A et B
2π
sont sur un même rayon rectiligne, ΦB − ΦA = k · AB, avec kkk = n . Pour
λ0
une onde sphérique, la phase Φ varie comme kr ; en particulier, si A et B sont
2π
sur un même rayon, ΦB − ΦA = n AB.
λ0
Les rayons lumineux sont, en tout point, perpendiculaires aux surfaces d’onde
(surfaces équi-phase) : c’est le théorème de Malus.
Lors de la traversée d’un dioptre plan séparant deux milieux d’indices différents
n1 et n2 , l’onde subit une réflexion et une réfraction. Les ondes réfléchie et
réfractée se propagent dans le plan d’incidence (défini par le rayon incident et
la normale au dioptre au point d’incidence). Au cours de la réflexion comme de
la réfraction, le rayon traverse cette normale. Le rayon réfléchi est symétrique
du rayon incident relativement à la normale ; le rayon réfracté vérifie la relation
n1 sin θ1 = n2 sin θ2 .
On rend compte des phénomènes de polarisation en décrivant l’onde lumineuse
comme une onde électromagnétique, caractérisée par le trièdre orthogonal direct
(k, E, B) ; la direction de polarisation est celle du vecteur E ; elle est donc
orthogonale à la direction de propagation.
Sauf en lumière non polarisée (lorsque la direction de E varie aléatoirement), le
vecteur E décrit en général une ellipse dans le plan de polarisation, avec pour
cas particuliers les polarisations rectiligne et circulaire (droite ou gauche, selon
le sens de rotation apparent de E pour un observateur qui regarde l’onde se
diriger vers lui).
Un polariseur (rectiligne) projette le champ électrique sur une direction fixe.
L’utilisation d’un polariseur tournant (angle variable θ) suivi d’une mesure
d’intensité (analyseur) permet de déterminer la polarisation de l’onde étudiée.
En particulier, la loi de Malus I = I0 cos2 θ identifie une polarisation rectiligne.
Chapitre 6
Optique géométrique
6.1 Imagerie dans les conditions de Gauss
6.1.1 Stigmatisme
2 Objets et images : le but des systèmes optiques utilisés en imagerie est la formation
d’images (nettes) à partir d’objets lumineux. Nous considérons dans la suite qu’un
objet lumineux est un ensemble de points A, et que le système doit, pour chaque point
A, former une image ponctuelle A′ .
Rappelons ici qu’on appelle objet tout point à partir duquel une onde lumineuse
sphérique diverge. Si ce point de divergence est situé après la face d’entrée du système
optique étudié, on dit que l’objet est virtuel, et qu’il est réel sinon. Un objet virtuel A
est, en pratique, un faisceau convergent qui convergerait vers A, si le système optique
était absent. Si le faisceau sphérique divergent devient un faisceau parallèle, l’objet
est rejeté à l’infini.
De même, on appelle image tout point vers lequel une onde lumineuse sphérique
converge. Si ce point de convergence est situé après la face de sortie du système
optique étudié, on dit que l’image est réelle, et qu’elle est virtuelle sinon. Une image
virtuelle A′ est, en pratique, un faisceau divergent qui semble provenir du point A′ .
Si le faisceau sphérique convergent devient un faisceau parallèle, l’image est rejetée à
l’infini.
2 Condition de stigmatisme : on dit qu’un système optique (Σ) est stigmatique pour
le couple (A, A′ ), ou encore que A′ est l’image de A, si tout rayon lumineux issu de
A passe, après traversée du système (Σ), par le point A’.
Système
A A′
b b
(Σ)
Figure 6.1 – Stigmatisme d’un système optique (Σ)

La figure 6.1 présente un cas de stigmatisme, pour un point objet réel A et un point
image réel A′ . Le tracé (en pointillés) des surfaces équiphase montre que les points A
et A′ peuvent être considérés comme les limites de telles sphères équiphase, lorsque
leur rayon r → 0. On peut interpréter cette propriété comme suit : si tous les rayons
lumineux quittent A avec, pour l’onde optique w(A), la même phase, alors des rayons
lumineux retrouveront la même phase lorsqu’ils convergent en A′ .
On peut d’ailleurs donner une interprétation directe de cette propriété, en imaginant
l’arrivée, en un même point M , de plusieurs ondes lumineuses w1 , w2 , . . .X, déphasées
arbitrairement. Notant par exemple wi = w0 exp (−jϕi ), la somme w = wi peut
i
être représentée sur la figure 6.2 comme la somme d’un grand nombre de complexes
arbitrairement déphasés.
b b b
Déphasages aléatoires Déphasages nuls Déphasages faibles
Figure 6.2 – Ajout d’ondes déphasées : un point de vue géométrique
Lorsque on somme (somme vectorielle bien sûr) en M un grand nombre d’ondes

arbitrairement déphasées (figure 6.2 à gauche), on obtient manifestement une quasi-
annulation deux à deux des ondes qui s’ajoutent en M : on n’observera pas de lumière
(on pourrait parler d’interférences destructives). Au contraire, lorsque les déphasages
des ondes qui se superposent en M sont nuls ou très faibles (figure 6.2 au centre),
l’ajout des amplitudes conduit à une amplitude totale maximale : on observera un
maximum de lumière (on pourrait parler d’interférences constructives). Ainsi, ce n’est
que dans le cas où toutes les phases sont égales à l’arrivée en A′ qu’on observera l’image
de A. Ce résultat peut être énoncé comme suit :
Condition de stigmatisme
X Le système optique (Σ) est stigmatique pour le couple (A, A′ ) si et seule-
ment si tous les rayons issus de l’objet A atteignent l’image A′ avec le
même chemin optique L = (AA′ ) ; celui-ci est donc indépendant du rayon
lumineux particulier choisi et on écrira (AA′ ) = cte.
2 Limites de l’optique géométrique : il existe un troisième cas, présenté sur la figure

6.2 à droite ; c’est celui où les différents déphasages sont faibles mais non nuls. Comme
2π
la phase de l’onde optique s’exprime selon Φ(M ) − Φ(S) = (SM ), cela signifie que
λ0
les écarts entre chemins optiques sur les différents rayons qui parviennent en un point
M donné sont du même ordre de grandeur que λ0 ; la plupart du temps, cela veut
aussi dire que la dimension caractéristique du système optique étudié est du même
ordre de grandeur que λ0 .
Dans un tel cas, on pourra observer une accumulation de lumière non nulle ailleurs
qu’au niveau de l’image géométrique, et en pratique de part et d’autre de celle-ci : il
s’agit des phénomènes de diffraction. Avant même leur étude au chapitre prochain,
nous noterons dès maintenant les deux propriétés principales de la diffraction :
6 : Optique géométrique 121
Diffraction et imagerie
X Lorsque la dimension a d’un système optique et la longueur d’onde λ0
sont d’un ordre de grandeur comparable, on observera des écarts à la
formation de l’image géométrique, qui reste le centre de la zone lumineuse
(ou tache de diffraction).
Nous établirons que l’ordre de grandeur de l’écart angulaire de part et
d’autre de l’image géométrique est en général donné par ∆θ ∼ λ0 /a.
Nous négligerons dans l’étude de l’imagerie géométrique les phénomènes de diffraction,

sauf pour préciser qualitativement les limites de qualité des instruments d’optique,
lorsqu’ils sont dus à la diffraction.
6.1.2 Conditions de Gauss

2 Stigmatisme des systèmes centrés : ici et dans toute la suite, nous étudions un sys-
tème optique (Σ) centré, d’axe de symétrie (Ox) ; du fait de la symétrie de révolution,
l’étude se fera dans le plan (Oxy) de la figure 6.3.
y
+
α H(α) x
b b
A
(Σ)
Figure 6.3 – Notations pour un système centré
On appellera A un point de l’axe, et un rayon lumineux issu de A est entièrement

caractérisé par l’angle orienté α fait par ce rayon avec l’axe optique. Un tel rayon
coupe l’axe optique en un point de l’axe que nous noterons H(α).
Enfin, toutes les surfaces (dioptres, miroirs) rencontrées par un tel rayon au cours
de sa propagation seront supposées régulières (sans point anguleux), ce qui signifie
qu’au niveau de leur intersection avec l’axe optique, elles sont normales à celui-ci ; en
particulier, un rayon lumineux incident sur (Σ) le long de l’axe optique (α = 0) reste
confondu avec ces axe jusqu’à sa sortie de (Σ).
Un système centré est stigmatique pour un couple de points (A, A′ ) de l’axe optique
si et seulement si H(α) = A′ , ∀α ; ceci implique que le chemin optique L(α) = (AA′ )
soit indépendant de α.
De telles relations ne sont, même pour des systèmes optiques simples (formés par
exemple d’un dioptre unique) qu’exceptionnellement vérifiées, et seulement pour un
couple unique de points (A, A′ ) ; nous nous contenterons donc dans la suite de condi-
tions de stigmatisme approché, en imposant L(α) ≃ cte, au moyen donc d’un déve-
loppement limité.
2 Stigmatisme dans les conditions de Gauss : le chemin optique L(α) est évidemment
une fonction paire de α, puisque le changement de α et −α correspond aux mêmes
parcours du fait de l’invariance de révolution (voir le trajet pointillés sur la figure
6.3). On en déduit que, pour des angles assez faibles, le développement de L(α) ne
contient que des termes pairs, L(α) = L0 + h(A)α2 + k(A)α4 + . . ..
On appelle relation de conjugaison la condition h(A) = 0 ; elle impose en général la
position du point A′ . Si elle est réalisée, le chemin optique est constant au quatrième
ordre près en α et on aura réalisé le stigmatisme approché du système optique pour le

couple de points (A, A′ ), où l’image A′ de A est alors définie comme A′ = lim H(α).
α→0
Stigmatisme approché des systèmes centrés

X Si tous les rayons lumineux sont limités à des angles (par rapport à l’axe
optique) faibles, on dit que le système vérifie la première condition de
Gauss. Dans ce cadre, un système centré présente, pour tout objet de
l’axe optique, le stigmatisme approché pour un couple (A, A′ ), où le point
A′ , situé sur l’axe optique, porte le nom d’image de Gauss de A.
2 Aplanétisme dans les conditions de Gauss : la formation d’images ponctuelles à

partir d’objets ponctuels n’est pas suffisante pour parler d’imagerie ; nous chercherons
donc à quelle condition un objet étendu AB peut donner une image étendue A′ B ′ par
un système optique (Σ).
Isolons pour cela un des dioptres qui constituent le système centré (Σ), et remplaçons
celui-ci par la sphère tangente qui figure sur le schéma 6.4. On note C le centre de cette
sphère, S son sommet (son intersection avec l’axe optique) et I le point d’incidence
du rayon AIA′ sur le dioptre, qui sépare des milieux d’indices n et n′ .
y
I b x′
+
′
B
u′ b
A α θ x
b bS b b
u C A′ α′
b
R
B n n′
Figure 6.4 – Aplanétisme d’un système centré
La rotation de l’ensemble d’un angle arbitraire θ de l’ensemble laisse le dioptre in-

changé mais transforme le couple objet A, image A′ en un couple (B, B ′ ), pour lequel
le système reste évidemment stigmatique. On pourra considérer que l’objet AB et
l’image A′ B ′ sont contenus dans des plans de front (plans perpendiculaires à l’axe
optique) si leurs dimensions restent assez faibles devant le rayon de courbure R du
dioptre : les rayons doivent rester limités à des points B ou B ′ voisins de l’axe.
Un système qui forme des images droites, dans un plan de front, à partir d’objets
droits, dans des plans de front, est dit aplanétique. Cette propriété s’étend par asso-
ciativité à tout système centré :
Aplanétisme approché des systèmes centrés

X Si tous les rayons lumineux restent (par rapport à l’axe optique) à des
distances faibles (devant les divers rayons de courbure des dioptres et
miroirs), on dit que le système vérifie la seconde condition de Gauss.
Dans ce cadre, un système centré présente, pour tout objet étendu AB
dans un plan de front, l’aplanétisme approché : l’image de AB est A′ B ′ ,
image droite dans un plan de front.
2 Invariant de Lagrange et Helmholtz : considérons, sur la figure 6.4, le rayon lumi-

neux particulier BSB ′ . La relation de Snell-Descartes n sin u = n′ sin u′ devient, dans
A′ B ′ AB
les conditions de Gauss, n =n (on assimile les sinus et les tangentes). On
SA′ SA
remarque de même, en considérant le rayon lumineux AIA′ et en assimilant SI à un
SI SI
segment de droite, que |α| = et |α′ | = .
SA SA′
Ces deux relations considérées ensemble, et prenant en compte les divers signes,
conduisent à nABα = n′ A′ B ′ α′ ; le terme nABα se conserve ainsi à la traversée d’un
dioptre ; il se conservera évidemment de proche en proche à la traversée d’un nombre
quelconque de dioptres et forme finalement l’invariant de Lagrange et Helmholtz‡
(6.1), pour un système optique formant une image de dimension A′ B ′ à partir d’un
objet de dimension AB.
nentrée × AB × α = nentrée × A′ B ′ × α′ (6.1)
Dans cette relation, les indices des milieux d’entrée et de sortie sont la plupart du
temps identiques, les systèmes centrés étant plongés dans l’air.
Il est important de retenir, dans cette relation, la définition des angles α et α′ : ce

sont les angles algébriques faits avec l’axe optique, avant et après le système centré,
par le même rayon lumineux, issu de A et donc passant par A′ .
2 Conjugaison et grandissement : tout système centré utilisé dans les conditions de

Gauss est donc à la fois stigmatique et aplanétique ; il est donc entièrement caractérisé
par deux relations :
• la relation de conjugaison, qui permet de déterminer la position A′ = f (A) de

l’image A′ (sur l’axe optique) d’un objet ponctuel arbitraire A (également sur
l’axe optique) ;
• les relations de grandissement, qui permettent de déterminer la dimension A′ B ′ de
l’image étendue dans un plan de front de l’objet AB, lui même étendu dans un
plan de front.
On définit alors le grandissement linéaire transversal γ par la relation (6.2) ; c’est en

général une fonction de la position de l’objet A.
A′ B ′
γ= (6.2)
AB
Toutefois, l’existence de l’invariant de Lagrange et Helmholtz permet de remplacer

l’étude de γ par celle du grandissement angulaire (ou grossissement) G, défini par la
relation (6.3), qui montre aussi son lien avec γ. L’étude de G est préférable à celle de
γ pour les systèmes afocaux (systèmes formant des images à l’infini à partir d’objets à
l’infini), c’est-à-dire lorsqu’on définit toutes les dimensions apparentes par des angles.
α′ nentrée
G= Gγ = (6.3)
α nsortie
6.2 Lentilles et miroirs
6.2.1 Lentilles sphériques

2 Lentilles sphériques minces : on a déjà eu l’occasion de présenter ce type de
dispositif ; la figure 6.5 rappelle quelques notations relatives aux lentilles minces, et
en particulier le fait que leur épaisseur décroı̂t avec la distance ρ à l’axe optique.
Notant R1 et R2 les rayons algébriques des deux faces (sur la figure, R1 > 0 et
1 1
R2 < 0), on a montré que e(ρ) = e0 − − ρ2 .
R1 R2
y
e(ρ)
Ab S1 b b
S
b 2
Ab′ x
ρ O
b b
I1 I2
e0
Figure 6.5 – Lentille sphérique mince
Considérons alors le rayon lumineux AI1 I2 A′ ; pour le calcul du chemin optique

L = (AI1 I2 A′ ), on peut remplacer les trajets courts de I1 à I2 par leurs projec-
tions horizontales (puisque dans les conditions de Gauss cos α ≃ 1), alors qu’on ne
pourra pas faire cette approximation pour les trajets longs AI1 et I2 A′ .
Le trajet I1 I2 comporte une distance e(ρ) parcourue dans le verre (indice nV ) et la
longueur complémentaire e0 − e(ρ) parcourue dans l’air, assimilé au vide(indice 1)
1 1
donc (I1 I2 ) = e0 + (nV − 1) e(ρ) où (I1 I2 ) = nV e0 − (nV − 1) − ρ2 .
R1 R2
Notons alors p l’abscisse de A par rapport au sommet d’entrée dans la lentille (p < 0
pour cet objet réel sur la figure) et p′ l’abscisse de A′ par rapport au sommetp de
′ 2 2
sortie de la lentille (p > 0 pour cette image réelle) ; on2 a alors AI1 = p + ρ
ρ
soit, dans les conditions de Gauss, (AI1 ) = −p 1 + 2 . De même on obtient
2p
ρ2

h
(I2 A ) = p 1 + ′2 et le chemin optique total est L = −p + ne0 + p′ + ρ2 où on
′ ′
2p 2
1 1 1 1
a posé h = − + ′ − V , avec V = (nV − 1) − .
p p R1 R2
Cette expression s’interprète ainsi :
– le chemin optique (AA′ ) pour un rayon qui reste sur l’axe optique (ρ = 0) est formé
de deux trajets dans l’air (distances −p et +p′ ) et d’un trajet dans le verre de la
lentille (distance e0 , indice nV ) ;
– lorsque ρ 6= 0, le rayon s’éloigne de l’axe, les trajets dans l’air s’allongent mais le
trajet dans la lentille diminue.
– il existe donc une condition de compensation de ces variations, au moins à cet ordre
du développement. Cette condition h = 0 assure un chemin optique (AA′ ) constant,
quel que soit le rayon qui joint A à A′ : c’est donc l’image de Gauss de A′ qu’on
détermine ainsi.
2 Relation de Descartes : on déduit immédiatement de ce qui précède, si la lentille
est mince et qu’on peut confondre au même point O les sommets S1 et S2 des faces
d’entrée et de sortie, la relation de conjugaison de Descartes :
1 1 1 1 1
− + ′ =− + =V = ′ (6.4)
p p OA OA ′ f
On dira qu’une lentille mince est convergente si V ′ > 0 ou, ce qui revient au même,
si f ′ > 0 ; dans le cas contraire, elle est dite divergente. Une lentille convergente
1 1
correspond à − > 0, ce qui est le cas des lentilles présentées sur la figure 6.6.
R1 R2
Dans tous les cas, le centre de la lentille est plus épais que le bord, ce qui justifie la
représentation conventionnelle des lentilles convergentes.
R1 > 0, R2 < 0 R2 > R1 > 0
R1 > 0, R2 → ∞ Schéma conventionnel
Figure 6.6 – Lentilles sphériques minces convergentes
1 1
De même, les lentilles divergentes correspondent à − < 0, donc aux lentilles à
R1 R2
bords plus épais que le centre ; quelques exemples sont présentés sur la figure 6.7.
R1 < 0, R2 > 0 R1 > R2 > 0
R1 < 0, R2 → ∞ Schéma conventionnel
Figure 6.7 – Lentilles sphériques minces divergentes
2 Foyers et relations de grandissement de Newton : on appelle foyer objet F le point

de l’axe optique dont l’image est à l’infini, et foyer image F ′ le point image d’un point
de l’axe optique rejeté à l’infini. La relation de conjugaison impose OF ′ = f ′ = −OF .
On note aussi f = OF = −f ′ la distance focale objet de la lentille.
On emploie parfois les termes foyer principal objet ou image pour distinguer ces points
(situés sur l’axe) d’autres points Φ (respectivement Φ′ ) situés dans le plan de front
de F (respectivement, de F ′ ) mais hors de l’axe optique. Du fait de l’aplanétisme de
la lentille, l’image de Φ est aussi à l’infini, et Φ′ est aussi l’image d’un objet à l’infini
(mais dans les deux cas, hors de l’axe optique).
B
B
b
Fb′ A′ B′ b b
A F O A ′ ′ O
FA F
B′
Figure 6.8 – Foyers et centre optique
La connaissance des foyers F et F ′ permet de construire l’image d’un objet arbitraire

AB, au moyen de deux rayons passant par F (donc émergent parallèlement à l’axe
optique) et incident parallèlement à l’axe optique (donc émergent en passant par F ′ ;
les tracés correspondants sont reportés sur la figure 6.8, dans le cas d’un objet réel,
pour une lentille convergente et pour une lentille divergente.
Dans les deux cas, l’existence de triangles semblables en O permet d’établir les re-
A′ B ′ F ′ A′
lations de grandissement pour γ = , avec d’une part γ = ′ (triangles sem-
AB F O
′ FO
blables en F ) et d’autre part γ = (triangles semblables en F ) : ce sont les
FA
relations de Newton pour le grandissement :
F ′ A′ f′
γ=− ′
= (6.5)
f FA
OA′ A′ B ′ OA′
La première expression s’écrit aussi γ = 1 − soit, du fait de (6.4), = ;
f′ AB OA
′
ceci montre que les points B, O et B sont alignés. Les droites correspondantes (en
pointillés sur la figure 6.8 sont donc des rayons lumineux qui passent pas O et ne sont
pas déviés ; pour cette raison, le point O est appelé centre optique de la lentille.
La nouvelle expression du grandissement ainsi obtenue porte le nom de relation de
Descartes pour le grandissement :
OA′ p′
γ= = (6.6)
OA p
Enfin, la simple comparaison des deux relations (6.5) permet d’établir une relation
de conjugaison, dite de Newton, et qui est parfois plus commode que la relation de
Descartes (6.4) :
F A · F ′ A′ = −f ′2 (6.7)
On remarquera la signification géométrique de la relation (6.7) : les grandeurs F A et

F ′ A′ sont toujours de signe contraire. Pour une lentille convergente en particulier,
F et F ′ étant disposées dans cet ordre, cela signifie en particulier qu’on objet réel
disposé avant F a toujours son image disposée après F ′ ; on peut en tirer d’autres
conclusions analogues dans chaque cas particulier.
p′ − f ′ f′
Recopiant l’égalité des deux expressions (6.5) sous la forme − = ,
f ′ p + f′
′ ′
après développement puis division par p, p et f , on retrouve donc aussi la relation
1 1 1
de conjugaison de Descartes − + ′ = ′ ; il faut en général savoir passer des
p p f
relations algébriques aux schémas de construction, et réciproquement.
2 Constructions géométriques : les constructions géométriques sont basées sur cinq

règles, dont les trois premières ont déjà été établies ci-dessus :
Rayons de construction (1)
X • Un rayon lumineux qui passe par le foyer F ressort de la lentille paral-
lèlement à l’axe optique.
• Un rayon lumineux qui atteint la lentille parallèlement à l’axe optique
ressort de celle-ci en passant par F ′ .
• Un rayon lumineux qui atteint la lentille en son centre optique O n’est
pas dévié.
2 Objets et images à l’infini : considérons maintenant un foyer secondaire objet,
c’est-à-dire un point Φ situé dans le même plan de front que F . L’image de Φ est
à l’infini, mais disposée hors de l’axe optique ; on peut déterminer sa direction en
imaginant un rayon (éventuellement fictif) issu de Φ et passant par O, donc non
dévié. On en déduit la direction angulaire α′ de l’image de Φ, et en particulier la
relation α′ = −F Φ/f ′ , comme on le voit sur la figure 6.9 (à gauche, dans le cas d’une
lentille convergente).
Φ Φ′
α
b b
F O α ′ O F′
f′ f′
Figure 6.9 – Foyers secondaires
Considérons de même un foyer secondaire image, c’est-à-dire un point Φ′ situé dans

le même plan de front que F ′ . L’objet dont Φ′ est image est à l’infini, mais hors de
l’axe optique ; on en détermine la direction en imaginant un rayon (éventuellement
fictif) passant par O et Φ′ , non dévié. On en déduit la direction angulaire α de l’objet
dont Φ′ est image, avec α = F ′ Φ′ /f ′ (cf. figure 6.9 à droite, toujours dans le cas d’une
lentille convergente).
Objets et images à l’infini

X Un objet ou une image à l’infini est uniquement caractérisé par sa di-
mension angulaire.
• Dans le cas objet dans le plan focal −→ image à l’infini, on remplace
l’étude du grandissement (γ → ∞ ici) par la relation α′ = −AB/f ′ .
• Dans le cas objet à l’infini −→ image dans le plan focal, on remplace
le grandissement (ici γ → 0) par la relation A′ B ′ = f ′ α.
En pratique, on considérera souvent qu’un objet A est à l’infini s’il est (( suffisamment
loin )) du système considéré ; on peut donner une idée quantitative de cette condition
1 1 1
en remarquant que, si |p| ≫ f ′ , la relation de conjugaison − + ′ = ′ fournit
p p f
f ′p
p′ = ′ ≃ f ′ ; l’image A′ est donc voisine du foyer image F ′ .
f +p
On pourra considérer que l’image est à l’infini si l’écart F ′ A′ est assez faible ; cet écart
f ′2 f ′2
est donné par F ′ A′ = f ′ − p′ = ′ ≃− ; on peut donc considérer que F ′ et A′
f +p p
sont confondus si F ′ A′ ≪ f ′ , donc si |p| ≫ f ′ .
La validité de cette condition dépend bien sûr de la précision recherchée ; ainsi, un
appareil photographique équipé d’un objectif de distance focale f ′ = 50 mm (objectif
reproduisant la vision ordinaire sur une pellicule de 24 mm × 36 mm) traitera un
objet comme disposé à l’infini pour une distance supérieure à 30 m environ, c’est-à-
dire pour un rapport f ′ /|p| inférieur à 0, 2 % ; on peut autoriser des critères plus ou
moins contraignants selon la qualité de l’image désirée.
La construction du rayon émergent associé à un rayon incident quelconque peut mettre
à profit la notion de foyer secondaire ; la figure 6.10 montre comment un rayon lumi-
neux arbitraire passe par un foyer secondaire objet Φ (et on construit donc le faisceau
parallèle émergent), mais peut aussi être considéré comme appartenant à un faisceau
incident parallèle (avec convergence au foyer secondaire image Φ′ ).
I
Φb Φb′
Ab α b b
Ab′ x
F O F′ α′
Figure 6.10 – Construction de rayons et foyers secondaires
Rayons de construction (2)

X • Tout rayon passant par un foyer secondaire objet Φ émerge en tant
qu’élément d’un faisceau parallèle ; on détermine la direction de ce fais-
ceau en traçant le rayon fictif ΦO.
• Tout rayon incident peut être considéré comme appartenant à un fais-
ceau parallèle, qu’on complète avec un rayon passant par O. Ce faisceau
converge en un foyer secondaire Φ′ .
2 Grandissement angulaire : la même figure 6.10 montre aussi la relation qui lie les
angles faits à l’entrée et à la sortie de la lentille par un même rayon lumineux avec
OI OI
l’axe optique : dans les conditions de Gauss, α = − et α′ = − montrent que
′
OA OA′
α p
le grandissement angulaire est G = = ′ ; on retrouve simplement la relation de
α p
Lagrange et Helmholtz (6.1) dans le cas particulier des milieux extrêmes identiques :
α′ 1
G= = (6.8)
α γ
6.2.2 Miroirs sphériques

2 Miroirs sphériques : reprenant le principe de l’étude effectuée pour les lentilles,
on étudie le miroir concave de la figure 6.11.
y
bI
B
θ A′ x
b b b bS
A C
B′ b
J
Figure 6.11 – Stigmatisme du miroir sphérique
Nous calculerons le chemin optique (AIA′ ) pour deux points A, d’abscisse p, et A′ ,

d’abscisse p′ , de l’axe optique (Ox) d’un miroir sphérique de sommet S confondu avec
O, de centre C et de rayon R = SC ; R < 0 sur la figure.
On détermine d’abord les coordonnées (x, y) de I en écrivant l’équation du cercle,
2 2 y2
x − R + y 2 = R soit, à l’ordre le plus bas, x = .
s 2R

p p
Il vient donc AI = (x − p)2 + y 2 ≃ p2 + y 2 1 − au même ordre, soit encore
R
y2 1 y2 1

1 ′ ′ 1
AI ≃ −p + − ; au même ordre, IA ≃ −p + − . Finalement,
2 p R 2 p′ R
le chemin optique (AIA′ ) = −p − p′ + hy 2 sera constant, et A′ sera l’image de A,
seulement sous réserve de la relation de conjugaison h = 0, soit :
1 1 2 1 1 2
+ = ou + = (6.9)
p p′ R SA SA′ SC
Le miroir étant invariant par toute rotation d’angle θ autour de C, il est aussi forcé-
ment aplanétique, avec pour image de l’objet AB l’arc (assimilé à un segment dans
les conditions de Gauss) A′ B ′ ; on peut d’ailleurs identifier le trait pointillé BCB ′ de
la figure 6.11 avec un rayon lumineux et identifier la relation de grandissement :
A′ B ′ CA′
γ= = (6.10)
AB CA
Cette relation s’interprète donc comme l’existence, par ailleurs évidente, d’un centre
optique, puisque le rayon BCB ′ parvient sur le miroir en J sous incidence normale ;
il est donc réfléchi sur lui-même.
Centre optique d’un miroir

X Un rayon qui atteint un miroir sphérique en passant par son centre re-
vient sur lui-même ; au changement de sens près, il n’est donc pas dévié
et le centre du miroir est aussi son centre optique.
Toutefois, les relations (6.9) et (6.10) ne sont pas établies avec la même origine. Pour
p′ − R
le grandissement, on passe à l’origine au sommet en écrivant γ = soit encore
p−R
p′ 1/R − 1/p′ p′
γ= ou, compte tenu de la relation de conjugaison, γ = − ; c’est la
p 1/R − 1/p p
relation de grandissement de Descartes :
A′ B ′ SA′ p′
γ= =− =− (6.11)
AB SA p
On peut d’ailleurs, à l’inverse, obtenir une relation de conjugaison avec origine au

CA′ CA′ − CS
centre en identifiant les deux expressions du grandissement, =− soit,
CA CA − CS
après simplification en croix et division par CA, CA′ et CS, la relation :
1 1 2
+ ′
= (6.12)
CA CA CS
2 Foyers et relations de Newton : comme pour une lentille mince, on définit les foyers
objet F (sur l’axe, dont image et à l’infini) et image F ′ (image sur l’axe d’un objet à
l’infini). Faisant respectivement tendre vers l’infini SA′ (ou CA′ ) puis SA (ou CA), on
trouve que les deux foyers sont confondus et vérifient SF = SF ′ = R/2, c’est-à-dire
qu’ils sont situés au milieu de l’intervalle [CS].
B I
A′ Cb Fb b
A F′ S
B′ J
Figure 6.12 – Miroir sphérique concave
La figure 6.12 place ces foyers et résumes certaines règles de construction de rayons
propres aux miroirs sphériques. On y remarque la représentation symbolique des mi-
roirs par leur plan tangent (avec indication de la concavité). On y a fait figurer quatre
rayons de construction :
Constructions géométriques
X Pour déterminer l’image d’un objet B hors de l’axe optique par un miroir
sphérique, on peut utiliser :
• le rayon incident sur le miroir en passant par le sommet S, qui est
réfléchi en faisant, avec l’axe optique (qui est aussi la normale au point
d’incidence) un angle égal à celui fait à l’entrée ;
• le rayon incident sur le miroir en passant par le centre optique C, qui
n’est pas dévié, de sorte que B, C et B ′ sont alignés ;
• le rayon incident sur le miroir parallèlement à l’axe optique, qui émerge
du miroir en passant par le foyer F ′ ;
• le rayon incident sur le miroir en passant par le foyer F , qui émerge
du miroir parallèlement à l’axe optique.
La figure 6.12 montre l’existence de triangles, semblables en F = F ′ , qui permettent

A′ B ′ F ′ A′
d’établir deux nouvelles relations de grandissement, à savoir γ = = ′ dans
AB F S
′ ′ ′ ′ A′ B ′ FS
les triangles F SI et F A B , et γ = = dans les triangles F SJ et F AB.
AB FA
On retiendra ces deux relations de grandissement, et la relation de conjugaison (dite
de Newton) qui en découle sous la forme :
2
SF F ′ A′ 2 R
γ=− =− F A · F ′ A′ = SF ′ = (6.13)
FA SF ′ 4
2 Grandissement angulaire : reprenant la géométrie de la figure 6.12, on a tracé sur

la figure 6.13 un rayon issu d’un point A sous l’angle α ; après réflexion sur le miroir,
ce rayon atteint (pour cause de stigmatisme) l’image A′ de A sous l’angle α′ .
bH
B
bI
α
A′ Cb Fb b
′ S
α A
bJ
′
B
Figure 6.13 – Grandissement angulaire par un miroir sphérique concave
SH
Ces angles, tous deux négatifs sur la figure 6.13, vérifient les relations α = et
SA
′
SH α SA
α′ = ; on en déduit la relation de grandissement angulaire G = = . La
SA ′ α SA′
comparaison avec l’expression (6.11) du grandissement linéaire montre que G = −1/γ.
On peut considérer qu’il s’agit d’un cas particulier de l’invariant de Lagrange et Helm-
holtz (6.1), à condition de poser nsortie = −nentrée . En effet, il est possible de considérer
que les lois de la réflexion (en particulier la relation de Descartes i′ = −i) sont équi-
valentes aux lois de la réfraction (notamment n sin i = n′ sin i′ ) à condition de poser
n′ = −n.
On peut aussi considérer que le signe − dans la relation G = −1/γ permet de rendre
compte du changement de sens de propagation lors de la réflexion ou, si on préfère,
du changement d’orientation de l’axe optique si on voulait le définir, à l’entrée comme
à la sortie d’un système à miroir, dans le sens moyen des rayons lumineux.
Finalement, on écrira la relation de Lagrange et Helmholtz pour un miroir sphérique :
Gγ = −1 (6.14)
6.2.3 Description optique de l’œil

2 Description sommaire : l’œil est pratiquement toujours le premier détecteur op-
tique utilisé pour le réglage d’un dispositif optique ; il est donc important de connaı̂tre,
même brièvement, sa structure et quelques termes associés. La figure 6.14 décrit très
sommairement une coupe de l’œil humain, qui forme un globe sphérique de 25 mm
de diamètre environ.
Corps vitré
Cornée
Rétine
Pupille
Nerf
Cristallin optique
Iris
Figure 6.14 – Vue en coupe de l’œil humain
• La cornée, protège l’œil de l’extérieur ; c’est une membrane transparente. Elle est
emplie du corps vitré, liquide très visqueux qui donne à l’œil sa forme.
• La pupille est la partie centrale de l’œil ; elle comporte un diaphragme (l’iris) dont le
diamètre d’ouverture varie en fonction de la luminosité. C’est la pigmentation de
l’iris qui détermine la couleur de l’œil. La pupille contient un liquide transparent,
l’humeur aqueuse, qui, avec le corps vitré, maintient la pression exercée sur le
globe oculaire et permet donc de déterminer sa forme.
• Le cristallin est un milieu biconvexe, légèrement déformable, situé derrière l’iris ; sa
forme détermine les propriétés optiques de l’œil. Son épaisseur est de l’ordre de
5 mm sur une largeur double.
• La rétine est le film sensible sur lequel se forment les images. C’est une mem-
brane nerveuse qui tapisse le fond de l’œil, d’environ 0, 25 mm d’épaisseur et
de quelques centimètres carrés de surface. Elle comporte plus de 100 millions
de cellules nerveuses (bâtonnets) sensibles à l’intensité lumineuse et servant à
la détection du mouvement, et moins de 10 millions d’autres cellules (cônes)
sensibles aux nuances de couleur.
• Le nerf optique, long de 3 à 6 centimètres, transmet l’image rétinienne au cerveau.
2 La vision : la vergence totale de l’œil est d’environ V ≃ 50 δ, correspondant à une

focale d’environ 2 cm, ce qui permet la convergence des images au fond de l’œil, sur
le plan de la rétine. Cette vergence résulte de l’action des différents constituants de

l’œil : la cornée, l’humeur aqueuse, le cristallin et le corps vitré. Toutefois, le dioptre
sphérique séparant l’air de la cornée assure la majeure partie de cette vergence.
Les indices optiques du corps vitré et de l’humeur aqueuse sont proches de celui de
l’eau (n ≃ 1, 37) et invariables ; par contre, un muscle en anneau (les fibres de Zinn)
maintient, déplace ou déforme le cristallin (n ≃ 1, 42) en fonction des nécessités de la
vision. Cette déformation permet donc de changer la vergence de l’ensemble de l’œil,
donc de faire la mise au point (sur le plan de la rétine) d’images d’objets situés à
distance variable : c’est l’accommodation.
En l’absence d’effort musculaire (on parle de vision sans accommoder), l’œil forme
sur le plan de la rétine une image nette des objets situés à l’infini ; le plan de la rétine
est donc le plan focal image de l’œil au repos.
2 Limites et défauts de vision : pour un œil normal (ou emmétrope), tout objet situé
à l’infini forme une image nette sur la rétine, sans que le cristallin ne change de forme ;
on dit que le ponctum remotum Pr (distance maximale de vision nette) est rejeté à
l’infini.
La déformation du cristallin en vision de près permet un augmentation de la vergence
de l’œil assurant une vision nette des objets situés au-delà du punctum proximum Pp
(distance minimale de vision nette). Ce point est à une distance de l’ordre de 10 cm
pour les enfants très jeunes, et il augmente avec l’âge et se fixe à environ 25 cm chez
l’adulte.
Avec un œil myope (trop convergent), Pp est plus faible que pour un œil normal mais
l’image d’un objet à l’infini se forme, sans accommodation, en avant de la rétine :
la vision de l’infini est floue. On corrige donc ce défaut en plaçant devant l’œil une
lentille divergente.
Au contraire, l’œil hypermétrope n’est pas assez convergent ; on corrige ce défaut en
plaçant devant l’œil une lentille convergente.
On dit que l’œil est astigmate si la cornée ou le cristallin présente des irrégularités de
courbure ; on corrige ce défaut avec des lentilles cylindriques ou toriques.
On parle enfin d’œil presbyte si la capacité d’accommoder disparaı̂t (par exemple avec
l’âge) ; on corrige donc seulement la vision de près en utilisant des lentilles multifocales
(dites progressives) ; le haut de la lentille n’étant pas corrigé (vision de loin correcte)
mais le bas étant convergent (correction de la vision de près).
6.3 Systèmes centrés
6.3.1 Propriétés des systèmes centrés

2 Définition et propriétés générales : ce paragraphe décrit quelques propriétés gé-
nérales des systèmes centrés, formés d’associations d’une ou plusieurs lentilles sphé-
riques, ou d’un ou plusieurs miroirs sphériques, alignés le long du même axe de symé-
trie de révolution (axe optique).
L’ensemble est utilisé dans les conditions de Gauss et forme donc automatiquement
un dispositif stigmatique (tout point A de l’axe optique a une image A′ sur l’axe
optique) et alpanétique (tout objet AB étendu dans un plan de front possède une
image A′ B ′ étendue dans un plan de front).
Notons que tous les systèmes centrés décrits ci-après ne sont pas toujours utilisés
dans les conditions de Gauss ; il arrive par exemple qu’une lentille d’entrée de micro-
scope ou d’objectif photographique soit éclairée sous une ouverture angulaire très
importante. Cette partie du dispositif est alors adapté spécialement à son utilisa-
tion (lentille asphérique par exemple). De même, les miroirs primaires des télescopes
peuvent être de forme parabolique et non sphérique, pour assurer, dans le cas par-
ticulier de l’observation à l’infini, un stigmatisme meilleur que celui des conditions
de Gauss.
2 Relations de conjugaison et de grandissement : le programme ne prévoit la connais-

sance générale d’aucune relation de conjugaison ou de grandissement pour un système
comportant plus d’une lentille ou d’un miroir ; nous établirons donc seulement ici cer-
taines propriétés générales à titre documentaire.
Toutefois, on notera que l’invariant de Lagrange et Helmholtz se généralise par asso-
ciativité à un système comportant un ou plusieurs miroirs sphériques ; en notant n le
nombre de réflexions, on en déduit (si les milieux extrêmes sont identiques) :
n réflexions ⇒ Gγ = (−1)n (6.15)
2 Caractérisation des objets et des images : certains systèmes optiques font des
images d’objets situés à distance finie (objets proches), d’autres d’objets qu’on doit
considérer comme situés à l’infini (objets terrestres lointains, objets astronomiques).
Les images formées seront elles-mêmes situées à distance finie (par exemple si elles
doivent être projetées sur un écran, ou sur le plan d’une surface photosensible), ou à
très grande distance (puisqu’une image à l’infini peut être observée sans accommoder,
c’est-à-dire sans effort musculaire au niveau de l’œil).
Le tableau 6.1 présente des exemples d’appareils correspondant aux quatre couples
possibles de position des objets et des images.
Objet à distance finie Objet à l’infini

Image à distance finie Appareil photo, réglé à Appareil photo, réglé à
distance finie ; projecteur l’infini ; lunette ou téles-
de cinéma cope astronomique, avec
focalisation sur un capteur
CCD
Image à l’infini Microscope ; phare de si- Lunette ou télescope as-
gnalisation marine tronomique, pour observa-
tion à l’œil ; viseur de go-
niomètre pour le repérage
des angles
Table 6.1 – Exemples de dispositifs optiques
Un objet est caractérisé par sa dimension ; s’il est à distance finie, on utilise la dimen-
sion transversale AB, mais s’il est situé à une grande distance d → ∞, cette dimension
vérifie nécessairement AB → ∞.
Toutefois, on peut continuer à définir une dimension apparente, comme sur la figure
AB
6.15, au moyen du rapport θ = : deux objets A1 B1 et A2 B2 de même rapport θ
d
sembleront, pour l’observateur, de même taille.
Objets et images à l’infini

X Un objet ou une image à l’infini peut être représenté par un faisceau
parallèle ; l’angle θ fait par ce faisceau parallèle avec l’axe optique suffit à
caractériser entièrement la dimension apparente de l’objet ou de l’image.
B1
B2
θ
A1 A2
d1 Système
d2
Figure 6.15 – Dimension apparente d’un objet
2 Grandissements, focale et puissance : compte tenu de ce qui précède, on utilisera

diverses relations pour exprimer les dimensions relatives de l’objet et de son image,
formée par un système optique. On peut distinguer quatre types de systèmes optiques,
le vocabulaire le plus courant quant aux dimensions respectives d’un objet et de son
image figurent dans le tableau 6.2.
Objet à distance finie Objet à l’infini

Grandissement linéaire Focale
A′ B ′ A′ B ′
Image à distance finie γ= f′ =
AB θ
Puissance Grandissement angulaire

θ′ θ′
Image à l’infini P= G=
AB θ
Table 6.2 – Grandissements, focale, puissance
Dans ce tableau, P porte le nom de puissance du système optique (on parle ainsi
de la puissance d’un microscope) et se mesure en m−1 (unité appelée en Optique
dioptrie, symbole δ) ; f ′ est la focale s’identifiera souvent avec la distance focale image
du système optique et se mesure en m ; on parle ainsi de la focale d’un télescope,
même s’il est formé de plusieurs miroirs ayant chacun leurs foyers.
6.3.2 Étude géométrique d’un système centré

2 Foyers : considérons un système centré, tel qu’il est représenté sur la figure 6.16 ;
on y signale la présence des dioptres d’entrée et de sortie, ainsi que les tracés de deux
rayons particuliers.
B1 (R1 ) K′
A2 Hb Fb b b
A1 F′ H′
) K
(R 2
B2
Figure 6.16 – Foyers d’un système centré

Un rayon lumineux qui se dirige vers le système parallèlement à l’axe optique croise
ensuite celui-ci en un point de l’axe noté F ′ , qui est le foyer principal image du
système optique (sur la figure, c’est une image réelle). De même, pour émerger du
système parallèlement à l’axe optique, un rayon lumineux doit passer par le point F
avant le système : c’est son foyer principal objet (sur la figure, c’est un objet virtuel).
La définition ci-dessus permet de placer des foyers, pas de définir des focales, et
encore moins un centre optique ! Comme on le montrera, un système centré n’est
en général pas équivalent à une lentille mince unique ; en particulier, il n’a pas de
centre optique situé entre ces foyers.
2 Grandissement et plans principaux : le centre optique d’une lentille est un point O

qui présente deux propriétés :
– par définition d’un centre optique, un rayon qui passe par O ressort sans être dévié ;
on en déduit que les angles α et α′ faits par le rayon lumineux avec l’axe optique
avant et après passage par la lentille sont égaux : c’est le point tel que G = 1 (donc,
du fait de l’existence de l’invariant de Lagrange et Helmholtz, tel que γ = 1) ;
– du fait des propriétés particulières de la lentille mince, ce point O est quasiment
confondu avec les deux sommets des deux dioptres successifs qui limitent la lentille.
C’est la première propriété que nous allons chercher à généraliser, en étudiant s’il est
possible de réaliser, pour un couple (H, H ′ ) formé d’un objet H de l’axe et son image
H ′ sur l’axe, la relation γ = 1. Considérons pour cela, toujours sur la figure 6.16, un
objet A1 B1 complètement arbitraire, seule sa dimension transverse étant spécifiée ;
l’extrémité B se déplace alors de façon aléatoire sur la rayon (R1 ), qui est parallèle
à l’axe avant le passage par le système. L’image A′1 B1′ de A1 B1 se déplace alors sur
le rayon émergent correspondant, avec en général une dimension différente (et donc
γ 6= 1) sauf lorsque B1′ passe par le point unique K ′ (et A′1 passe en même temps par
le point unique H ′ , projeté de K ′ sur l’axe optique) :
Point principal image

X Pour un système optique présentant un foyer image F ′ , on peut toujours
déterminer l’unique image H ′ (sur l’axe optique) telle que γ = 1 et
cherchant l’intersection du rayon incident parallèle à l’axe avec le rayon
émergent correspondant (qui passe par F ′ ).
Le point H ′ s’appelle point principal image du système centré.
Le même raisonnement s’applique pour la détermination de l’objet H dont H ′ est

l’image ; on cherche à placer un objet arbitraire A2 B2 dont l’extrémité B2 se déplace
sur le rayon (R2 ) qui passe par F . L’image A′2 B2′ de A2 B2 n’a même dimension que
l’objet (avec donc γ = 1) que si A2 passe en H et B2 en K, déterminés comme suit :
Point principal objet

X Pour un système optique présentant un foyer objet F , on peut toujours
déterminer l’unique objet H (sur l’axe optique) tel que γ = 1 et cherchant
l’intersection du rayon incident passant par F avec le rayon émergent
correspondant (parallèle à l’axe).
Le point H s’appelle point principal objet du système centré.
Sur la figure 6.16, H ′ est l’image de H mais on a choisi, pour des raisons de lisibilité,
A1 B1 6= A2 B2 donc K ′ n’est pas l’image de K.
2 Relations de Newton : la figure 6.17 représente un système optique centré par la

seule donnée des points H, H ′ (conjugués), F et F ′ , et des plans de front correspon-
dants (respectivement, les plans principaux objet et image et les plans focaux objet
et image). La règle précisée ci-dessus permet de construire l’image de n’importe quel
objet AB, comme sur la figure 6.17 :
• un rayon incident parallèle à l’axe croise son émergent dans le plan principal image,
A′ B ′ F ′ A′
au point I ; on en déduit γ = =− ′ ′;
AB HF
• un rayon incident passant par F croise son émergent dans le plan principal objet,
A′ B ′ HF
au point J ; on en déduit γ = =− ;
AB FA
• un rayon passant par B et H avant le système passe par H ′ et B ′ après celui-ci ;
comme γ = 1 pour le couple (H, H ′ ), on a aussi G = 1 donc α = α′ , soit encore
A′ B ′ H ′ A′
γ= = .
AB HA
B I
Fb α bH H′ b
Fb′ A′
′
A α
J B′
Figure 6.17 – Plans principaux et focaux et relation de Newton
Les deux premières relations de grandissement sont les relations de Newton ; elles
généralisent immédiatement celles obtenues pour les lentilles et miroirs sphériques :
HF F ′ A′
F A · F ′ A′ = HF · H ′ F ′ γ=− =− ′ ′ (6.16)
FA HF A
HF H ′ A′
La comparaison des deux dernières relations de grandissement impose − =
FA HA
HF H ′ F ′ + F ′ A′
soit − = ; on développe alors cette expression qui devient donc
FA HF
+ FA
F A HF + H ′ F ′ = F H HF + H ′ F ′ . Comme cette relation doit être vraie pour
tout A, y compris A 6= H, on a forcément HF + H ′ F ′ = 0 :
f = HF = −H ′ F ′ = −f ′ (6.17)
La relation (6.17) définit les distances focales image f ′ et objet f ; même si on remarque
la forte analogie avec les lentilles minces, il reste la propriété générale H 6= H ′ qui
fait la différence avec le cas des lentilles pour lesquelles O = O′ .
• si H 6= H ′ , le système centré est un système épais, d’épaisseur optique (algébrique)
ē = HH ′ ; un tel système n’a pas de centre optique ;
• si H = H ′ , le système centré est un mince, équivalent à une lentille de centre optique

H et de distance focale image (algébrique) f ′ = H ′ F ′ ; le point H = H ′ est sont
centre optique.
2 Systèmes afocaux : la construction géométrique des figure 6.16 et 6.17 n’est

possible que si le système optique étudié présente effectivement des foyers F et F ′
situés à distance finie ; il est possible que les foyers soient rejetés à l’infini, auquel cas
le système est dit afocal.
B
B′
A A′
Figure 6.18 – Système afocal
La figure 6.18 montre que, dans ce cas, un rayon incident parallèle à l’axe émerge
parallèlement à l’axe optique ; les deux foyers F et F ′ sont donc simultanément rejetés
à l’infini.
Dans un tel cas, tout objet AB donne une image A′ B ′ dont la dimension se conserve
lorsqu’on translate AB ; en effet, si l’extrémité B se déplace sur un rayon parallèle
à l’axe, alors l’extrémité B ′ se déplace sur le rayon émergent correspondant et la
dimension de A′ B ′ ne varie pas.
Systèmes afocaux
X Pour un système afocal, le grandissement linéaire γ et donc le grandis-
sement angulaire G ne dépendent pas de la position de l’objet : ce sont
des caractéristiques du système.
Si |γ| > 1, le système agrandit les images formées à distance finie des
objets situés à distance finie.
Si |γ| < 1 donc |G| < 1, le système agrandit les images formées à l’infini
des objets situés à l’infini.
Un système optique est stigmatique si tout rayon issu de A passe par A′ après
traversée du système optique. Il y a stigmatisme si et seulement si le chemin
optique (AA′ ) d’un objet A à son image A′ vérifie (AA′ ) = constante, quel que
soit le rayon choisi de A à A′ à travers le système.
Un système optique est centré s’il présente un axe de révolution (axe optique).
Un système optique centré est aplanétique si tout objet étendu AB dans un
plan de front (plan perpendiculaire à l’axe optique) donne une image A′ B ′
étendue dans un plan de front.
Dans les conditions de Gauss (rayons faiblement inclinés sur l’axe, atteignant
les divers dioptres à des distances de l’axe faibles devant les rayons de courbure),
tout système centré est stigmatique et aplanétique.
Tout ce qui suit est décrit dans les conditions de Gauss.
Il y a aplanétisme si et seulement si nentrée ABα = (−1)n nsortie A′ B ′ α′ , où α
et α′ sont les angles faits avec l’axe optique par un même rayon, issu de A et
passant par A′ ; n est le nombre de réflexions.
A′ B ′ α′
On définit les grandissements linéaire et angulaire, γ = et G = ; alors,
AB α
n nentrée
Gγ = (−1) ou, si les milieux extrêmes sont identiques, Gγ = (−1)n .
nsortie
Pour une lentille sphérique, f ′ = OF ′ = −OF = −f est positif si la lentille
(convergente) est à bords minces, négatif si la lentille (divergente) est à bords
1 1 1 OA′
épais. Relations de Descartes : − + = ′, γ = et G = 1/γ.
OA OA ′ f OA
Pour un miroir sphérique, f ′ = SF ′ = SF = SC/2 (F est au milieu de [SC]).
1 1 1 2 SA′
Relations de Descartes + = ′ = ,γ=− et G = −1/γ.
SA SA ′ f SC SA
F ′ A′ f
Dans les deux cas (lentilles et miroirs), on a γ = − ′
= − et donc
f FA
F A · F ′ A′ = f f ′ (relations de Newton).
Cette relation se généralise à tous les systèmes centrés.
Un système afocal présente des grandissements linéaire γ et angulaire G
constants, quelle que soit la position de l’objet.
Chapitre 7
Diffraction de la Lumière
7.1 Le principe de Huygens et Fresnel
7.1.1 L’énoncé du principe

2 Historique : la première mise en évidence du phénomène de diffraction est due
à l’italien Grimaldi ; ses travaux ont été publiés en . Observant la propagation
d’un pinceau lumineux, Grimaldi remarqua que l’ombre portée dans ce faisceau par
une tige fine était plus large que ce que les calculs géométriques prévoyaient ; de plus,
cette ombre était entourée de quelques bandes colorées.
Grimaldi est l’auteur du terme diffraction, qui désigne une (( rupture )) dans la propa-
gation rectiligne des rayons lumineux. Hooke fit ensuite en Angleterre des observa-
tions analogues. Pour rendre compte de ces résultats, Newton proposa en , dans
son ouvrage, Opticks, une interprétation corpusculaire qui ne parut pas décisive. En
se basant justement sur l’existence des phénomènes de diffraction, Huygens‡ proposa
à la fin du xviie siècle une vision ondulatoire de la propagation de la lumière.
Cette théorie trouvera une forme quantitative grâce aux travaux de Fresnel‡ à la
fin du xviiie siècle ; c’est dans ce cadre que la théorie de la diffraction est exposée ici.
2 Le cadre de l’étude : nous ne considérerons ici aucun phénomène de polarisation
et nous nous placerons donc dans le cadre de l’approximation scalaire, en notant
W (M, t) l’onde lumineuse correspondante.
Nous nous placerons de plus dans le cas d’une onde monochromatique en écrivant
W (M, t) = w(M ) exp (jωt) ; la formation d’images en lumière polychromatique (en
particulier en lumière blanche) sera simplement traitée par superposition des résultats
obtenus pour plusieurs longueurs d’onde.
Le fait qu’on puisse ajouter les éclairements obtenus pour diverses longueurs d’onde,
comme s’ils se propageaient indépendamment les uns des autres, relève de l’hypo-
thèse d’incohérence de rayonnements de longueurs d’onde différentes. Cette hypo-
thèse sera justifiée ultérieurement, à l’occasion de l’étude des interférences lumi-
neuses.
Il est en principe possible de décrire complètement la propagation d’une telle onde
W (M, t) = w(M ) exp (jωt) par la résolution de l’équation de l’équation de propaga-
tion ∆w = −ω 2 /c2 w, avec dans chaque milieu homogène c = c0 /n ; cette résolution,
qui doit être complétée par la prise en compte de conditions aux limites à la surface
de chaque dioptre ou miroir, est en pratique souvent équivalente à la formulation de
la diffraction selon Huygens et Fresnel.
2 Le principe de Huygens et Fresnel : on a vu au premier chapitre comment le

traitement des lentilles comme objets déphasants permet de décrire l’onde émergente
du plan de la lentille à partir uniquement de la répartition de l’amplitude lumineuse
w(M ) dans les différents points M de ce plan. Le principe de Huygens et Fresnel est
la généralisation de cette méthode :
Principe de Huygens et Fresnel
X L’onde lumineuse observée en un point P situé après une surface (Σ) (cf.
figure 7.1) ne dépend que de la répartition de l’amplitude lumineuse sur
les points M de (Σ). On peut considérer cette onde comme la superposi-
tion d’ondelettes (ondes sphériques émises par des sources infinitésimales
fictives sur la surface (Σ)) issues des différents points M de (Σ).
Ainsi, l’élément d’aire dΣ situé autour de M émet une ondelette d’am-
plitude dae (M ) = κwi (M )dΣ proportionnelle à dΣ et à l’amplitude lu-
mineuse wi (M ) incidente en M .
Pour obtenir l’onde observée en P , il suffit de sommer les amplitudes
complexes des ondelettes lumineuses sphériques se propageant depuis
les différents points M de (Σ) jusqu’en P ; du fait de leur propagation
de M en P , chacune de ces ondes se déphase proportionnellement au
x w (M )
i
chemin optique (M P ), soit w(P ) = κ exp [−jk0 (M P )] dΣ,
MP
M ∈(Σ)
en notant k0 = 2π/λ0 .
bM
b
b P
S b
M′
(Σ)
Figure 7.1 – Principe de Huygens et Fresnel
Dans cette expression, on ne s’intéressera en général pas à la constante de propor-

tionnalité κ. D’autre part, on notera bien que la surface (Σ), qu’on qualifiera à partir
de maintenant de pupille diffractante, n’est pas forcément une surface matérielle.
7.1.2 Expressions intégrales du principe de Huygens et Fresnel

2 Intégrale de Rayleigh-Sommerfeld : il est possible de montrer l’expression de l’onde
diffractée en P par le pupille (Σ) :
x 1 wi (M )
w(P ) = exp [−jk0 (M P )] cos αdΣ (7.1)
jλ0 M P
M ∈(Σ)
On parle ici de l’intégrale de Rayleigh‡ -Sommerfeld, dans laquelle α désigne l’angle

entre le vecteur n normal à la surface (Σ) et la direction de propagation MP. Si on
7 : Diffraction de la Lumière 143
se place dans le cas de la diffraction dans des directions faiblement inclinées sur la
normale n, on peut écrire cos α ≃ 1 et on retrouve l’expression intégrale du principe
de Huygens et Fresnel :
x wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.2)
MP
M ∈(Σ)
Nous serons amenés à étudier l’effet de pupilles partiellement transparentes ou dé-

phasantes ; on décrira ce type de pupille en considérant que chaque point M de la
pupille (Σ) transforme l’onde incidente wi (M ) en une onde d’amplitude complexe
T (M )wi (M ) ; la fonction complexe T (M ) porte le nom de transmittance complexe de
la pupille.
Le module |T (M )| de la transmittance vérifie bien sûr |T (M )| 6 1 ; si |T (M )| < 1, on
décrit une pupille partiellement transparente.
L’argument arg (T (M )) de la transmittance décrit le déphasage de la lumière lors de
la traversée de la pupille ; on notera aussi arg (T (M )) = −k0 L(M ) où L(M ) est le
chemin optique équivalent à la traversée de la pupille au point M .
Finalement, nous utiliserons l’expression intégrale du principe de Huygens et Fresnel
sous la forme :
x T (M )wi (M )
w(P ) = κ exp [−jk0 (M P )] dΣ (7.3)
MP
M ∈(Σ)
L’ensemble de ce chapitre sera consacré aux moyens de calculer et d’interpréter cette

intégrale, en fonction notamment :
• des conditions d’éclairement de la pupille, et donc en fonction de la répartition
wi (M ) de l’amplitude complexe incidente en un point quelconque M de la pu-
pille ;
• de la forme et des dimensions de la pupille, c’est-à-dire en fonction des bornes de
l’intégrale (7.3) ;
• de la position du point P où a lieu l’observation.
2 Pupilles planes et diffraction à grande distance : dans l’expression (7.3), la position

du point d’observation P intervient de deux manières :
• l’amplitude des ondes sphériques fait intervenir un facteur de (( dilution )) de l’éner-
1
gie . On a déjà eu l’occasion de remarquer que ce terme est pratiquement
MP
constant dès que l’observation se fait à une distance suffisante de la pupille (Σ) ;
on pourra donc généralement considérer que ce terme d’amplitude est quasiment
constant sur toute l’étendue de la figure de diffraction, c’est-à-dire de la zone
éclairée par la pupille diffractante (Σ).
• la phase des ondelettes qui interfèrent en P dépend du chemin optique (M P ) ;
on a là aussi déjà eu l’occasion de remarquer qu’il n’est souvent pas légitime de
considérer que ce terme reste constant, car dans l’exponentielle exp [−jk0 (M P )],
une variation du chemin optique même de l’ordre de grandeur de la longueur
d’onde λ0 (donc quelques fractions de micromètre) se traduit par une variation
de la phase de l’ordre de grandeur de k0 λ0 = 2π.
x X
MP bP
M b
z
(Σ) b b
O Ω
Figure 7.2 – Pupilles planes et observation dans un plan
Pour être plus précis, considérons le cas où la pupille diffractante (Σ) est un certain
plan (Oxy), tandis que l’observation se fait en un point P d’un plan (ΩXY ), parallèle
au précédent mais décalé d’une
p longueur OΩ = z (cf. figure 7.2).
On peut alors écrire M P = z 2 + (X − x)2 + (Y − y)2 ; dans toute la suite, nous
nous placerons dans le cas où la distance
z est nettement supérieure
à toutes les
(X − x)2 + (Y − y)2
autres ; on peut alors écrire M P ≃ z 1 + . Appelant alors d un
2z 2
majorant des grandeurs X, x, Y et y, c’est-à-dire la plus grande dimension rencontrée
sur la pupille et dans l’étude de la figure de diffraction, on pourra considérer que
M P ≃ z avec une précision acceptable si z ≫ d.
En pratique, les observations de figures de diffraction sont faites dans la plupart des
cas à une distance z ∼ 1 m au moins, tandis que la plus grande dimension d’une figure
de diffraction ou d’une pupille diffractante ne dépasse que rarement 1 cm ; ainsi, on
peut considérer que M P ≃ z à mieux que 10−4 près.
On notera donc l’intégrale donnant l’amplitude diffractée sous la forme pratique, qui
sera utilisée dans toute la suite, faisant intervenir une distance (( moyenne )) M P0 :
κ x
w(P ) ≃ T (M )wi (M ) exp [−jk0 (M P )] dΣ (7.4)
M P0
M ∈(Σ)
Remarquons encore une fois qu’une variation relative de 10−4 dans l’expression de
M P n’est, par contre, pas du tout négligeable dans l’exponentielle exp [−jk0 (M P )] ;
imaginons par exemple que (M P ) soit de l’ordre de grandeur de z = 1 m, les variations
les plus importantes attendues pour (M P ) seront de l’ordre de 10−4 m, ce qui, avec
par exemple λ0 = 500 nm, correspond à des variations maximales de la phase k0 (M P )
10−4
de l’ordre de 2π = 200×2π ! On doit donc pour l’instant conserver telle quelle
5 × 10−7
l’expression de l’exponentielle dans (7.4).
Les ordres de grandeurs cités ci-dessus correspondent au cas de la diffraction des ondes
lumineuses ; cependant, le phénomène de diffraction existe pour les ondes électroma-
gnétiques dans tous les domaines des longueurs d’onde, avec des moyens de description
identiques et souvent des approximations analogues à celles qui sont faites ici.
On utilise en pratique couramment la diffraction des rayons X pour la détermina-
tion des structures diffractantes ; toutefois, la longueur d’onde des rayons X étant
nettement plus courte que celle des ondes lumineuses visibles (de l’ordre de 10−12 m
par exemple), on s’intéresse à des objets diffractants de dimensions caractéristiques
nettement plus faibles (cristaux ou macromolécules par exemple).
2 Éclairage par une source ponctuelle : la pupille (Σ) étant éclairée par une source
ponctuelle S, on peut encore écrire l’onde wi (M ) incidente en M en fonction de
l’onde émise en S et du terme de déphasage exp [jk0 (SM )] ; toutefois, on devrait ici
distinguer le cas des ondes planes (la source S étant rejetée à l’infini, et le module de
l’amplitude complexe de l’onde étant conservé) et celui des ondes sphériques (la source
S est à distance finie, et module de l’amplitude de l’onde décroı̂t comme 1/SM ) ;
toutefois, dans les mêmes conditions que ci-dessus, cette variation d’amplitude est
pratiquement toujours négligeable, et nous écrirons donc :
wi (M ) = w(S) exp [−jk0 (SM )] (7.5)
Dans toute la suite, on ne s’intéressera qu’au cas d’une pupille plane, dans le plan
(Oxy), éclairée à distance suffisante, et observée également à une distance suffisante
pour négliger tous les termes de dilution d’énergie dans la propagation des ondes
sphériques, ce qui mène à la forme pratique :
x
w(P ) ≃ Kw(S) T (x, y) × exp [−jk0 (SM P )] dxdy (7.6)
M ∈(Oxy)
L’expression exacte de la constante K est sans importance dans ce qui suit.
7.1.3 Optique géométrique et diffraction

2 Figure de diffraction et image géométrique : considérons le cas où la pupille est
seulement transparente, c’est-à-dire T (x, y) = 1 en tout x point de la pupille P ; dans
ce cas, l’amplitude diffractée en P est proportionnelle à exp [−jk0 (SM P )] dxdy.
M ∈P
Le calcul exact du chemin optique (SM P ) dépend du dispositif optique utilisé pour
éclairer le point P ; toutefois, si on note S ′ l’image de S par ce dispositif, on sait que
le chemin optique (SM S ′ ) est constant, c’est-à-dire indépendant du choix du point
′
M sur la pupille P ; on x peut noter L0 cette constante, et l’amplitude complexe en S
′
est w(S ) = Kw(S) exp [−jk0 L0 ] dxdy = KAw(S) exp [−jk0 L0 ], où A est l’aire
M ∈P
de la pupille P ; on a donc |w(S ′ )| = |Kw(S)| A.
L’amplitude lumineuse
en tout autre point P sera moindre
en module, puisqu’on peut
x

écrire |w(P )| = Kw(S) exp [−jk0 (SM P )] dxdy 6 |Kw(S)| A. Cette propriété

M ∈P
se généralise sous la forme suivante :
Lien entre optique géométrique et diffraction

X Le chemin optique d’un objet à son image étant constant, l’ensemble
des ondelettes réémises depuis une surface arbitraire (Σ) parviennent en
phase au point image géométrique de la source ; c’est donc en ce point
que la lumière s’accumule.
L’image définie dans le cadre de l’optique géométrique est donc en général
le point le plus lumineux de la figure de diffraction.
2 Écarts à l’optique géométrique : considérons, sur la figure 7.3, une pupille plane
diffractante P, dont on notera a une dimension caractéristique.
Sur la figure, cette pupille est éclairée en lumière parallèle, donc les différents points
de la pupille sont éclairés en phase : wi (M ) est constant pour tout point M ∈ P.
x
α
b M2 b
a α z
b
α
a H1
vers P b
P
M1 b
δ
Figure 7.3 – Écarts à l’optique géométrique
On considère alors les ondelettes émises par divers points de P, qui interfèrent en un
point d’observation P situé à grande distance de la pupille ; pour évaluer un ordre de
grandeur, nous considérerons que ce point est pratiquement à l’infini. Ainsi, les rayons
lumineux qui éclairent P sont quasiment parallèles entre eux, définis seulement par
un angle α.
Dans l’intégrale (7.6) qui permet le calcul de l’amplitude complexe de l’onde lumineuse
en P , la seule différence entre deux ondelettes émises par deux points différents de
la source réside dans le terme exp [−jk0 (M P )]. On peut alors estimer la plus grande
valeur de l’écart de phase en comparant les chemins optiques M P pour deux points
extrêmes M1 et M2 de la pupille ; ces points dont donc distants de a (cf. figure 7.3 à
droite).
À partir du passage dans le plan H1 M2 (orthogonal à la direction du point P ), les
chemins optiques parcourus sur les deux rayons représentés sont identiques ; la seule
différence à prendre en compte est donc de l’ordre de δ = a sin α, soit aussi δ ≃ aα si
on se contente d’étudier de faibles écarts à la direction α = 0 qui est celle de l’optique
géométrique.
On pourra donc considérer deux cas :
2π
• si k0 δ = aα ≪ 2π, toutes les ondes émises par les divers points de la pupille P
λ0
arrivent en phase en P et l’éclairement est maximal ; on peut donc dire que des
λ0
rayons tels que α ≪ éclairent le centre de la figure de diffraction ;
a
• si au contraire k0 δ est de l’ordre de 2π ou plus, les déphasages entre les rayons
émis par les divers points de la pupille P deviennent importants, la somme (7.6)
contient de beaucoup de nombres complexes largement déphasés et on verra peu
ou pas de lumière : on est donc au-delà de la tache centrale de diffraction.
Nous admettrons la généralisation de ce résultat sous la forme suivante :
Lien entre longueur d’onde et Diffraction

X La lumière est toujours concentrée au voisinage immédiat de l’image
géométrique, dans une région, appelée tache centrale de diffraction dont
la largeur angulaire, vue depuis le plan de la pupille diffractante, est de
l’ordre de grandeur de α = λ0 /a si λ0 est la longueur d’onde dans le vide
de la lumière utilisée et a une dimension caractéristique de la pupille.
Les largeurs angulaires α étant souvent faibles, on les mesure en fractions de radian
mais aussi en minutes d’arc (1′ , ou une minute d’arc, est 1/60e de degré) ou en
secondes d’arc (1′′ , ou une seconde d’arc, est 1/60e de minute). On vérifie facilement
que 1′ ∼ 0, 3 mrad et 1′′ ∼ 5 µrad.
2 Écarts à l’optique géométrique : on peut utiliser le résultat ci-dessus pour prévoir

l’effet diffractant ou non d’une pupille, de dimension a, sur une onde lumineuse de
longueur d’onde λ0 qui éclaire cette pupille :
λ0
• si a ≫ λ0 , la largeur angulaire α = de la tache centrale de diffraction est très
a
faible et la diffraction est négligeable : l’image d’une source reste ponctuelle. On
pourra dire que la pupille est si grande (relativement à la dimension caractéris-
tique λ0 de l’onde lumineuse qui la traverse) qu’elle n’est pas vue par l’onde. Il
n’y a donc pas diffraction dans ce cas ;
λ0
• si a & λ0 , la largeur angulaire α = de la tache centrale de diffraction reste faible
a
mais significative : l’effet de la diffraction est effectivement la formation d’une
tache observable, qui dégrade la qualité des images.
La figure 7.4 montre ainsi l’observation au microscope de deux points sombres
très voisins ; la largeur finie des taches de diffraction, qui se recouvrent, fait qu’on
n’est plus sûr de distinguer deux images ponctuelles. On dira que la résolution
du microscope est ici insuffisante pour séparer les deux images.
b b b b
Les points observés Les taches de diffraction

Figure 7.4 – Observation au microscope limitée par la diffraction
• enfin, si a ≪ λ0 , la largeur angulaire de la tache de diffraction est si grande qu’on

peut considérer que la diffraction a lieu de manière isotrope, dans toutes les
directions. On peut aussi dire que la pupille est si petite qu’on peut la traiter
comme une source d’ondelettes unique, ponctuelle, émettant donc une onde
quasiment sphérique.
On prendra garde, pour évaluer l’importance ou non des phénomènes de diffraction,

aux ordres de grandeur ; les mesures optiques étant souvent très précises, un angle
d’ouverture qui pourrait a priori paraı̂tre négligeable peut ne pas l’être. Ainsi, avec
des télescopes faisant plusieurs mètres d’ouverture (a ∼ 5 m) et pour une obser-
vation en lumière visible (λ0 ∼ 500 nm), les phénomènes de diffraction participent
de façon significative à la limitation du pouvoir de résolution, bien que l’ouverture
angulaire λ0 /a = 10−7 rad = 0, 02′′ semble très faible.
2 En résumé : le caractère inévitable des phénomènes de diffraction, dont on peut

montrer qu’ils sont liés à la nature quantique de la lumière, limite le fonctionnement
de nombreux dispositifs optiques.
En particulier, la diffraction perturbera la métrologie de l’imagerie géométrique, puis-
qu’au lieu d’observer sous forme d’un point unique l’image d’un point lumineux, on
observera une tache de diffraction : la diffraction limite la résolution des systèmes
optiques, c’est-à-dire leur capacité à séparer les images de deux objets voisins.
De la même façon, la diffraction perturbera la métrologie de la spectroscopie optique,
c’est-à-dire de la mesure des longueurs d’onde. Par exemple, on s’attend, après passage
par un prisme, à séparer les faisceaux lumineux correspondant à des longueurs d’onde
différentes. Le recouvrement inévitable des images proches du à l’existence de taches
de diffraction limitera donc la résolution des systèmes spectroscopiques, définie ici

comme leur capacité à séparer des longueurs d’ondes voisines.
7.2 Diffraction de Fraunhofer
7.2.1 Diffraction à l’infini par une pupille plane
2 Les conditions de Fraunhofer : nous étudierons essentiellement dans la suite la

diffraction par une pupille plane, éclairée par une source à l’infini, avec observation à
l’infini : on parle alors de diffraction de Fraunhofer‡ .
La pupille plane P, contenue dans le plan (Oxy), est alors (cf. figure 7.5) éclairée par
un faisceaux de rayons parallèles dirigé par le vecteur unitaire ui ; si les dimensions
de la pupille ne sont pas trop grandes, on observera des rayons diffractés dans des
directions différentes de la direction d’observation incidente.
x
b
M
b
z
′
M
b
ui M ′′ ud
Figure 7.5 – Diffraction de Fraunhofer
Parmi toutes les directions éclairées par les ondelettes émises par les points M , M ′ ,
etc. de P, on s’intéressera dans ce qui suit à celles qui se propagent dans une direction
commune de vecteur directeur unitaire ud ; ces diverses ondes interfèrent bien sûr
seulement à l’infini.
2 L’intégrale de Fraunhofer : dans le cas de la diffraction de Fraunhofer, l’intégrale

de diffraction (7.6) prend une forme simple car le calcul du chemin optique (SM P )
peut être effectué au moyen du schéma de la figure 7.6. Sur ce schéma, le point O est
une origine choisie arbitrairement dans le plan (Oxy) de la pupille P.
x
b
dep M
uis P
S vers
z
H K
b b
b
ui O ud
Figure 7.6 – Calcul du chemin optique dans la diffraction de Fraunhofer

Il n’est pas nécessaire que le point origine O fasse effectivement partie de la pupille
P ; certaines droites représentées sur cette figure ne sont donc pas nécessairement
des rayons lumineux effectifs.
On peut noter (SM P ) = (SM ) + (M P ) le chemin optique de la source S au point
d’observation P . Quels que soient les dispositifs optiques placés de part et d’autre du
plan P de la pupille, on sait aussi d’après le théorème de Malus que les rayons lumineux
sont perpendiculaires aux surfaces d’onde, ou surfaces de chemin optique constant ;
ainsi, le chemin optique (SM ) est identique au chemin optique (SH) puisque M et
H sont sur la même surface d’onde.
De même, le chemin optique (M P ) est égal au chemin optique (KP ) puisque K et M
sont situés sur la même surface perpendiculaire aux rayons lumineux qui se dirigent
vers P . Finalement, on écrira (SM P ) = (SHOKP ) − (HO) − (OK).
Les chemins optiques (HO) et (OK) étant parcourus dans l’air, d’indice pris égal à
1, de part et d’autre de la pupille, on écrira ces chemins (HO) = HO = HO · ui et
(OK) = OK = OK · ud . L’utilisation de mesures algébriques permet d’étendre le cas
de la figure 7.6 à une situation différente, si le point M était au-dessous de O par
exemple.
On remarque que la méthode de calcul du chemin optique présentée ici ne fait

intervenir que les seuls phénomènes de diffraction au niveau de la pupille P ; l’emploi
du théorème de Malus permet de ne pas prendre en compte l’existence de miroirs,
lentilles, etc., dans le dispositif optique complet : ces systèmes étant par construction
stigmatiques, ils n’introduisent aucune différence de chemin optique supplémentaire.
Par construction, HM ⊥ ui , ce qui permet d’écrire (HO) = (HO − HM) · ui soit
(HO) = −OM · ui ; de même, MK ⊥ ud donc (OK) = (OK − MK) · ud = OM · ud .
Finalement, (HO)+(OK) = OM·(ud − ui ) donc (SM P ) = (SOP )−OM·(ud − ui ),
où le terme (SOP ) est une constante relativement à P , c’est-à-dire pour l’intégration
sur le plan de la pupille P.
On peut alors déterminer l’amplitude complexe de l’onde lumineuse diffractée vers le
point P , situé dans la direction de vecteur unitaire ud , par l’intégrale de Fraunhofer :
x
w(ud ) = Kw(S) exp [−jϕ0 ] T (M ) exp [jk0 OM · (ud − ui )] dxdy (7.7)
M ∈P
où la phase ϕ0 = k0 (SOP ), ne dépend que du choix de l’origine O dans le plan de P.

2 Les cosinus directeurs : on explicite souvent l’intégrale de Fraunhofer (7.7) en
faisant intervenir les coordonnées cartésiennes des vecteurs unitaires ui et ud , sous la
forme ui = αi ex + βi ey + γi ez et ud = αd ex + βd ey + γd ez ; ces coefficients portent le
nom de cosinus directeurs. Puisque OM = xex + yey , l’intégrale de Fraunhofer prend
encore la forme :
x
w(αd , βd ) = Kw(S) exp [−jϕ0 ] T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.8)
R2
où on a noté ∆α = αd − αi et ∆β = βd − βi les variations des cosinus directeurs dus à

la diffraction. On notera aussi dans l’intégrale (7.8) que le domaine d’intégration est
étendu à la totalité du plan (Oxy), ce qui impose de noter par convention T (x, y) = 0
pour tout point situé hors de la pupille P.
7.2.2 Montages de diffraction à l’infini

Il n’existe évidemment ni source à l’infini, ni possibilité d’observer quoi que ce soit
à l’infini ; nous allons donc proposer deux montages pratiques permettant d’observer
effectivement les figures de diffraction déterminées par le calcul des intégrales de
Fraunhofer (7.7) ou (7.8).
2 Cas des angles quelconques : dans ce cas (figure 7.7), on utilise un goniomètre,
muni d’un collimateur C et d’une lunette de visée L. Un tel dispositif est adapté
à l’étude de phénomènes de diffraction pour des angles quelconques, éventuellement
grands, mais limités à un plan : le plan (Oxz) du goniomètre.
S x
b C
L
θi θd
u z
i
P ud
Figure 7.7 – Diffraction de Fraunhofer : étude sur un goniomètre
La source lumineuse utilisée est en fait placée au foyer objet S du collimateur, et

l’observation se fait à l’œil, sans accommoder, au moyen de la lunette de visée. Dans
une telle géométrie, βi = βd = 0 tandis que αi = ui ·ex = sin θi et αd = ud ·ex = sin θd :
les cosinus directeurs sont ici les sinus des angles formés par le faisceau incident et le
faisceau diffracté avec la normale au plan de la pupille. Sur la figure 7.7, on remarque
que θi < 0 et θd > 0.
À un facteur multiplicatif près, on écrira ici l’intégrale de Fraunhofer :
x
2π
w(θd ) ∝ T (x, y) exp j x (sin θd − sin θi ) dxdy (7.9)
λ0
R2
2 Le cas des conditions de Gauss : lorsque l’éclairage de la pupille et l’observation

de la figure de diffraction se font dans des directions voisines de la normale (Oz) au
plan de la pupille,
p les vecteurs directeurs ui et ud sont peu écartés de ez , ce qu’on
peut écrire γi = 1 − αi2 − βi2 ≃ 1 au second ordre près, ainsi d’ailleurs que γd ≃ 1.
Les rayons incident (sur la pupille) et émergent (vers le point d’observation P ) restant
alors proches de l’axe (Oz), on peut utiliser des systèmes optiques stigmatiques dans
les conditions de Gauss pour réaliser l’éclairage et l’observation, comme sur la figure
7.8 qui utilise deux lentilles convergentes.
On ne doit en aucun cas raccorder les deux schémas de la figure 7.8 en un seul ;
en effet, le schéma de gauche (pour l’éclairage) est tracé dans le plan défini par les
vecteurs ez et ui , tandis que le schéma de droite (pour l’observation) est tracé dans
le plan défini par ez et ud . Ces deux plans sont en général distincts.
La source ponctuelle S est disposée dans le plan foyer objet de la lentille d’éclairage
Le (de distance focale image fe′ ), au voisinage de son foyer principal objet Fe ; après
S b bP
Fe C z Co F′ z
b b e b b o
ui ud
Le Lo
Figure 7.8 – Cosinus directeurs dans les conditions de Gauss
traversée de cette lentille, on obtient donc un faisceau parallèle, donc le vecteur uni-
taire ui ≃ αi ex + βi ey + ez est parallèle à la direction SCe , où Ce est le centre optique
αi βi 1
de Le . Comme SCe = fe′ ez − xS ex − yS ey , on peut écrire = = ′ , ou :
−xS −yS fe
xS yS
αi ≃ − βi ≃ − (7.10)
fe′ fe′
Ainsi, les cosinus directeurs de la direction incidente sur la pupille mesurent des gran-
deurs proportionnelles aux abscisses et ordonnées de la source dans le plan focal de
la lentille d’éclairage.
La même étude faite pour la lentille d’observation Lo , de distance focale image fo′ et
de centre optique Co , montre que le vecteur ud ≃ αd ex + βd ey + ez est parallèle à
Co P = fo′ ez + xP ex + yP ey , ce qui mène à :
xP yP
αd ≃ βd ≃ (7.11)
fo′ fo′
et les cosinus directeurs de la direction diffractée par la pupille mesurent des grandeurs
proportionnelles aux abscisses et ordonnées du point d’observation dans le plan focal
de la lentille d’observation.
Rappelons une fois encore que le calcul de chemin optique proposé à partir de la
figure 7.6 n’est pas modifié par la présence de telles lentilles ; en effet, s’agissant de
dispositifs stigmatiques pour un couple (plan à l’infini, foyer secondaire), ces lentilles
n’introduisent aucune différence de marche supplémentaire par rapport à celle qui
apparaı̂t de part et d’autre du plan de la pupille diffractante P.
Finalement, on pourra écrire ici, toujours à un facteur multiplicatif près, l’expression

de l’intégrale de Fraunhofer adaptée aux conditions de Gauss :
x
2π xP xS yP yS
w(xP , yP ) ∝ T (x, y) exp j x + ′ +y + ′ dxdy
λ0 fo′ fe fo′ fe
R2
(7.12)
On adopte souvent une forme simplifiée de (7.12), en considérant que la source est
disposée au foyer principal objet de Le (donc avec xS = yS = 0) ; bien que cette
approximation ne soit pas très réaliste sur le plan expérimental, elle permet de discuter
plus simplement de la forme de l’intégrale de Fraunhofer :
x
2π
w(xP , yP ) ∝ T (x, y) exp j (xxP + yyP ) dxdy (7.13)
λ0 fo′
R2
Dans l’écriture (7.13), on se gardera de confondre les notations (x, y), coordonnées
du point courant d’intégration, et (xP , yP ), position du point d’observation où on
calcule l’intégrale donnant l’amplitude complexe w(xP , yP ).
On peut aussi considérer que le passage de (7.12) à (7.13) est un simple changement de
f′ f′
l’origine du plan d’observation, xP 7→ x′P = xP − o′ xS et yP 7→ yP′ = yP − o′ yS . Ce
fe fe
changement a pour effet de recentrer la figure de diffraction sur l’image géométrique S ′
f′ f′
de la source S, dont les coordonnées sont évidemment xS ′ = − o′ xS et yS ′ = − o′ yS .
fe fe
2 En résumé : dans toute la suite, nous utiliserons l’expression générale :
x
w(P ) ∝ T (x, y) exp [jk0 (x∆α + y∆β)] dxdy (7.14)
R2
en retenant pour expression de la variation des cosinus directeurs lors de la diffraction

l’une ou l’autre forme :
∆α = sin θd − sin θi pour de grands angles

xP xS (7.15)
∆α = + ′ dans les conditions de Gauss
fo′ fe
et les expressions analogues pour ∆β le cas échéant.
7.2.3 Propriétés générales des figures de diffraction à l’infini

2 Translation de la pupille : le déplacement de la pupille P dans son plan (Oxy)
peut être décrite par un simple changement de la fonction de transparence T (x, y). La
figure 7.9 représente ainsi deux pupilles transparentes découpées dans un plan opaque,
identiques à une translation OO′ près.
Les pupilles P et P ′ sont définies par des fonctions de transparence T (x, y) et T ′ (x′ , y ′ )
telles que T ′ (M ′ ) = T (M ) si MM′ = OO′ . Si on note OO′ = aex + bey cette trans-
lation, on en déduit que T ′ (x, y) = T (x − a, y − b) ; on peut donc relier les amplitudes
complexes diffractées par ces deux pupilles
x dans une même direction en écrivant pour
la pupille P ′ , w′ = Kw0 exp [−jϕ0 ] T ′ (x, y) exp [jk0 (x∆α + y∆β)] dxdy ; faisant le
R2
changement de variables x′ = x − a,xy ′ = y − a, on peut encore écrire cette am-
plitude w′ = Kw0 exp [−j(ϕ0 − ϕ)] T (x′ , y ′ ) exp [jk0 (x′ ∆α + y ′ ∆β)] dx′ dy ′ avec
R2
ϕ = k0 (a∆α + b∆β) ; on reconnaı̂t dans cette
x expression l’amplitude complexe diffrac-
tée par la pupille P, w = Kw0 exp [−jϕ0 ] T (x′ , y ′ ) exp [jk0 (x′ ∆α + y ′ ∆β)] dx′ dy ′ .
R2
O′ b
b
M′ P′
O x
b
b
M P
Figure 7.9 – Translation d’une pupille dans son plan
Translation de la pupille diffractante

X La translation de la pupille diffractante dans son plan selon le vecteur
OO′ = aex + bey s’accompagne d’un simple déphasage de l’amplitude
2π
complexe, w′ (P ) = w(P ) exp [jϕ] avec ϕ = (a∆α + b∆β) ou encore
λ0
2π
ϕ= OO′ · (ud − ui ).
λ0
On observera donc la même intensité lumineuse en chaque point P pour
les deux pupilles, puisque l’éclairement est proportionnel à |w(P )|2 .
Un tel résultat peut a priori sembler peu naturel : on s’imagine parfois que la figure
de diffraction est translatée en même temps que la pupille. Il n’en est évidemment
rien puisque, quelle que soit la position de la pupille, la figure de diffraction est
centrée sur l’image géométrique de la source, telle qu’elle se formerait en l’absence
de toute pupille. Le déplacement de cette dernière ne peut donc évidemment pas
avoir pour effet le déplacement de la figure de diffraction.
2 Théorème de Babinet : on dira que les pupilles P et P ′ sont complémentaires si

les transmittances complexes T et T ′ associées vérifient T (M ) + T ′ (M ) = 1 pour tout
point M ∈ (Oxy). C’est par exemple le cas des deux pupilles de la figure 7.10, formées
respectivement d’un trou circulaire dans un écran opaque et d’un disque opaque sur
un écran transparent.
Figure 7.10 – Pupilles complémentaires pour le théorème de Babinet
On peut alors comparer, en un même point P de la zone d’observation, les amplitudes

complexes w(P ) et w′ (P ) diffractées par P et P ′ ; en effet, la relation (7.14) montre
que w(P ) + w′ (P ) = w0 (P ), où l’amplitude w0 (P ) correspondrait à la diffraction

par une pupille telle que T 0 (M ) = 1, ∀M : il s’agit en fait d’un plan idéalement
transparent.
Un tel plan ne diffracte pas la lumière puisqu’il est par construction de très grandes
dimensions (en tous cas très supérieures à λ0 ) ; l’amplitude w0 (P ) est donc entièrement
concentrée au point S ′ , image géométrique de la source S. En particulier, si P 6= S ′ ,
w0 (P ) = 0 donc w(P ) = −w′ (P ) et donc |w(P )|2 = |w′ (P )|2 :
Théorème de Babinet
X En tout point de la zone d’observation, sauf au niveau de l’image géo-
métrique S ′ de la source ponctuelle qui les éclaire, deux pupilles complé-
mentaires fournissent la même figure de diffraction.
2 Diffraction et Optique de Fourier : considérons à nouveau l’expression (7.14) de

l’amplitude diffractée en un point P par
xune pupille plane, que nous écrirons sous la
forme w(P ) = Kw0 exp [−jk0 (SOP )] T (x, y) exp [jk0 (x∆α + y∆β)] dxdy. Si on
R2
note alors k0 ∆α = u et k0 ∆β = v, on remarque que l’amplitude diffractée est propor-
tionnelle à la transformée de Fourier (inverse) à deux dimensions de la transmittance,
x
qu’on définit par Tb (u, v) = 1 T (x, y) exp (j[ux + vy]) dydy en généralisation des
2π 2
R
définitions proposées dans le cadre du cours d’électronique.
Transformée de Fourier en Optique

X L’amplitude complexe diffractée à l’infini par une pupille plane est pro-
portionnelle à la transformée de Fourier Tb (u, v) de la fonction de trans-
mittance complexe.
Cette transformée de Fourier est calculée pour les variables u et v, qui
2π
portent le nom de pulsations spatiales et sont définies par u = ∆α et
λ0
2π
v= ∆β ; u et v mesurent l’ouverture angulaire du faisceau diffracté
λ0
de part et d’autre de la direction d’éclairement de la pupille.
On sait que les largeurs respectives des fonctions T (dans le plan des coordonnées
spatiales) et Tb (dans le plan des pulsations spatiales) varient en sens inverse :
∆x · ∆u ∼ 2π donc ∆x · ∆α ∼ λ0 (7.16)
On retrouve ainsi une généralisation de la relation déjà affirmée, liant la largeur ∆x

λ0
de la pupille et la largeur angulaire dans la direction correspondante, ∆α ∼ .
∆x
En particulier, on retiendra que si ∆x ≫ ∆y, alors ∆α ≪ ∆β : si la pupille est allongée
(le long de l’axe (Oy) ici), alors la figure de diffraction est allongée perpendiculairement
à la pupille, le long de l’axe (Ox) dans ce cas).
7.3 Calculs de figures de diffraction à l’infini
2 Notations : dans toute cette partie, nous calculerons d’abord l’amplitude complexe
diffractée à l’infini, dans une direction définie par les variations (angulaires) des cosi-
x
nus directeurs ∆α et ∆β, w(∆α, ∆β) = Kw′0 T (x, y) exp [jk0 (x∆α + x∆β)] dxdy ;
R2
dans cette expression, on a posé w′0 = w0 exp [−jk0 (SOP )].
Ce calcul ne nous renseigne pas directement sur l’aspect de la figure de diffraction, qui
dépend de la répartition de l’éclairement, donné par E(∆α, ∆β) = |w(∆α, ∆β)|2 ; on
exprimera aussi ces éclairements en fonction de coordonnées sur l’écran d’observation,
xP yP
en utilisant les expressions ∆β = ′ et ∆α = ′ , où fe′ est la focale de projection
fe fe
et où les coordonnées (xP , yP ) dans le plan d’observation sont relatives à l’origine O,
confondue avec l’image S ′ de la source ponctuelle qui éclaire la pupille.
Enfin, nous ne considérerons dans la suite que des pupilles purement transparentes,
c’est-à-dire qui vérifient T (M ) = 1 pour M ∈ P et T (M ) = 0 sinon ; le calcul de
2
x

l’éclairement se ramène à E(xP , yP ) = |Kw′0 |2 × exp [jk0 (x∆α + x∆β)] dxdy ,
(x,y)∈P
où E(0, 0) = |Kw′0 |2 × S au centre de la figure, si S est la surface de la pupille.
Nous poserons systématiquement E(0, 0) = E0 dans ce qui suit pour l’éclairement
au centre de la figure de diffraction, ce qui permet enfin d’écrire l’éclairement en un
point de la figure d’interférence sous la forme E(xP , yP ) = E0 |s(xP , yP )|2 , où le terme
(sans dimension) s(xP , yP ) est l’amplitude complexe diffractée réduite, donnée par
1 x
s(xP , yP ) = exp [jk0 (x∆α + x∆β)] dxdy.
S
(x,y)∈P
7.3.1 Diffraction à l’infini par une pupille rectangulaire

2 La pupille étudiée : elle est représentée sur la figure 7.11 ; il s’agit d’un orifice
rectangulaire, de dimensions a > b, transparent, percé dans un plan opaque.
y
b x
bO
Figure 7.11 – Pupille rectangulaire
Le choix de l’origine O du plan de la pupille au centre de celle-ci est, comme on l’a

vu, arbitraire : une translation de cette pupille dans son plan ne modifie pas la figure
de diffraction.
2 La répartition d’éclairement : l’amplitude complexe diffractée réduite est ici don-
Z a/2 Z b/2
1
née par s(xP , yP ) = exp [jk0 x∆α] dx exp [jk0 y∆β] dy. On recon-
ab x=−a/2 y=−b/2
naı̂t ici le produit de deux intégrales analogues, dont le calcul est simple ; on écrit
Z a/2
1 a/2 1
par exemple exp [jk0 x∆α] dx = exp [jk0 x∆α] qui se met
a x=−a/2 jk0 a∆α x=−a/2
2j sin k0 a∆α
2
encore sous la forme ; finalement, quelques simplifications mènent à
jk0 a∆α
k0 a∆α k0 b∆β
s(xP , yP ) = sinc × sinc .
2 2
L’éclairement en un point P de la zone d’observation prend alors la forme :
πa∆α πb∆β
E = E0 × sinc2 × sinc2 (7.17)
λ0 λ0
2 La figure de diffraction : on a déjà eu l’occasion de présenter le comportement de la

fonction u 7→ sincu dans le cours d’électronique ; le tracé de la fonction u 7→ sinc2 u s’en
déduit ; il est reporté sur la figure 7.12, qui met en évidence la présence, mais aussi
l’intensité relative, des deux premiers maxima secondaires. Ceux-ci correspondant
3π 5π
approximativement à sinc2 ≃ 0, 045 et sinc2 ≃ 0, 016.
2 2
sinc2 u E(∆α)
1, 6 %
1 E0
4, 5 %
u ∆α
−2π −π π 2π − 2λa0 − λa0 λ0 2λ0
∆u = 2π a a
2λ0 /a
πa∆α
Figure 7.12 – Tracé des fonctions u 7→ sinc2 u et ∆α 7→ E(∆α) = E0 sinc2
λ0
πa∆α
La même figure fait apparaı̂tre le tracé de la fonction ∆α 7→ E(∆α) = E0 sinc2 ,
λ0
qui est la réduction à une dimension de la fonction d’éclairement E(∆α, ∆β).
Toutefois, puisqu’il s’agit d’une fonction de deux variables ∆α et ∆β, on doit en
donner une représentation tridimensionnelle ; la figure 7.13 montre la répartition de
la lumière dans le plan d’observation.
On remarquera l’absence totale de visibilité hors des axes (puisqu’alors aucune des
deux fonctions sinc2 de l’éclairement (7.17) ne prend sa valeur maximale 1) ; la figure
de diffraction prend la forme d’une croix, formée d’une tache centrale et de taches
secondaires, dont la luminosité n’est que quelques pour cent de celle du centre de la
figure (4, 5 % pour le premier maximum secondaire, 1, 6 % pour le second, etc.).
La tache centrale est, le long de chaque axe, deux fois plus large que chacune des taches
secondaires ; en valeurs angulaires, cette largeur à la base du maximum principal est
respectivement égale à 2λ0 /a ou 2λ0 /b selon l’axe étudié.
Compte tenu qu’on a choisi a > b, la figure 7.13 montre bien que la figure de diffraction
est allongée perpendiculairement à la plus grande direction de la pupille.
∆β
2λ0
a
∆α
2λ0
b
Figure 7.13 – Figure de diffraction d’une pupille rectangulaire
S′
b b
2λ0 fo′
Sb b
b b b b
b
z
b b
fe′ fo′
P
Figure 7.14 – Montage de diffraction de Fraunhofer pour une pupille rectangulaire
La figure 7.14 récapitule les éléments du montage de diffraction par une pupille en
forme de fente rectangulaire : la source ponctuelle S donnerait, en l’absence de toute
pupille, une image S ′ au moyen des deux lentilles d’éclairage (focale fe′ ) et d’observa-
tion (focale fo′ ) ; la pupille, allongée dans une direction, donne une figure de diffraction
allongée perpendiculairement.
Dans le plan focal de la lentille d’observation, on observe donc essentiellement une
2λ0
tache centrale dont la largeur angulaire se projette dans le plan focal de la
a
2λ0 fo′
lentille d’observation en une largeur effective . Cette tache centrale est entourée
a
de taches secondaires, moins lumineuses et de largeur deux fois moindres.
2λ0 2λ0
On ne confondra pas la largeur angulaire à la base ou (selon l’axe étudié)
a b
du maximum central de diffraction avec la largeur à la base des pics secondaires, qui
λ0 λ0
ne sont égaux qu’à la moitié du précédent, ou . Le risque de confusion est
a b
d’autant plus grand qu’on s’intéresse souvent à la demi-largeur du pic central, qui
est aussi proche de sa largeur à mi-hauteur ; cette demi-largeur angulaire est bien
λ0 λ0
sûr ou selon l’axe étudié.
a b
λ0 2λ0
On ne confondra pas non plus les largeurs angulaires ou (qui sont des angles
a a
et se mesurent en radian) avec les largeurs projetées dans le plan focal du dispositif
λ0 fo′ 2λ0 fo′
d’observation, égales respectivement à ou (qui sont des longueurs et
a a
se mesurent en mètre).
7.3.2 Diffraction à l’infini par une fente fine

2 La pupille étudiée : on s’intéresse maintenant au cas particulier d’une fente fine
très allongée, que l’on peut donc traiter comme une fente rectangulaire dans le cas
limite où a ≫ b ; ainsi, on peut réutiliser les résultats précédents en faisant a → ∞.
La figure de diffraction de la figure 7.13 se rétrécit alors sur l’axe horizontal, puisque
sa largeur angulaire le long de cet axe est de l’ordre de λ0 /a → 0. Ainsi, la figure
de diffraction se réduit à un alignement de taches le long de l’axe (Oy), qui est l’axe
perpendiculaire à la direction de la fente fine.
Sur cet axe, les largeurs de la tache centrale et des maxima secondaires, ainsi que leur
luminosité relative, sont rappelées sur la figure 7.15.
Représentation dans le plan focal d’une lentille de projection de focale fo′

1, 6 % 4, 5 % 2λ0 fo′ /b 4, 5 % 1, 6 %
λ0 fo′ /b 100 % λ0 fo′ /b

La figure est perpendiculaire à la fente diffractante
Figure 7.15 – Figure de diffraction d’une fente fine
2 Généralisation : considérons une pupille de dimension quelconque, mais dont une

dimension est nettement supérieure à l’autre. Si par exemple cette grande dimension
(la longueur ℓ de la pupille) est alignée avec l’axe (Ox), on peut affirmer, comme dans
le cas précédent, que l’ouverture angulaire le long de cet axe (Ox) sera de l’ordre de
grandeur de λ0 /ℓ, donc négligeable.
Pupilles longues
X Si une pupille plane, de normale (Oz), présente une longueur ℓ très
grande dans la direction de l’axe (Ox), aucune diffraction n’aura lieu
dans cette diffraction et la figure de diffraction sera limitée à une ligne
perpendiculaire à la pupille.
On peut donc, dans le cas des pupilles longues, faire un schéma dans le seul plan
(Oyz), qui concentre les phénomènes de diffraction ; c’est le cas de la figure 7.16.
Dans un tel cas, l’intégrale de diffraction sera écrite comme on l’a fait plus haut dans
le cas du goniomètre de la figure 7.7, donc avec βi = sin θi , βd = sin θd tandis que
Z ℓ/2
αi = αd . Le calcul intégral selon (Ox) mène donc au résultat immédiat dx = ℓ
x=−ℓ/2
et il ne reste alors qu’à étudier la diffraction dans le plan (Oyz) :
Z
w(P ) = Kℓw0 T (y) exp [jk0 y∆β] dy (7.18)
P
y yP
b θd P
θd z
N
θi ℓ≫b
fo′
Figure 7.16 – Diffraction par une pupille longue
avec, selon que les angles de diffraction sont grands (dans le cas général) ou petits
(comme dans le cas de la figure 7.16, qui utilise une lentille et impose donc de se
placer dans les conditions de Gauss), les deux expressions possibles pour la variation
des cosinus directeurs dans le plan de la diffraction :
yP yS
∆β = sin θd − sin θi ou ∆β = + ′ (7.19)
fo′ fe
xP xS
L’expression (7.18) n’est valable que sur l’axe défini par + ′ = 0 ; pour toute
fo′ fe
autre valeur de xP , w(P ) = 0 et E(P ) = 0.
2 Élargissement de l’éclairage : dans le cas du montage de la figure 7.16, la répartition

de la lumière a lieu exclusivement dans le plan de figure : la figure de diffraction est
une ligne, parallèle à l’axe (Oy) et passant par le centre de la figure, donc par l’image
S ′ de la source ponctuelle S utilisée pour éclairer le dispositif.
Si on juxtapose à cette source S un autre point source S1 , décalé le long de l’axe (Ox),
les faisceaux issus de S et de S1 vont, indépendamment l’un de l’autre, éclairer la même
pupille P et former deux figures de diffraction juxtaposées, centrées respectivement
en S ′ et S1′ , donc parallèles l’une à l’autre.
y
b b
x ℓ S1′
S b
b b b b b
b z
S′
S1
b b
fe′ fo′
P
Figure 7.17 – Éclairage large d’une pupille étroite
La figure 7.17 montre cette situation, une pupille étroite étant éclairée par deux sources
ponctuelles S et S1 décalées parallèlement à la plus grande longueur de la pupille.
Les deux figures de diffraction sont alors décalées de la même façon, chacune étant
centrée respectivement sur l’image géométrique (respectivement S ′ ou S1′ ) de la source
ponctuelle correspondante.
On généralise immédiatement ce résultat au cas d’une source étendue, formée non

plus d’un point source S mais d’une fente source, disposée parallèlement à la fente
diffractante : on obtient alors une figure de diffraction étalée, parallèlement aux deux
fentes précédentes, le comportement de l’éclairement en fonction de y étant inchangé.
Éclairage des pupilles fines

X Une pupille fine, étendue sur une grande longueur ℓ le long de l’axe
(Ox), ne diffracte que le long de l’axe (Oy). On peut donc l’éclairer par
une fente source, allongée parallèlement à la pupille le long de (Ox) ;
l’éclairement obtenu dans le plan focal imageZde la lentille de projection
s’écrit alors E(y) = |w(y)|2 où w(y) = K ′ w0 T (y) exp [−jk0 ∆βy] dy ;
P
cet éclairement ne dépend pas de xP et la figure d’interférences est donc
étendue parallèlement à la fente source et à la pupille diffractante.
Au contraire de l’expression (7.18), l’éclairement E(P ) est alors indépendant de xP ;

la figure de diffraction est donc invariante par translation le long de (Ox), qui est
à la fois la plus grande direction de la pupille diffractante et de la fente source qui
éclaire l’ensemble.
On peut, à titre de comparaison, tracer ensemble la figure de diffraction par une pupille
rectangulaire avec éclairage ponctuel (à gauche sur le tracé 7.18 ; il s’agit simplement
d’une reprise de la figure 7.13), puis par une pupille rectangulaire fine (largeur b selon
(Oy), grande longueur ℓ ≫ b selon (Ox)) avec éclairage ponctuel (au centre sur le
tracé 7.18) et enfin la même pupille fine mais avec un éclairage large, parallèle à la
pupille (à droite sur le tracé 7.18).
yP yP
2λ0 fo′ /b
2λ0 fo′ /b
xP
2λ0 fo′ /ℓ
ℓ≫b
Pupille rectangulaire Pupille longue ℓ ≫ b

Source ponctuelle Source étendue selon (Ox)
Figure 7.18 – Pupilles rectangulaires : figure de diffraction et conditions d’éclairage
7.3.3 Diffraction à l’infini par une pupille circulaire

2 La pupille étudiée : considérons maintenant le cas d’une pupille circulaire de centre
O et de rayon R, transparente, dans un écran opaque. Il s’agit d’une pupille à la fois
très facile à réaliser et très courante puisque la plupart des instruments d’optique sont
constitués de lentilles ou de miroirs à bords circulaires.
Nous chercherons donc à déterminer la répartition de l’amplitude diffractée par une
telle pupille dans le plan focal image d’une lentille de projection de distance focale
image fo′ ; les coordonnées du point P dans ce plan étant prises relativement à une
origine confondue avec l’image S ′ de la source ponctuelle

qui éclaire le système, on
x xxP yyP
aura donc w(P ) = Kw0 exp jk0 + ′ dxdy.
fo′ fo
P
y
b
√
b
2 R2 − x2 x
Figure 7.19 – Paramétrage pour le calcul de diffraction par une pupille circulaire
Le calcul de l’intégrale
p ci-dessus se faitpen précisant les bornes d’intégration, à savoir
(cf. figure 7.19) − R2 − x2 6 y 6 R2 − x2 puis −R 6 x√6 R ; il vient donc
Z R R2 −x2
xxP fo′ yyP
w(P ) = Kw0 exp jk0 ′ × exp jk0 ′ √
dx ou, après
x=−R fo jk0 yP fo − R2 −x2
Z R √
2fo′ xxP k0 R2 − x2 yP
substitution, w(P ) = Kw0 exp jk0 ′ sin dx.
k0 yP x=−R fo fo′
Cette intégrale, dont on ne sait pas donner d’expression analytique dans le cadre du
Rk0 xP
cours, peut cependant être réécrite en fonction des variables réduites u = et
fo′
Z 1 p
Rk0 yP 4Kw0 R2
v= ′
, sous la forme w(P ) = cos (uX) sin v 1 − X 2 dX, où on
fo v 0
a posé X = x/R et en exploitant la parité du terme intégré.
Le choix de l’ordre d’intégration (y, puis x) est évidemment arbitraire ; le résultat
obtenu doit être symétrique en xP , yP . En fait, il ne dépend même pas du choix
particulier des axes (Ox) et (Oy) dans le plan de la pupille ; en effet, le dispositif
ayant la symétrie de révolution autour de (Oz), il en va de même de la figure de
diffraction.
Ainsi, l’éclairement en un point q
P de l’écran ne dépend pas de xP et de yP , mais
seulement de la distance rP = x2P + yP2 entre P et le centre de la figure. Plus
précisément, le changement de variables proposé ci-dessus montre que l’amplitude
Rk0 rP
complexe w(P ) et l’éclairement E(P ) ne dépendent en fait que de ρ = .
fo′
Nous admettrons que l’intégrale ci-dessus peut s’écrire en termes de la fonction J1 de
J1 (ρ)
Bessel‡ , sous la forme w(ρ) = 2πR2 Kw0 ; avec donc pour éclairement :
ρ
2
J1 (ρ) 2πR
E(rP ) = 4E0 ρ= rP (7.20)
ρ λ0 fo′
Dans cette expression, le facteur 4 assure seulement que E(0) = E0 , éclairement au

centre de la figure. À partir d’expressions tabulées de la fonction de Bessel J1 , on
a représenté sur la figure 7.20 le comportement de l’éclairement E en fonction de la
distance rP au centre de la figure de diffraction.
On a en particulier fait figurer la première annulation de E(rP ), atteinte pour ρ ≃ 3, 83,
3, 83 λ0 fo′
donc encore pour rP ≃ ; cette distance correspond au rayon d’un cercle
2π R
sombre (E = 0) qui entoure une tache circulaire très lumineuse. Cette tache porte le
nom de tache d’ Airy‡ , et son rayon est donné par :
4J12 (ρ)
E(rP )
ρ2
1 E0
1, 7 % 1, 7 % × E0
ρ rP
3, 83 7, 02 rA 1, 8 × rA
4J12 (u)
Figure 7.20 – Tracé des fonctions u 7→ et rP 7→ E(rP )
u2
λ0 fo′
rA = 0, 61 (7.21)
R
On remarque sur les tracés de la figure 7.20 que la tache d’Airy est une zone cir-
culaire entourée d’un cercle faiblement lumineux (avec une luminosité maximale de
l’ordre de grandeur de 1, 7 % de celle observée au centre de la figure) ; on peut vi-
sualiser l’existence de cet anneau sur la figure 7.21, qui représente sur un diagramme
tridimensionnel l’éclairement en fonction des coordonnées d’espace.
Figure 7.21 – Représentation de l’éclairement dans la tache d’Airy
Il est important de retenir l’expression (7.21) du rayon de la tache d’Airy ; on peut

d’ailleurs en retrouver l’ordre de grandeur en remarquant qu’une pupille circulaire
de rayon R (et donc de surface πR2 ) doit former une tache de diffraction de même
largeur angulaire qu’une pupille carrée de côté a (et donc de surface a2 ) sous réserve
que leurs surfaces soient comparables.
En imposant πR2 ∼ a2 , la largeur angulaire de la tache d’Airy à sa base (ou diamètre
λ0 2 λ0 λ0
angulaire) peut être estimée à 2 ∼ √ = 1, 13 ; cette valeur n’est pas exac-
a π R R
tement identique à celle déduite de l’étude qui précède, mais elle s’en approche assez
pour appuyer le résultat (7.21), qu’on peut d’ailleurs recopier sous la forme :
λ0 fo′
∆α = 1, 22 rA = ∆α (7.22)
R 2
2 Application : considérons un système optique quelconque, dont le diaphragme

d’entrée est circulaire de rayon R. Les faisceaux lumineux entrant dans ce système
subissent une diffraction qui remplace chaque rayon lumineux par un faisceau élargi,
de diamètre angulaire ∆α. On considère alors que le reste du dispositif n’est pas
limitant du point de vue de la diffraction, c’est-à-dire que les diaphragmes des lentilles
ultérieures sont de diamètre supérieur au diamètre des faisceaux dans le système.
b E
pupille P θ
∆α
∆α
θ 2
∆α
b
Figure 7.22 – Résolution angulaire et tache d’Airy
Une telle ouverture angulaire ∆α ne permet pas de distinguer des objets qui éclairent
le système optique sous des angles trop proches, car alors leurs taches d’Airy se re-
couvrent ; la figure 7.22 illustre ce cas, dans le cas où les objets sont effectivement
angulairement résolus car leur écart angulaire θ est assez élevé.
On rend quantitative cette affirmation en imposant le critère de Rayleigh pour la
séparation des faisceaux issus des deux objets observés : on dit qu’il y a séparation si
l’écart θ entre les maxima est supérieur à la demi-largeur à la base de l’un d’eux :
λ0
θ > θmin = 0, 61 (7.23)
R
Cette relation constitue la justification quantitative de la figure 7.4. La résolution

angulaire ainsi déterminée, évaluée pour la longueur d’onde du maximum de sensibilité
de l’œil (λ0 ∼ 560 nm), est par exemple de l’ordre de grandeur de θmin ∼ 0, 7′′
pour R = 10 cm ; la résolution angulaire des instruments d’optique réels est toujours
moindre que cette limite théorique, du fait des autres défauts de l’appareil.
E E
∆α ∆α
La prévision théorique Le signal observé
Figure 7.23 – Un cas de non-résolution angulaire
La figure 7.23 montre un cas de non-résolution angulaire de deux images, en re-

marquant en particulier comment les bruits aléatoires enregistrés par le détecteur
dégradent la courbe (( théorique )) en interdisant de détecter le minimum de lumière

entre les deux images si ce minimum est trop peu marqué.
Enfin, la figure 7.24 compare les photographies d’une même galaxie spirale réali-
sées avec deux télescopes, l’un (à gauche), de diamètre 50 cm ; l’autre (à droite),
de diamètre 5 m. La différence de résolution entre les deux images est parfaitement
apparente.
Figure 7.24 – Photographies d’une galaxie spirale réalisée avec deux télescopes
Principe de Huygens et Fresnel : L’onde lumineuse observée en un point P

situé après une surface (Σ) peut être considérée comme la superposition d’on-
delettes sphériques, émises par des sources infinitésimales fictives sur la surface
(Σ). Ces ondelettes se propagent jusqu’en M , où on peut écrire l’amplitude
x T (M )w (M ) 2π
i
complexe w(P ) = κ exp −j (M P ) dΣ, si T (M ) est la
MP λ0
M ∈(Σ)
transmittance (complexe) de la pupille en M .
Pour une pupille plane, éclairée et observée dans
les conditions
de Fraunhofer,
x 2π
on peut écrire w(P ) ≃ Kw(S) T (M ) exp −j (SM P ) dxdy où on peut
λ0
M ∈P
écrire (SM P ) = (SOP ) − OM · (ud − ui ) ; l’amplitude complexe diffractée en
P ne dépend alors que des variations des cosinus directeurs, ∆α = ex ·(ud − ui )
et ∆β = ey · (ud − ui ) si (Oz) est la normale
à la pupille, avec
l’intégrale de
x 2π
Fraunhofer w(P ) ≃ Kw0 T (x, y) exp j (x∆α + y∆β) dxdy.
λ0
M ∈P
Les variations des cosinus directeurs ∆α ou ∆β s’expriment, pour une diffrac-

tion aux grands angles, comme une différence de sinus (sin θd −sin θi ) ; pour une
utilisation dans les conditions de Gauss, on peut l’écrire en fonction de la fo-
cale f ′ du système d’observation et des coordonnées du point P d’observation,
∆α = xP /f ′ et ∆β = yP /f ′ , l’origine des coordonnées du plan d’observation
étant prise au niveau de l’image géométrique de la source (point seul éclairé en
l’absence de pupille).
Une translation de la pupille dans son plan ne s’accompagne d’aucune modi-
fication de la figure de diffraction : l’amplitude complexe subit un déphasage
global et l’éclairement est inchangé.
La diffraction par une pupille fine et allongée se fait principalement dans la
direction perpendiculaire à la plus grande dimension de la pupille.
La diffraction se traduit par un écart angulaire de part et d’autre de l’image
géométrique. Pour une pupille rectangulaire de largeur a, le diamètre angulaire
d’ouverture (largeur à la base du pic central de diffraction) est 2λ0 /a. Pour
une pupille circulaire de rayon R, le diamètre angulaire d’ouverture (diamètre
d’ouverture de la tache d’Airy) est 1, 22λ0 /R.
L’éclairement résultant de la diffraction à l’infini par une pupille rectangulaire
πa∆α πb∆β
de cotés a selon (Ox) et b selon (Oy) s’écrit E(P ) = E0 sinc2 sinc2 .
λ0 λ0
Chapitre 8
Interférences à deux ondes
8.1 Le phénomène d’interférence
8.1.1 Présentation
2 Définitions : on parle d’interférences lorsque, en présence de plusieurs faisceaux lu-
mineux éclairant la même région de l’espace, l’éclairement E (ou l’intensité lumineuse)
n’est pas identique à laX somme des éclairements correspondant aux divers faisceaux,
pris séparément : E =
6 Ei .
i
Dans ce chapitre, nous nous intéresserons essentiellement aux interférences à deux
ondes ; la différence E − (E1 + E2 ), lorsqu’elle existe, porte le nom de terme d’inter-
férence. La présence de ce terme se traduit en général par une alternance de zones
sombres et claires : on parle de franges, respectivement sombres et claires, quelle que
soit la géométrie de ces zones.
La conservation de l’énergie totale impose bien sûr que l’énergie totale, sommée sur
l’ensemble de la zone éclairée, reste égal à la somme des énergies qui seraient envoyées
indépendamment
Z Z par
Z les deux faisceaux qui interfèrent ; on peut par exemple écrire
EdS = E1 dS + E2 dS si les intégrales sont étendues à toute la zone éclairée par
l’un ou l’autre des faisceaux.
2 Historique : dès , Newton décrit des phénomènes d’interférence (les anneaux
qui portent son nom, qui apparaissent entre deux surfaces réfléchissantes très proches)
et en propose une interprétation partielle, dans le cadre de la théorie corpusculaire de
la lumière dont il est l’auteur.
L’anglais Young, dont les centres d’intérêt sont multiples, réalise une série d’expé-
riences relatives aux interférences, dont certaines sont décrites plus loin ; il suggère
alors en  une interprétation ondulatoire et propose alors une première évaluation,
essentiellement correcte, de la longueur d’onde des ondes lumineuses pour différentes
couleurs.
Enfin, les travaux de Fresnel‡ à partir de  fondent la version moderne de la
théorie ondulatoire de la lumière et permet une interprétation correcte tant des phé-
nomènes de diffraction que des phénomènes d’interférence.
Finalement, les phénomènes d’interférence ont trouvé de nombreuses applications dans
la métrologie des petites dimensions, avec notamment les travaux de Michelson ;
l’appareil développé par ce dernier et ses applications seront présentés ultérieurement.
8.1.2 Interférences et cohérence
2 Éclairement en présence de deux ondes : nous décrirons les phénomènes d’inter-

férence dans le cadre du modèle scalaire de la lumière ; cette description est aussi
adaptée à l’étude des interférences entre ondes de nature quelconque, par exemple
entre ondes sonores, sous la seule réserve que l’amplitude w(t) étudiée en présence de
deux ondes puisse s’écrire comme la somme W (t) = W1 (t) + W2 (t) des amplitudes
dues, séparément, aux deux ondes qui interfèrent.
On remarquera bien sûr l’analogie fondamentale avec l’étude des phénomènes de

diffraction. Tandis que ceux-ci se déterminent par l’étude de la superposition li-
néaire d’une infinité d’ondes émises par des sources infiniment voisines, les phéno-
mènes d’interférence s’étudient par la somme d’un nombre plus restreint d’ampli-
tudes d’ondes lumineuses, mais on verra que les amplitudes ainsi sommées peuvent
présenter des déphasages plus conséquents. Dans les deux cas, l’ajout des amplitudes
mettra en évidence l’importance des déphasages relatifs des diverses ondes.
Le calcul de l’amplitude totale étant donc essentiellement linéaire, on pourra procéder,
pour ce calcul, par l’intermédiaire d’une notation complexe et écrire W = W 1 + W 2 .
Naturellement, on ne fera pas l’erreur d’appliquer les mêmes méthodes de super-

position linéaire à l’éclairement lumineux, qui est une grandeur quadratique et non
linéaire !
2 Temps de réponse des récepteurs : les deux amplitudes W i (i = 1 ou 2) ainsi que
leur somme W sont des grandeurs à variation très rapide dans le temps ; il en va a
priori de même de l’éclairement |W |2 qui en résulte. Rappelons par exemple ici que,
pour une onde lumineuse de longueur d’onde λ0 ∼ 500 nm, la fréquence associée est
ω c0
f= = ∼ 6 × 1014 Hz ; cette fréquence est beaucoup plus élevée que ce qui est
2π λ0
accessible aux récepteurs lumineux usuels.
Ainsi, le temps de réponse de l’œil humain peut être évalué à τ ∼ 25 ms ; un signal plus
rapide (un clignotement à 50 Hz par exemple) ne sera pas perçu. Une photodiode ou
un dispositif à transfert de charge (Charge Coupled Device ou CCD) peut suivre sans
difficulté des phénomènes un peu plus rapides, par exemple jusqu’à τ ∼ 10 ms pour
une photodiode ou τ ∼ 10 µs pour un CCD ; toutefois, ces durées restent toujours
très longues devant la période de variation de |W |2 .

On écrira alors E1 = |W 1 |2 et E2 = |W 2 |2 les éclairements apportés par les deux
faisceaux, pris séparément, tandis

que l’éclairement
observé en présence des deux
ondes simultanément est E = |W 1 + W 2 |2 ; dans ces expressions, on rappelle que la
notation hi désigne la moyenne temporelle surZ une durée caractéristique τ du récepteur
1 τ
ou de l’appareil de mesure utilisé : hf i = f (t)dt.
τ 0
La présence ou non de phénomènes d’interférence a donc pour origine la présence du
double produit dans le calcul du module carré |W 1 + W 2 |2 , après calcul de la moyenne
temporelle de ce double produit.
2 Déphasage et interférences : considérons un point M éclairé par deux faisceaux,
correspondant aux deux amplitudes complexes W 1 = w01 exp (jΦ1 (t)) et W 2 =
w02 exp (jΦ2 (t)). Dans ces expressions, les amplitudes (réelles) w01 et w02 peuvent
dépendre du point M : par exemple, si celui-ci est atteint après un trajet plus ou
moins long, ou à travers un milieu plus ou moins absorbant, on en tiendra compte
dans l’amplitude w0i .
Les phases Φi (t) dépendent évidemment aussi du point considéré ; rappelant les ex-
pressions w(M ) = w(S) exp (−jk0 (SM )) pour la relation entre l’onde en M et celle
8 : Interférences à deux ondes 169
au niveau de sa source S, ainsi que W (M ) = w(M ) exp (jωt), avec aussi ω = c0 k0 et

k0 = 2π/λ0 , on voit que les variations de la phase Φ(t) ont au moins trois origines :
– des variations temporelles rapides liées à la pulsation, donc à la longueur d’onde de
l’onde lumineuse ;
– une phase liée directement à la position de M , ou plus précisément au chemin
optique suivi par l’onde considérée depuis sa source jusqu’en M ;
– enfin, les éventuelles variations de la phase de l’onde à l’origine, lors de son émission
au niveau de cette source.
On notera donc :
2π
Φi (t) = ωi t − (Si M ) − ϕ0i (t) (8.1)
|{z} λ0i | {z }
oscillation rapide | {z } phase à l’émission
terme de propagation
La présence du terme ϕ0i (t) mérite une explication : il s’agit d’une conséquence des
mécanismes d’émission des ondes lumineuses par les sources de lumière. Ces ondes
ne sont pas émises de façon permanente, mais sous forme de trains d’onde de durée
limitée. Un train d’onde commence à être émis lorsqu’un atome de la source, préala-
blement excité par une source d’énergie, commence à se désexciter. Il cesse d’exister
lorsque l’atome émetteur est perturbé (par exemple par un choc au sein du milieu qui
constitue la source de lumière).
Lorsque l’émission lumineuse reprend un peu plus tard, il n’existe pas de corrélation
entre la phase du nouveau train d’onde et celle du train d’onde qui l’a précédé ; ainsi, la
grandeur ϕ0i (t) varie de manière complexe au gré des émissions successives des trains
d’ondes qui se succèdent, sauf s’il existe un phénomène de synchronisation (comme
par exemple le mécanisme d’émission stimulée, dans le cas des lasers).
Il reste à évaluer la moyenne temporelle de |W 1 + W 2 |2 = (W 1 + W 2 ) (W ∗1 + W ∗2 )
qui s’écrit, après développements, |W 1 |2 + |W 2 |2 + W 1 W ∗2 + W ∗1 W 2 .
Rappelons ici quelques propriétés des nombres complexes qui seront souvent utiles
dans la suite. En plus de la relation |z|2 = zz ∗ déjà utilisée ci-dessus, rappelons
que z + z ∗ = 2 Re(z) ; en particulier, si on adopte la notation trigonométrique
z = ρ exp (iθ), alors z + z ∗ = 2ρ cos θ. De même, on montre sans difficulté que, si
z1 = ρ1 exp (iθ1 ) et z2 = ρ2 exp (iθ2 ), alors |z1 +z2 |2 = ρ21 +ρ22 +2ρ1 ρ2 cos (θ1 − θ2 )
et |z1 − z2 |2 = ρ21 + ρ22 + 2ρ1 ρ2 sin (θ1 − θ2 ).
En fonction des amplitudes et phases des deux ondes, cette grandeur s’écrit encore
2 2
w01 + w02 + 2w01 w02 cos (Φ1 (t) − Φ2 (t)) ; on reconnaı̂t ici les expressions des éclai-
2
rements Ei = w0i (sous réserve que w0i soit indépendant du temps, ce que nous
supposerons ici) ; il vient donc l’expression :
p
E(M ) = E1 (M ) + E1 (M ) + 2 E1 (M )E2 (M ) hcos (Φ1 (t) − Φ2 (t))i (8.2)
| {z }
le terme d’interférence éventuel
Notons bien que ce résultat ne s’applique que pour l’étude des interférences à deux
ondes ! Dans le cas où un plus grand nombre de termes sont à prendre en compte,
on devra procéder à l’addition des complexes W i avant de calculer la moyenne du
module du carré de cette somme de plus de deux termes. Nous verrons ultérieurement
sous quelles conditions on peut aussi dégager une expression générale, qui sera de
toutes façons différente de (8.2).
8.1.3 Conditions de cohérence

2 Cohérence temporelle : on dira qu’il y a cohérence des deux faisceaux qui éclairent
le point M si le terme d’interférence n’est pas systématiquement nul du fait de la
moyenne temporelle
qui le définit.
Ce terme d’interférence
est proportionnel
à la
(S1 M ) (S2 M )
moyenne de cos [ω1 − ω2 ] t − 2π − − [ϕ01 (t) − ϕ02 (t)] , terme qui
λ01 λ02
varie rapidement dès lors que ω1 6= ω2 : une telle situation est en général incompatible
avec l’observation d’interférences.
Une première condition nécessaire est donc d’imposer ω1 = ω2 , c’est-à-dire aussi
λ01 = λ02 : les deux faisceaux doivent impérativement est monochromatiques, à la
même fréquence.
Notons d’abord que même deux raies de longueur d’onde très voisines, comme le
sont les composantes du doublet jaune des lampes à vapeur de sodium par exemple,
ne sauraient interférer ; avec des longueurs d’onde écartées seulement d’un millième
ω 2πc0
en valeur relative, on aura ω1 − ω2 ∼ = donc, avec λ0 ∼ 600 nm,
1 000 1 000λ0
12
un écart ω1 − ω2 de l’ordre de 3 × 10 rad · s ; il n’existe à l’heure actuelle
−1
pas de dispositif électronique assez rapide pour détecter et mesurer un signal de

fréquence aussi élevée. Il existe toutefois des exceptions, lorsque les deux faisceaux
ont initialement la même longueur d’onde mais lorsque celle-ci subit un décalage
relatif très faible (bien plus faible que le facteur 10−3 évoqué ci-dessus) du fait de
sa propagation ; c’est pas exemple le cas des interféromètres à effet Sagnac.
Sous cette première condition,
le terme d’interférence devient proportionnel à la va-
2π
leur moyenne de cos [(S1 M ) − (S2 M )] + [ϕ01 (t) − ϕ02 (t)] , où on a noté λ0 la
λ0
longueur d’onde (dans le vide) unique correspondant aux deux faisceaux. Dans cette
expression, le premier terme est en général indépendant du temps ; on notera alors la
différence de marche au point M entre les deux faisceaux sous la forme :
δ(M ) = (S1 M ) − (S2 M ) (8.3)
et seules les éventuelles variations temporelles de ϕ01 (t) − ϕ02 (t) peuvent encore em-
pêcher l’observation des interférences. Pour bien comprendre l’origine des variations
temporelles de ϕ0i (t), rappelons une fois encore le mécanisme de l’émission de lumière
dans une source lumineuse. Un atome, excité par un apport d’énergie extérieur (ther-
mique, électrique, etc.) se désexcite par émission d’une onde sinusoı̈dale, jusqu’à ce
que cette émission soit interrompue, par exemple par un choc avec un autre atome.
L’onde émise a alors la forme d’une succession de trains d’onde, chacun correspondant
à une phase aléatoire.
La durée de chacun des trains d’onde, ainsi que la durée de l’intervalle qui sépare deux
trains d’onde consécutifs, est a priori aléatoire ; cependant, chacune de ces durées reste
en général du même ordre de grandeur, que nous noterons τc ou temps de cohérence.
La figure 8.1 présente la forme des trains d’onde W 1 et W 2 émis par deux sources
indépendantes, ainsi que les variations des phases associées ; on constate que, pendant
les intervalles de temps où les deux trains d’ondes W 1 et W 2 coexistent, leur déphasage
ϕ01 − ϕ02 varie très rapidement au cours du temps.
2 Condition de cohérence temporelle : sauf exception, la fréquence très élevée des
chocs dans le milieu qui constitue la source de lumière impose des variations très
rapides des deux phases ϕ01 (t) et ϕ02 (t) ; en général, leur différence varie plus vite
ϕ01 (t) − ϕ02 (t)
intervalles de
W1 (t) temps où les deux
ondes coexistent
W2 (t)
Figure 8.1 – Émission de trains d’onde successifs
que ne peuvent suivre les appareils de mesure, et en moyenne le terme d’interférence

disparaı̂t toujours.
Finalement, la seule situation permettant l’observation d’interférences correspond à
ϕ01 (t) − ϕ02 (t) constant à tout instant, c’est-à-dire à l’éclairage du point M par deux
faisceaux provenant initialement des mêmes atomes, avec en particulier une relation
de phase fixe à l’émission.
Condition de cohérence temporelle

X On ne pourra observer d’interférence en un point M que si les deux
(ou plus) faisceaux qui éclairent le point M correspondent à des sources
exactement synchrones, de même fréquence et de même phase. Il faut
pour cela que ces différents faisceaux parviennent au point M en pro-
venant initialement de la même source S, vie des trajets éventuellement
différents.
On écrit alors en général l’expression de l’éclairement sous la forme (8.4), qui porte
parfois le nom de formule fondamentale des interférences à deux ondes :

p 2π
E(M ) = E1 (M ) + E2 (M ) + 2 E1 (M )E2 (M ) cos δ(M ) + ∆ϕ0 (8.4)
λ0
On retranscrit parfois cette relation sous une forme faisant intervenir exclusivement
des déphasages, en fonction d’un déphasage lié à la différence de marche ∆ϕ :
2π p
∆ϕ = δ(M ) E = E1 + E2 + 2 E1 E2 cos (∆ϕ + ∆ϕ0 ) (8.5)
λ0
Au contraire, on préfère parfois utiliser une forme faisant intervenir exclusivement des
trajets optiques, en fonction d’une différence de marche (fictive) optique δ0 :
2π p 2π
∆ϕ0 = δ0 E = E1 + E2 + 2 E1 E2 cos (δ(M ) + δ0 ) (8.6)
λ0 λ0
Signalons quelques causes qui permettent de justifier l’existence d’un terme δ0 ou

∆ϕ0 non nul, même pour un éclairage de M à partir d’une source unique : il suffit
d’interposer sur un des deux trajets de la lumière parvenant en M un dispositif dé-
phasant : lame de verre d’indice n à traverser, miroir réfléchissant avec un déphasage
la lumière qui l’éclaire, etc.
2 Trains d’onde et étalement en fréquence : dans toute la suite, nous considérerons

que les trains d’onde ont, en moyenne, la durée τc ; l’étude générale des fonctions
non périodiques menée dans le cadre de l’analyse de Fourier montre alors qu’un train
d’onde, grandeur de durée ∆t = τc , ne correspond pas à une onde strictement mono-
chromatique (qui serait un train d’onde de durée infinie) ; il s’agit en fait d’une onde
quasi monochromatique, caractérisée par son étendue ∆ω ou ∆f en pulsation ou en
fréquence de part et d’autre de la fréquence centrale des oscillations sinusoı̈dales.
1
La relation générale ∆t×∆ω ∼ 2π permet d’écrire ici ∆f ∼ : plus les trains d’onde
τc
sont de courte durée, moins la source peut être considérée comme monochromatique.
c0
On peut aussi utiliser la relation λ0 = entre longueur d’onde et fréquence pour
f
remarquer que des petites variations de fréquence et de longueur d’onde sont reliées par
c0 c0
dλ0 = − 2 df ; puisque on a montré que |df | 6 ∆f , on en déduit que |dλ0 | 6 2 ∆f :
f f
une source émettant des trains d’onde présente donc un étalement en longueur d’onde
c0 ∆f
∆λ0 donné par la relation ∆λ0 = 2 ∆f = λ20 , ce qu’on notera :
f c0
∆λ0 1
2 = (8.7)
λ0 c0 τc
On retrouve ici encore que, plus les termes τc et ∆λ0 sont grands, moins on peut
considérer que la source est monochromatique.
2 Longueur de cohérence : en réalité, l’expression (8.4) ne constitue qu’une première
approche du phénomène d’interférence. En effet, la présence de la différence de marche
2π
δ = (S1 M )−(S2 M ) ou du déphasage ∆ϕ = δ signifie que les ondes qui sont parties
λ0
au même instant de la source lumineuse S atteignent le point M avec un décalage
|δ|
temporel τ = ; les deux ondes qu’on doit additionner au point M sont alors
c0
représentées sur la figure 8.2, où on a représenté en traits gras un train d’ondes (de
durée τc ), tel qu’il parvient en M par les voies de chemins optiques respectifs (S1 M )
et (S2 M ).
En traits plus fins, on a tracé les trains d’onde qui précèdent ou suivent celui qui nous
intéresse ; sans rapport de phase deux à deux, l’addition de ces ondes non cohérentes
ne peut donc mener à l’observation d’interférences. Les seuls intervalles de temps
où le phénomène d’interférence se produit sont alors encadrés sur la figure 8.2 ; ces
intervalles ont pour durée τc − |δ|/c0 .
W2 (t)
t
|δ|/c0
τc
W1 (t)
t
Figure 8.2 – Longueur de cohérence
Finalement, on aura pour terme d’interférence

une grandeur nulle pendant une durée
2π
|δ|/c0 , et un terme cos δ + ∆ϕ0 pendant le reste τc −|δ|/c0 de la durée du trains
λ0
d’onde ; à partir de ce moment, le phénomène reprend avec les trains d’onde suivants.
Si on suppose pour simplifier que tous les trains d’onde ont (au moins en moyenne)
la même durée τc , on en conclut que l’éclairement observé en M prend la forme
p τc − |δ|/c0 2π
E = E1 + E2 + 2 E1 E2 cos δ + ∆ϕ0 si |δ|/c0 6 τc , et E = E1 + E2
τc λ0
(donc pas du tout d’interférence) si |δ|/c0 > τc .
f (δ)
1
ℓc ℓc δ
Figure 8.3 – Influence de la longueur finie des trains d’onde : tracé de f (δ)
Notant ℓc = c0 τc pour la longueur (spatiale, moyenne) d’un train d’onde, ou longueur
p 2π
de cohérence, on pourra écrire E = E1 +E2 +2 E1 E2 f (δ) cos δ + ∆ϕ0 et déduire
λ0
ℓc − δ
du tracé 8.3 de f (δ) = une condition supplémentaire de cohérence temporelle :
ℓc
Longueur de cohérence
X On ne peut observer d’interférences que pour des différences de marche
δ inférieures (en valeur absolue) à la longueur de cohérence (ou longueur
des trains d’onde) ℓc .
Plus généralement, du fait de la longueur finie des trains d’onde, les
phénomènes d’interférence sont bien marqués pour des différences de
marche faibles, et sont de moins en moins visibles pour des différences
de marche élevées, et proches de ℓc .
Les ordres de grandeur de ℓc dépendent de la nature de la source lumineuse, et des

phénomènes qui gouvernent l’émission lumineuse au sein de celle-ci ; le tableau 8.1
présenté plus bas présente quelques ordres de grandeur pour ℓc et pour N = ℓc /λ0 ,
qui est une grandeur sans dimension qui évalue le nombre de motifs de sinusoı̈des
comprises dans un train d’ondes moyen.
En utilisant la relation (8.7), on peut aussi écrire :
λ20
ℓc = c0 τc = (8.8)
∆λ0
∆λ0 1
On en déduit l’élargissement spectral relatif = , qui constitue une autre
λ0 N
mesure du caractère monochromatique de la source utilisée ; il figure également dans
le tableau 8.1.
Source ℓc N ∆λ0 /λ0
Laser CO2 stabilisé (infrarouge) 30 km 3 × 109 3 × 10−10
Laser Hélium–Néon 30 cm 50 000 2 × 10−5
Raie rouge de l’Hydrogène 4 mm 6 500 1, 6 × 10−4
Lumière naturelle avec filtre coloré ∼ 10 µm ∼ 25 ∼ 0, 04
Lumière blanche ∼ 0, 5 µm ∼1 ∼1
Table 8.1 – Valeurs numériques de la longueur de cohérence
La grande variété des ordres de grandeur présents dans ce tableau impose quelques
commentaires. On remarque d’abord l’excellente monochromaticité des sources laser ;
qui est bien meilleure qu’une source spectrale obtenue par exemple en isolant une raie
d’émission d’une source à Hydrogène.
Au contraire, l’emploi d’un simple filtre coloré ne permet pas de définir une source
monochromatique : si la lumière qui en est issue semble d’une teinte unique à l’œil, il
n’en est rien en réalité.
Enfin, les valeurs concernant la lumière blanche ont été évaluées en considérant qu’il
s’agit d’ondes couvrant tout l’intervalle des longueurs d’onde de λmin = 400 nm à
λmax = 800 nm ; l’intervalle correspondant ∆λ0 = λmax − λmin = 400 nm est donc
bien du même ordre de grandeur que la longueur d’onde moyenne λ0 correspondant
au domaine visible.
2 Cohérence spatiale : la condition de cohérence temporelle énoncée ci-dessus est, en
fait, extraordinairement restrictive si on la prend au sens strict : exiger qu’une source
unique S éclaire le point M par au moins deux voies différentes, c’est restreindre
l’étude des interférences aux phénomènes éclairés par un atome unique ! Comme on
va le voir, il suffit en fait d’utiliser une source de très petites dimensions, même si elle
contient bien évidemment un très grand nombre de sources ponctuelles.
Considérons en effet plusieurs atomes sources k = 1, 2, . . ., qui éclairent par deux voies
différentes le même point d’observation M . Nous admettrons aussi qu’un dispositif
approprié sélectionne une longueur d’onde unique, mais aussi que la différence de
marche δ = (SM )1 − (SM )2 est assez faible devant la longueur de cohérence de la
source.
On peut alors
X écrire l’amplitude lumineuse complexe en M sous la forme de la somme
w(M ) = wk1 (M )+wk2 (M ) où l’amplitude wki (M ) correspondant à l’atome émetteur
k
k K 2π
numéro k et à la voie i (i = 1, 2) vérifie wi (M ) = wi (S) exp −j (SM )i .
λ0
Prenant en compte la différence des deux modules du aux différences d’éclairement

k
p
k
p 2π
des deux voies, on peut noter w1 (M ) = H k E1 et w2 (M ) = H k E2 exp j δ) .
λ0
Dans cette expression, le coefficient H k a un module Hk et une phase ψk , qui décrivent

respectivement la contribution de l’atome particulier étudié à l’amplitude totale de
l’onde émise et la phase à l’émission par cet atome particulier. On remarquera que le
même coefficient H k intervient pour les deux voies 1 et 2 qui éclairent le point M : un
atome k donné contribue pour la même proportion et avec la même phase à l’origine
aux ondes qui parviennent en M par ces deux voies ; à l’arrivée, le seul déphasage est
dû à la différence de marche δ.
En l’absence d’interférences, si le point M était éclairé par la seule
X voiep 1, on aurait
ainsi en présence de tous les atomes émetteurs wtotal (M ) = Hk E1 exp (jψk ) ;
2k
X p

l’éclairement correspondant serait alors Hk E1 exp (jψk ) . Dans cette somme,

k
les produits croisés exp (j [ψi − ψj ]) correspondent, pour un grand nombre d’atomes
émetteurs, à une somme nulle (somme d’un grand nombre de nombres complexes X
2
arbitrairement déphasés) ; il reste donc pour éclairement |wtotal (M )| ≃ Hk2 E1 ;
X k
puisqu’on doit obtenir ici E1 , on en déduit que Hk2 = 1.
k
On réinterprète ainsi le coefficient Hk en affirmant que l’atome numéro k contribue
H2
pour la fraction P k 2 = Hk2 à l’éclairement total.
k Hk
Considérons à nouveau la situation d’interférence, le point M étant éclairé par les

différents atomes k = 1, 2, . . . par deux voies présentant une différence de marche δ.
On peut alors réécrire l’amplitude
p complexe
totaleen M sous la forme d’un produit
p 2π X
de deux termes w(M ) = E1 + E2 exp j δ H k que l’on écrit encore sous
λ0
k
la forme w(M ) = Σ × Σ′ .

p p 2π
Le premier terme est une somme Σ = E1 + E2 exp j δ de nombres complexes
λ0
présentant un déphasage fixe et constant ; typiquement, on parlera de terme d’inter-
férence correspondant à un éclairage cohérent. Il permet, lors du passage au calcul de
l’éclairement, d’obtenir la fonction d’interférences
désormais classique à deux ondes
2
p 2π
puisque |Σ| = E1 + E2 + 2 E1 E2 cos δ .
λ0
X X
Le second terme est une somme Σ′ = Hk = Hk exp (jψk ) présentant des dé-
k k
phasages aléatoires, c’est-à-dire correspondant
2 X à plusieurs
X ondes incohérentes entre
elles. Là aussi, dans la somme Σ′ = Hk2 + 2 Hi Hj cos (ψi − ψj ), le grand
k i<j
nombre de cosinus d’angles prenant des valeurs aléatoires sera en général faible, et
même
′ 2 exactement
X nul en moyenne temporelle : il ne restera donc finalement que
Σ = 2
Hk = 1. Ce terme constant, réel, traduit simplement l’addition des éclai-
k
rements en l’absence de relation de phase entre les ondes issues d’atomes différents.
Finalement, la seule condition pour observer effectivement des franges d’interférence
avec une source formée d’un grand nombre d’atomes est la mise en facteur du terme
d’interférence Σ, qui doit être le même pour tous les atomes de la source ; il suffit
pour cela que la différence de marche δ = (SM )1 − (SM )2 soit constante pour tous
les atomes source, donc que la position de tous ces atomes soit confondue avec un
point unique S avec une précision suffisante.
Condition de cohérence spatiale

X On ne pourra observer d’interférence en un point M que si les divers
faisceaux qui éclairent le point M sont issus de sources ponctuelles.
En pratique, il suffira bien sûr que la dimension spatiale de la source soit assez réduite
pour que la différence de marche δ = (SM )1 −(SM )2 ne change pas quand on parcourt
tousles points
de la fente source ; les variations ∆δ doivent en particulier être telles
∆δ
que
≪ π.
λ0
On mémorisera aussi les résultats obtenus ci-dessus à l’occasion du calcul de l’éclaire-
ment observé en présence d’une source étendue sous la double forme très importante :
Éclairage cohérent
X Lors de la somme de plusieurs ondes cohérentes entre elles (issues de la
même source, synchrones),
X on procède à l’addition des amplitudes com-
plexes wtotal = wi avant de calculer l’éclairement E = |wtotal |2 cor-
i
respondant ; les différentes phases intervenant dans cette somme, étant
en relation invariable au cours du temps, font en général intervenir un
terme d’interférence.
Éclairage incohérent
X Lors de la somme de plusieurs ondes incohérentes entre elles (issues de
sources différentesXou non synchrones), on procède à l’addition des éclai-
rements Etotal = Ei puisque les déphasages entre amplitudes varient
i
de manière aléatoire.
8.1.4 Franges d’interférence

2 Ordre d’interférence : nous utiliserons provisoirement l’expression
p déjà établie pour
des interférences à deux ondes, E(M ) = E1 (M )+E2 (M )+2 E1 (M )E2 (M ) cos ∆ϕ avec
δ(M )
∆ϕ = 2π , dans le cas où la longueur de cohérence est nettement plus importante
λ0
que la différence de marche δ(M ).
Si les fonctions Ei (M ) varient assez lentement, que l’éclairement présente un maximum
local à chaque fois que ∆ϕ ≡ 0[2π], et un minimum lorsque ∆ϕ ≡ π[2π] ; on parle
respectivement de franges claires et de franges sombres, et on notera :
∆ϕ = 2pπ δ(M ) = pλ0 (8.9)
où la grandeur p porte le nom d’ordre d’interférence ; cet ordre est unpentier pour
une frange claire (p ∈ Z), avec pour éclairement Emax = E1 + E2 + 2 E1 E2 ; c’est
1
un demi-entier (ce terme, en Physique, désigne un élément de + Z, ou encore
2
la moitié d’un entier
p relatif impair) pour une frange sombre, avec pour éclairement
Emin = E1 + E2 − 2 E1 E2 .
Le lien entre frange claire et ordre d’interférence entier n’est pas restreint au seul
cas des interférences à deux ondes ; on verra progressivement qu’on obtient le même
résultat dans tous les cas de systèmes interférentiels lorsque les interférences sont
la cause principale de variation de la luminosité en fonction de la position du point
d’observation M .
2 Contraste des franges : les courbes de la figure 8.4 montrent la répartition d’éclai-
rement en fonction de la différence de marche, dans les deux cas où E1 ≃ E2 (à gauche)
et E1 > E2 (à droite) ; on voit que, dans le second cas, on n’observe pas d’annulations
de l’éclairement au niveau des franges sombres ; on dira encore que le contraste des
franges est plus faible dans le second cas.
E1 ≃ E2 E E1 > E2 E
δ δ
b b b b b b
−λ0 +λ0 −λ0 +λ0
Figure 8.4 – Interférences à deux ondes et contraste
On définit de façon quantitative le contraste des franges, pour évaluer la différence

d’éclairement entre les franges claires et les franges sombres, par la relation :
Emax − Emin
C= (8.10)
Emax + Emin
C’est une grandeur sans dimension, positive par construction, et qui peut atteindre
au maximum la valeur C = 1 lorsque Emin = 0. En particulier, dans lepcas des
interférences à deux ondes décrites ci-dessus,
√ on a vu que Emax = E1 + E2 + 2 E1 E2 et
p 2 E1 E2
Emin = E1 +E2 −2 E1 E2 donc C = : le contraste ne garde sa valeur maximale
E1 + E2
C = 1 que si E1 = E2 ; il s’annule seulement si E1 = 0 ou E2 = 0.
2 Fonction de visibilité : on a vu que la prise en compte de la longueur de cohérence
finie des trains d’onde qui interfèrent permet
d’expliciter
l’éclairement sous la forme
p ℓc − |δ| 2π
E(δ) = E1 + E2 + 2 E1 E2 cos δ + ∆ϕ0 ; plus généralement, nous ren-
ℓc λ0
contrerons souvent des dispositifs d’interférence à deux ondes permettant d’expliciter
l’éclairement sous la forme :

2π
E(δ) = E0 1 + V (δ) cos δ + ∆ϕ0 (8.11)
λ0
Dans ce cas, la fonction V (δ) porte √ le nom de fonction de visibilité ; dans le cas
2 E1 E2 ℓc − |δ|
précédent, on a par exemple V (δ) = .
E1 + E2 ℓc
Nous donnerons une interprétation générale de (8.11) dans le cas où V varie plus
2π
lentement que le terme d’interférence cos δ + ∆ϕ0 ; on peut alors représenter
λ0
l’allure des fonctions V (δ) et E(δ), à la même échelle, selon la figure 8.5.
V (δ) E
λ0 δ
Figure 8.5 – Fonction de visibilité et franges
On constate alors que le terme interférentiel oscille rapidement de −1 à +1, tandis

que l’éclairement oscille entre Emin = E0 (1 − |V (δ)|) et Emax = E0 (1 + |V (δ)|) ; on
identifie donc ici un contraste des franges, liée directement à la fonction de visbilité,
par la relation :
Emax − Emin
C= = |V (δ)| (8.12)
Emax + Emin
Notons ici que la fonction de visibilité peut changer de signe ; une zone où V (δ) < 0
est caractérisée par le phénomène d’inversion du contraste : dans ces zones, les
franges claires remplacent les franges sombres, et réciproquement.
8.1.5 Nature des franges

2 Sources secondaires : puisqu’on a vu que les interférences ne peuvent être observées
que si une source unique S0 , ponctuelle et monochromatique, éclaire le même point
M , l’existence de la différence de marche δ = (S1 M ) − (S2 M ) ne s’explique que par
l’existence de deux trajets différents pour éclairer le point M ; une telle situation est
par exemple représentée sur la figure 8.6, dans ce qu’on appellera dans la suite la
géométrie d’Young.
b
S1
M
b
b
S0
S2
b
Figure 8.6 – Sources secondaires
Cette géométrie d’Young est caractérisée par l’existence de deux points de passage
obligés des rayons lumineux, les sources secondaires S1 et S2 , à partir desquels on peut
éclairer plusieurs points M . La différence de marche entre les faisceaux qui interfèrent
en M peut alors s’écrire δtotal = (S0 S1 M ) − (S0 S2 M ), somme de deux termes :
– la différence δavant = (S0 S1 )−(S0 S2 ), qui est indépendante de M , peut s’interpréter
comme une différence de phase à l’émission par les sources secondaires, fictives,
placées en S1 et S2 .
On pourra en fait traiter S1 et S2 comme s’il s’agissait de sources synchrones avec

2π
un décalage de phase constant à l’émission, donné par ϕ0,1 − ϕ0,2 = δavant .
λ0
– la différence δaprès = (S1 M ) − (S2 M ), qui dépend de la position de M , et dont
le calcul sera purement géométrique, car nous supposerons toujours que les trajets
S1 M et S2 M sont purement rectilignes dans le vide ou, le cas échéant, des trajets
simples à travers des dispositifs optiques focalisants (des lentilles par exemple).
2 Franges rectilignes : nous adopterons la géométrie de la figure 8.7 ; la distance entre
les sources secondaires est notée a et l’observation sera réalisée en un point quelconque
M , éclairé par les deux sources secondaires S1 et S2 . On choisit un système d’axes de
sorte que les coordonnées de S1 et S2 sont respectivement (a/2, 0, 0) et (−a/2, 0, 0) ;
les coordonnées de M seront notées (x, y, z). De plus, on supposera ici que δavant = 0.
x p = −3
E
M b
p = −2
S1 S1 M
b
p = −1
a
O z
b bΩ
b p = +1
S2 S2 M
p = +2
D
p = +3
Figure 8.7 – Franges d’interférence et géométrie de Young
La différence de marche s’écrit alors δ(M ) = S1 M − S2 M et une frange d’ordre

p (claire si p est entier, sombre si p est demi-entier) a pour équation intrinsèque
S1 M − S2 M = pλ0 ; on reconnaı̂t l’équation d’une famille d’hyperboloı̈des de foyers
S1 et S2 , représentes ci-dessus pour diverses valeurs de p.
x
p = −3
p = −2
p = −1
Ω y
p=0
p = +1
p = +2
p = +3
Figure 8.8 – Forme des franges sur l’écran (Ωxy)
La forme exacte des franges observées sur un écran dépend de la position de cet écran ;
sur la figure 8.7, l’écran E est disposé parallèlement à l’axe S2 S1 et l’intersection des
franges claires avec l’écran d’observation prend alors la forme d’un réseau de courbes,
comme celles de la figure 8.8.
Nous nous placerons dans la suite dans le cas où la distance D entre les sources
et l’écran est beaucoup plus grande que toutes les autres dimensions mises en jeu :
D ≫ x, y, a. Les franges de la figure 8.8 sont alors très peu courbées au voisinage du
centre de la figure ; on peut en première approximation traiter ces courbes comme
des droites. On peut d’ailleurs obtenir une équation cartésienne
r de ces droites en
a 2
effectuant un développement limité des longueurs S1 M = x− + y 2 + D2 et
r 2
a 2 2 2
1 2 2 a2
S2 M = x+ + y + D , sous la forme S1 M ≃ D + x + y − ax +
2 2D 4
2
1 a
et S2 M ≃ D + x2 + y 2 + ax + , d’où enfin l’expression importante :
2D 4
ax
δaprès = S1 M − S2 M ≃ − (8.13)
D
ax λ0 D
Une frange δ = δavant − = pλ0 est donc une droite, d’équation xp = x0 − p ,
D a
où on a noté x0 = −Dδavant /a l’abscisse de la frange d’ordre zéro, qui porte aussi
souvent le nom de frange centrale.
On observe ainsi un réseau de franges rectilignes parallèles et équidistantes, la distance
de deux franges consécutives portant le nom d’interfrange i, avec :
λ0 D
i= (8.14)
a
La figure 8.9 montre l’aspect de telles franges ; on y constate aussi la perte progressive
de contraste de part et d’autre de la frange centrale.
abscisse x
sur l’écran
i
Figure 8.9 – Franges rectilignes dans un dispositif de Young
Remarquons que la relation (8.14) impose, pour une observation facile, une distance
a faible entre sources secondaires ; ainsi, avec un écran situé à D = 1 m des sources
secondaires et un éclairage monochromatique à la longueur d’onde λ0 = 500 nm
(dans le domaine visible), un interfrange i = 0, 5 mm sera obtenu avec une distance
des sources secondaires a = 1 mm.
On observera de telles franges rectilignes et équidistantes avec divers dispositifs pra-
tiques présentés plus loin : trous et fentes de Young, miroirs de Fresnel, coin d’air.
2 Franges circulaires : considérons maintenant le cas où l’écran d’observation E est
disposé perpendiculairement à l’axe S1 S2 , comme on le voit sur la figure 8.10.
Dans une telle géométrie, les franges d’interférence sont des intersections de courbes
(hyperboloı̈des) présentant l’axe de symétrie de révolution avec un écran qui présente
la même symétrie de révolution ; il s’agit donc nécessairement de cercles d’axe (Ox).
x
Mb
E
D
S1
b
z
S2 b
Figure 8.10 – Franges circulaires d’interférence à deux ondes
Sans donner d’équation algébrique générale de ces franges circulaires, nous noterons
seulement, par exemple en observant la figure 8.11, que ces franges ne sont en général
pas équidistantes ; on ne définira donc ici pas d’interfrange.
y
Figure 8.11 – Franges circulaires non équidistantes
On observera de telles franges circulaires, non équidistantes, avec divers dispositifs

pratiques présentés plus loin : bilentilles de Meslin, lame d’air, dispositif de Newton ;
l’étude générale de ces franges circulaires ne figure pas au programme.
On aura encore l’occasion d’étudier, dans un chapitre ultérieur, le dispositif interfé-
rentiel de Michelson ; celui-ci, qui permet des mesures de grande précision, permet
selon le réglage choisi de faire apparaı̂tre des franges rectilignes ou circulaires.
8.1.6 Observation à l’infini

2 Principe : on remplace souvent l’observation à grande distance D par une ob-
servation à l’infini, c’est-à-dire en pratique dans le plan focal image d’une lentille de
projection de distance focale image f ′ .
Nous traiterons ici le cas d’un dispositif à deux sources secondaires ponctuelles S1 et
S2 , cohérentes, distantes de a, dans les deux situations géométriques déjà décrites :
l’écran peut être parallèle à l’axe S1 S2 (avec formation de franges rectilignes) ou
perpendiculaire à cet axe (avec formation de franges circulaires).
2 Écran parallèle à l’axe S1 S2 : le schéma de principe est celui de la figure 8.12.
On n’a représenté, parmi tous les rayons issus de S1 et S2 , que deux d’entre eux ;
parallèles, ils convergent donc à l’infini ou, en pratique, après traversée de la lentille,
au point M situé dans le plan focal de celle-ci.
Le stigmatisme de la lentille, supposée utilisée dans le cadre des conditions de Gauss,
assure que le chemin optique (S1 K1 M ) est identique au chemin optique (HK2 M ),
puisque S1 et H sont dans un même plan perpendiculaire au faisceau parallèle dont
M est l’image.
x
K1
S1 b
α bM
α b x z
F′
a
b b K2
S2
H
f′
Figure 8.12 – Franges rectilignes à l’infini avec deux sources ponctuelles
On justifie aussi parfois cette propriété en évoquant le principe du retour inverse de

la lumière : en inversant le sens de parcours des rayons lumineux, l’image de M est
un faisceau parallèle dont S1 H est un plan de phase ; ainsi, (M S1 ) = (M H).
La différence de chemin optique se réduit alors à δ = (S1 M ) − (S2 M ) = −S2 H ;
considérant le triangle S1 S2 H, on a encore S2 H = a sin α où le rayon de construction
(fictif) passant par M et le centre optique de la lentille impose x = f ′ tan α.
Enfin, la lentille étant utilisée dans les conditions de Gauss, sin α ∼ tan α d’où l’ex-
pression de la différence de marche δ = −ax/f ′ .
Le calcul qui précède ne doit en aucun cas être remplacé par le raisonnement inexact
suivant : les distances S1 K1 et S2 K2 étant égales, on pourrait être tenté d’affirmer
que δ = K1 M − K2 M . Ce résultat est manifestement faux sur la figure (il fournirait
ici δ > 0, ce qui n’est pas le cas) pour la raison suivante : K1 et K2 ne sont pas
des points, mais des zones de traversée de la lentille ; celle-ci, convergente, est plus
épaisse au voisinage de son centre et la traversée en K2 correspond à un chemin
optique supérieur à celui associé à la traversée en K1 . Il n’est ni utile ni simple de
chercher à exprimer cette différence d’épaisseur et on n’utilisera pas cette méthode.
Finalement, la comparaison de ce résultat avec (8.13) montre que les franges restent
rectilignes et équidistantes, d’interfrange i obtenu en faisant D −→ f ′ :
ax λ0 f ′
δ = S1 M − S2 M ≃ − i= (8.15)
f′ a
2 Écran perpendiculaire à l’axe S1 S2 : le schéma de principe est maintenant celui

de la figure 8.13 ; on n’a, là aussi, représenté que les rayons qui interfèrent au point
M du plan focal image de la lentille de projection.
Les mêmes raisonnements que ci-dessusp permettent décrire δ = S1 M − S2 M = a cos α
avec r = f ′ tan α ; la notation r = x2 + y 2 est celle des coordonnées polaires, car la
figure 8.13 est invariante de révolution autour de l’axe (Oz), de même que les franges
qui sont donc circulaires de centre F ′ .
Le stigmatisme de la lentille n’étant assuré que pour des petits angles, |α| ≪ π et on
peut encore écrire :

r2
δ = a cos α ≃ a 1 − ′2 (8.16)
2f
bM
H
b r
b b α α b
z
S1 S2 F′
Figure 8.13 – Franges circulaires à l’infini avec deux sources ponctuelles
En particulier, le rayon rp de la frange circulaire d’ordre p est donné par :
s
′ pλ0
δ = pλ0 rp = f 2 1 − (8.17)
a
On remarque les propriétés qui découlent immédiatement de cette relation :

– rp n’est pas une fonction affine de p donc les franges circulaires consécutives de
même nature ne sont pas équidistantes : il n’existe pas d’interfrange. On vérifie
cette propriété dans le cas de la figure 8.11 ;
– le rayon rp décroı̂t quand p augmente : l’ordre est maximal au centre ;
a
– l’ordre au centre de la figure est p(r = 0) = > 0 ; le centre des cercles concen-
λ0
triques formés par ces anneaux n’est pas une (( frange centrale )) au sens des in-
terférences ; cet ordre au centre est même en général très élevé, avec par exemple
a = 0, 1 mm et λ0 = 500 nm, on trouve p(r = 0) = 200 (avec ces valeurs numé-
riques, le centre de la figure est brillant, mais ce cas est accidentel).
8.2 Dispositifs d’interférence à deux ondes
Il ne s’agit en aucun cas d’une présentation exhaustive de tous les dispositifs inter-
férentiels possibles, mais seulement d’une présentation rapide de quelques unes des
réalisations les plus fréquemment rencontrées.
Les seuls dispositifs interférentiels à deux ondes dont la connaissance détaillée est
exigée par le programme sont les dispositifs à trous (ou fentes) de Young et l’appareil
de Michelson, qui sera présenté dans un chapitre ultérieur.
8.2.1 Dispositifs à division du front d’onde

puis recombinaison
division du front
2 Définition : on appelle division du front d’onde

l’opération consistant à séparer en deux l’onde lumi-
M
neuse unique, issue d’une source lumineuse, par un ap- b
pareil présentant deux parties ou deux zones distinctes,
avant de recombiner les deux faisceaux au niveau du
point M où l’observation sera réalisée. Le schéma de
principe qui décrit cette opération est présenté ci-contre.
2 Trous ou fentes de Young : le dispositif des trous de Young est présenté sur la figure
8.14 ; il est formé de deux trous T1 et T2 , en général circulaires, de faible dimension,
éclairés par une source ponctuelle S.
bM
T1
S z
b
zone
d’interférences
T2
E
Figure 8.14 – Dispositif des trous de Young
Du fait de leur petitesse, les deux trous diffractent la lumière incidente et peuvent
être considérés comme des sources secondaires émettant deux faisceaux dont la largeur
angulaire est liée à la dimension des trous.
Un tel dispositif présente exactement la géométrie nécessaire pour observer des franges
quasi-rectilignes, équidistantes, sur un écran E disposé à grande distance des deux
trous, parallèlement au plan (Oxy) dans lequel les deux trous sont percés.
On verra au chapitre suivant comment le dispositif peut être modifié, sans perdre la
forme et la disposition des franges, mais pour augmenter leur luminosité :
– en remplaçant les trous par des fentes fines, longues, perpendiculaires à la direction
T1 T2 : on parle alors de dispositif des fentes de Young ;
– en remplaçant l’observation directe sur un écran par l’emploi d’une lentille de pro-
jection, l’observation étant alors réalisée dans le plan focal image de cette lentille ;
on parle alors d’observation à l’infini des franges rectilignes.
2 Miroirs de Fresnel : le dispositif est représenté sur la figure 8.15 ; une source
ponctuelle S est disposée à la distance d de l’arête O de deux miroirs plans faisant un
angle α, en principe de l’ordre de 10−2 à 10−3 rad, très exagéré sur la figure.
S
b
u
b
S1 O
α
β
b
S2
Figure 8.15 – Miroirs de Fresnel

Un obstacle approprié empêche la source S d’éclairer directement la zone d’observa-

tion ; on n’observera donc en sortie d’un tel dispositif que les deux faisceaux issus de
S et s’étant réfléchis sur les deux miroirs. Ces deux faisceaux semblent provenir des
deux images S1 et S2 de S, symétriques de S relativement aux deux miroirs.
Le dispositif est donc équivalent aux deux sources secondaires S1 et S2 , qui forment
avec O un triangle isocèle de sommet O et d’angle β, avec donc une distance entre
β
sources secondaires a = S1 S2 = 2d sin .
2
L’emploi des relations de Descartes montre immédiatement que SOS \1 = 2u tandis que
\ \
SOS2 = 2u + 2α, d’où on déduit immédiatement que β = S1 OS2 = 2α. Finalement,
au vu de la faible valeur de l’angle α, on peut écrire a = 2d sin α = 2dα.
Le dispositif des miroirs de Fresnel est en général réalisé avec d de l’ordre de la dizaine
de centimètres ; l’angle α étant réglable, on peut aisément obtenir des valeurs de a
variables de zéro à quelques millimètres. Il est en général bien plus lumineux que
le dispositif de Young, puisqu’il n’implique pas la diffraction par des trous de faible
dimension.
On peut imaginer n’utiliser qu’un seul miroir, et employer S et S1 comme sources

secondaires ; toutefois, un tel dispositif (miroir unique de Lloyd) ne donne pas for-
cément d’interférences du fait du caractère non polarisé de la lumière naturelle et
de la présence d’un déphasage entre les deux composantes rectilignes de la polari-
sation naturelle ; on peut alors montrer que les deux systèmes de franges associés
aux deux composantes orthogonales de la lumière naturelle sont exactement décalés
d’un demi-interfrange, ce qui conduit à la disparition des franges.
2 Bilentilles de Meslin : le dispositif (son étude générale est hors programme) est
formé d’une lentille convergente sciée en deux parties qui sont décalées, conformé-
ment à la figure 8.16 ; les deux faisceaux se recouvrent dans une zone d’interférence
restreinte, située entre S1 et S2 ; c’est donc dans cette région qu’on doit disposer
l’écran E.
L1
E
Sb S1 S2
b b
b
M
L2
Figure 8.16 – Bilentilles de Meslin
Pour déterminer la différence de chemin optique δ en M entre les deux faisceaux,

on écrira d’abord (S1 M ) = (SS1 ) + S1 M et (S2 M ) = (SS2 ) − S1 M ; on peut alors
remarquer que les chemins optiques (SS1 ) et (SS2 ), entre un objet et son image,
ne dépendent pas du rayon particulier choisi ; en particulier, ces deux grandeurs ne
dépendent pas de M et on écrira donc δ = S1 M + S2 M + Cte.
Au contraire des dispositifs précédents, on aura donc une différence de marche

géométrique donnée par la somme S1 M +S2 M et non pas la différence S1 M −S2 M ;
on peut interpréter cette propriété en remarquant que S2 est une source secondaire
virtuelle (non atteinte par le rayon lumineux) ; S1 est une source secondaire réelle.
Les franges sont alors des surfaces telles que S1 M + S2 M , donc des ellipsoı̈des de
révolution autour de l’axe passant par leurs foyers S1 et S2 ; leur intersection avec
l’écran E est donc formée de demi-cercles d’axe confondu avec S1 S2 .
2 Biprisme de Fresnel : on peut encore proposer un dispositif interférentiel équivalent
aux précédents au moyen d’un biprisme, formé de deux prismes de verre de petit angle
A accolés par la base. Ce dispositif est représenté sur la figure 8.17.
Un prisme n’étant en général pas un dispositif stigmatique pour un point source situé
à distance finie, cet appareil n’est pas équivalent aux dispositifs de Young, sauf dans
le cas de la figure 8.17 où la source est rejetée à l’infini. Le faisceau incident parallèle
fournit alors, en sortie de l’appareil, deux faisceaux parallèles déviés en sens contraire
formant un angle 2α, si α est la déviation due à un des prismes.
S1
α
α
S2
Figure 8.17 – Biprisme de Fresnel
Il existe alors une région de l’espace (en gris sur la figure) où interfèrent deux ondes
planes, cohérentes entre elles mais dont les directions de propagation font un angle 2α ;
on peut considérer que deux sources secondaires S1 et S2 , situées à très grande distance
a
D et décalées d’une très grande longueur a, avec 2α ≃ , éclairent cette région. On
D
observera donc des franges rectilignes, parallèles et équidistantes, perpendiculaires au
plan de la figure 8.17, avec pour interfrange i = λ0 D/a (selon la relation général pour
un dispositif d’Young à grande distance) donc i ≃ λ0 /2α.
Une étude exacte des interférences entre deux ondes planes est proposée plus loin,
dans le cadre du dispositif dit du coin d’air ; on montrera à ce moment que l’expres-
sion exacte de l’interfrange est i = λ0 /2 sin α.
8.2.2 Dispositifs à division d’amplitude
2 Définition : on appelle division d’am-

des deux ondes
plitude l’opération consistant à produire

recombinaison
deux ondes lumineuses à partir d’une onde M

division b
unique, lors de la traversée d’un dispositif
partiellement transparent ou partiellement d’amplitude
réfléchissant. On doit, pour observer les in-
terférences, compléter le dispositif par un
appareil dirigeant les deux ondes ainsi pro-
duites vers le point M où l’observation sera réalisée.
Le schéma de principe d’une telle opération est représenté ci-contre.
2 Lame à division d’amplitude : La réalisation d’un dispositif à division d’amplitude

fait en général appel à de fines lames de verre ; dans ce chapitre, nous les traiterons
comme une surface unique dont l’épaisseur est donc négligée, ainsi que tout déphasage
apporté par la lame. Nous reprendrons la description de ces lames de manière plus
satisfaisante lors de l’étude de l’interféromètre de Michelson.
Un telle surface assure une transmission partielle de l’onde (avec un coefficient de
transmission t) et une réflexion partielle de l’onde (avec un coefficient de réflexion
r). Si on note w0 l’amplitude (réelle) de l’onde incidente sur la lame, les ondes réflé-
chie et transmise auront pour amplitudes respectives rw0 et tw0 . Si la lame n’a fait
l’objet d’aucun traitement particulier, on a en général t ≫ r : une lame de verre est
essentiellement transparente.
On notera que, si la lame n’est pas absorbante, la conservation de l’énergie (propor-

tionnelle au carré de l’amplitude lumineuse) impose r2 + t2 = 1.
Il est toutefois possible de réaliser un dépôt métallique sur une des faces de la lame,
qui se comporte alors partiellement comme un miroir ; si r = t, la lame est dite
semi-réfléchissante.
Nous décrirons ici deux dispositifs interférentiels formés de deux lames essentiellement
transparentes : les lame d’air et coin d’air. L’interféromètre de Michelson, qui sera
étudié ultérieurement, fait appel pour sa réalisation à deux lames, dont l’une est
semi-réfléchissante et l’autre est totalement transparente.
2 Dispositif interférentiel à lame d’air : on réalise une lame d’air en disposant,
sur la trajet d’une onde lumineuse, deux dispositifs partiellement réfléchissants (par
exemple, deux fines lamelles de verre) ; la figure 8.18 représente (à gauche) une telle
lame à faces parallèles, et un des rayons qui l’éclaire, sous l’incidence i.
w0 w1 w2 w3
i b
i S
d1 e
d2
lame 1
lame L1 d1 lame 2
S1 b d2
b
2e
lame L2 S2
Figure 8.18 – Lame d’air à faces parallèles et sources secondaires
Les ondes successivement réfléchies par le dispositif ont pour amplitudes réelles res-
pectives w1 = rw0 (après une réflexion), w2 = rt2 w0 (après une réflexion et deux
transmissions), w3 = r4 t2 w0 et plus généralement wn = r2(n−1) t2 w0 pour les ondes
suivantes (n > 3).
Comme r ≪ t ≃ 1, w1 ≃ w2 tandis que wn ≪ . . . ≪ w3 ≪ w2 : il s’agit, en
première approximation, d’interférences à deux ondes (d’amplitudes pratiquement
égales w1 ≃ w2 ).
Si on éclaire le dispositif au moyen d’une source ponctuelle unique S (cf. figure 8.18
à droite), les rayons émergents semblent provenir des deux images de S par réflexion
sur les deux lames ; ces sources secondaires S1 et S2 sont distantes de 2e, si e est la
distance qui sépare les deux lames.
L’ensemble du dispositif est alors équivalent à un dispositif d’Young, l’observation
étant en général réalisée sur un écran parallèle aux lames ; on se trouve dans le cas de
la figure 8.10 et les franges sont circulaires, comme par exemple sur la figure 8.11.
2 Franges circulaires d’une lame d’air : pour déterminer la nature des franges formées
par un dispositif à lame d’air, on va montrer qu’il n’est en fait pas nécessaire de
connaı̂tre la disposition ni même la nature précise de la source qui éclaire la lame
d’air : il suffit que cette source éclaire la lame sous plusieurs incidences i.
K
i b i
b
i b
H Q
e
P
b
Figure 8.19 – Calcul de la différence de marche pour une lame d’air
Sur la figure 8.19, le point H représente le dernier point commun aux deux ondes ; en
ce point, ces deux ondes sont en phase. Si l’observation est faite à l’infini, on constate
sur la figure que les deux ondes parcourent des trajets différents pour atteindre le
plan KQ, orthogonal au faisceau de sortie ; l’une parcourt seulement la distance HK,
tandis que l’autre doit parcourir la distance HP Q. Si on néglige tout déphasage lors
des réflexions et transmissions, on peut écrire δ = HP Q − HK = 2HP − HK.
On exprime alors aisément ces différentes longueurs en fonction de l’épaisseur e de la
e sin2 i
lame d’air : HP = puis HQ = 2e tan i donc HK = HQ sin i = 2e . Il reste
cos i cos i
2e
donc δ = 1 − sin2 i , soit enfin :
cos i
δ = 2e cos i (8.18)
Ce résultat n’est évidemment rien d’autre que celui déjà obtenu en (8.16) ; on en dduit
immédiatement les propriétés des franges circulaires obtenues en projection dans le
plan focal de la lentille représentée sur la figure 8.20. Les franges réalisées avec une
lame d’air ainsi projetées à l’infini portent le nom d’anneaux de Haidinger, ou franges
d’égale inclinaison.
Fb′ Mb
Écran
i
f′
Lentille de projection
Lame d’air
Figure 8.20 – Anneaux de Haidinger
En particulier, le rayon rp de la frange d’ordre p estp donné par δ = pλ0 donc, dans
les conditions de stigmatisme de la lentille, rp = f ′ 2 − pλ0 /e.
2 Coin d’air : on passe aisément du dispositif de la lame d’air à celui du coin d’air
en rompant la symétrie de révolution (qui assurait la formation de franges coniques)
si les deux lames L1 et L2 ne sont plus parallèles, mais forment un dièdre de petit
angle α ; cette situation est alors représentée sur la figure 8.21, tracée dans un plan
perpendiculaire à l’axe du dièdre, qui est aussi l’axe (Oz) formé de l’intersection des
deux lames.
y fr a
ng
es
e1
u b
u e2
ond
M ond u+α
x Y
O b
u′
u′ α
X
Figure 8.21 – Coin d’air et franges de Fizeau
Dans les mêmes conditions de transparence que pour l’étude de la lame d’air, on peut
considérer que le système forme, par réflexion, des interférences à deux ondes de même
amplitude (réelle) w1 ≃ w2 = w.
Si le dispositif est éclairé par une source ponctuelle unique S, on peut comme pré-
cédemment remplacer celle-ci par les deux sources secondaires S1 et S2 formées des
deux images de S par réflexion sur les deux lames. Le coin d’air est alors strictement
équivalent à un dispositif de miroirs de Fresnel.
2 Coin d’air en éclairage parallèle : nous allons étudier en détail le cas où le coin
d’air est éclairé par une source à l’infini, c’est-à-dire par une onde plane entièrement
définie par son angle d’incidence u. On a supposé sur la figure 8.21 que cette onde
se propage dans le plan perpendiculaire à l’arête du dièdre formé par les deux lames
réfléchissantes formant le coin d’air.
On étudie, après réflexion sur ces deux lames, les deux ondes, de même amplitude,
formées par réflexion ; ces ondes sont en phase en leur seul point commun O (si
on néglige tout déphasage du aux transmissions et aux réflexions) et on peut donc
exprimer les amplitudes complexes associées sous la forme wi = w exp (−iki · r), les
2π
vecteurs d’onde k1 et k2 ayant même amplitude k0 = , mais ils sont dirigés,
λ0
conformément à la figure 8.21 par les lois de Snell-Descartes, en fonction de l’angle
d’incidence u sur la première lame et de l’angle d’incidence u′ = u + α sur la seconde.

2π sin u x
On peut en particulier écrire les phases de ces deux ondes ϕ1 = ·
λ0 cos u y
2π sin(u′ + α) x
et ϕ2 = · , en utilisant la base proposée sur la figure 8.21. Le
λ0 cos(u′ + α) y
déphasage des deux ondes en un point M quelconque, de coordonnées (x, y, z) s’écrit
2π
alors ϕ2 − ϕ1 = δ, en fonction de la différence de marche δ donnée, après quelques
λ0
transformations trigonométriques, par δ = 2 sin α (x cos(u + α) − y sin(u + α)).
pλ0
Une frange d’ordre p est donc un plan d’équation x cos(u+α)−y sin(u+α) = ;
2 sin α
ces plans sont dirigés par le vecteur unitaire eY = sin(u+α)ex +cos(u+α)ey : ils sont
donc parallèles entre eux. Certains de ces plans figurent, en pointillés, sur le schéma
du dispositif. Si on place un écran perpendiculairement à ces franges (donc dirigé par
(eX , ez )), on observera des franges rectilignes.
Dans le système d’axes Y, X adapté à l’étude de ces franges, leur équation peut s’écrire
δ = 2 sin αX ; ces franges sont alors équidistantes, la frange d’ordre p se projetant sur
cet écran selon la droite d’équation xp = pλ0 .
L’interfrange est alors la grandeur constante i = xp+1 − xp soit :
λ0
i= (8.19)
2 sin α
Notons qu’on n’observera de franges bien visibles que si l’interfrange est assez grand ;
ainsi, pour obtenir un interfrange de i = 0, 1 mm avec λ0 = 500 nm, il faudra choisir
α = 2, 5 mrad.
L’angle u est aussi faible en général et eX ≃ ex donc δ ≃ 2xα ≃ 2x tan α ; il s’agit
simplement de l’expression δ ≃ 2e(x) où on a noté e(x) l’épaisseur du coin d’air à
l’abscisse x. Cette expression s’interprète ainsi : l’onde 2 doit, en plus du trajet de
l’onde 1, faire un aller et retour entre les deux lames du coin d’air, ce qui correspond
à une différence de marche égale au trajet aller et retour 2e(x).
Pour cette raison, ces franges portent aussi le nom de franges d’égale épaisseur ; on
parle encore de franges de Fizeau.
2 Anneaux de Newton : on peut généraliser l’étude ci-dessus en réalisant des inter-
férences entre deux ondes subissant deux réflexions sur deux surfaces voisines, comme
par exemple les deux faces d’une lame mince d’huile à la surface de l’eau, ou bien
les deux faces d’un coin formé par un miroir et la face inférieure d’une lentille plan-
convexe (figure 8.22). On forme alors des franges de Newton.
r
lentille
lame d’huile
Figure 8.22 – Franges de Newton
Dans les deux cas, si on se limite aux faibles incidences et à des lames peu inclinées, on
formera des franges d’égale épaisseur. Pour une lame d’huile, δ = 2ne où n est l’indice
optique de l’huile et e l’épaisseur en un point donné du film d’huile forme ; dans le
second cas, δ = 2e(r) car on forme une lame d’air (indice égal à 1) dont l’épaisseur
présente la symétrie de révolution et ne dépend donc que de la distance r à l’axe de
symétrie.
Une frange correspond donc à une courbe d’épaisseur constante, donc à une ligne de
niveau de la fonction e(M ) au point M où on forme les franges.
Dans le cas du dispositif à symétrie de révolution, ces franges sont donc des cercles
concentriques qui portent le nom d’anneaux de Newton. Dans le cas des interférences
formées en présence d’une lame d’huile (ou plus généralement d’une fine lame de
liquide), on peut disposer ainsi d’une méthode de mesure de l’épaisseur du film liquide.
Les interférences à deux ondes (ou plus) peuvent être réalisées par division du
front d’onde ou par division d’amplitude, pour former des sources secondaires
cohérentes : elles doivent être synchrones et de petite dimension.
En présence de sources cohérentes, on procède à l’addition des amplitudes com-
plexes ; dans le cas contraire, on procède à l’addition des éclairements :
X 2
X
wtotal = wi E = |wtotal | E= Ei
i i
| {z } | {z }
cohérence incohérence
p
Avec deux ondes monochromatiques, E = E1 + E2 + 2 E1 E2 cos ∆ϕ avec pour
2π
déphasage ∆ϕ = δ ; la différence de marche δ peut avoir une composante
λ0
optique (déphasage des sources secondaires) et une composante géométrique
S2 M − S1 M .
Plus généralement, on définit le contraste entre franges claires et sombres en
Emax − Emin
un point du champ d’interférence par C = ; dans le cas (fréquent)
Emax + Emin
2π
où on peut écrire E(M ) = E0 1 + V (M ) cos δ(M ) et si la fonction de
λ0
visibilité V (M ) varie lentement, alors C = |V (M )|.
b
Si deux sources secondaires S1 et S2 sont distantes de a, bM
S1 b
l’observation réalisée sur un écran parallèle à S1 S2 situé b
à grande distance D des sources (géométrie de Young) a b
D b
montre des franges rectilignes, perpendiculaires à S1 S2 , S2 b b i
équidistantes de i = λ0 D/a puisque δ = ±ax/D. b
b
On peut réaliser la même observation à l’infini en utili- bM
S1 b
sant une lentille de projection de focale f ′ ; on observe b
alors des franges rectilignes, perpendiculaires à S1 S2 , a b
b
équidistantes de i = λ0 f ′ /a puisque δ = ±ax/f ′ . S2 b f′ b i
b
Pour montrer ce résultat, on utilise le stigmatisme de le lentille.
Si deux sources secondaires S1 et S2 sont distantes

de a, l’observation réalisée sur un écran perpendicu- S1
laire à S1 S2 situé dans le plan focal image d’une len- b b
α
′ S2
tille convergente de focale f montre des franges circu- a
laires, centrées sur l’axe S1 S2 , non équidistantes, avec
δ = ±a cos α et r ≃ f ′ α. Les franges sont des anneaux d’égale inclinaison.
Pour montrer ce résultat, on utilise le stigmatisme de le lentille.
Chapitre 9
Réseaux de diffraction
9.1 Les fentes de Young
9.1.1 Diffraction par deux fentes

2 Le dispositif des fentes de Young : reprenons l’étude des interférences à l’infini par
un dispositif formé de deux fentes identiques, de même largeur b, de grande longueur
ℓ, dont les axes sont distants de a > b (cf. figure 9.1).
y
f1′ x f2′
z
b b b b b
Figure 9.1 – Le dispositif des fentes de Young
Ces deux fentes sont percées dans un écran opaque éclairé par une onde monochro-
matique l’aspect de cette pupille est représenté sur la figure 9.2.
a
ℓ
Figure 9.2 – Les fentes de Young
Cette onde est issue d’une source ponctuelle S disposée au foyer objet d’une lentille
convergente de focale f1′ ; l’observation est réalisée dans un écran disposé dans le
plan focal image d’une autre lentille convergente de focale f2′ . Les deux lentilles sont
utilisées dans les conditions de Gauss.
2 Calcul de l’amplitude diffractée : en utilisant le système d’axes orthonormé de la
figure 9.1, l’amplitude diffractée dans la direction définie par les cosinus directeurs
(α, β) par la pupille double que forment les fentes de Young s’écrit sous la forme
x 2π
w(α, β) = Kw0 exp j (xα + yβ) dxdy, où λ0 désigne la longueur d’onde
λ0
M ∈(Σ)
utilisée. L’intégrale porte sur tous les points M de coordonnées (x, y) appartenant
à la

ℓ ℓ
pupille (Σ). Cette intégrale porte donc sur tous les couples (x, y) tels que y ∈ − ;
2 2
a b a b [ a b a b
tandis que x ∈ − − ; − + + − ;+ + .
2 2 2 2 2 2 2 2
On peut donc mettre calculer cette intégrale comme le produit de deux termes fonc-
tions séparément de α et de β, sous la forme w(α, β) = Kw0 A(α) × B(β), où on a
Z +ℓ/2
2π πβℓ
posé B(β) = exp βy dy soit B(β) = ℓ × sinc .
−ℓ/2 λ0 λ0
B(β) est un terme classique de diffraction par une pupille longue ; compte tenu de
la grande valeur de ℓ, la largeur angulaire dans la direction de l’axe (Oy) est limitée
λ0
et de l’ordre de grandeur de , c’est-à-dire qu’elle est très faible : il n’y a pas de
ℓ
diffraction dans la direction de la plus grande longueur de la pupille.
Le terme A(α) étant une intégrale portant sur la réunion de deux intervalles disjoints,
il s’agit d’une somme de deux intégrales analogues A(α) = f+a/2 (α) + f−a/2 (α), où
Z d+b/2
2π
on a choisi de poser fd (α) = exp j αx dx.
d−b/2 λ0
Le changement de variables x′ = x − d permet de calculer immédiatement ces deux
Z +b/2
2π 2π ′
intégrales sous la forme fd (α) = exp j αd exp j αx dx′ soit finale-
λ0 −b/2 λ0

2π παb
ment fd (α) = b exp j αd sinc .
λ0 λ0
πβℓ π π
Finalement, w(α, β) = KB(β)w0 asinc exp j αa + exp −j αa ; on re-
λ0 λ0 λ0
παb
connaı̂t dans cette expression la mise en facteur de wdiff (α, β) = Kw0 aB(β)sinc
λ0
correspondant à la figure de diffraction commune des deux fentes, et d’un terme
∩(φ/2) = exp (jφ/2) + exp (−jφ/2), qui décrit une propriété déjà citée : la translation
π
d’une pupille dans son plan se traduit par un simple déphasage ±φ/2 = ± αa de
λ0
l’amplitude diffractée.
2 Éclairement et terme d’interférences : dans l’éclairement |w(α, β)|2 , on met en
παb πβℓ
facteur l’éclairement Ediff (α, β) = K 2 |w0 |2 a2 ℓ2 sinc2 sinc2 qui serait produit
λ0 λ0
par une pupille diffractante unique (quelle que soit sa position dans le plan de la
pupille) pour écrire E(α, β) = Ediff (α, β) × ∩2 (φ/2) ; le terme ∩2 (φ/2) décrit donc le
phénomène d’interférences à deux ondes.
φ φ
On peut en effet écrire ∩(φ/2) = 2 cos donc ∩2 (φ/2) = 4 cos2 ; on reconnaı̂t ici un
2 2
terme classique d’interférences à deux ondes puisque ∩2 (φ/2) = 2 (1 + cos φ). Ainsi,
9 : Réseaux de diffraction 195
l’éclairement total envoyé par l’ensemble des deux pupilles dans la direction de cosinus
directeurs (α, β) s’écrit :

2πδ
E(α, β) = 2Ediff (α, β) 1 + cos (9.1)
λ0
avec pour différence de marche δ entre les ondes émises par les deux pupilles l’expres-
sion, déjà établie dans le cadre du formalisme simplifié du chapitre précédent, δ = aα.
X Y
On peut d’ailleurs aussi écrire α = ′ et β = ′ , en fonction des coordonnées (X, Y )
f2 f2
du point d’observation sur l’écran ; on a donc encore :

πℓY 2 πbX 2π aX
E(X, Y ) = 2E0 sinc2 sinc 1 + cos (9.2)
λ0 f2′ λ0 f2′ λ0 f2′
9.1.2 Interprétation de la figure de diffraction
2 Étude de l’éclairement : comme on l’a indiqué ci-dessus, la répartition de lumière

le long de l’axe (OY ) est essentiellement centrée en Y = 0, à part une tache de
λ0 λ0 f2′
diffraction de faible demi-largeur à la base (en termes angulaires) ou (en
ℓ ℓ
termes de longueur). On s’intéressera donc à l’expression
de l’éclairement
sur l’axe
2 πbX 2π aX
(OX), sous la forme E(X, Y = 0) = 2E0 sinc 1 + cos .
λ0 f2′ λ0 f2′
Il s’agit d’un produit de deux fonctions de X, dont les dimensions caractéristiques
λ0 f2′
des variations sur l’axe (OX) sont respectivement ∆X = (pour le terme de
′
b
λ0 f2
diffraction) et i = (pour le terme d’interférences). Puisque a > b, on peut
a
affirmer que ∆X > i et même en général ∆X ≫ i si les fentes sont assez fines : le
terme de diffraction est donc une fonction à variation lente, dont on peut considérer
qu’elle sert d’enveloppe de la fonction d’interférences à variations plus rapides.
E
i
∆X ∆X
Figure 9.3 – Éclairement par un système de deux fentes fines
La figure 9.3 représente le tracé de cette fonction. On y voit l’effet du phénomène de

diffraction : les franges sont moins lumineuses sur les bords de la figure de diffraction,
la frange centrale étant la plus lumineuse des franges brillantes.
πbX
Les franges brillantes correspondent à l’éclairement Emax = 4E0 sinc2 tandis que
λ0 f2′
les franges sombres correspondent à Emax = 0 ; les franges gardent donc un contraste
Emax − Emin
maximal théorique C = = 1. Notons qu’en pratique le contraste observé
Emax + Emin
sera toujours plus faible en présence d’éclairements parasites, l’éclairement minimal
sur l’écran n’étant jamais nul.
Toutefois, la figure 9.3 montre bien que les franges d’ordre élevé sont moins visibles,
car moins lumineuses, que les franges voisines du centre de la figure ; un défaut de
contraste relatif peut ici être évoqué pour expliquer l’aspect attendu sur l’écran, où
on ne verra nettement qu’un petit nombre de franges.
9.2 Les réseaux de diffraction
9.2.1 Définitions
2 Réseau de diffraction par transmission : on peut décrire un réseau par transmission
comme la généralisation du dispositif précédent dans le cas où le nombre de fentes
N est supérieur à 2 : on réalise un réseau de diffraction par transmission en réalisant
une pupille percé d’un nombre, en général assez grand, de fentes fines, parallèles et
équidistantes. La figure 9.4 représente une telle pupille.
a a a b b b
Figure 9.4 – Réseau de diffraction par transmission
Nous considérerons dans toute la suite que ces fentes sont équidistantes ; la distance
de deux fentes consécutives est le pas du réseau a. Ces fentes seront aussi en général
considérées comme très fines, de largeur commune b ≪ a, et de grande longueur ℓ ≫ a.
Un tel réseau est en général réalisé par gravure dans un écran opaque ; le pas a des
réseaux est de l’ordre de grandeur de quelques micromètres ou, ce qui revient au
même, le nombre de traits par unité de longueur 1/a est en général de l’ordre de
quelques centaines à quelques milliers de traits par millimètre.
Les réseaux usuels ayant une largeur utile de l’ordre de quelques centimètres, le nombre
N de traits du réseau éclairé peut atteindre quelques milliers.
2 Réseaux : plus généralement, nous appellerons réseaux une pupille de diffraction
présentant une fonction de transparence périodique. Si la période spatiale n’est réalisée
que le long d’un seul axe (Ox), on parle de réseau unidimensionnel et la période
spatiale, toujours notée a, garde le nom de pas du réseau.
On rencontre aussi des réseaux à double périodicité spatiale, ou des réseaux tridi-
mensionnels ; en particulier, une structure cristalline peut être considérée comme un
réseau tridimensionnel.
Notons encore que les réseaux ne sont pas seulement utilisés dans le domaine de la
lumière visible ; en particulier, on réalise fréquemment l’étude de la diffraction par des
réseaux atomiques ou moléculaires en utilisant des rayons X ; on verra en effet que
des longueurs d’ondes plus courtes (en particulier, du même ordre de grandeur que
la période a du réseau) sont mieux adaptées à l’étude des propriétés des réseaux de
diffraction.
Revenant au domaine optique, on peut proposer divers exemples de réseaux effec-

tivement utilisés, à commencer par des réseaux utilisés en réflexion ; la figure 9.5
indique schématiquement la forme de tels réseaux, composés d’une juxtaposition de
miroirs. Dans le premier cas (réseau plan par réflexion, en haut sur la figure), le réseau
est formé d’un grand nombre de miroirs plans, coplanaires, très fins, avec la même
géométrie que celle d’un réseau plan.
a a a b b b
miroirs
miroirs
a a a α
Figure 9.5 – Réseaux par réflexion, plan (en haut) et réseau de Michelson (en bas)
Dans le second cas (réseau de Michelson‡ , ou réseau en échelon), les miroirs sont
toujours régulièrement disposés avec le pas a, mais ils sont inclinés d’un angle α sur
la direction moyenne du réseau (α est en général de l’ordre de quelques dizaines de
degrés). Un tel réseau peut être utilisé avec des miroirs plus larges ; il correspond en
général à des phénomènes plus lumineux. Par contre, sa réalisation est plus délicate
que celle d’un réseau plan ; il est donc en général produit avec des valeurs de N plus
faibles (quelques centaines par exemple).
Nous rencontrerons encore de nombreux types de réseaux, en particulier les réseaux

de phase (constitués par une variation périodique de l’indice optique n d’un milieu
transparent, ou encore par une variation périodique de l’épaisseur d’une lame de
verre) ; dans chaque cas, le seul caractère périodique de la fonction de transmittance du
réseau, considéré comme une pupille diffractante, permet de déterminer des propriétés
générales communes à tous les réseaux.
2 Interférences à ondes multiples : les réseaux permettent de généraliser la notion

d’interférences à deux ondes au cas des interférences à N ondes, ou N > 2 peut
en général être très élevé. La condition de formation d’une frange brillante derrière
un tel dispositif est en général beaucoup plus contraignante que dans le seul cas de
deux ondes : on doit en effet exiger que le déphasage de deux ondes émises par deux
traits consécutifs du réseau soient en phase (déphasées de 2pπ, avec p ∈ Z) avec une
précision δϕ beaucoup plus importante que pour les interférences à deux ondes.
En effet, une erreur δϕ dans la réalisation de cette condition de déphasage entre
deux traits consécutifs impose un déphasage régulièrement croissant entre les traits
successifs du réseau. La figure 9.6 montre une interprétation géométrique, dans le plan
complexe, de la somme de cinq nombres complexes peu déphasés, plus de la somme

de cinq nombres complexes plus fortement déphasés.
Déphasage faible Déphasage élevé
me
me
som
som
Figure 9.6 – Somme de cinq nombres complexes régulièrement déphasés
On constate bien que, plus le déphasage de deux de ces cinq complexes consécutifs est
important, plus leur somme est faible. L’effet est d’autant plus marqué que N est élevé
et, si δϕ s’éloigne un tant soit peu de zéro, on aura donc affaire à des interférences
destructives et à une frange sombre.
Notons cependant que la condition d’interférence constructive se détermine de la même
façon, quel que soit le nombre de franges ; on imposera à la différence de marche δ entre
deux ondes issues de deux traits consécutifs d’être un multiple entier de la longueur
d’onde, δ = pλ0 .
On peut résumer ces deux propriétés, qui ne sont d’ailleurs pas spécifiques aux seuls
dispositifs à réseaux, en notant que la largeur des franges brillantes dépend de N ,
tandis que leur disposition n’en dépend pas :
Finesse des franges

X Dans un dispositif interférentiel à ondes multiples, la condition d’in-
terférence constructive doit être assurée plus précisément que dans un
dispositif à deux ondes ; les franges brillantes sont donc d’autant plus
fines que N est plus élevé.
La mesure de la position de ces franges brillantes est donc plus précise.
Pour assurer la conservation de l’énergie totale transmise ou réfléchie par
le dispositif, les franges brillantes sont aussi beaucoup plus brillantes que
dans un dispositif à deux ondes : on observera des points (ou des traits)
très lumineux sur un fond très sombre.
Position des franges

X Dans un dispositif interférentiel à ondes multiples, la disposition des
franges brillantes ne dépend pas du nombre N d’ondes qui interfèrent ;
on la détermine par application de la relation δ = pλ0 , comme dans le
cas des interférences à deux ondes.
Dans le cas des réseaux, le nombre entier p et la p-ième frange brillante
qui lui est associée portent le nom d’ordre du réseau.
9.2.2 Ordres du réseau
2 Éclairage et observation à l’infini : nous nous placerons systématiquement dans ce

cas dans la suite : le réseau périodique est une pupille plane P confondue avec le plan
(Oxy). La propriété (transmission, réflexion ou déphasage) qui caractérise ce réseau
sera supposée périodique de période a le long de l’axe (Ox) et nous supposerons que
la dimension ℓ du réseau le long de l’axe (Oy) est suffisamment grande pour que tout
effet de diffraction soit négligeable le long de cet axe.
La diffraction se fait donc uniquement dans le plan Π = (Oxz) perpendiculaire à la
plus grande dimension des traits du réseau ; dans ce plan, on éclaire le réseau par une
onde plane, monochromatique de longueur d’onde λ0 , dirigée par le vecteur unitaire
ui = αi ex + γi ez ; toutefois, nous ne supposerons pas forcément que |αi | ≪ 1.
La figure 9.7 représente donc les conditions usuelles d’éclairement et d’observation
pour un réseau plan, où on notera αi = sin θi et α = sin θ les cosinus directeurs des
directions d’éclairement et d’observation. Sur cette figure, θ > 0 mais θi < 0.
Π +
b
λ0 b
b
b θ
θi z
b
b
a b
a b
b
Figure 9.7 – Éclairage et observation à l’infini pour un réseau plan
En pratique, les angles θi et θ peuvent atteindre des valeurs allant jusqu’à ±60◦ . On
peut justifier ce fait en évaluant rapidement un ordre de grandeur : avec un pas du
réseau de l’ordre de a ∼ 1 µm, la largeur individuelle b de chaque trait d’un réseau
λ0
par transmission vérifie b ≪ 1 µm, donc l’ouverture en cosinus directeur ∆α = de
b
la figure de diffraction vérifie, pour λ0 ∼ 500 nm, la relation ∆α ≫ 0, 5.
On ne doit pas confondre ouverture en cosinus directeurs et ouverture angulaire ; en

effet, la relation α = sin θ montre que ∆α = ∆(sin θ) ∼ cos θ∆θ ; il n’y a que dans
les conditions de Gauss que ces deux notions coı̈ncident.
Avec une valeur de ∆α aussi élevée, le réseau diffracte dans toutes les directions, et
pas seulement pour les angles faibles ; les réseaux ne sont pas nécessairement éclairés
dans les conditions de Gauss.
Notons que, si le réseau n’est pas en général utilisé dans les conditions de Gauss, la
lentille utilisée pour réaliser le faisceau incident est, elle, utilisée dans ces conditions
paraxiales ; la figure 9.7 plus bas montre cette lentille, utilisée au voisinage de son
axe optique. Il en va en général de même du dispositif (viseur, lentille) utilisé pour
étudier le faisceau émergent dans la direction θp de l’ordre p.
Notons encore que la figure 9.7 est entièrement tracée dans le plan perpendiculaire à
la plus grande dimension des traits du réseau ; on a en effet déjà vu que la diffraction
hors de ce plan est négligeable.
2 Ordres du réseau : sur la figure 9.7, on observe la diffraction à l’infini par une
juxtaposition de motifs identiques (des fentes fines par exemple) décalés de a ; la
condition de formation d’interférences constructives (franges brillantes) est comme
toujours δ = pλ0 , où p ∈ Z est l’ordre du réseau, tandis que la figure classique 9.8
rappelle le principe de la détermination de la différence de marche entre les ondes

issues de la source, passant par deux traits consécutifs T et T ′ du réseau, jusqu’à un
plan orthogonal au faisceau observé.
x
θi T′b θ +
b
b
ǫ
a z
|ǫ| ≪ π θi θ K
b
b b
(conditions de Gauss)
H T
Figure 9.8 – Calcul de la différence de marche (transmission)
On sait en effet qu’un dispositif d’observation, stigmatique, formera à l’infini une

image en ajoutant les amplitudes complexes correspondant à tous ces rayons, sans
introduire de différence de marche supplémentaire. Les rayons, qui étaient en phase
dans le plan de phase HT ′ de l’onde incidente, se retrouvent ainsi déphasés au niveau
de l’observation, la différence de marche étant δ = HT K, avec HT = −a sin θi et
T K = a sin θ :
δréseau par transmission = a (sin θ − sin θi ) (9.3)
et la position angulaire θp de l’ordre p du réseau est donnée par la relation de Bragg‡ :
λ0
Réseau par transmission : sin θp − sin θi = p p∈Z (9.4)
a
2 Réseau par réflexion : le calcul de la différence de marche dans le cas d’un réseau
par réflexion se fait de manière tout à fait analogue, dans le cadre de la figure 9.9 ; on
notera sur cette que θi < 0 et θ > 0.
Dans ce cadre, la différence de marche prend la forme δ = T ′ K−T H, avec les distances
T ′ K = a sin θ et T H = −a sin θi , d’où la relation :
δréseau par réflexion = a (sin θ + sin θi ) (9.5)
et la position angulaire θp de l’ordre p du réseau :
λ0
Réseau par réflexion : sin θp + sin θi = p p∈Z (9.6)
a
2 Orientation des angles : les relations (9.3) et (9.5) sont évidemment changées en
leurs opposées si on change l’orientation des angles ; celle-ci étant conventionnelle,
θi T′b +
θ K b
θ a z
θi
b b
H T
Figure 9.9 – Calcul de la différence de marche (transmission)
le phénomène physique observé est bien sûr inchangé, car la transformation p 7→ −p

dans les relations de Bragg (9.4) et (9.6) ne change pas la nature brillante de la frange.
Il importe donc seulement de savoir retrouver simplement le signe relatif des deux
cosinus directeurs sin θ et sin θi , qu’on peut facilement retrouver en considérant le cas
de l’ordre zéro, direction particulière correspondant à l’absence de toute différence de
marche, et qui est donc celle de l’optique géométrique, en l’absence de diffraction.
réseau
Transmission réseau Réflexion
θi θi
b b
θ θ
p = 0 ⇔ |θ| = |θi | p = 0 ⇔ |θ| = |θi |

δ = ±a (| sin θ| − | sin θi |)
δ = ±a (sin θ − sin θi ) δ = ±a (sin θ + sin θi )
Figure 9.10 – Ordre zéro et orientation des angles
La figure 9.10 montre le rayon non dévié correspondant à l’ordre zéro dans les deux cas
(réseaux par réflexion et par transmission) et indique comment retrouver simplement
le signe qui figure dans les expressions de la différence de marche et de la relation de
Bragg, indépendamment du choix d’orientation (ou non) des angles.
La relation encadrée sur la figure 9.10 s’applique, seule, dans tous les cas (et en
particulier aux angles non orientés). On retiendra donc :
Relation de Bragg
X La position angulaire θp du p-ième ordre d’un réseau plan de pas a est
donnée par la relation δ = pλ0 .
La différence de marche δ entre deux rayons passant par deux traits
consécutifs du réseau s’écrit δ = ±a (|sin θ| − |sin θi |) ; on vérifie toujours
que δ = 0 correspond à la direction donnée par les prévisions de l’optique
géométrique, en l’absence de tout phénomène de diffraction.
Dans la suite, on développera systématiquement l’étude des réseaux plans par trans-
mission ; les résultats obtenus s’adaptent aisément aux autres cas.
2 Aspect et visibilité des ordres : compte tenu de la grande finesse attendue pour
des franges d’interférence à ondes multiples, les maxima de lumière correspondant
à un ordre p donné sont angulairement définis avec une grande précision ; la figure
9.11 montre qualitativement la différence entre des interférences à deux ondes et des
interférences à ondes multiples.
E
Interférences
Interférences à N ondes
à deux ondes
b b b
δ
−λ0 0 λ0
Figure 9.11 – Finesse des franges à ondes multiples
Alors que dans le premier cas on voit une alternance de franges sombres et claires, le
second montre des franges brillantes très fines sur un fond sombre. La conservation
de l’énergie totale montre que, pour conserver l’aire totale sous la courbe lorsque ses
maxima s’affinent (zone grisée sur la figure 9.11), l’amplitude de ces maxima doit
s’élever en même temps que leur largeur décroı̂t.
Toutefois, toutes les franges ne sont pas forcément observables, puisque l’observation
pλ0
de l’ordre p de position angulaire θp sonnée par sin θp = sin θi + (dans le cas
a
d’un réseau par transmission) impose forcément une limite à la valeur de p puisque
|sin θp | 6 1.
À titre d’exemple, considérons le cas où a = 2 µm et λ0 = 500 nm ; on aura ainsi
λ0
= 0, 25. Dans le cas d’un éclairage en incidence normale (sin θi = 0), on pourra
a
ainsi observer a priori les ordres −4 à +4 puisque sin θp = 0, 25 × p ; toutefois, les
ordres ±4, émergents en incidence rasante, ne sont jamais observables. On observera
ainsi les sept maxima correspondant à p = 0, ±1, ±2 et ±3. Les valeurs de sin θp étant
en progression arithmétique, celles de θp ne le sont pas et la figure 9.12 (à gauche)
montre la position de ces sept ordres visibles, telle qu’elle apparaı̂t sur un goniomètre.
Ces ordres apparaissent sous la forme de points si la source est ponctuelle. Toutefois,
comme dans le cas des fentes de Young, on peut allonger la source perpendiculairement
à la figure (c’est-à-dire parallèlement aux traits du réseau) pour faire apparaı̂tre ces
ordres sous la forme de traits lumineux parallèles à l’axe du goniomètre.
La même figure 9.12 représente (à droite) la disposition des ordres observables pour
une incidence non nulle sur le même réseau.
2 Juxtaposition des ordres : lorsque plusieurs longueurs d’onde sont présentes dans le
spectre de la source qui éclaire le réseau, elles correspondent à des sources incohérentes
entre elles et les divers faisceaux émergents se superposent puisqu’on doit additionner
les éclairements correspondant à des sources incohérentes.
Un réseau disperse ainsi, pour un ordre p donné, les diverses composantes monochro-
matiques de la lumière qui l’éclaire, entre deux valeurs extrêmes sin θpmin et sin θpmax
p=4
p=6
b b
5
=
=
p
p
2b
4b
p= p=
réseau
réseau
p=1b p=3b
p=0b p=2b
p=1
p= b b
p = −1 p=
incidence normale −2 b incidence 30◦ 0
b
p
p
=
=
p = −4
p = −2
−
−
b b
3
1
Figure 9.12 – Ordres d’un réseau, 1/a = 500 traits par mm, λ0 = 500 nm
lorsque λ0 varie de λmin à λmax ; ce caractère dispersif d’un réseau constitue la base
de certaines applications des réseaux, la réalisation de spectromètres.
Dans les mêmes conventions que celles de la figure 9.12, on a représenté sur la figure
9.13 l’étalement angulaire des faisceaux émergents d’un réseau avec a = 2 µm, éclairé
en incidence normale par un faisceau de lumière polychromatique, lorsque λ0 varie de
pλ0
λmin = 400 nm à λmax = 750 nm, en appliquant la relation sin θ(λ0 ) = .
a
3
p=
2
p=
réseau
1
p=
p=0
p=
−
p= 1
−2
p=
−3
Figure 9.13 – 1/a = 500 traits par mm, 400 nm 6 λ0 6 750 nm
On constate que, pour les ordres ±3, |θ±3 | s’étend de 36, 9◦ jusqu’au delà de l’émer-
gence rasante, tandis que pour l’ordre ±2, |θ±2 | s’étend de 23, 6◦ à 48, 6◦ . De même,
les ordres ±4 (non représentés ci-dessus) débutent à 53, 1◦ . Il y a donc superposition
des ordres à partir de l’ordre 2 : une raie lumineuse observée dans certains intervalles
angulaires peut a priori appartenir à deux ordres différents (ou plus), ce qui en rend
l’analyse plus difficile.
Cette circonstance, ajoutée à la diminution de la luminosité diffractée pour les grands
angles, limite en pratique l’observation aux ordres ±1 ou ±2, au moins dans le cas
des réseaux plans.
9.2.3 Fonction réseau

2 Calcul de l’amplitude diffractée : pour améliorer la description de l’onde diffractée
par un réseau, et préciser la forme de la répartition d’éclairement évoquée sur la
figure 9.11, on va déterminer l’amplitude diffractée par un tel réseau, en appliquant
le principe de Huygens etZ Fresnel à une
structure diffractante
périodique.
2π
On a ainsi w(θ) = KwS t(x) exp j x (sin θ − sin θi ) dx, l’intégrale portant sur
P λ0
N[
−1
une pupille P à transparence périodique, c’est-à-dire sur la réunion P = Pn de
n=0
N pupilles identiques à un décalage près. On peut donc écrire cette intégrale sur une
NX−1
réunion d’intervalles disjoints sous forme de la somme w(θ) = wn (θ), où on a
n=0
2π
Z
posé wn (θ) = KwS t(x) exp j x (sin θ − sin θi ) dx.
x∈Pn λ0
Les N pupilles Pn étant régulièrement décalées de a, le changement de variables
x 7→ x′ = x − na transforme l’intervalle d’intégration
Pn en P0 , ce qu’on écrit sous la
2π ′
Z
′
forme wn (θ) = KwS t(x + na) exp j (x + na) (sin θ − sin θi ) dx′ .
x ∈P0
′ λ 0
′ ′
Le caractère a-périodique de la fonction de transmittance impose t(x + na) = t(x ) ; il
2π
vient donc encore la mise en facteur wn (θ) = w0 (θ) exp j na (sin θ − sin θi ) où on
λ0
2π ′
Z
reconnaı̂t dans w0 (θ) = KwS ′
t(x ) exp j x (sin θ − sin θi ) dx′ l’amplitude
x′ ∈P0 λ0
complexe diffractée par le trait (( origine )) du réseau : on retrouve le fait qu’un déca-
lage de la pupille s’accompagne d’un simple déphasage. On généralise immédiatement
ce résultat sous la forme :
Calcul de l’amplitude émise par un réseau
X Dans un réseau formé de N motifs identiques mais décalés, l’amplitude
envoyée par le réseau dans la direction u s’écrit :
N
X −1 N
X −1
w(u) = wn (u) = w0 (u) exp (jnϕ)
n=0 n=0
où ϕ désigne le déphasage, dans la direction u, entre deux ondes émises

par deux motifs consécutifs du réseau.
2π
Dans le cas des réseaux plans, ϕ = a (sin θ − sin θi ).
λ0
N
X −1
2 Fonction réseau : il reste ci-dessus à déterminer la somme R = exp (jnϕ).
n=0
S’agissant de la somme d’une série géométrique, elle s’écrit immédiatement
sous la
1 − exp (jN ϕ) ψ ψ
forme R = . Notant alors l’identité 1 − exp (jψ) = 2j exp j sin ,
1 − exp (jϕ)
2 2
N −1 sin(N ϕ/2)
on en déduit R = exp j ϕ .
2 sin(ϕ/2)
Finalement, l’éclairement observé derrière un réseau se mettra systématiquement sous

la forme :
sin2 (N ϕ/2)
Eréseau = Eun seul trait × RN (ϕ) RN (ϕ) = (9.7)
sin2 (ϕ/2)
ce qui définit au passage la fonction réseau RN pour un réseau à N traits.
2 Étude de la fonction réseau : l’étude générale de la fonction RN est indis-

pensable pour préciser la répartition de la lumière diffractée par un réseau. On
peut commencer par décrire rapidement les deux cas simples N = 2 et N = 3,
2
pour lesquels on a R2 (ϕ) = |1 + exp (jϕ)| donc R2 (ϕ) = 2(1 + cos ϕ) ainsi que
2
R3 (ϕ) = |1 + exp (jϕ) + exp (2jϕ)| donc R3 (ϕ) = (1 + 2 cos ϕ)2 ; les tracés corres-
pondants, sur la figure 9.14, montrent les propriétés importantes suivantes :
– les maxima principaux de la fonction réseau sont atteints pour ϕ = 2pπ, p ∈ Z ;
– l’amplitude de ces maxima, donnée par la limite lim RN (ϕ), est égale à N 2 ;
ϕ→0
– lorsque N augmente, ces maxima sont plus intenses et plus fins ;
– lorsque N > 2, la fonction réseau présente un certain nombre de maxima secon-
daires, d’amplitude (relativement au maximum principal) faible.
RN
9
b
4 b
ϕ
b b b
−2π 0 2π
Figure 9.14 – Fonctions réseau pour N = 2 et N = 3
Ces propriétés se généralisent au cas N > 3 ; en effet, on peut alors considérer la

fonction de réseau comme le produit RN (ϕ) = f (ϕ)×gN (ϕ) de la fonction à variations
Nϕ ϕ −1
rapides gN (ϕ) = sin2 par la fonction à variations lentes f (ϕ) = sin2 .
2 2
2π
Ces deux fonctions sont périodiques, de périodes respectives et 2π ; elles sont
N
représentées dans le cas N = 6 sur la figure 9.15.
Le produit de ces deux fonctions, c’est-à-dire la fonction réseau RN , est évidemment
2π-périodique, ce qui autorise l’étude simplifiée de la figure 9.16, toujours tracé dans
le cas N = 6.
π
On remarque que, sauf pour q = 0, les points d’abscisse ϕq = (2q+1) correspondent
N
à des maxima de la fonction gN (ϕ), donc à un point de de contact de la fonction
avec son enveloppe g(ϕ) ; ces points de contact sont pratiquement confondus avec des
maxima locaux de la fonction de réseau.
On peut évaluer l’amplitude d’un de ces maxima secondaires en remarquant que
−1
(2p + 1)π
gN (ϕp ) = 1 donc RN (ϕp ) = f (ϕN ) = sin2 ; le plus élevé de ces
2N
3π
maxima secondaires correspond à p = 1 donc ϕ1 = et son amplitude peut être
N
g6 (ϕ)
f (ϕ)
ϕ
b b b b b
−2π 2π 0 2π 2π
−
N N
Figure 9.15 – Numérateur et dénominateur de la fonction réseau pour N = 6

R6
b
N2
N 2 × 4, 5 % 3π
ϕ=
N
b b ϕ
b b b b b
−2π 2π 0 2π 2π
−
N N
Figure 9.16 – Fonction réseau pour N = 6
−1
4N 2 N2

2 3π
donc évaluée, si N est assez élevé, à RN (ϕ1 ) = sin ∼ ∼ , soit
2N 9π 2 22
seulement 4, 5 % du maximum principal voisin.
Nous retiendrons les propriétés générales suivantes :
Propriétés de la fonction réseau
sin2 (N ϕ/2)
X La fonction RN (ϕ) =
sin2 (ϕ/2)
présente les propriétés suivantes :
Elle est paire et 2π-périodique ; ses maxima principaux, atteints pour
ϕ = 2pπ avec p ∈ Z, sont d’amplitude égale à RN (2pπ) = N 2 .
Elle présente, entre deux maxima principaux, N − 1 annulations et N − 2
maxima secondaires ; ceux-ci représentent au plus 4, 5 % de l’amplitude
des maxima principaux ; la demi-largeur à la base d’un maximum prin-
cipal quelconque est égale à ∆ϕ = 2π/N .
2 Finesse des franges : revenant à la différence de marche δ = a (sin θ − sin θi ) pour

2π
un réseau, et compte tenu que ϕ = δ, on a représenté sur la figure 9.17 la fonction
λ0
d’éclairement pour un réseau éclairé en incidence normale (θi = 0), dans le cas où
a = 5λ0 (soit par exemple λ0 = 500 nm et a = 2, 5 µm) en fonction de θ.
Le tracé, réalisé avec N = 20 seulement, montre que les maxima secondaires sont en
pratique inobservables ; on y voit apparaı̂tre (en pointillés) la mise en facteur du terme

2 b sin θ 2π
E(θ) = E0 sinc RN a sin θ
λ0 λ0
p = −1 p=1
p = −2 p=2
p = −3 p=3
p = −4 2∆θ p=4
θ
b b b b b
◦ ◦
−40 −20 0 20◦ 40◦
Figure 9.17 – Aspect de l’éclairement diffracté par un réseau en incidence normale
de diffraction commun qui sert d’enveloppe des franges et montre une diminution
régulière de la luminosité des franges sur les bords de la figure : les franges d’ordre
élevé ne seront jamais observables.
Les maxima de lumière correspondant aux ordres visibles sont par contre toujours
très fins ; on peut en particulier définir et déterminer la demi-largeur à la base ∆θ
d’un de ces maxima en considérant que ∆θ est la petite variation de θ qui mène de
la valeur θp du maximum d’ordre p à la première annulation de la fonction de réseau
voisine de θp , pour θ = θp ± ∆θ.
λ0 a
On aura ainsi sin θp = p tandis que 2π sin(θp + ∆θ) = 2pπ + ∆ϕ ou encore
a λ0
a 2π
2π sin(θp + ∆θ) = 2pπ + ; un développement limité au premier ordre mène alors
λ0 N
a 2π λ0 λ0 1
à 2π cos θp ∆θ = ou ∆θ = = p .
λ0 N N a cos θp a N 1 − p2 λ20 /a2
On remarquera que ce calcul s’applique encore en incidence oblique, puisqu’il consiste
à rajouter le terme constant −a sin θi qui disparaı̂t dans l’évaluation du terme dif-
férentiel ∆θ ; on pourra donc être amené à retrouver l’expression générale (dont la
connaissance n’est pas exigible) :
λ0
∆θ = (9.8)
N a cos θp
10−2
Dans le cas de la figure 9.17, a = 5λ0 et N = 20 donc ∆θ = p soit
1 − p2 /25
∆θ ∼ 10−2 rad ; dans le cas d’un réseau réel, N est plutôt de l’ordre de plusieurs
centaines et la largeur angulaire d’un ordre (ou d’un maximum principal) est de
l’ordre de moins d’un milliradian, ce qui correspond à une tache de largeur inférieure
à 1 mm au foyer d’une lentille de projection de 1 m de focale.
9.3 Applications des réseaux
9.3.1 Métrologie des longueurs d’onde

2 Dispersion par un réseau : considérons un réseau plan, éclairé sous l’incidence θi ;
on a vu que l’amplitude diffractée par le réseau se concentre dans des maxima très fins,
λ0
dont les positions angulaires sont données par la relation sin θp = sin θi + p . Pour
a
un réseau et un ordre donnés, une variation δλ0 de longueur d’onde s’accompagne
donc d’une variation δθ de l’angle d’observation du maximum.
Un réseau est donc (comme un prisme) un dispositif dispersif ; on définit la dispersion
Dp par un réseau utilisé dans l’ordre p de sorte que δθ = Dp δλ0 , donc par la relation :
dθp p
Dp = = (9.9)
dλ0 a cos θp
a a
Comme = q est une fonction croissante de |p|, on aura
cos θp 2
1 − (sin θi + pλ0 /a)
donc intérêt à utiliser l’ordre le plus élevé possible pour obtenir une dispersion élevée,
ce choix pouvant être contrarié par deux inconvénients des ordres élevés :
– la diminution de la luminosité des ordres élevés, du fait de l’enveloppe globale de
diffraction ;
– l’éventualité de la superposition des ordres, qui rend délicate l’interprétation des
raies observées pour les ordres élevés.
2 Spectrosopes à réseau : la réalisation d’un spectroscope à réseau pour la mesure
des longueurs d’onde consiste donc simplement à réaliser une structure diffractante
périodique de période a connue, avant de l’utiliser sur un goniomètre comme dans le
cas des figures 9.12 par exemple.
La mesure de l’angle d’émergence θp et de l’angle d’incidence θi permet donc, si a et
l’ordre p choisi pour l’observation sont connus, d’en déduire une mesure de la longueur
d’onde du rayonnement utilisé, par application de la relation de Bragg (9.4).
λ0
2 Domaine d’utilisation : puisque sin θp = sin θi + p , la condition nécessaire pour
a
l’obtention d’ordres observables est que λ0 et a doivent rester du même ordre de
grandeur, ou plus précisément a & λ0 . En effet :
– si a < λ0 , on aura toujours |p|λ0 /a > |p| > 1 et pratiquement aucun ordre ne sera
observable (sauf l’ordre zéro, qui n’est pas dispersif) ;
– si a ≫ λ0 , la dispersion Dp sera toujours très faible et la mesure des longueurs
d’onde sera très peu précise.
Par exemple, pour la détermination d’une longueur d’onde du domaine visible, on uti-
lisera des réseaux tels que a > 1 µm, où 1/a < 1 000 traits par millimètre. Des valeurs
de a plus faibles correspondent à des mesures possibles dans le domaine ultraviolet.
Les fabricants de réseaux, utilisant notamment des techniques dérivées de l’hologra-
phie, proposent régulièrement pour ces usages des réseaux de diffraction comportant
jusqu’à 5 000 traits par millimètre ou plus.
Pour la détermination de longueurs d’onde plus courtes (par exemple dans le domaine
des rayons X, avec λ ∼ 10−10 m), on peut remplacer les réseaux gravés par des
machines par des structures cristallines, le rôle des traits du réseau étant rempli par
les plans réticulaires du cristal (plans d’alignement des atomes). La distance entre
plans réticulaires est alors de l’ordre de grandeur des paramètres de maille, soit par
exemple a ∼ 200 pm = 2 × 10−10 m.
2 Résolution spectrale : rappelons ici que la résolution d’un appareil de mesure est,
en général, la plus petite variation de la grandeur mesurée repérable par l’appareil.
Dans le cas d’un réseau utilisé pour la mesure des longueurs d’onde, cette résolution
est évaluée par le plus petit écart δλ0 provoquant une déviation δθ repérable, compte
tenu de l’ensemble des limitations de mesure des angles.
Nous ne prendrons ici en compte que la seule limitation intrinsèque d’un spectroscope,
due au phénomène de diffraction lui-même. La figure 9.18 illustre la répartition de
lumière attendue par un réseau observé dans l’ordre p s’il est éclairé par deux raies
de longueurs d’onde λ0 et λ0 + δλ0 ; du fait de l’incohérence de ces deux raies, on
observera comme éclairement la somme des deux éclairements dus aux deux raies.
E E Dp δλ0
λ0 λ0 + δλ0 λ0 λ0 + δλ0
∆θ
θ θ
Deux raies non résolues Raies juste résolues
Figure 9.18 – Résolution de deux raies par un réseau
Sur cette figure 9.18, le tracé de gauche correspond à deux raies non résolues car
angulairement trop proches ; à l’observation, on croı̂t voir une raie unique (traits
pleins) là où on a en fait la somme de deux éclairements correspondant à deux raies
insuffisamment décalées en longueur d’onde.
Au contraire, le tracé de droite correspond au cas de deux raies résolues : on voir
nettement apparaı̂tre un minimum local entre les deux maxima d’éclairement voisins.
On définit la limite de résolution en appliquant le critère de Rayleigh déjà employé
pour l’étude de la résolution spatiale pour la formation des images : on dira que les
raies sont résolues si l’écart angulaire δθ = Dp δλ0 qui les sépare est supérieur à la
demi-largeur à la base ∆θ commune aux deux pics que l’on cherche à distinguer.
p λ0
Cette condition s’écrit donc δλ0 > , compte tenu de (9.9) et (9.8) ; il
a cos θp N a cos θp
existe donc un écart de longueur d’onde minimal résolu, tel que δλ0 > δλmin constitue
le critère de résolution.
On définit habituellement le pouvoir de résolution du réseau par la grandeur sans
dimension :
λ0
R= = pN (9.10)
δλmin
Ainsi, pour atteindre une résolution élevée, on doit utiliser un réseau comportant un
nombre élevé de traits, dans l’ordre le plus élevé possible.
Avec de simples réseaux par transmission, on peut atteindre N de l’ordre de plusieurs
centaines et R de l’ordre de quelques milliers, ce qui permet de séparer deux raies
distantes, en longueur d’onde, d’un millième en valeur relative ; c’est par exemple le
cas des deux raies du doublet D du sodium ; avec λ1 = 589, 0 nm et λ2 = 589, 6 nm,
ces raies sont résolues par la plupart des réseaux usuels, sauf si d’autres défauts de
réalisation optiques du spectroscope viennent dégrader la résolution.
Pour atteindre des résolutions plus élevées, on doit changer la technologie de réalisa-
tion des réseaux ; on verra par exemple en exercice comment l’utilisation de réseaux
non plans (réseau de Michelson par exemple) permet d’augmenter fortement la valeur
du pouvoir de résolution R = pN .
2 Applications à l’astronomie : Fraunhofer‡ fur le premier à fabriquer, en , un
réseau constitué de fils fins équidistants tendus entre deux supports. Au moyen d’un
tel réseau, il décomposa la lumière solaire et découvre dans le spectre correspondant
500 raies sombres qui portent aujourd’hui le nom de raies de Fraunhofer.
Bunsen et Kirchhoff donnèrent vers  l’interprétation correcte des raies de
Fraunhofer : il s’agit de raies correspondant à l’absorption de la lumière par les
gaz contenus dans la partie la plus froide de l’atmosphère solaire. La comparaison
des longueurs d’onde correspondant à ces raies d’absorption permit de déterminer la
composition chimique de l’atmosphère solaire.
La généralisation de la méthode à l’étude de spectres d’étoiles ou de galaxies plus
lointaines montre en général un décalage vers le rouge des raies d’absorption par
rapport à leur valeur mesurée pour les mêmes éléments au laboratoire. On interprète
ce décalage par un effet Doppler du à l’éloignement des sources stellaires, dans le
cadre de l’expansion de l’univers consécutive à l’explosion primordiale (ou Big Bang).
La mesure de ce décalage vers le rouge permet une mesure directe de la vitesse de

récession des étoiles et galaxies lointaines et, donc, une validation des modèles cosmo-
logiques.
9.3.2 Métrologie des longueurs

2 Diffraction par les cristaux : on peut, à l’inverse de la réalisation des spectroscopes,
utiliser des faisceaux d’ondes de longueur d’onde λ0 connue pour en déduire une me-
sure du pas a d’un réseau par observation de la figure de diffraction. Cette technique
est particulièrement utilisée pour la détermination des structures cristallines, considé-
rées comme des associations de réseaux bidimensionnels formés de plans réticulaires,
plans d’alignement des atomes dans un cristal.
La figure 9.19 montre la disposition de certains plans réticulaires dans un cristal ; un
faisceau cohérent de rayons X éclaire ce cristal et on étudie les interférences formées, à
l’infini, par les faisceaux diffractés par des plans réticulaires successifs en fonction des
angles d’incidence et de réflexion θ supposés égaux (on néglige donc ici la diffraction
en se plaçant dans le cadre des lois de Snell-Descartes).
En notant a la distance entre les plans réticulaires indiqués sur le schéma, la différence
de marche entre deux rayons réfléchis sur des plans réticulaires consécutifs devient
a cos2 θ
δ = (HIJ) − (HK), avec HI = IJ = et HK = HJ cos θ = 2a . Il vient
sin θ sin θ
donc δ = 2a sin θ. La condition de maximum d’interférences conduit à la relation de
Bragg généralisée à cette géométrie, 2a sin θp = pλ0 .
Le choix des plans réticulaires est toutefois largement arbitraire ; la même figure 9.19
montre un autre réseau de plans réticulaires, caractérisé par le pas a′ . Finalement, du
fait de la présence de très nombreux ensembles de plans réticulaires, dont l’orientation
relative dans l’espace peut être assez variée, on obtient une figure de diffraction formée
de nombreux pics étroits, répartis dans les diverses directions de l’espace autour de
Π
θ θ
H
J
I
a
a′
Figure 9.19 – Diffraction par des plans réticulaires d’un cristal
l’ordre zéro. La figure 9.20 montre une telle figure de diffraction, dans le cas d’un
cristal à symétrie cubique.
Figure 9.20 – Diffraction des rayons X par un cristal
La comparaison de la figure observée avec un modèle de répartition des atomes sur

les nœuds du réseau cristallin permet de déterminer tous les paramètres géométriques
de la maille cristalline, si on connaı̂t la longueur d’onde λ0 du faisceau de rayons X
utilisé.
2 Généralisation : la méthode proposée ci-dessus se généralise à toutes sortes de
molécules, dont on étudie la diffraction par des faisceaux de rayons X pour en déter-
miner la répartition des atomes dans l’espace, où même plus précisément la densité
volumique de répartition électronique dans la molécule.
Pour cet usage, des sources de rayons X intenses sont utilisées (rayonnement syn-
chrotron dû à l’accélération des électrons dans un accélérateur circulaire d’électrons)
et des méthodes numériques performantes permettent de remonter de l’observation
de la figure de diffraction par une molécule cristallisée à l’intégralité de la structure
géométrique de celle-ci.
Ces méthodes sont notamment utilisées dans le domaine de la biochimie pour déter-
miner la structure tridimensionnelle de molécules d’intérêt biologique : protéines et
enzymes, ADN, etc.
Un réseau est un dispositif diffractant à transparence périodique ; la période a

de la fonction de transmittance est le pas du réseau. Les traits du réseau étant
très longs, la diffraction n’a lieu que dans le plan perpendiculaire à ces traits.
b
b
b
θi b θ
b
b
a b
réseau
La différence de marche observée à l’infini entre deux rayons diffractés par
deux traits consécutifs est δ = a (sin θ ∓ sin θi ) ; les signes doivent être choisis
en fonction des orientations conventionnelles des angles mais on doit toujours
vérifier que δ = 0 pour les rayons non diffractés (c’est-à-dire, la direction de
l’optique géométrique).
La position des maxima principaux (ordres du réseau) est indépendante du
nombre N de traits ; elle est donnée par la relation de Bragg, δ = pλ0 donc
sin θp = ± sin θi + pλ0 /a. Ces maxima sont très fins si N est élevé.
La condition | sin θp | < 1 limite le nombre d’ordres observables.
dθp p
Un réseau est un système dispersif, avec Dp = = .
dλ0 a cos θp
N
X −1
L’amplitude totale diffractée par un réseau est wtotal = w0 exp (−jnϕ) avec
n=0
ϕ = 2πδ/λ0 ; il y a mise en facteur du terme de diffraction w0 commun aux N
traits identiques du réseau.
sin2 (N ϕ/2)
L’éclairement total diffracté par un réseau est Etotal = Eun trait ; la
sin2 (ϕ/2)
fonction de réseau qui apparaı̂t ici présente des maxima principaux d’amplitude
N 2 pour ϕ = 2pπ, séparés par N − 2 maxima secondaires peu sensibles ; la
demi-largeur à la base des maxima principaux est 2π/N . Dans le tracé de cette
fonction d’éclairement, Eun trait est une enveloppe de diffraction.
E
p = δ/λ0
b b b b b
−2 −1 0 1 2
Un réseau peut être utilisé pour la mesure des longueurs a ou des longueurs
d’onde λ0 ; la résolution des mesures augmente avec l’ordre p et avec le nombre
N de traits éclairés.
Pour un spectroscope, le critère de Rayleigh permet d’évaluer la résolution
δλmin selon R = λ0 /δλmin = pN .
Pour la mesure d’une longueur a, on doit choisir une longueur d’onde λ0 . a.
Chapitre 10
Interférences localisées
10.1 L’interféromètre de Michelson
10.1.1 Historique
2 Le problème de l’éther : lors de la publication du Treatise on Electricity and Magne-
tism par Maxwell en , l’ouvrage prédisait la possibilité de propagation d’ondes
électromagnétiques. La vérification expérimentale, apportée peu de temps après par
Hertz, posa un problème de cohérence avec la théorie mécanique : les équations de
√
Maxwell prévoyaient en effet une célérité de propagation c0 = 1/ ε0 µ0 , valeur uni-
verselle qui ne pouvait donc être réalisée que dans un seul référentiel galiléen : les lois
d’addition des vitesses imposaient un changement de la vitesse de propagation par
changement de référentiel galiléen.
Les physiciens furent donc amenés à admettre l’existence d’un référentiel galiléen
particulier, unique système de référence relativement auquel les équations de l’élec-
tromagnétisme devaient s’appliquer ; on appela ce référentiel éther absolu.
Dans un autre référentiel galiléen R′ , en translation à la vitesse v relativement à l’éther
absolu R, la vitesse d’une onde électromagnétique devait donc devenir c′ = c + v, si
c = c0 u est la vitesse de l’onde électromagnétique se propageant dans la direction u
du référentiel R. Dans la suite, R′ est le référentiel terrestre et les mesures proposées
devaient donc mettre en évidence la vitesse de déplacement de la Terre par rapport à
l’éther absolu.
2 L’expérience de Michelson et Morley : la mise en évidence de ce référentiel de l’éther
absolu fut l’objet de nombreuses expériences, parfois très fines, et toutes infructueuses ;
toutefois, l’une des plus célèbres de ces expériences a conduit à la construction d’un
appareil qui reste d’un usage très étendu aujourd’hui.
Il s’agit de l’expérience menée en  par Michelson‡ et Morley, destinée à mettre
en évidence le mouvement de la Terre relativement à l’éther absolu au moyen d’une
méthode interférométrique. En assimilant a priori l’éther absolu au référentiel de
repos du système solaire, les expérimentateurs s’attendaient à une variation périodique
annuelle du système de franges formé.
Le principe de l’expérience est décrit sur le schéma de la figure 10.1 : une source
émet en A deux ondes synchrones à angle droit. Deux miroirs orthogonaux M1 et
M2 renvoient ces ondes vers le point A où on étudie leur déphasage par une méthode
interférentielle ; si les trajets AM1 et AM2 sont identiques, le déphasage est entière-
ment dû au fait que l’ensemble de l’appareil se déplace (avec la Terre) à la vitesse
v relativement à l’éther absolu : v est ainsi la vitesse d’entraı̂nement du référentiel

terrestre R′ relativement à l’éther absolu R.
b y
M2 R 2
c0
c
x
v
v
A R1 M1
b b
Figure 10.1 – Expérience de Michelson et Morley
L’une de ces ondes est émise parallèlement à l’axe (Ox) qui est celui de la vitesse v ; le
parcours de A jusqu’au point R1 de réflexion sur un miroir M1 se fait donc à la vitesse
c0 + v par rapport à R′ , tandis que le trajet de retour R1 A se fait à la vitesse
c0 −2 v.
ℓ ℓ 2ℓ v
Le temps de parcours aller et retour est donc τ1 = + ≃ 1+ 2
c0 + v c0 − v c0 c0
car v ≪ c0 , si ℓ désigne la distance AM1 .
L’autre onde est émise perpendiculairement à cette direction, et l’ondevoyage donc à
v2
q
′ 2 2
la vitesse cey = c0 u + vex dans R , ce qui impose c = c0 − v ≃ c0 1 − 2 . Le
2c0
temps de trajet aller
et retour est donc, si la distance AM2 est aussi égale à ℓ, donné
v2

2ℓ 2ℓ
par τ2 = ≃ 1+ 2 .
c c0 2c0
2π
Finalement, l’écart de phase à l’arrivée est de l’ordre de Φ = ω (τ1 − τ2 ) soit Φ = ∆
λ0
où la différence de marche équivalente est donnée par ∆ = ℓv 2 /c20 . En réalisant un
appareil avec des bras de l’ordre de ℓ ∼ 10 m, et v étant de l’ordre de grandeur de la
vitesse de la Terre sur son orbite (v ∼ 30 km · s−1 ), la différence de marche attendue
∆ 0, 1
était de l’ordre de ∆ ∼ 100 nm, soit un ordre d’interférence p = = = 0, 2
λ0 0, 5
dans le domaine visible.
Après trois mois sur son orbite, la vitesse v de la Terre devant tourner de π/2, on s’at-
tendait à voir permuter les rôles des deux bras AM1 et AM2 ; la variation périodique
du système de franges devait être parfaitement décelable, les franges se déplaçant de
manière sinusoı̈dale dans le plan d’observation, de part et d’autre de leur position
moyenne, avec une amplitude totale de déplacement de 0, 4 frange.
Le résultat nul de l’expérience de Michelson et Morley, même après avoir augmenté
la longueur ℓ des bras de l’interféromètre jusqu’à plus de 30 mètres, a amené les
physiciens à réviser certaines notions théoriques fondamentales. On peut citer ici les
travaux du physicien Lorentz et du français Poincaré.
L’interprétation aujourd’hui communément admise du résultat nul de l’expérience de
Michelson et Morley fut donnée en  par Einstein, sous la nom de théorie de
la Relativité restreinte, basée sur le fait désormais expérimental que la célérité de la
lumière dans le vide c0 est un invariant par changement de référentiel galiléen.
10 : Interférences localisées 215
2 La théorie de la relativité : dans le cadre de la théorie de la relativité, on considère

que les bases de la Mécanique sont fausses en présence de mouvements à grande
vitesse : le temps ne s’coule plus identiquement dans deux référentiels R et R′ en
translation l’un par rapport à l’autre. Les lois de composition des positions (x 7→ x′ )
et des instants (t 7→ t′ ) doivent à la fois conserver la forme limite non relativiste à
basse vitesse (t′ ∼ t et x′ ∼ x − vt) et consacrer l’invariance de c0 par changement de
référentiel galiléen. Toute autre connaissance sur cette théorie est hors programme, et
les développements présentés ci-après ne sont proposés qu’à titre documentaire.
Ainsi, si un signal lumineux est émis à l’instant 0 au point origine O (quand ce point
est donc commun aux deux référentiels R et R′ ) le long de leur axe commun (Ox), ce
rayon lumineux sera perçu à l’abscisse x et à l’instant t = x/c0 dans R, et à l’abscisse
x′ à l’instant t′ = x′ /c0 dans R′ .
On montre que la seule transformation linéaire qui assure cette conservation est la
transformation de Lorentz, donnée par les relations (10.1) ; dans ces équations, on
vérifie par exemple facilement que, si x = c0 t, alors x′ = c0 t′ .
x − vt t − vx/c20
x′ = p t′ = p (10.1)
1 − v 2 /c20 1 − v 2 /c20
Les conséquences de la théorie de la Relativité et de la transformation de Lorentz

sont immenses : en plus de décrire l’écoulement du temps comme un phénomène
relatif à l’observateur et non pas absolu, elle a imposé un remaniement complet de la
Mécanique puisque ses fondements les plus élémentaires, comme la loi d’addition des
vitesses, cessent d’être valables.
dx dx′
Ainsi, les vitesses et ′ d’un même mobile relativement à R et R′ vérifient elles
dt dt
la relation d’addition modifiée :
dx′ dx/dt − v
= (10.2)
dt′ 1 − vdx/c20 dt
dx′ dx
au lieu de la loi d’addition des vitesses = − v (vitesse relative = vitesse
dt′ dt
absolue − vitesse d’entraı̂nement) de la mécanique classique. Notons en particulier
dx dx′
que, si = ±c0 avec η = ±1, alors = ±c0 également : la loi d’addition des
dt dt′
vitesses généralisée laisse, comme prévu, invariante la norme et le sens de la célérité
des ondes lumineuses par changement de référentiel galiléen.
10.1.2 Constitution de l’interféromètre

2 Séparation du faisceau : l’aspect fondamental de la réalisation de l’appareil de
Michelson est la production de deux faisceaux cohérents se propageant à angle droit,
ce qui fait de l’appareil de Michelson un dispositif à division d’amplitude. On utilise
pour cette division une lame semi-réfléchissante (ou lame séparatrice) Sp disposée à
45◦ du faisceau incident, selon la figure 10.2.
Le système semi-réfléchissant est en général réalisé au moyen d’une lame de verre à
faces parallèles, de faible épaisseur h, traitée sur une de ses faces au moyen d’un fin
dépôt métallique pour être semi-réfléchissante. Le schéma est proposé dans le cas où
c’est la première face qui est ainsi traitée, mais on rencontre aussi l’autre cas.
Sp
α
α
α
Séparation du faisceau Réalisation de la lame Sp
Figure 10.2 – Lame semi-réfléchissante de l’interféromètre de Michelson
L’application des lois de Snell-Descartes montre immédiatement qu’en cas d’incidence

sous l’angle α, un des faisceaux n’est pas dévié tandis que l’autre subit une déviation
D = π − 2α ; si α est de l’ordre de π/4, on produit bien deux faisceaux presque
orthogonaux.
2 Éclairage des miroirs de l’interféromètre : on complète la lame semi-réfléchissante

Sp au moyen de deux miroirs, dont nous supposerons provisoirement qu’ils sont or-
thogonaux entre eux et aux axes (Ox) et (Oy) d’un système de coordonnées cartésien
dont la lame Sp forme la première bissectrice ; par contre, le faisceau incident sur le
système pourra être incliné sur (Ox) d’un angle i, comme le montre la figure 10.3.
y
M2
Sp M1
3π/2
x
i
Figure 10.3 – Éclairage des miroirs de l’interféromètre de Michelson
On considère alors la progression des divers faisceaux sauf ceux qui sont renvoyés en
direction de la source lors de la seconde réflexion sur la lame semi-réfléchissante ; ces
rayons ont, sur la lame semi-réfléchissante, des angles d’incidence α = π/4 ± i et
subissent donc :
– pour le rayon qui se réfléchit en M1 , une transmission sans dérivation par Sp, une
réflexion sur M1 avec déviation de π−2i, et enfin une réflexion sur Sp avec déviation
de π/2 + 2i ;
– pour le rayon qui se réfléchit en M2 , une réflexion sur Sp avec déviation de π/2 + 2i,
une réflexion sur M2 avec déviation de π − 2i, et enfin une transmission par Sp sans
déviation.
Comme le montre la figure 10.3, les deux faisceaux sortent alors de l’interféromètre
parallèlement entre eux, et perpendiculairement au faisceau d’entrée (avec donc une
déviation totale égale à 3π/2).
2 Lame compensatrice : l’étude de la propagation des faisceaux de rayons dans l’in-

terféromètre montre que chacun d’eux rencontre deux fois la lame semi-réfléchissante,
une fois pour une réflexion et une fois pour une transmission. La figure 10.4 (à gauche)
montre ces trajets dans le cas d’un angle d’incidence i quasiment nul ; les trajets aller
(avant réflexion sur les miroirs M1 et M2 ) et retour (après réflexion) sont décalés pour
plus de lisibilité.
Cp
Sp
Figure 10.4 – Lame semi-réfléchissante et compensation
Les faisceaux qui se réfléchissent sur M1 traversent trois fois la lame, tandis que ceux
qui se réfléchissent sur M2 ne la traversent qu’une fois. Cette différence introduit donc
une différence de marche δlame = 2n(λ0 )h(i), où h(i) est l’épaisseur de lame traversée
(qui dépend de l’incidence i) et n(λ0 ) est l’indice optique de la lame (qui dépend de
la longueur d’onde utilisée).
Pour éviter de devoir prendre en compte ce terme, dont les variations en fonction de
i et λ0 sont complexes, on utilise une lame compensatrice, exactement identique à la
lame séparatrice et disposée parallèlement à celle-ci, mais qui n’a pas subi de trai-
tement semi-réfléchissant ; la figure 10.4 (à droite) montre clairement qu’en présence
de cette lame, chacun des faisceaux traverse exactement trois fois la même épaisseur
du même matériau, supprimant par là même toute différence de marche au niveau de
l’ensemble formé des lames séparatrice Sp et compensatrice Cp.
Si la lame semi-réfléchissante est métallisée sur sa face arrière (c’est-à-dire du côté

de M1 et non pas de M2 ), la lame compensatrice Cp doit être disposée sur le trajet
entre Sp et M1 au lieu d’être disposée entre Sp et M2 comme sur les schémas
ci-dessus. Naturellement, quel que soit le choix du constructeur d’un interféromètre
de Michelson, la disposition de la lame Cp du bon côté de Sp est assurée.
2 Miroir fixe, miroir mobile : en l’absence de toute différence de marche au niveau

de l’ensemble séparateur compensateur, seuls les trajets depuis la lame jusqu’au deux
miroirs M1 et M2 sont éventuellement différents ; ces deux miroirs présentent :
– tous les deux, un réglage d’inclinaison, destiné à assurer avec la plus grande précision
possible l’orthogonalité du miroir et de son axe ; si ce réglage est bien réalisé, M1
est perpendiculaire à (Ox), M2 est perpendiculaire à (Oy) et les deux miroirs sont
dits orthogonaux ;
– pour un seul d’entre eux (le miroir M1 dans la suite), un réglage de translation
permettant de déplacer le miroir, sur un chariot mobile, le long de l’axe (Ox). Le
déplacement du miroir s’appelle chariotage ; réglé au moyen d’une vis micromé-
trique, il peut être contrôlé avec une grande précision (de l’ordre d’une fraction de
micromètre) ou être imposé à vitesse constante au moyen d’un moteur.
y
M2
Cp
Le M1
d2 Sp
S x
b
d1
VA
Lo Chariotage
Figure 10.5 – Schéma complet de l’appareil
On complète enfin le schéma de principe (figure 10.5) de l’interféromètre en ajoutant

un verre de protection anticalorique V A à l’entrée, protégeant les lames et miroirs
d’une élévation de température due à la source S, disposée éventuellement derrière
une lentille d’éclairage Le ; on utilise aussi en général une lentille de projection Lo
pour l’observation des franges.
On notera enfin d1 et d2 les distances des deux miroirs M1 et M2 au point d’intersec-
tion des faisceaux entrant et sortant de l’appareil (en incidence normale, c’est-à-dire
quand ces faisceaux sont alignés avec les axes (Ox) et (Oy).
La photographie de la figure 10.6 montre un des appareils utilisés au Laboratoire ; les
deux miroirs et les lames séparatrice et compensatrice y figurent, ainsi que les trajets
des rayons lumineux dans l’interféromètre.
Figure 10.6 – Un interféromètre de Michelson de laboratoire
10.1.3 Réglages de l’interféromètre

2 Dépliement des faisceaux : on a vu plus haut que l’ensemble des lames sépara-
trice et compensatrice est conçu pour assurer la séparation des deux faisceaux et une
déviation globale de 3π/2, sans introduire de différence de marche supplémentaire.
En réalité, en fonction de la nature du traitement semi-réfléchissant disposé sur

la lame séparatrice, une différence de marche globale de λ0 /2 (correspondant à
un changement de signe ou à un déphasage de π) peut apparaı̂tre entre les deux
faisceaux ; l’effet de cette différence de marche est l’interversion des franges claires
et sombres et sera facilement pris en compte en fin de calculs le cas échéant. Nous
l’oublierons donc provisoirement dans les calculs qui suivent.
Ainsi, les deux faisceaux émergent de l’appareil parallèlement et au voisinage de l’axe
(Oy) ; on peut rendre compte de l’ensemble des propriétés géométriques et optiques de
ces deux faisceaux en les dépliant au niveau des réflexions sur l’ensemble séparateur-
compensateur, comme le montre la figure 10.7 à gauche.
M2
M1 M2′ M1
Figure 10.7 – Dépliement des faisceaux dans l’interféromètre de Michelson
Dans toute la suite, on remplacera donc le miroir fixe M2 par son symétrique M2′
relativement à la lame séparatrice, et on oubliera toutes les réflexions sur cette lame
séparatrice, conformément à la figure 10.7, à droite.
2 Réglage en lame d’air : lorsque les miroirs M1 et M2 sont rigoureusement per-
pendiculaires, ou encore quand M1 et M2′ sont rigoureusement parallèles, on dit que
l’interféromètre est réglé en lame d’air ; on emploie aussi parfois le vocabulaire abusif
(( réglage en miroirs parallèles )). Les miroirs M1 et M2′ forment alors une lame d’air
fictive d’épaisseur e = d1 − d2 .
On notera, ici et dans toute la suite, que e est une grandeur algébrique ; e est positif
si le miroir M1 est charioté au-delà de la position de M2′ , et négatif sinon. La position
e = 0, pour laquelle M1 et M2′ se superposent exactement, porte le nom de contact
optique.
Dans un réglage en lame d’air, on a déjà eu l’occasion de déterminer la différence de
marche entre les deux rayons, parallèles entre eux, issus de la lame ; la figure 10.8
rappelle le principe de ce calcul de δ au point de convergence P des deux faisceaux,
situé dans le plan focal image de la lentille de projection Lo .
Considérons ainsi un rayon lumineux quelconque incident sous l’angle i en direction
des deux miroirs de l’interféromètre ; on notera S l’intersection de ce rayon avec l’axe
(Ox). Les rayons réfléchis sur les miroirs M1 et M2′ croisent le même axe aux points
S1 et S2 , symétriques de S par rapport à M1 et M2′ ; ces deux points sont distants de
2e et peuvent être considérés comme des sources secondaires en phase avec le point
(commun aux deux faisceaux) S. En partant des deux sources secondaires S1 et S2 ,
on voit donc que la seule différence de marche est δ = S1 H.
Finalement, δ = (SM1 P ) − (SM2 P ) = S1 H = 2e cos i ; l’angle i correspond à la
r
distance r = F ′ P selon la relation tan i = ′ ; l’ensemble du schéma est invariant de
fo
M2′ M1
b
P i Sb bH i x
F′ b i b b
S2 S1
fo′ e 2e
Figure 10.8 – Différence de marche et réglage en lame d’air
révolution autour de l’axe (Ox) et les franges sont donc circulaires d’axe (Ox). On
retiendra l’expression de la différence de marche et du rayon de la frange d’ordre p :
rp
δ = 2e cos ip = pλ0 tan ip = (10.3)
fo′
!
rp i2p
Dans les conditions de Gauss, on peut écrire ip ≃ ′ et δ ≃ 2e 1 − , d’où
fo 2
l’expression approchée :
r
pλ0
rp = fo′ 2− (10.4)
e
La relation (10.3), avec 0 6 ip < π/2, montre que p et e sont de même signe ; comme le
rayon des franges ne dépend que du rapport p/e, nous nous contenterons ici d’étudier
les conséquences de (10.4) si e > 0 et p > 0.
D’après cette relation, rp est une fonction décroissante, non linéaire de p ; la valeur
minimale rp = 0 correspond donc à la valeur maximale pmax = 2e/λ0 atteinte au
centre de la figure et qui correspond à un trajet aller et retour de longueur 2e entre
les deux miroirs.
Enfin, pour p > 0 fixé, rp est une fonction croissante de e ; le cas particulier remar-
quable e = 0 correspond à δ = 0 en tout point de l’écran.
On retiendra l’ensemble de des résultats sous la forme suivante, détaillant les proprié-
tés des franges d’égale inclinaison ou anneaux de Haidinger :
Anneaux d’égale inclinaison

X Dans le réglage en miroirs parallèles, l’interféromètre de Michelson pro-
duit, à l’infini, des anneaux concentriques non équidistants.
L’ordre des franges est maximal au centre et correspond à δcentre = 2e ;
l’ordre décroı̂t sur les bords de la figure.
Au contact optique (e = 0), l’éclairement est uniformément lumineux ;
lorsqu’on s’en éloigne, e augmente à partir de zéro et les anneaux
semblent sortir du centre (rp croı̂t à p fixé).
La photographie de la figure 10.9 représente les franges d’une lame d’air réalisées avec
un interféromètre de Michelson éclairé par une source spectrale (lampe à vapeurs de
Mercure).
Figure 10.9 – Anneaux de Haidinger, lampe au Mercure
La présence de nombreux anneaux visibles montre que les valeurs de i ne sont pas
limitées aux conditions de Gauss ; bien au contraire, on atteint facilement quelques
dizaines de degrés pour la valeur maximale de i. La source qui éclaire l’interféromètre
est donc large ; le problème du défaut de cohérence spatiale de cette source est abordé
au § 10.2.1.
2 Applications à la métrologie : la relation (10.3) permet de relier une mesure de
rayon d’un anneau clair (p ∈ Z) ou sombre (p + 1/2 ∈ Z) à une mesure de la longueur
e ou de la longueur d’onde λ0 .
Toutefois, la valeur exacte de l’ordre d’interférence p est en général inconnue ; on doit
donc effectuer au moins deux mesures de rayons, par exemple consécutifs (p2 = p1 − 1
si p1 est l’anneau interne et p2 le rayon externe) ou, pour améliorer la précision,
séparés par m rayons intermédiaires (avec dans ce cas p2 = p1 − m − 1).
cos ip2 − cos ip1
On élimine alors p1 et p2 en écrivant m + 1 = 2e , ce qui permet de
λ0
mesurer e si on connaı̂t λ0 , ou au contraire de mesurer λ0 si on connaı̂t e.
La mesure des longueurs correspondant par exemple à un déplacement donné e des
miroirs depuis le contact optique est une application en métrologie des longueurs ; un
interféromètre de Michelson peut ainsi réaliser des étalons de longueur ou, comme on
le verra en exercice, des mesures d’épaisseur de diverses lames.
La mesure des longueurs d’onde peut s’étendre, comme on le verra plus bas, à la
détermination du spectre de luminance d’une source non monochromatique.
2 Réglage en coin d’air : considérons maintenant un appareil de Michelson réglé
au voisinage immédiat du contact optique, c’est-à-dire pour d1 = d2 . Tout défaut de
réglage du parallélisme des miroirs M1 et M2′ (qu’il soit involontaire ou délibéré) mène
à la formation d’un coin d’air, comme celui qui est représenté sur la figure 10.10.
Les rayons lumineux incidents sur le miroir M1 sous l’incidence i sont dirigés par le
2π
vecteur d’onde k = (cos iex − sin iey ) ; après réflexion sur ce miroir, ils sont dirigés
λ0
2π
par le vecteur d’onde k1 = − (cos iex + sin iey ).
λ0
De même, l’angle d’incidence sur le miroir M2′ est i′ = i + α, si α est l’angle dièdre
formé par M1 et M2′ ; on en déduit que le faisceau réfléchi sur M2′ fait l’angle 2α + i
2π
avec l’axe (Ox), donc qu’il est dirigé par k2 = − (cos(i + 2α)ex + sin(i + 2α)ey ).
λ0
Ainsi, l’onde lumineuse totale observée en un point M (x, y, z) est-elle donnée par
w = w0 [exp (−jk1 · r) + exp (−jk2 · r)] ; la différence de phase correspondante est
M1 y
α
i
k i
x
i′
k1
e(y)
k2 M2′
Figure 10.10 – Réglage de l’interféromètre en coin d’air
2π
donc ∆ϕ = (k1 − k2 ) · r = δ, et on déduit donc le calcul de la différence de marche
λ0
2π
δ de celui de la différence k1 − k2 = 2 sin α (− sin(i + α)ex + cos(i + α)ey ).
λ0
Finalement, δ(M ) = 2 sin α [cos(i + α)y − sin(i + α)x] ; en particulier, lorsque l’ob-
servation est effectuée sur le plan du miroir M1 , x = 0 et on obtient l’expression
approchée valable pour les petits angles :
δ ≃ 2 sin αy ≃ 2αy ≃ 2e(y) (10.5)
puisque e(y) = tan αy est l’épaisseur du coin d’air à l’abscisse y ; on interprète bien
sûr ce résultat comme l’existence d’un aller en retour supplémentaire entre les lames
du coin d’air. Ainsi, les franges, données par l’équation δ = pλ0 , sont rectilignes,
d’équation yp = pλ0 /2α, parallèles à l’arête des miroirs M1 et M2′ , et équidistantes
d’interfrange λ0 /2α.
Figure 10.11 – Franges du coin d’air, éclairage en lumière blanche
La photographie de la figure 10.11 représente les franges du coin d’air réalisées avec
un interféromètre de Michelson éclairé en lumière blanche. Le problème du défaut de
cohérence temporelle de la source est abordé plus bas, voir le § 10.2.2.
10.2 Cohérence et contraste
10.2.1 Cohérence spatiale et localisation

2 Anneaux de Haidinger : pour obtenir des anneaux bien visibles comme ceux de
la photographie 10.9, il faut éclairer l’interféromètre de Michelson avec une source
angulairement large, comme le montre la figure 10.12.
2imax x
2imax
plus grand anneau visible
Figure 10.12 – Élargissement spatial de la source et anneaux de Haidinger
Ainsi, pour observer un anneau de rayon maximal rmax ∼ 30 cm au foyer d’une

lentille de focale fo′ ∼ 1 m, on doit avoir tan imax = rmax /fo′ donc imax ∼ 17◦ ; avec
une ouverture angulaire totale de 34◦ , la source est dite angulairement large.
En pratique, on peut utiliser comme source une lampe disposée directement devant
l’interféromètre ; une telle source ne peut évidemment pas être considérée comme
ponctuelle et ne vérifie donc pas le critère de cohérence spatiale.
Pourtant, les anneaux restent bien visibles si on les observe uniquement dans le plan
focal de la lentille de projection : c’est le phénomène de localisation.
Localisation des franges
X Dans le cas de certains dispositifs interférentiels, l’utilisation d’une source
spatialement étendue, donc incohérente, provoque en général la perte des
franges (par chute du contraste) en tout point de l’espace sauf sur une
surface bien spécifique, la zone de localisation des franges.
Avec un interféromètre à franges localisées, on peut utiliser une source étendue (donc
très lumineuse) à condition de ne réaliser l’observation que sur la surface de localisa-
tion. C’est le cas de l’interféromètre de Michelson réglé en lame d’air :
Localisation des anneaux de Haidinger
X Les anneaux de Haidinger (franges d’égale inclinaison d’une lame d’air)
sont localisés à l’infini, c’est-à-dire en pratique dans le plan focal image
de la lentille de projection.
Pour donner une interprétation simple de la localisation des franges de Haidinger, on

peut remarquer que la différence de marche δ en un point de l’écran d’observation
ne dépend que de la position de ce point, puisque δ = 2e cos i où r = fo′ tan i ; deux
éléments incohérents de la source de lumière large disposée devant l’interféromètre
éclairent des directions i et i′ différentes, et par conséquent ces faisceaux incohérents
ne se recoupent géométriquement pas sur la surface de localisation.
Au contraire, pour que deux rayons parviennent au même point de la surface de
localisation, il est nécessaire qu’ils soient issus de la source sous la même incidence i :
chaque point de la surface de localisation n’est atteint que par deux rayons issus de
la même partie de la source : de tels rayons restent exactement cohérents.
Nous pouvons éventuellement retenir la justification suivante de la localisation des
franges de la lame d’air : chaque point de la surface de localisation est l’intersection
de deux rayons lumineux issus, avant traversée de l’interféromètre, de la division

d’amplitude d’un rayon unique issu de la source. Ces deux rayons lumineux émergent
parallèlement entre eux et leur intersection est située à l’infini, ainsi donc que la
surface de localisation.
2 Franges de Fizeau : on a vu plus haut que les franges d’interférence d’un coin d’air
sont donnés par la relation δ(x, y) = 2 sin α [cos(i + α)y − sin(i + α)x] pour un coin
d’air d’angle dièdre α, si le miroir M1 est éclairé sous l’incidence i. Nous supposerons
comme ci-dessus que diverses valeurs de i correspondent à des éléments incohérents
de la source, spatialement large, qui éclaire l’interféromètre.
On constate bien sûr que l’élargissement spatial de la source pose en général un
problème de cohérence : pour un point (x, y) et un coin d’air α fixés, la différence
de marche varie lorsque i varie ; on superposera donc au même point des franges
claires (pour certaines valeurs de i) et des franges sombres (pour d’autres valeurs de
i). Globalement, les franges risquent d’être peu contrastées, voire invisibles.
Le seul cas où les franges restent visibles correspond à une différence de marche qui
∂δ
dépend très peu de i ; on cherchera donc à imposer = 0 pour des valeurs de i situées
∂i
de part et d’autre de zéro, ce qui correspond à la condition 0 = sin(i+α)x+cos(i+α)y
pour i = 0, on encore y = −x tan α.
Comme le montre la figure 10.10, il s’agit de l’équation du plan formé par le miroir
M2′ ; on a ainsi montré que les franges de Fizeau sont (au second ordre près en i)
localisées sur M2′ si le miroir M1 est éclairé au voisinage de l’incidence normale.
Le rôle des deux miroirs peut être permuté : si on éclaire M2 au voisinage de l’incidence
normale, les franges sont localisées sur la surface de M1 . En pratique, l’angle entre
les deux miroirs est trop faible pour qu’il soit possible de faire la différence entre les
deux situations ; on retiendra :
Localisation des franges de Fizeau
X Les franges de Fizeau (franges d’égale épaisseur d’un coin d’air) sont
localisés sur la surface des miroirs.
Pour donner une interprétation simple de la localisation des franges de Fizeau, on peut
là encore remarquer que la surface de localisation est formée des points sur lesquels
les parcours des deux rayons traversant les deux bras de l’interféromètre se séparent ;
chaque point de la surface de localisation est, ici encore, l’intersection de deux rayons
lumineux issus, avant traversée de l’interféromètre, de la division d’amplitude d’un
rayon unique issu de la source.
2 Généralisation : les résultats obtenus ci-dessus se généralisent, mais aucune pro-
priété générale n’est au programme. Rappelons donc simplement ici qu’avec tout dis-
positif interférentiel classique, l’élargissement spatial de la source de lumière provoque
en général une diminution du contraste des franges.
Toutefois, certains dispositifs à division du front d’onde présentent la propriété de
localisation des franges : cette perte de contraste est nulle ou très faible pour les points
d’une certaine surface, formée des intersections, après traversée de l’interféromètre,
de deux rayons lumineux issus, avant celui-ci, de la division d’amplitude d’un même
rayon issu de la source.
Il n’y a localisation que si cette propriété définit une surface unique dans l’espace ;
c’est en particulier le cas de l’interféromètre de Michelson, qu’il soit utilisé en lame
d’air (localisation à l’infini) ou en coin d’air (localisation sur les miroirs).
10.2.2 Cohérence temporelle et luminance spectrale

2 Luminance spectrale : considérons un système interférentiel à deux ondes éclairé,
d’abord, par une source monochromatique de nombre d’onde σ0 = 1/λ0 . En un point
où la différence de marche des deux ondes qui interfèrent est δ, l’éclairement produit
est E = 2E0 [1 + cos (2πσ0 δ)] ; dans cette expression, E0 est l’éclairement uniforme
attendu en présence d’une seule des deux voies de l’interféromètre.
En présence de plusieurs longueurs d’onde dans la source, on sait que l’incohérence
des émissions non synchrones impose de déterminer l’éclairement total en sommant
X
les éclairements correspondant à des nombres d’onde différents : Etotal = Eσi .
σi
Si les longueurs d’onde présentes sont assez nombreuses pour être décrites par une
modélisation continue, on remplacera cette somme par l’expression :
dE0
Z
E(δ) = 2 [1 + cos (2πσδ)] dσ (10.6)
dσ
dE0
Dans cette relation, × dσ désigne l’éclairement qui serait envoyé sur l’écran par
dσ
une seule voie de l’interféromètre si on limitait les nombres d’onde à un intervalle de
dE0
largeur dσ ; la grandeur porte donc le nom de luminance spectrale de la source.
dσ
La luminance spectrale est donc une mesure du caractère plus ou moins monochro-
matique d’une source lumineuse ; c’est une fonction très étroite centrée en σ0 dans le
cas d’une source quasi-monochromatique (figure 10.13 à gauche) ou au contraire une
fonction très large dans le cas d’une source de lumière blanche (figure 10.13 à droite).
dE/dσ dE/dσ
b
σ b b
σ
σ0 σmin σmax
Figure 10.13 – Exemples de luminances spectrales
D’une manière générale, la largeur ∆σ de la luminance spectrale caractérise le degré

de cohérence temporelle de la source : plus ∆σ est élevé, moins la source est cohérente.
2 Cohérence temporelle et contraste : le Zcalcul de l’intégrale (10.6) est souvent
dE0
possible explicitement. Le premier terme 2 dσ = 2Etotal est simplement une
dσ
constante (relativement à δ) qui mesure le double de l’éclairement total envoyé par la
source en présence seulement d’un des bras de l’interféromètre.
dE0
Z
Le second terme 2 cos (2πσδ) dσ est proportionnel à la partie réelle de la trans-
dσ
dE0
formée de Fourier de la fonction de luminance spectrale , calculée pour la variable
Z +∞ dσ
dE0 1 dE0
x = 2πδ, dont on rappelle que TF =√ exp (−jxσ) dσ.
dσ 2π σ=−∞ dσ
Le calcul de ce terme est possible explicitement dans le cas d’une luminance spectrale
simple, comme celle d’une raie de nombre d’onde moyen σ0 et de largeur spectrale
∆σ, dont la luminance spectrale est représentée sur la figure 10.14 à gauche.
dE/dσ V (δ)
K
σ0 σ −1/∆σ 1/∆σ δ
b b b
∆σ 2/∆σ
Figure 10.14 – Exemple de calcul de contraste dans le cas d’une raie de largeur ∆σ
dE0 dE0
Z Z
On a alors aisément 2 dσ = 2K∆σ tandis que 2 cos (2πσδ) dσ s’écrit
dσ dσ
Z σ0 +∆σ/2
2K ∆σ ∆σ
2K cos (2πσδ) dσ = sin 2πδ σ0 + − sin 2πδ σ0 −
σZ
0 −∆σ/2
2πδ 2 2
dE0
soit 2 cos (2πσδ) dσ = 2K∆σ cos (2πσ0 δ) V (δ), après quelques transformations
dσ
trigonométriques, et où on a choisi de poser V (δ) = sinc (π∆σδ). On reconnaı̂t alors
dans l’expression de l’éclairement E(δ) = 2K∆σ (1 + V (δ) cos (2πσ0 δ)) une fonction
de visibilité V (δ), représentée sur la figure 10.14 à droite.
dE
La relation générale entre largeurs de la fonction de départ et sa transformée de
dσ
Fourier V (δ) apparaı̂t sur la figure 10.14 : plus la raie étudiée est monochromatique
(∆σ étroit), plus la fonction de contraste est large et donc plus le nombre de franges
visibles est élevé.
On peut généraliser le résultat qui précède à toutes les formes de luminance spectrale,
en montrant dans le cadre général des transformées de Fourier que :
E(δ) = 2Etotal [1 + V (δ) cos (2πσ0 δ)] (10.7)
où σ0 est un certain nombre d’onde central, et V (δ) s’identifie en général à une fonction
de visibilité, associée à un contraste des franges C(δ) = |V (δ)|.
La largeur ∆x de la fonction V (x) et celle ∆σ de la luminance spectrale vérifient,
comme pour toute transformée de Fourier, ∆x × ∆σ = 2π ; puisque x = 2πδ, on en
déduit que la largeur ∆δ de la fonction de visibilité, c’est-à-dire l’étendue des valeurs
de la différence de marche δ pour lesquelles le contraste reste suffisant pour que les
franges soient visibles, vérifie :
1
∆δ = δmax − δmin ∼ (10.8)
∆σ0
Ainsi, plus la source est monochromatique, plus on pourra observer un nombre de

franges important. Si on se souvient que δ = pλ0 = p/σ0 , on peut réécrire cette
expression en terme de nombre de franges visibles :
σ0
∆p = pmax − pmin ∼ (10.9)
∆σ0
λ0 σ0
On peut aussi écrire ≃ ; avec une largeur spectrale relative de un millième,
∆λ0 ∆σ0
λ0
∼ 103 et on peut espérer une fonction de visibilité étalée sur un millier de
∆λ0
franges ; c’est le cas du doublet de raies D du sodium (raies jaune-orangées), dont le
traitement détaillé est présenté ci-après.
2 Exemple : le doublet de raies D du sodium : en première approximation, ce
doublet est formé d’un système bichromatique à deux raies, de longueurs d’onde
λ1 = 589, 0 nm et λ2 = 589, 6 nm. On pose encore σ1 = 1/λ1 , σ2 = 1/λ2 , et on
σ1 + σ2
définit σ0 = et ∆σ0 = σ1 − σ2 .
2
Les deux raies du doublet étant de même intensité, on peut calculer l’éclairement
total produit par un interféromètre éclairé par une lampe à vapeurs de sodium sous
la forme E = E1 + E2 , avec Ei = 2E0 [1 + cos (2πσi δ)] ; après un calcul immédiat, il
vient E = 4E0 [1 + V (δ) cos (2πσ0 δ)] où on a choisi de poser V (δ) = cos (π∆σ0 δ),
reconnaissant une fonction à variation lente du fait de la faible valeur de ∆σ.
Comme précédemment, plus l’écart ∆σ0 est faible, plus la raie bichromatique pourra
être assimilée à une raie monochromatique, et plus la fonction de visibilité aura une
grande étendue en termes de valeurs de δ. On reconnaı̂t toutefois une propriété par-
ticulière des sources bichromatiques : la fonction de visibilité est périodique. Ceci
signifie qu’après la disparition des franges, obtenue pour certaines valeurs de δ qui
annule V (δ), les franges réapparaissent avec changement de signe de V (δ), donc avec
inversion du contraste.
La présence des inversions périodiques du contraste est une propriété caractéristique
des interférences avec des sources bichromatiques ; on peut en comprendre l’origine
physique en traçant, sur la même figure 10.15 les figures d’interférence qui seraient
obtenues séparément pour les longueurs d’ondes λ1 et λ2 (le tracé n’est pas à l’échelle).
E1 + E2
retour du contraste
perte de contraste
δ
E1 et E2
b b b
b b b
Figure 10.15 – Brouillage des franges et source bichromatique
Sur cette figure, on voit clairement que le contraste est maximal pour δ = 0 puisque
les deux fonctions E1 et E2 prennent leur maxima aux mêmes points ; par la suite, les
deux systèmes de franges se décalent progressivement jusqu’à observer l’annulation du
contraste lorsque le décalage des deux systèmes de frange atteint exactement un demi-
interfrange. Sur la figure, des points marquent des maxima de lumière correspondant
aux deux raies de longueurs d’onde λ1 et λ2 ; on voit qu’ils s’alignent dans les zones
de maximum de contraste, et qu’ils sont exactement en opposition dans les zones de
perte de contraste.
Le décalage des systèmes de franges reprend ensuite jusqu’à ce que les systèmes de
franges se retrouvent en phase pour restaurer le contraste, et ainsi de suite.
Revenant à l’expression de l’éclairement produit derrière l’interféromètre de Michelson
éclairé avec une source à vapeurs de sodium, on peut poser λ0 = 1/σ0 ≃ 589, 3 nm et
∆λ0 ∆σ0
définir la largeur spectrale ∆λ0 en longueur d’onde par = , ce qui permet
λ0 σ 0
2π π∆λ0 p
d’écrire E = 4E0 1 + V (δ) cos δ et V (p) = cos puisque δ = pλ0 .
λ0 λ0
Le tracé 10.16 de la répartition d’éclairement V (δ) montre que V (p) est une fonction
π∆λ0 p π
de visibilité, avec des annulations périodiques du contraste pour ≡ [π].
λ0 2
E
4E0 (1 + V (p))
4E0 (1 − V (p))
p
b
λ0 /2∆λ0
Figure 10.16 – Éclairement par une source bichromatique
Le nombre de franges visibles entre deux annulations du contraste est donc de l’ordre
λ0
de ∆p = , comme affirmé dans le cas général. Ce tracé n’est pas à l’échelle dans
∆λ0
le cas d’une source à vapeurs de sodium.
On peut visualiser l’effet de cette perte périodique du contraste en observant les
photographies de la figure 10.17, prises justement en éclairant un interféromètre de
Michelson réglé en lame d’air au moyen d’une lampe à valeurs de sodium ; on y voit,
de gauche à droite, une chute régulière du contraste des franges.
Dans le cas de la troisième figure, les franges sont pratiquement invisibles, la fonction
de visibilité étant trop faible.
Figure 10.17 – Contraste des anneaux de Haidinger avec une lampe au sodium
Ces développements mènent à une méthode immédiate de mesure d’un élargissement

spectral dans le cas d’une source bichromatique : on enregistre l’éclairement au centre
(i = 0 donc δ = 2e) de la figure d’interférences en réalisant une variation lente de e

au moyen d’un moteur. Le tracé obtenu est le même que celui de la figure 10.16, et
permet une mesure de λ0 et de ∆λ.
2 L’interféromètre de Michelson, analyseur de luminance spectrale : On peut enfin
généraliser la méthode ci-dessus pour analyser la luminance spectrale d’une source
quelconque. En effet, on a vu que l’éclairement E(δ) est la somme d’un terme constant
2E0 et d’un terme variable en fonction de δ, proportionnel à la transformée de Fourier
de la luminance spectrale recherchée.
On procède donc en plusieurs temps, conformément au schéma 10.18 :
– enregistrement de la fonction E(δ) en plaçant un détecteur au centre de la figure
en anneaux et en assurant une translation régulière à la vitesse V du miroir M1 au
moyen d’un moteur ;
– dans le signal enregistré, suppression de la partie continue au moyen d’un filtre
passe-haut ;
– du signal restant, on calcule numériquement la transformée de Fourier inverse au
moyen d’un logiciel FFT par exemple ;
– la grandeur obtenue est la luminance spectrale de la source.
source Mesure de Passe-haut

Michelson E en i = 0, puis FFT :
dE/dσ e=Vt
δ = 2V t −→ dE/dσ
Figure 10.18 – Interféromètre de Michelson et transformée de Fourier

L’interféromètre de Michelson utilise une lame séparatrice (semi-réfléchissante

à 45◦ du faisceau d’entrée) pour diviser l’amplitude et éclairer deux miroirs
presque orthogonaux. Une lame compensatrice assure l’absence de toute diffé-
rence de marche à la séparation du faisceau, sauf éventuellement un déphasage
de π (δ ′ = λ0 /2) pour certaines réalisations de la couche semi-réfléchissante.
En réglage en miroirs (( parallèles )) (en fait orthogonaux), l’interféromètre

réalise une lame d’air et produit des franges d’égale inclinaison, avec δ = 2e cos i
où e est l’intervalle entre les miroirs.
L’angle i est relié au rayon rp des anneaux de Haidinger observés pau foyer d’une
lentille d’observation de focale fo′ par rp = fo′ tan i soit rp ≃ fo′ 2 − pλ0 /e.
Ces anneaux ne sont pas équidistants ; l’ordre est maximal au centre et décroı̂t
sur les bords.
Les anneaux sont localisés à l’infini : le contraste des franges reste élevé, même
en présence d’une source spatialement étendue.
Lorsque e = 0 (contact optique), l’éclairement est uniforme ; lorsqu’on chariote
pour s’éloigner du contact optique, les anneaux se resserrent (diminution de
la distance entre anneaux consécutifs) et semblent sortir depuis le centre de la
figure (p est fixé pour un anneau donc i augmente si e augmente).
Avec un moteur, l’enregistrement au centre de la figure d’interférences (i = 0 et
e = V t) permet de mesurer la luminance spectrale de la source en recherchant
la transformée de Fourier inverse de la partie variable du signal.
En réglage en coin d’air (miroirs inclinés d’un angle α), on observe des franges
d’égale épaisseur, avec δ ≃ 2e(M ) où e(M ) = y tan α est l’épaisseur du coin
d’air au point M , d’abscisse y mesurée depuis l’axe dièdre du coin d’air.
Ces franges de Fizeau sont rectilignes et équidistantes, avec pour équation
2y tan α = pλ0 donc d’interfrange i ≃ λ0 /2α.
Ces franges sont localisées sur la surface des miroirs : le contraste des franges
reste élevé, même en présence d’une source spatialement étendue.
Chapitre 11
Thermodynamique classique
11.1 Systèmes thermodynamiques
11.1.1 Physique statistique

2 Systèmes thermodynamiques : l’histoire de la Thermodynamique est liée à la
réalisation et à l’amélioration des machines thermiques, et en particulier des moteurs ;
toutefois, et notamment depuis les travaux de Boltzmann‡ , on la considère comme
la branche de la Physique décrivant les propriétés statistiques des systèmes formés
d’un grand nombre N de particules.
Pour les systèmes thermodynamiques usuels, N est en général de l’ordre de grandeur
du nombre d’Avogadro NA = 6, 02 × 1023 mol−1 ; on préfère souvent décrire de tels
systèmes thermodynamiques par l’intermédiaire de la quantité de matière n = N/Na
(appelée improprement nombre de moles), à moins qu’on ne préfère utiliser la masse
m = nM, la grandeur M désignant la masse molaire moyenne du système.
2 Notions de physique statistique : devant l’impossibilité matérielle de décrire les
systèmes thermodynamiques par l’intermédiaire des N jeux de caractéristiques des
particules d’un système thermodynamique (coordonnées xi , yi et zi , vitesse vi , etc.),
on se contente de décrire un système thermodynamique par des grandeurs de nature
moyenne.
Ainsi, on s’intéressera aux échanges énergétiques d’un système de particules en dé-
crivant l’énergie cinétique moyenne hec i d’une des particules du système (Σ) ; cette
moyenne doit se comprendre en général comme une valeur moyenne pour l’ensemble
N
1 X1
des particules du système (Σ) à un instant donné, soit hec i = mi vi2 pour un
N i=1 2
ensemble de N particules ponctuelles.
On pourrait toutefois aussi définir une autre notion de valeur moyenne, pour une des
particules prises au hasard dans le système (Σ) et en étudiant la moyenne des valeurs
de la grandeur physique (par exemple, ec ) au cours d’une durée assez longue, selon
1 t0 +τ
Z
l’expression ec = lim ec (t)dt ; dans cette définition, τ sera en pratique seule-
τ →∞ τ t
0
ment pris nettement supérieur aux plus petites durées des mesures macroscopiques.
On pourra alors définir des états d’équilibre thermodynamique, pour lesquels les gran-
deurs thermodynamiques ne varient pas au cours du temps, c’est-à-dire pour lesquels
une grandeur moyenne observable f ne dépend pas de l’instant t0 où elle est mesurée.
Dans la plupart des cas, cette moyenne individuelle au cours du temps f coı̈ncide alors
avec la moyenne instantanée sur l’ensemble des particules du système hf i ; on parlera

indifféremment de grandeur moyenne, sans préciser la nature de cette moyenne.
On adoptera en général une notation macroscopique pour ces grandeurs moyennes,
préférant utiliser par exemple Ec = N ec , énergie cinétique totale du système, que
son équivalent microscopique ec . Dans le cas des grandeurs extensives (leur définition
est rappelée plus loin), on remplacera usuellement la grandeur extensive X par les
grandeurs massique x = X/m, volumique xV = X/V ou molaire xm = X/n associées,
avec en particulier les notations du tableau 11.1.
Grandeur physique Symbole Symbole Symbole Symbole

(massique) (molaire) (volumique)
Énergie E e
Énergie interne U u um
Enthalpie H h hm
Enthalpie libre G g µ
Entropie S s sm
Masse m 1 M ρ
Pression p non défini, p est intensive
Quantité de matière n 1/M 1 1/vm
Température T non défini, T est intensive
Volume V 1/ρ vm 1
Table 11.1 – Les notations des variables de la Thermodynamique
Certaines grandeurs ne sont pas relatives au volume d’un système, mais à la surface
de l’interface entre deux systèmes ; elles concernent donc les échanges entre deux
systèmes. Chaque grandeur X est transportée d’un flux de X par unité de temps.
Les grandeurs surfaciques associées à ces flux sont en général qualifiées de densités de
courant : on parle ainsi de densité de courant de masse, d’énergie ou d’entropie, comme
on parle de densité de courant électrique. Ces densités de courant sont éventuellement
des grandeurs vectorielles, la direction et le sens du vecteur étant ceux des échanges
réalisés. Les notations et unités correspondantes sont indiquées dans le tableau 11.2.
Grandeur transportée Flux associé Courant associé

Charge électrique q, C Courant électrique I, A jq , A · m−2
Masse m, kg Débit de masse Dm , kg · s−1 jm , kg · s−1 · m−2
Travail W, J Puissance utile Putile , W
Transfert thermique Q, J Puissance thermique Ptherm , W jt , W · m−2
Énergie rayonnée Puissance rayonnée R, W · m−2
Table 11.2 – Grandeurs échangées, flux et densités de courant
2 Échelles microscopique, mésoscopique et macroscopique : la physique statistique

fait le lien entre l’échelle microscopique, où on doit adopter une description individuelle
des particules comportant un système quelconque, et l’échelle macroscopique, qui est
celle de nos observations, et où seules subsistent des variables moyennées sur un très
grand nombre de particules.
On peut aussi, pour l’étude des milieux continus (fluides et solides déformables), défi-
nir une échelle intermédiaire, dite mésoscopique ; il s’agit de dimensions telles qu’elles
peuvent être considérées comme des infiniment petits à l’échelle macroscopique, tout
en continuant à contenir des nombres de particules suffisamment importants pour
11 : Thermodynamique classique 235
faire l’objet d’une description continue, la notion de moyenne statistique y conservant

tout son sens.
Ainsi, nous parlerons par exemple d’élément de volume dV pour un cube mésosco-
pique : il continue à faire l’objet d’un traitement statistique et on y définit les gran-
deurs thermodynamiques moyennes (pression p, température T , etc.) mais l’échelle
correspondante est trop faible à notre échelle pour qu’on puisse distinguer des va-
riations locales de ces grandeurs : par définition, p et T sont donc uniformes dans
un élément mésoscopique et on assimilera ces élément à un point à l’échelle de nos
observations macroscopiques.
Les dimensions choisies pour déterminer l’échelle mésoscopique dépendent de la na-
ture des phénomènes étudiés ; ainsi, dans une expérience de laboratoire, un volume
de l’ordre de 1 mm3 sera un bon choix d’échelle mésoscopique puisque les plus pe-
tites dimensions des capteurs de pression ou de température seront de l’ordre du
millimètre. Le nombre de particules correspondant pour un gaz parfait dans les
conditions normales (0 ◦ C, 1 bar) de température et de pression est de l’ordre de
NA × 1 mm3 /22, 7 L · mol−1 ∼ 3 × 1016 ≫ 1.
On doit se méfier de toute application numérique basée sur cette valeur numérique
du volume molaire des gaz ; rappelons qu’elle ne s’applique que dans le modèle du
RT
gaz parfait, sur la base de la relation vm = ; le choix des conditions normales
p
(T = 273 K, p = 1 bar) mène à l’application numérique vm = 22, 7 L · mol−1 . La
′
valeur numérique vm = 22, 4 L · mol−1 , encore souvent rencontrée, correspond à
′
p = 1, 013 bar, pression atmosphérique moyenne au niveau de la mer.
Par contre, dans le domaine météorologique par exemple, on effectue les calculs de
dynamique des fluides en considérant des éléments de volume de l’ordre du kilomètre
cube ou plus, simplement parce que choisir une dimension trop faible dépasserait
les capacités de calcul des systèmes informatiques
Z utilisés. Dans ce cas, on appellera
1
pression dans ce volume la moyenne pm = pdV ; c’est la moyenne qu’un expé-
V
rimentateur obtiendrait en explorant l’espace occupé par cet élément mésoscopique
en effectuant plusieurs mesures réparties dans tout cet espace de l’ordre du kilomètre
cube.
Dans toute la suite, nous considérerons les systèmes thermodynamiques comme des
milieux continus ; dire par exemple qu’une grandeur physique g(r) y est homogène
voudra simplement dire que, jusqu’à l’échelle mésoscopique, il n’est pas possible d’ob-
server des variations spatiales de g(r). Naturellement, une telle affirmation est néces-
sairement inexacte à l’échelle microscopique.
2 Vocabulaire de description des systèmes thermodynamiques : un système thermo-
dynamique (Σ) est en général défini en extension, par une limite non nécessairement
matérielle. Si ce système peut échanger de la matière avec l’extérieur, il est dit ouvert,
et fermé dans le cas contraire.
Un système qui ne peut réaliser aucun échange (ni de matière, ni d’énergie) avec l’ex-
térieur est dit isolé. On peut en général compléter fictivement tout système (Σ), pour
en faire un système fermé, en lui adjoignant l’ensemble des parties de son environne-
ment avec lesquels des échanges de matière ou d’énergie ont lieu. L’ensemble fermé
ainsi défini porte parfois le nom d’univers.
Un système thermodynamique est dit homogène si toute grandeur physique mesurable
est homogène, c’est-à-dire présente la même valeur en tout point du système, au moins
jusqu’à l’échelle mésoscopique. On peut par exemple souvent considérer un fluide

comme homogène si ses dimensions sont assez faibles ; sinon, la variation de pression
avec l’altitude par exemple ne peut plus être négligée, en particulier dans le cas des
fluides.
Dans un système hétérogène, on préférera donc une description locale du système,
définissant par exemple sa masse volumique ρ, son volume molaire vm ou son volume
massique 1/ρ en tout point ; l’utilisation de grandeurs intégrales comme le volume
total V ou la masse totale m n’a de sens que pour des systèmes homogènes.
On appellera phase tout sous-système macroscopique dont les propriétés physiques
varient de façon continue en fonction des coordonnées d’espace ; les surfaces de dis-
continuité forment les limites d’une phase.
On pourra ainsi distinguer dans un système thermodynamique une phase gazeuse (en
général homogène sous réserve de la limitation de son extension spatiale), une ou
plusieurs phases liquides (en cas de non miscibilité par exemple) et une ou plusieurs
phases solides (la miscibilité à l’état solide est exceptionnelle).
Un système thermodynamique est à l’équilibre si toutes les grandeurs locales mesu-
rables sont indépendantes du temps, au moins à l’échelle des mesures effectuées ; cet
équilibre peut d’ailleurs être métastable et le système évolue alors très lentement mais
on n’exclut pas de le traiter comme s’il était à l’équilibre pendant des durées assez
brèves devant les temps caractéristiques de son évolution.
11.1.2 Variables thermodynamiques

2 Variables extensives : une variable thermodynamique X est dite extensive si elle
est proportionnelle à la quantité de matière du système pour laquelle on la définit.
Elle peut alors être exprimée en termes de somme d’une grandeur locale massique
(notée en général x) ou volumique (notée xv ) :
Z Z
X= xv (M )dτ = x(M )dm (11.1)
M ∈(Σ) M ∈(Σ)
Z
En particulier, la masse est une grandeur extensive avec M = ρ(M )dτ mais
Z M ∈(Σ)
aussi M = dm, donc dm = ρ(M )dτ , ce qui impose la relation entre grandeurs
M ∈(Σ)
volumiques et massiques :
xv (M ) = ρ(M )x(M ) (11.2)
Le volume, la charge électrique, les grandeurs énergétiques (énergie E, énergie interne

U , enthalpie H et l’enthalpie libre G qui sera définie ultérieurement) et l’entropie S
sont des grandeurs extensives.
Dans certains cas, on définit aussi des grandeurs molaires, notées par exemple xm ,
par la relation (si M est la masse molaire du système étudié) :
xm (M ) = Mx(M ) (11.3)
2 Variables intensives : une variable thermodynamique Y est dite intensive (ou

locale) si elle est indépendante de la quantité de matière pour laquelle on la définit.
En plus de la pression p et de la température T , les grandeurs volumiques, massiques
et molaires associées à une variable extensive sont des grandeurs intensives.
Dans un système inhomogène, une grandeur intensive est une fonction du point M
considéré ; on notera par exemple Y = Y (M ).
2 Paramètres de contrainte : l’évolution d’un système thermodynamique est en
général contrôlé par les systèmes extérieurs qui agissent à sa frontière.
On connaı̂t en particulier des évolutions mécaniques, sous la contrainte d’une pression
extérieure imposée : on dit alors que la valeur pext de cette pression extérieure est un
paramètre de contrainte.
De même, des évolutions thermiques se font sous la contrainte d’une température
extérieure imposée : on dit aussi que la valeur Text de cette température extérieure
est un paramètre de contrainte.
Plus généralement, on dira qu’une grandeur Yext est un paramètre de contrainte si :
– la valeur Yext est imposée à l’extérieur de la surface qui limite le système thermo-
dynamique (Σ) étudié ;
– la grandeur Y correspondante, définie pour le système thermodynamique (Σ) étudié,
doit vérifier Y = Yext pour assurer l’équilibre.
On définit alors les évolutions mono-Y (respectivement monobares, monothermes,
etc.) qui font passer le système étudié d’un état d’équilibre avec l’extérieur à un autre ;
ainsi, la variable extensive Y part d’une valeur initiale égale à la valeur contrainte Yext
pour atteindre une valeur finale qui reprend la même valeur, sans que Y reste constant
durant cette évolution.
Prenant l’exemple d’une évolution monobare et monotherme du fait d’un contact

mécanique et thermique avec l’atmosphère, on écrira donc pi = pf = pext pour les
pressions initiale et finale, et Ti = Tf = Text pour les températures initiale et finale
en tout point du système (Σ) étudié. Par contre, les états intermédiaires peuvent être
beaucoup plus complexes, et en particulier p et T ne sont pas forcément homogènes
dans (Σ) au cours de l’évolution : on ne pourra donc pas forcément définir une
pression ou une température du système durant une telle transformation.
Le cas particulier des transformations iso-Y (isobare, isotherme, etc.) correspond évi-
demment à Y = Yext = constante pendant toute l’évolution. Ainsi par exemple, à
tout instant d’une transformation isobare, on peut définir et mesure une pression uni-
forme (indépendante du point de mesure) dans tout le système et cette pression est
constante (indépendante du temps) pendant la transformation.
11.1.3 Transport de grandeurs extensives

2 Courant de transport : pour rendre quantitative la notion de transport d’une
grandeur extensive (masse, énergie, etc.) associée à un déplacement de matière à
travers la surface fermée (S) extérieure du système thermodynamique (Σ), considérons
(cf. figure 11.1) un élément dS de cette surface, orienté vers l’extérieur de (Σ) et de
(S).
La quantité de la grandeur X qui sera transportée pendant la durée dt à travers cet
élément de surface vers l’extérieur de (Σ) est celle qui se trouve derrière la surface dS,
à une distance de celle-ci au plus égale à dℓ = vdt, où v est la vitesse de la matière
dont le déplacement assure le transport de X ; cette vitesse est mesurée relativement
à un référentiel dans lequel la surface de contrôle (S) est fixe. Cette condition définit
un cylindre de base dS et de hauteur vdt.
(Σ)
vdt
n
θ
dS
Figure 11.1 – Transport d’une grandeur extensive à travers la surface d’un système
La hauteur de ce cylindre, mesurée perpendiculairement à l’élément de surface dS,

est dℓ cos θ = v · ndt ; remarquons que cette notation en termes de produit scalaire
définit une hauteur positive dans le cas où la matière sort effectivement de (Σ), et
négative dans le cas contraire : on calcule donc ici une grandeur algébrique, orientée
positivement dans le sens des débits sortants.
Signalons dès maintenant une différence essentielle de convention entre ces débits
de grandeurs extensives, comptés positivement s’ils sortent du système thermody-
namique étudié, et l’usage thermodynamique, qui consiste à compter positivement
ce qui est fourni au système (Σ). On ne s’étonnera donc pas de l’intervention sys-
tématique d’un signe − dans les relations qui utilisent la notion de débit.
Règles d’orientation
X En Physique en général, toute surface fermée sera (sauf mention expresse
du contraire) orientée par convention vers l’extérieur du système.
En Thermodynamique au moins, tous les échanges algébriques seront
(sauf mention expresse du contraire) comptés positivement s’ils sont re-
çus par le système étudié.
Le volume de ce cylindre élémentaire est donc égal à dτ = dS × dℓ cos θ, qu’on écrira
aussi dτ = (v · n) dSdt ; la quantité de X sortant de (Σ) par ce mode de transport est
donc d2 Xconvecté = xV dτ = xV (v · n) dSdt, où on emploie ici le terme de convection
pour tout transport associé à un déplacement de matière.
On retiendra donc l’expression du flux de X convecté par unité de temps à travers la
totalité surface (S) extérieure à (Σ) :
¯
dX ¯¯
I
= jX · ndS jX = xV v (11.4)
dt ¯convecté (S)
On définit ainsi une densité surfacique de courant de X, notée jX ; cette grandeur se

mesure dans l’unité de X par unité de temps et de surface. L’intégrale (11.4) est le
flux de cette densité surfacique de courant à travers la surface sortante de (Σ).
On aura en particulier pour les débits de masse et de charge sortants de la surface
entourant (Σ) les expressions, écrites en fonction de la masse volumique ρ et de charge
volumique ρc (parfois appelée densité volumique de charge) :
I I
Dm = ρv · ndS Dq = j · ndS avec j = ρc v (11.5)
(S) (S)
Le débit de charge Dq sortant de la surface (S) se mesure dans l’unité [Dq ] = [j] × [S]
soit [Dq ] = [ρc ] × [v] × [S] = C · m−3 × m · s−1 × m2 soit [Dq ] = C · s−1 = A ; il s’agit
évidemment de ce qu’en électrocinétique on appelle le courant électrique sortant de
(S), en on retiendra la relation essentielle dans le domaine de l’Électromagnétisme :
I
Isortant de (S) = j · ndS avec j = ρc v (11.6)
(S)
Le vecteur ρv est la densité volumique de courant de masse ; il s’exprime en kilo-

gramme par seconde et par mètre carré. De même, le vecteur j = ρc v porte le nom
usuel de densité volumique de courant électrique même s’il s’exprime en ampère par
mètre carré ; l’origine de cette nomenclature trompeuse est la répartition continue en
volume des charges dans le modèle employé.
2 Théorème d’Ostrogradski : la sortie effective d’une grandeur X en dehors du
volume intérieur au système (Σ) dépend de la géométrie du vecteur v ; en particulier,
on observera une sortie importante de X en dehors des zones d’où le vecteur v diverge
manifestement.
La figure 11.2 montre deux géométries bien différentes du vecteur v. À gauche, des
lignes de champ presque parallèles entraı̂nent la compensation des flux sortant et en-
trant d’une surface fermée (S) : la divergence est faible ou nulle. À droite au contraire,
le champ est localement divergent et le flux sortant est élevé, positif.
(S) (S)
|div v| ∼ 0 div v > 0
Figure 11.2 – Géométries non divergente et divergente d’un champ de vecteurs
Pour donner un contenu quantitatif à ce caractère divergent, considérons, dans le cas

des coordonnées cartésiennes, un élément de volume dτ = dx dy dz, représenté sur la
figure 11.3 en projection dans le seul plan (Oxy).
y
j(x + dx)
j(x)
b b
jx (x) jx (x + dx)
(Σ′ ) (Σ)
xb x + dx x
b
Figure 11.3 – Caractère divergent d’un vecteur
Sur cette figure, on a représenté un vecteur quelconque j en deux points de la surface

(S) qui entoure le volume élémentaire dτ ; le vecteur j peut par exemple être une den-
sité de courant d’une grandeur X sortant du système thermodynamique infinitésimal

de volume dτ .
Pour modéliser le fait, visible sur la figure 11.3, qu’il sort vers la droite plus de
X par la surface dS = dydz et d’abscisse x + dx qu’il n’en rentre à l’abscisse x
à travers la même surface, nous écrirons le débit sortant de X sous forme de la
différence DX = j(x + dx)dS · ex − j(x)dS · ex + P C, où la notation +P C indique
qu’il faut sommer, par permutation circulaire des indices x, y, z, deux autres termes
correspondant aux deux autres paires de surfaces limitant le système étudié. Ces débits
font donc intervenir les projections jx (x) et jx (x + dx) du vecteur j perpendiculaires
aux deux surfaces étudiées.
Avec des notations un peu plus générales, on notera encore le flux de j sortant de ce
∂jx
I
volume élémentaire sous la forme j · ndS = dx dS + P C, soit, compte tenu de
∂x
∂jx ∂jx
I
l’expression de dτ , j · ndS = dxdydz + P C = dτ + P C.
∂x ∂x
Si on ne se contente pas d’un volume élémentaire, on peut généraliser ce résultat
par juxtaposition d’un nombre quelconque de volumes élémentaires ; en effet, le flux
sortant de l’ensemble formé, sur la figure 11.3, de la réunion (Σ) ∪ (Σ′ ) est la somme
des flux sortants de (Σ) et de (Σ′ ), l’aire commune correspondant à une annulation
de deux flux sortants identiques mais comptés en sens inverse.
Pour une surface finie, on écrira donc le théorème d’Ostrogradski :
I Z
W · ndS = div Wdτ (11.7)
(S) (V )
Dans l’expression (11.7), la notation W désigne un vecteur quelconque ; la première

intégrale est le flux sortant de W à travers la surface fermée (S) orientée vers l’exté-
rieur ; la seconde intégrale porte sur la totalité du volume intérieur à (S), et la grandeur
div W, qui porte le nom de divergence du vecteur W (de composantes cartésiennes
W = Wx ex + Wy ey + Wz ez ) s’exprime en coordonnées cartésiennes selon :
∂Wx ∂Wy ∂Wz

div W = + + (11.8)
∂x ∂y ∂z
2 Divergence d’un vecteur : la relation (11.7) constitue la définition intrinsèque

d’un opérateur différentiel, l’opérateur divergence, dont la relation (11.8) ne constitue
qu’une des formes pratiques.
Cet opérateur différentiel construit, à partir d’un vecteur variable W, une grandeur
scalaire (c’est-à-dire un nombre), qui s’exprime dans l’unité de W divisée par l’unité
de longueur.
On remarquera les analogies avec l’opérateur gradient, défini par une relation intrin-
sèque liée à la variation infinitésimale df d’une grandeur scalaire : df = grad f · dr ;
on en connaı̂t alors diverses expressions, notamment dans le système de coordonnées
∂f ∂f ∂f
cartésien : grad f = ex + ey + ez .
∂x ∂y ∂z
Les analogies ne doivent pas faire oublier une différence essentielle : la divergence
div W est un scalaire défini à partir d’un vecteur W, alors que le gradient grad f
est un vecteur défini à partir d’un scalaire f . En particulier, les notations grad W
et div f n’ont aucun sens.
On utilise aussi, dans le seul cas des coordonnées cartésiennes, un moyen mnémo-
technique pour mémoriser les expressions des opérateurs gradient et divergence, en
définissant le vecteur symbolique nabla par la relation :
∂ ∂ ∂
∇= ex + ey + ez (11.9)
∂x ∂y ∂z
ce qui permet d’écrire grad f = ∇ × f et div W = ∇ · W.

Comme pour le gradient, il est possible d’obtenir pour la divergence des expressions
dans n’importe quel système de coordonnées orthogonal, soit à partir de l’expression
(11.7) du théorème d’Ostrogradski, soit à partir d’un simple changement de variables.
Le calcul en est un peu fastidieux et les résultats seront seulement indiqués, sans
qu’il soit en général nécessaire de les mémoriser. En coordonnées cylindriques (r, θ, z),
1 ∂ 1 ∂Wθ ∂Wz
div W = (rWr ) + + , tandis qu’en coordonnées sphériques (r, θ, ϕ),
r ∂r r ∂θ ∂z
1 ∂ ¡ 2 ¢ 1 ∂ 1 ∂Wϕ
div W = 2 r Wr + (sin θWθ ) + .
r ∂r r sin θ ∂θ r sin θ ∂ϕ
∂f 1 ∂f ∂f
La comparaison avec les expressions cylindrique grad f = er + eθ + ez et
∂r r ∂θ ∂z
∂f 1 ∂f 1 ∂f
sphérique grad f = er + eθ + eϕ de l’opérateur gradient montre
∂r r ∂θ r sin θ ∂ϕ
que, en dehors du système cartésien, il n’existe pas de vecteur nabla permettant un
moyen mnémotechnique unique.
Comme tout opérateur différentiel, on peut attribuer des propriétés simples à la

dérivée d’un produit ; ainsi, le lecteur vérifiera sans difficultés, par exemple en co-
ordonnées cartésiennes, les relations générales grad (f g) = f grad g + g grad f et
div (f W) = f div W + W · grad f .
Enfin, à partir de deux dérivées premières, on peut calculer une dérivée seconde ; on
vérifie de même sans difficultés la relation :
div grad f = ∆ f (11.10)
qui fournit une définition intrinsèque de l’opérateur laplacien, rencontré à l’occasion de

l’étude des ondes, et qu’on peut ainsi généraliser au cas des
µ systèmes de coordonnées
1 ∂2f ∂2f
¶
1 ∂ ∂f
cylindrique et sphérique, respectivement en ∆ f = ρ + 2 2
+ et
ρ ∂ρ ∂ρ ρ ∂ϕ ∂z 2
∂2f
µ ¶ µ ¶
1 ∂ ∂f 1 ∂ ∂f 1
∆f = 2 r2 + 2 sin θ + 2 2 .
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
Notons que le vecteur grad div W peut aussi être défini à partir d’un vecteur W,
mais qu’il ne constitue pas une généralisation de l’opérateur laplacien au cas des
fonctions vectorielles ; lorsque cette généralisation sera proposée, on vérifiera immé-
diatement que grad div W 6= ∆ W.
2 Équations de continuité : on peut immédiatement appliquer le théorème d’Ostro-
gradski à l’étude des grandeurs conservées, comme la masse M (ou la charge électrique
q). En effet, le débit de masse Dm sortant d’une surface fermée (S) est égal à la dimi-
nution de la masse M du système thermodynamique (Σ) formé de l’intérieur (V ) de
dM
(S) ; on aura donc = −Dm , où le signe − est associé aux choix conventionnels
dt
déjà évoqués plus haut.
Z
Comme M (t) = ρ(M, t)dτ , on peut évoquer le théorème de dérivation sous le
M ∈(V )
signe somme des intégrales dépendantZd’un paramètre pour écrire la variation de la
dM ∂ρ(M, t)
masse M se (Σ) sous la forme = dτ .
dt M ∈(V ) ∂t
Enfin, on peut utiliser
I le théorème d’Ostrogradski
Z pour transformer l’intégrale de flux
qui définit Dm = ρv · ndS selon Dm = div (ρv) dτ .
(S) M ∈(V )
∂ρ
Z Z
L’égalité dτ = − div (ρv) dτ devant être vérifiée pour tout volume (V ),
(V ) ∂t (V )
fini ou infinitésimal, on en déduit la loi de conservation (locale) de la masse, connue
en général sous la nom d’équation de continuité :
∂ρ
div (ρv) + =0 (11.11)
∂t
Le même raisonnement permet d’imposer en tout point et à tout instant une relation
locale de conservation de la charge électrique, liant la charge volumique ρc et la densité
volumique de courant j = ρc v, sous la forme identique :
∂ρc
div j + =0 (11.12)
∂t
Plus généralement, nous identifierons souvent les équations analogues à (11.11) ou

(11.12) en termes de conservation ou d’absence de conservation ; ainsi, une grandeur
∂xV
X qui vérifie div (xV v) + = f (M, t) 6= 0 ne se conserve pas, le terme f (M, t)
∂t
étant lié à la création ou à la destruction locale de X.
Ainsi, l’énergie d’une onde électromagnétique se propageant dans un milieu conduc-
teur ne se conserve pas : il y a perte d’énergie par effet Joule et dans ce cas on montrera
f (M, t) < 0. De même, l’entropie d’un fluide en évolution irréversible ne se conserve
pas non plus : il y a création d’entropie et dans ce cas on montrerait f (M, t) > 0.
11.1.4 Température et pression

2 Température : deux systèmes thermodynamiques sont en équilibre thermique si
la mise en contact énergétique sans échange de volume ni de matière ne s’accompagne
d’aucun transfert énergétique. Lorsqu’au contraire un échange énergétique a lieu, on
dit que le système qui cède de l’énergie à l’autre est le plus chaud.
Une grandeur thermométrique est une grandeur physique ϑ qui repère l’équilibre ther-
mique, c’est-à-dire qui vérifie ϑ1 = ϑ2 pour deux systèmes (Σ1 ) et (Σ2 ) en équilibre
thermique, et ϑ1 > ϑ2 si (Σ1 ) est plus chaud que (Σ2 ). On peut construire de nom-
breuses grandeurs thermométriques : résistance électrique d’un conducteur ohmique,
volume d’une colonne de liquide, etc.
À partir d’une grandeur thermométrique quelconque ϑ, on construit une température
centigrade θ à partir d’une transformation linéaire qui impose les valeurs 0 et 100
pour deux points fixes, la glace fondante (gf) et l’eau bouillante (eb) sous la pression
ϑ − ϑgf
standard de 1 bar. On écrira ainsi θ = 100 ; cette grandeur est dite repérée
ϑeb − ϑgf
et non mesurée car le produit, par exemple, de deux températures centigrades, est
dépourvu de sens physique.
Une température centigrade se désigne en degrés (0 ◦ , 25 ◦ , etc.). Dans le seul cas où
la grandeur thermométrique est la dilatation d’un gaz parfait (ϑ = pV /n), on utilise
la notation degrés Celsius (0 ◦ C, 25 ◦ C, etc.).
La notation T est réservée à cette grandeur thermométrique particulière (on parle de
température du gaz parfait), ou à son équivalent légal (on parle de température ther-
modynamique). Les définitions de ces deux grandeurs thermodynamiques équivalentes
seront rappelées plus loin.
2 Pression : la pression est liée à la force de contact exercée par un fluide au repos
sur tout élément de surface dS plongé dans ce fluide ; cette force est normale à la
surface dS et s’écrit dffluide→surface = +pndS, si n est la normale à dS, dirigée vers
l’extérieur du fluide.
L’unité de mesure des pressions est le pascal (newton par mètre carré) mais on utilisera
systématiquement le bar, défini par 1 bar = 105 Pa ; en particulier, on réserve le nom
de pression standard à la valeur p◦ = 1 bar.
La force de pression totale exercée sur le fluide au repos contenu dans un volume
(V ) s’écrit donc,
I compte tenu du principe des actions réciproques, sous la forme
fext→(V ) = − pndS, où l’intégrale porte sur la surface (S) qui entoure (V ) ; cette
surface est orientée vers l’extérieur.
2 Théorème du gradient : pour calculer l’intégrale qui définit la force de pression
totale, on peut adapter le théorème d’Ostrogradski (11.7) en choisissant pour fonc-
tion W la grandeur W = pex ou, plus IgénéralementZpour une fonction scalaire f
quelconque, W = f ex ; il vient alors ex · f ndS = div (f ex ) dτ ; le caractère
(S) (V )
uniforme du vecteur ex a permis sa mise en facteur dans la première intégrale.
∂f
L’application de la relation (11.8) montre alors immédiatement que div (f ex ) = ;
∂x
∂f
I Z
on en déduit que le vecteur f ndS a pour projection dτ sur ex . En per-
(S) (V ) ∂x
mutant circulairement les indices x, y, z, on en déduit le théorème du gradient, qu’on
doit considérer comme une forme particulière du théorème d’Ostrogradski :
I Z
f ndS = grad f dτ (11.13)
(S) (V )
En particulier, la somme des forces de pression exercées sur un fluide au repos prend
la forme :
I Z
fext→(V ) = − pndS = − grad pdτ (11.14)
(S) (V )
−grad p est donc la densité volumique de force équivalente aux forces de pression.
Si le fluide est au repos sous la seule action des forces de pression et de pesanteur,
donc la densité volumique est ρg, on pourraZécrire la condition
Z d’équilibre mécanique
du volume (V ) du fluide sous la forme − grad pdτ + ρgdτ = 0 et, cette
(V ) (V )
condition devant s’appliquer à tout volume (V ), on en déduit la condition d’équilibre

hydrostatique d’un fluide :
grad p = ρg (11.15)
On pourra souvent considérer que les gaz sont soumis à une pression uniforme puisque
leur masse volumique est souvent faible ; ainsi, avec de l’air dans les conditions nor-
males, ρ ∼ 1, 3 kg · m−3 et, à la surface de la Terre, kgrad pk ∼ 1, 3 × 10−4 bar · m−1 .
Une telle approximation est plus rarement raisonnable dans le cas des liquides ; ainsi,
pour l’eau on a en général ρ ∼ 1 000 kg · m−3 donc kgrad pk ∼ 0, 098 bar · m−1 : un
déplacement vertical de 10, 2 m suffit à faire varier la pression d’un bar.
11.1.5 Équation d’état

2 Coefficients thermoélastiques : l’étude historique des propriétés des fluides est
marquée par les lois de Boyle-Mariotte et de Charles, relatives respectivement aux
variations de volume et de température d’un gaz donc on fait varier la pression. Plus
généralement, en fixant pour un fluide la quantité de matière n étudiée, on étudie les
relations entre les trois variables pression p, température θ et volume V en fixant un
des termes pour étudier les relations entre les deux autres.
On définit ainsi trois coefficients thermoélastiques ; le premier (coefficient de dila-
tation isobare), noté α, décrit les variations relatives de volume d’un gaz chauffé à
1 V′−V
pression constante. En pratique, on mesure α = ou, dans le cas d’une li-
V θ′ − θ
mite à faible taux d’accroissement, et en utilisant provisoirement la notation T pour
la température :
µ ¶
1 ∂V
α= (11.16)
V ∂T p,n
Le second coefficient (coefficient de compressibilité isotherme), noté χT , décrit les

variations relatives de pression d’un gaz dont on fait varier le volume à tempéra-
ture constante. Une diminution de volume s’accompagnant d’une augmentation de
pression, on le définit logiquement, dans les mêmes conventions, par :
µ ¶
1 ∂V
χT = − (11.17)
V ∂p T,n
On définit parfois un troisième coefficient pour les variations isochores de pression

1
lorsque la température varie, par β = (∂p/∂T )V . La réalisation des mesures iso-
p
chores est délicate et on lui préfère la détermination de α et χT , sachant de plus
que, pour les systèmes simples (pour lesquels il n’existe pas d’autre variable que p,
V , T et n), on peut montrer la relation β = α/pχT .
m
Pour un système à n constant, on peut aussi écrire V = où la masse m est une
ρ
d(m/ρ) dρ
constante. Remarquant alors que = − , on retiendra les deux définitions
m/ρ ρ
souvent plus commodes de ces coefficients thermoélastiques :
µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− χT = (11.18)
ρ ∂T p ρ ∂p T
2 Équation d’état : l’existence d’une relation liant, pour un système fluide et fermé,
le volume V (ou la masse volumique ρ) aux pression p et température T découle de
l’existence des coefficients thermoélastiques : on peut en effet tracer, de proche en
proche, une surface définie par l’équations ρ = ρ(T, p) à partir
µ ¶de la µdonnée ¶ de ses
∂ρ ∂ρ
deux tangentes (cf. figure 11.4), donc de ses deux dérivées et .
∂p T ∂T p
ρ
p = Cte T = Cte
pente +ρχT
p
pente −ρα T
Figure 11.4 – Interprétation géométrique de l’équation d’état
L’expression obtenue, qu’on puisse l’expliciter ou qu’on doive la conserver sous forme
graphique ou numérique, porte le nom d’équation d’état. On en généralise la notion
sous la forme suivante :
Équation d’état et variables d’état
X On appelle variables d’état le plus petit ensemble de variables macro-
scopiques nécessaire et suffisant pour la description complète des états
d’équilibre d’un système thermodynamique.
Dans tout état d’équilibre, ces variables d’état vérifient une relation au
moins implicite, qui porte le nom d’équation d’état.
2 Macroétat et microétat : un état d’équilibre thermodynamique est une notion

macroscopique, définie par un nombre très restreint de paramètres, également ma-
croscopiques ; dans le cas des systèmes simples, ces paramètres sont par exemple la
quantité de matière n, la masse volumique ρ, la pression p et la température T .
De façon tout à fait évidente, la donnée d’un quadruplet M = (n, ρ, p, T ) ne suffit
évidemment pas à définir de manière unique l’état microscopique des N particules du
système, qui sont par exemple caractérisées par leurs positions ri = (xi , yi , zi ) et leurs
vitesses vi = (ẋi , ẏi , żi ).
La connaissance de ces 6N nombres, si elle était possible, définirait un microétat
µ = (xi , . . . , yi , . . . , zi , . . . , ẋi , . . . , ẏi , . . . , żi , . . .) ; chaque microétat se résume, lorsque
le processus statistique des mesures macroscopiques est effectué, en un macroétat
M = (n, ρ, p, T ) mais il est évident que chaque macroétat peut être réalisé à partir
d’un très grand nombre de microétats différents.
Nous noterons Ω(M) le nombre de microétats µ possibles mais différents qu’on ne
peut distinguer à l’échelle macroscopique ; la valeur de Ω(M) est une mesure du défaut
d’information statistique sur la réalité de l’état microscopique pour un observateur

qui ne dispose que de l’information macroscopique.
On emploie parfois pour désigner Ω(M) le terme de désordre, terme évidemment im-
propre et qu’il faut donc analyser avec précautions. On pourra par exemple dire qu’un
fluide est moins ordonné qu’un solide car, dans le cas d’un solide, la connaissance des
positions des atomes est plus précise (du fait de la nature cristalline du solide par
exemple) que pour un fluide, pour un même ordre de grandeur des paramètres ma-
croscopiques. De même, un gaz est moins ordonné qu’un liquide puisque la distance
moyenne entre molécules y varie de façon plus importante, diminuant la connaissance
a priori sur les propriétés du microétat µ pour un macroétat M donné.
11.1.6 Les gaz parfaits

2 Propriétés thermoélastiques : l’étude expérimentale des coefficients de dilatation
α des gaz en fonction des paramètres thermodynamiques mène à l’expression appro-
1
chée α = , valable pour tous les gaz au moins à basse pression, si θ est une
θ + θ0
température centigrade ; la constante universelle θ0 ≃ 273 ◦ C mène à la définition
d’une température absolue T = θ + θ0 ; il s’agit d’une grandeur mesurable (par l’in-
termédiaire de la mesure de α) et pas seulement repérable. Cette loi porte le nom
historique de loi de Charles et Gay-Lussac. µ ¶
1 ∂V 1
L’intégration de l’équation différentielle (pour p fixé) = mène à la
V ∂T p T
relation V = K(p)T , où la constante d’intégration K(p) dépend de p.
1
De même, la loi de Boyle et Mariotte conduit à la loi expérimentale approchée χT = ,
p
qui s’applique là aussi de manière approchée pour tous µ les¶ gaz au moins à faible
1 ∂V 1
pression ; on peut écrire cette équation sous la forme = − , ce qui impose
V ∂p T p
1 dK 1 A
= − donc encore K(p) = , où A est une vraie constante.
K(p) dp p p
On peut réécrire cette équation pV = AT ou, prenant en compte le caractère extensif
de V , pV = nRT où R est une constante intensive.
La loi d’Avogadro et Ampère précise la constante R en montrant que c’est une
constante universelle, indépendante de la nature du gaz étudié si on en considère
la limite aux basses pressions. On définit ainsi les gaz parfaits :
Gaz parfaits
X On appelle gaz parfait le comportement limite à très basse pression de
tous les gaz réels. Ce sont des systèmes caractérisés par les seules va-
riables d’état p, V , T et n, avec pour équation d’état pV = nRT .
On appelle aussi thermomètre à gaz parfait le thermomètre construit sur la grandeur
pV
thermométrique ϑ = lim ; la grandeur centigrade associée est nommée tempéra-
p→0 n
pV
ture Celsius. La température absolue T = lim est alors entièrement définie par
p→0 nR
un seul choix conventionnel, qui est celui de la valeur de R ou, si on préfère, celui de
la température d’un point de référence.
2 Équation d’état des gaz parfaits : en choisissant conventionnellement T = 273, 16 K
pour la température du point triple de l’eau (équilibre de l’eau pure sous les trois
phases vapeur, liquide et solide), le système international d’unités fixe la constante

des gaz parfaits à la valeur numérique R = 8, 31 J · K−1 · mol−1 .
On peut aussi réécrire la même équation des gaz parfaits en termes de grandeurs
n m 1
extensives, en remarquant que = , si M est la masse molaire du gaz étudié ;
V V M
on écrira donc indifféremment :
pV = nRT ⇔ pM = ρRT (11.19)
Enfin, on utilise aussi une écriture massique en notant r = R/M la constante massique
des gaz parfaits, ce qui permet de noter :
pV = nRT ⇔ pv = rT ou p = ρrT (11.20)
où on a noté v = 1/ρ le volume massique du fluide. Dans le cas de l’air considéré
comme un gaz parfait, M = 29 g · mol−1 donc r = 287 J · kg−1 · K−1 .
11.2 Le premier principe
11.2.1 Énergie interne

2 Définition : au niveau microscopique, on peut toujours considérer que toutes les
interactions entre particules sont conservatives, et donc qu’il y a conservation globale
de l’énergie d’un système isolé. Les termes dissipatifs (frottements par exemple) ne
sont qu’une apparence macroscopique, liée au manque d’information sur la nature des
transferts d’énergie ; ainsi, si un piston frotte sur des parois et s’échauffe, il y a en
réalité conservation de l’énergie globale, les (( pertes par frottement )) étant simple-
ment transférées au niveau de l’augmentation d’agitation moléculaire des particules
constituant les systèmes qui s’échauffent.
L’énergie mécanique totale d’un système thermodynamique (Σ) formé de N particules
est défini, en mécanique classique et dans un référentiel (que nous supposerons ici
N
X 1
galiléen) R par E = Ec + Ep , avec pour énergie cinétique Ec = mi vi2 et pour
i=1
2
PN ¡
énergie potentielle Ep = i=1 eext int
¢
p,i + ep,i ; dans ces expressions, mi et vi désignent
la masse et la vitesse de la i-ème particule, qui interagit d’une part avec les N − 1
autres particules du système (énergie potentielle eint
p,i ) et d’autre part avec l’extérieur
du système (parois, force de gravitation, etc. ; énergie potentielle eext
p,i ).
Le théorème de Koenig permet alors de relier l’énergie cinétique totale Ec à l’énergie

potentielle Ec∗ du même système dans le référentiel barycentrique R∗ et à la vitesse vG
N
1 2
X
du centre d’inertie G de (Σ) relativement à R, selon Ec = Ec∗ + mvG où m = mi
2 i=1
est la masse totale de (Σ).
On choisit alors de décomposer l’énergie mécanique totale E en deux termes, l’un
relatif aux interactions internes du système dans le référentiel barycentrique, là où (Σ)
est globalement au repos, et l’autre relatif aux mouvements et interactions d’ensemble
du système :
N µ ¶
1 1
mi vi∗ 2
X
2
E = U + mvG + Epext U= + eint
p,i (11.21)
2 i=1
2
Cette expression définit l’énergie interne U du système (Σ) ; le terme cinétique bary-
1
centrique mi vi∗ 2 dans cette expression qualifie l’agitation thermique, c’est-à-dire des
2
XN
mouvements en général désordonnés et de valeur moyenne vi∗ nulle, par construc-
i=1
tion même du référentiel barycentrique.
Les deux termes complémentaires dans l’expression de E décrivent d’une part l’énergie
1 2
cinétique mvG associée à une translation globale du système, par exemple lorsqu’il
2
N
X
est en écoulement, et ses interactions avec l’extérieur, décrites par Epext = eext
p,i .
i=1
Dans le cas où un système est globalement au repos et si ses interactions avec l’extérieur
sont négligeables (par exemple, si le système ne monte ni ne descend dans le champ
de pesanteur), l’énergie mécanique se réduit à l’énergie interne.
2 Modèle cinétique des gaz parfaits monoatomiques : considérons, comme modèle du
gaz parfait monoatomique, un ensemble de N particules ponctuelles, sans interactions
entre elles ou avec l’extérieur sauf aux instants des chocs des particules entre elles
ou sur les parois du système. Nous étudierons le mouvement du système dans son
référentiel barycentrique, supposé galiléen, de manière à évaluer son énergie interne
U , qui n’est alors rien d’autre que la somme de l’énergie cinétique des N particules
qui le composent.
Le système évoluant dans un espace borné (de volume V ), toutes les positions r∗i
des particules du système (dans le référentiel barycentrique) évoluent entre certaines
limites, et nous supposerons qu’il en va de même des vitesses vi∗ dans le même ré-
férentiel. On va s’intéresser aux corrélations entre mouvements en positions, décrites
X N
par le terme f (t) = mi r∗i · vi∗ .
i=1
Au vu des hypothèses précédentes, f (t) reste borné, mais évolue a priori très rapi-
dement au cours du temps, au rythme des mouvements et chocs des particules. Par
df 1 t0 +τ df
Z
contre, la moyenne de sa dérivée sur une durée τ vérifie = dt donc
dt τ t0 dt
df f (t0 + τ ) − f (t0 ) df
= ; si τ est assez grand, → 0.
dt τ dt
Si la durée τ représente l’ordre de grandeur d’une mesure macroscopique des propriétés
du système, on pourra considérer que τ est toujours nettement supérieur à toutes
les durées caractéristiques d’évolution de f (t) ; cette hypothèse revient à négliger, à
l’échelle macroscopique, les fluctuations des grandeurs statistiques du fait du grand
df
nombre de particules étudiées. Dans cette hypothèse, nous écrirons = 0.
dt
N N
df dv∗
mi vi∗ 2 +
X X
On peut alors calculer = r∗i · Fi , où Fi = mi i représente la
dt i=1 i=1
dt
force subie, à l’instant considéré, par la i-ème particule. Si on néglige les fluctuations
temporelles des propriétés du système, son énergie interne se réduit à la moyenne

N N
1X 1X ∗
temporelle U = mi vi∗ 2 ; on en déduit aussitôt que U = − r · Fi .
2 i=1 2 i=1 i
Le terme Fi est, en dehors de toute interaction, nul lors de tout déplacement de

la particule i, sauf lorsque celle-ci subit un choc. S’il s’agit d’un choc entre deux
particules i et j à l’intérieur du système, r∗i = r∗j à la position du choc, tandis que
le principe des actions réciproques impose Fi = −Fj ; les termes de choc à l’intérieur
XN
du gaz s’éliminent donc automatiquement dans la somme r∗i · Fi . Il n’en va pas
i=1
de même lors des chocs sur les parois, les forces Fi étant alors toutes dirigées dans le
même sens, de la paroi vers l’intérieur du gaz.
Considérons alors les termes associés aux chocs qui se produisent, à un certain instant,
en un point r de la paroi du système. On peut alors écrire la contribution à l’énergie
1 X
interne de ces chocs sous la forme dU = − r · Fj , la somme portant ici seulement
2 j
sur les particules j qui subissent un choc sur l’élément dS de paroi. Orientant cet
élément
Pde paroi, d’aire dS et de normale n, vers l’extérieur du gaz, on peut alors
écrire j Fj = −pndS, par définition même de la pression p du gaz.
p
Il reste donc dU = r·ndS et, si on suppose le système à l’équilibre thermodynamique,
2
p
I
donc si sa pression p est uniforme, U = r·ndS, l’intégrale portant sur la surface
2 (S)
fermée (S) des parois qui limitent (Σ). L’application du théorèmeZ d’Ostrogradski
p
permet de transformer ce flux en une intégrale de volume, U = div rdτ . Un
2 (Σ)
calcul immédiat (par exemple en coordonnées cartésiennes) fournissant div r = 3, il
3
vient finalement U = pV .
2
La comparaison de cette propriété avec la définition de la température T du gaz parfait
3
impose U = nRT ; on retiendra donc dans ce cas l’expression valable pour les seuls
2
gaz parfaits monoatomiques :
3
UGPM (T ) = nRT (11.22)
2
2 Les lois de Joule : il est possible d’établir une généralisation de cette propriété
dans le cadre du théorème d’équipartition, qui affirme que les moyennes de termes
d’énergie quadratique ont tous même valeur ; cette propriété s’applique par exemple
1 1
aux énergies de translation mi vi2 ou de rotation Ji ωi2 , etc.
2 2
Un gaz parfait peut présenter seulement trois degrés de liberté associés aux trois
composantes de la vitesse vi (c’est le cas des gaz monoatomiques) mais il peut en
présenter d’autres, selon que des termes de rotation ou de vibration sont présents ; le
nombre δ de degrés de liberté de rotation dépend de la nature des molécules du gaz, et
de sa température qui permet ou non l’apparition de degrés de liberté supplémentaires,
liés aux mouvements de rotation ou de déformation des molécules.
δ(T )
Nous retiendrons donc l’expression U (T ) = nRT , où l’étude de δ(T ) est en
2
général difficile et ne peut se faire de manière satisfaisante que dans le cadre de
l’étude quantique des oscillations moléculaires. En pratique, on se contente d’affirmer
les lois de Joule :
Première loi de Joule

X Pour un gaz parfait, l’énergie interne U (T ) n’est fonction que de la tem-
pérature T .
Du fait de l’équation d’état pV = nRT , l’expression de l’enthalpie H = U + pV

(nous rappellerons plus loin la justification de cette définition de H) devient aussi
H = U (T ) + nRT , donc :
Seconde loi de Joule

X Pour un gaz parfait, l’enthalpie H(T ) n’est fonction que de la tempéra-
ture T .
11.2.2 Travail, transfert thermique

2 Travail ; transfert thermique : les évolutions d’un système thermodynamique
(Σ) sont régies par le théorème de l’énergie mécanique dE = δWmacro + δWmicro ,
la variation de l’énergie mécanique totale du système étant la somme des travaux
(correspondant à des forces non prises en compte dans l’énergie potentielle extérieure)
reçus par le système ; on a distingué dans ces travaux ceux qui sont associés à des
évolutions de variables macroscopiques de ceux qui ne le sont pas.
On peut expliciter la différence entre ces deux types de travaux reçus en remarquant
N
X
que, dans l’expression général δWtotal = Fi ·dri , certaines forces ont une expression
i=1
macroscopique et un sens identique pour toutes les particules ; c’est par exemple le
cas des forces de pression exercées par un piston, ou des forces électriques exercées
par le champ E qui règne dans un conducteur électrique.
Dans le cas de ces forces macroscopiquement organisées, on peut espérer une mise en
N
X
facteur de la forme F · dri , et si un déplacement globale des particules est associé
i=1
à ces forces, on aura bien la possibilité d’exprimer le travail correspondant en fonction
de paramètres macroscopiques. Notant par exemple dri = drglobal + dri,agitation , on
XN
pourra par exemple identifier δWmacro = F · drglobal car dri,agitation = 0.
i=1
Le terme δWmacro prend en Thermodynamique le nom de travail reçu par le système

(Σ) et il sera simplement noté δW dans la suite.
Tous les autres termes, liés à des variables ne présentant pas de moyenne macrosco-
pique sensible, c’est-à-dire liés à des déplacements ou à des forces microscopiquement
dispersés, seront notés δWmicro ou δQ ; on les appelle transfert thermique reçu par le
système (Σ), où éventuellement chaleur reçue par (Σ).
L’énoncé du théorème de l’énergie mécanique pour une transformation infinitésimale
prend donc la forme :
µ ¶
1 2
dE = d U + mvG + Epext = δW + δQ (11.23)
2
et on note l’intégrale de cette expression pour une transformation finie sous la forme :
µ ¶
1 2
∆E = ∆ U + mvG + Epext = W + Q (11.24)
2
Rappelons ici que les notations df et ∆f s’appliquent à des fonctions dépendant

seulement de l’état initial et final, tandis que l’emploi des formes δW et δQ ou
encore W et Q a pour but de rappeler que ces grandeurs dépendent aussi en général
de la nature de la transformation subie par (Σ). L’emploi incorrect de notations
inadaptées, comme dW au lieu de δW , ou encore ∆W au lieu de W , est une faute
grave (mais hélas courante) en Thermodynamique.
2 Lien avec les paramètres de contrainte : considérons un système déformable, c’est-

à-dire limité par une surface qui évolue au cours du temps (cf. figure 11.5). Les forces
de pression exercées sur cette surface ont donc la possibilité d’exercer un travail.
b
d S2 pext
dr
b
Figure 11.5 – Travail des forces de pression
Au cours d’un déplacement dr, les forces de pression extérieur exercées sur le système
exercent un travail (résistant si dr est de même sens que la normale n) donné par
dδW = −pext d2 Sn · dr sur l’aire élémentaire d2 S de la surface extérieure du sys-
tème (on remarquera les notations différentielles d pour le déplacement et d2 pour la
surface ; elles ont pour seul but de signaler que ces deux différentielles n’ont rien en
commun).
Puisqu’on reconnaı̂t dans d2 Sn · dr l’augmentation (algébrique) de volume dV (on
pourrait également la noter dτ ou encore d3 V ) correspondant à la surface élémentaire
d2 S, on peut écrire le travail fourni par les forces de pression au système (Σ) sous la
forme de l’intégrale de surface :
I
δW = −pext dV (11.25)
(S)
Dans le seul cas particulier où la pression extérieure a même valeur en tout point de la
surface (S) qui limite le système thermodynamique, cette expression prend la forme :
δW = −pext dV (11.26)
Plus généralement, le travail reçu par un système thermodynamique de la part de

l’extérieur se met souvent sous la forme δW = Yext dX, où X est une variable extensive
d’état du système (Σ), et Y un paramètre intensif dont la valeur à l’extérieur du
système Yext constitue un paramètre de contrainte. On peut citer le travail des forces
électriques (en convention des récepteurs) δW = eext dq, le travail d’une force de
traction δW = Fext dℓ, etc.
Le couple de variables (Y, X) porte le nom de variables conjuguées. On notera que,
dans le cas des forces de pression, les variables conjuguées sont (−p, V ).
2 Cas de l’équilibre local : on s’intéresse souvent aux transformations au cours
desquelles les paramètres de contrainte extérieurs imposés au système sont en perma-
nence égaux aux paramètres intérieurs au système au niveau de la frontière, du fait
de l’équilibre local du système avec son environnement.
Ainsi, l’équilibre mécanique local impose p = pext en tout point de la surface (S)
entourant le système (Σ) étudié ; un équilibre thermique local imposerait de même
T = Text en tout point de (S). Remarquons que cette notion n’impose absolument
pas que la pression p ou la température T corresponde à un équilibre en tout point
intérieur au système (Σ) ; celui-ci peut même subir, loin à l’intérieur de la surface (S),
des évolutions complexes ne permettant pas de définir une pression ou une température
unique en chaque point.
La description proposée ici s’applique donc bien aux machines thermiques en écoule-
ment (turbines, etc.) pour lesquelles le régime d’écoulement est celui de l’équilibre à
la surface extérieure du système, mais pas forcément à l’intérieur.
Dans ce cas, le travail des forces de pression peut s’écrire :
I
Équilibre mécanique local : δW = − p d3 V (11.27)
(S)
avec d3 V = d2 Sn · dr ; cette intégrale doit être évaluée en prenant en compte les

valeurs de la pression aux divers points de la surface (S) qui limite le système étudié :
la pression n’est a priori pas uniforme.
Si p est uniforme, on obtient l’expression plus simple :
Équilibre mécanique local, p uniforme : δW = −p dV (11.28)
Si au contraire p n’est pas uniforme, on

I peut se rappeler que, selon (11.4), le flux des
grandeurs convectées s’exprime selon xV v · ndS ; si on s’intéresse à un système
(S)
fermé, ses limites se déplacent en même temps que le mouvement d’ensemble du fluide
3 2
et dr = vdt
I donc d V = d Sv·ndt et le travail (11.27) s’écrit comme un flux convecté,
δW = − p (v · n) d2 S × dt.
(S)
On définira alors la puissance mécanique reçue par le système en équilibre mécanique

δW
local de la part des forces de pression par la relation Pp,éq.local = , ce qui permet
dt
d’y reconnaı̂tre l’opposé d’un flux convecté, la grandeur volumique xV étant la pression
p et donc la grandeur massique associée x étant le quotient p/ρ. On obtient donc les
deux expressions équivalentes de la puissance des forces de pression dans le cas d’un
système en équilibre local :
p
I I
Pp,éq.local = − p (v · n) dS = − dDm (11.29)
(S) (S) ρ
en fonction du débit de masse dDm sortant de la surface dS. Rappelons ici que le
débit de masse est défini pour la totalité du système par la relation (11.5).
2 Évolutions quasi-statiques : on donne parfois ce nom aux transformations d’un
système pour lequel les paramètres de contrainte extérieurs sont en permanence égaux
aux paramètres correspondants, en tout point intérieur au système. Le système est
alors en équilibre en tout point, et l’évolution du système est donc infiniment lente.
Une transformation quasi-statique est donc forcément aussi un équilibre local, et la
relation (11.28) s’applique, on écrira alors δWqs = −pdV . Toutefois, pour des raisons
qui apparaı̂tront progressivement par la suite, nous préférerons l’expression réversi-
bilité mécanique pour décrire le caractère quasi-statique d’une transformation. On
réécrira donc l’expression (11.28) sous la forme :
δWrév.méca = −p dV (11.30)
11.2.3 Énoncé du principe

2 Le premier principe : la relation dE = δW + δQ (qui devient dU = δW + δQ si
on peut négliger l’énergie cinétique globale de translation et l’énergie potentielle du
système) ne constitue rien d’autre qu’une application statistique immédiate d’une loi
microscopique (le théorème de l’énergie mécanique) à un système thermodynamique.
1 2
Dans cette expression, l’énergie mécanique E = U + mvG + Epext sont a priori fonc-
2
tion du microétat µ, c’est-à-dire de l’ensemble des coordonnées et des vitesses des
N particules du système (Σ) étudié. Nous admettrons donc le premier principe qui
affirme que, si deux microétats µ1 et µ2 correspondent aux mêmes valeurs macrosco-
piques des variables d’état (V , p, T , etc.), donc au même macroétat M, alors l’énergie
E et l’énergie interne U reprennent la même valeur, bien que les deux situations
microscopiques puissent être totalement différentes.
Premier principe de la Thermodynamique

X Les valeurs de l’énergie interne U et de l’énergie mécanique E d’un sys-
tème thermodynamique sont des fonctions d’état extensives, c’est-à-dire
que leurs valeurs ne dépendent que des variables d’état macroscopiques
du système ; U et E varient de plus proportionnellement à la quantité
de matière n.
En particulier dans le cas d’un système simple (décrit par les seules variables p, V , T
et n), et fermé (à quantité de matière n constante), l’existence d’une relation d’état
(liant p, V et T ) permet d’écrire U = U (T, V ) par exemple.
2 Détente de Joule, Gay–Lussac : l’établissement des fonctions U (T, V ) peut se faire
sur la base de l’étude expérimentale de cette détente dans le vide, réalisée conformé-
ment à la figure 11.6 ; le fluide étudié est séparé d’un espace vide par une paroi. Cette
paroi peut être supprimée sans apport de travail mécanique (il s’agit par exemple
d’une feuille de plastique que l’on brise) ce qui amène le fluide à occuper un volume
final V ′ > V après la détente.
vide
fluide, V , T
Figure 11.6 – Détente de Joule, Gay–Lussac
En l’absence de tout travail mécanique, W = 0 (les parois extérieures étant indéfor-

mables, aucune force ne peut exercer de travail) ; de plus, si les parois de l’ensemble
sont bien isolées thermiquement (on parle de parois adiabatiques, Q = 0 donc ∆U = 0
si on néglige les variations d’énergie potentielle (par exemple de pesanteur) lors de la
détente.
Finalement, la relation U (V, T ) = U (V ′ , T ′ ) et la mesure de T ′ permet de déterminer
expérimentalement les variations de U en fonction du volume V et de la température
T . En particulier, l’étude de cette détente dans le cas des gaz réels sous faible pression
mène à T ′ ≃ T quel que soit V ′ . On retrouve ici l’expression de la première loi de
Joule, U n’étant fonction que de T pour un gaz parfait ; si U est maintenu constant,
il en va de même de T .
La méthode permet, dans le cadre de mesures précises, d’évaluer l’écart de compor-
tement entre gaz réels et gaz parfaits ; on peut en particulier proposer, sur la base de
transformations de ce type, des équations d’état alternatives pour le comportement
des fluides réels. L’équation d’état des gaz de Van der Waals en est un exemple :
n2 a
µ ¶ µ ¶
a
p+ 2 (vm − b) = RT p+ 2 (V − nb) = nRT (11.31)
vm V
2 Calorimétrie : l’existence de la fonction,

µ ¶ au moinsµ implicite,
¶ U (T, V ) des deux
∂U ∂U
variables V et T permet d’écrire dU = dT + dV ; comme les trans-
∂T V ∂V T
formations quasi-statiques d’un système simple homogène (donc à pression uniforme)
vérifient de plus δWrév.méca = −pdV , on en déduit qu’on peut de plus écrire :
δQrév.méca = CV dT + ℓdV (11.32)
où on a défini les coefficients calorimétriques

µ ¶CV et ℓ, qui sont à leur tour des fonctions
∂U
d’état, avec pour expressions ℓ = p + et :
∂V T
µ ¶
∂U
CV = (11.33)
∂T V
Le coefficient CV porte le nom de capacité thermique isochore ; c’est une grandeur

extensive à laquelle on associe les grandeurs massique cV et molaire cV,m . Le coefficient
ℓ porte le nom de chaleur latente d’augmentation de volume ; c’est une grandeur
intensive, dont l’étude générale est hors programme.
Certains problèmes de Thermodynamique formelle portent sur l’étude générale des
propriétés des coefficients CV et ℓ, à partir des expressions analytiques des deux
principes, sous la forme du théorème de Schwartz pour l’égalité des dérivées secondes
∂ ∂U ∂ ∂U
partielles croisées de fonctions de deux variables, à savoir = ou encore
∂T ∂V ∂V ∂T
∂(ℓ − p) ∂CV
= pour ce qui concerne le premier principe. Ce type de problème est
∂T ∂V
a priori hors programme.
2 Enthalpie : considérons le cas d’une transformation monobare, pour laquelle on
peut écrire δW = −pext dV si le système n’est soumis qu’aux forces de pression. On
peut alors écrire δQ = dU + pext dV = dH ∗ où on a défini le potentiel enthalpique
H ∗ = U + pext V , en profitant de la circonstance pext = Cte ; ce n’est pas une fonction
d’état puisqu’il dépend de l’extérieur du système étudié.
Toutefois, pour une transformation complète, la relation Q = ∆H ∗ qui en découle
s’écrit aussi Q = ∆H où on a défini la fonction d’état enthalpie H = U + pV ; en
effet, les valeurs initiale et finale de p lors d’une évolution monobare sont égales à
pext . Finalement, la relation :
Qmonobare = ∆H (11.34)
se compare utilement sur le plan théorique à Qisochore = ∆U , tout en ayant une

importance pratique bien supérieure, du fait du caractère courant des transformations
monobares. On peut aussi écrire dH = dU + pdV + V dp ou, pour une transformation
quasi-statique d’un système simple homogène, δQqs = dH − V dp, ce qui permet de
définir une deuxième série de coefficients calorimériques :
δQrév.méca = Cp dT + kdp (11.35)
µ ¶
∂H
qui sont encore des fonctions d’état, avec pour expressions k = −V + et :
∂p T
µ ¶
∂H
Cp = (11.36)
∂T p
Cp porte le nom de capacité thermique isobare ; c’est une grandeur extensive à laquelle
on associe les grandeurs massique cp et molaire cp,m .
Le coefficient k porte le nom de chaleur latente d’augmentation de pression ; c’est
une grandeur intensive, régie là aussi par
µ des relations
¶ issuesµ de
¶ l’étude formelle de
∂(k + V ) ∂Cp
la fonction H(p, T ), avec en particulier = . L’étude générale
∂T p ∂p T
de k et de ces relations est hors programme ; elles n’apportent d’ailleurs rien d’autre
que les mêmes relations que celles fournies à partir de l’étude du coefficient ℓ puisque
le passage U → H, très utile sur le plan pratique, ne constitue qu’un changement de
variable sur le plan mathématique.
On définit enfin le rapport (intensif) des capacités thermiques :
Cp cp
γ= = (11.37)
CV cV
On peut en général montrer que, pour des raisons de stabilité thermodynamique, tout
système macroscopique à l’équilibre vérifie Cp > 0, CV > 0 et γ > 1 soit Cp > CV .
2 Le cas des gaz parfaits : l’application des deux lois de Joule montre
µ ¶que U et
∂U
H ne dépendent que de T , on en déduit immédiatement les relations = 0 et
µ ¶ ∂V T
∂H
= 0 ou encore ℓ = p et k = −V ; on réécrira ces résultats :
∂p T

dU
 U = U (T ) CV (T ) = δQqs = CV dT + pdV


dT

GP : (11.38)

 dH
 H = H(T )
 Cp (T ) = δQqs = Cp dT − V dp
dT
Comme de plus H − U = nRT , on en déduit immédiatement la relation de Mayer,

Cp − CV = nR ; on peut donc exprimer Cp et CV en fonction de n, R et γ soit, sous
forme massique :
γ(T )r r
GP : cp (T ) = cv (T ) = (11.39)
γ(T ) − 1 γ(T ) − 1
où on rappelle l’expression r = R/M de la constante massique des gaz parfaits pour
une masse molaire M.
Dans le cas des gaz monoatomiques, on a vu qu’en présence des seuls trois degrés de
liberté de translation on peut écrire u(T ) = 3/2rT donc cV = 3r/2, cp = 5r/2 et
γGP monoat. = 5/3 ≃ 1, 67. Dans le cas des gaz polyatomiques, γ(T ) dépend en général
explicitement de la température ; toutefois, dans le domaine, souvent assez vaste, où
on peut ne prendre en compte que les cinq degrés de liberté de translation et rotation
des molécules diatomiques, on aura u(T ) ≃ 5/2rT donc γGP diat. ≃ 7/5 ≃ 1, 40.
2 Le cas des phases condensées : les liquides et solides présentant en général des
volumes faibles devant ceux des gaz, le terme pV et ses variations sont souvent nu-
mériquement négligeables devant les variations de U et donc de H, ce qui permet
d’écrire, par exemple en notations massiques :
uph. cond. ≃ hph. cond. cp ≃ cV (11.40)
et on utilisera souvent la notation c pour désigner indifféremment les capacités ther-

miques massiques isochore et isobare.
11.3 Le second principe
11.3.1 Évolutions spontanées
2 Évolutions spontanées : considérons le système thermodynamique fermé et isolé

représenté sur la figure 11.7, formé de deux compartiments séparés par un piston ;
les deux fluides situés de part et d’autre du piston sont caractérisés par les énergies
internes U1 et U2 , les températures T1 et T2 , les pressions p1 et p2 et les quantités de
matière n1 et n2 .
U1 , T1 , p1 , n1 U2 , T2 , p2 , n2
Figure 11.7 – Un système fermé et isolé à deux compartiments
Ce système n’est en général ni à l’équilibre thermique (si T1 6= T2 ) ni à l’équilibre

mécanique (si p1 6= p2 ) ; il peut donc évoluer par transfert thermique (sauf si le piston
est isolé) ou par déplacement du piston (sauf s’il est fixé).
Toutes les évolutions de ce système doivent assurer la conservation des grandeurs
extensives U1 + U2 , n1 + n2 et V1 + V2 ; toutefois, cette loi de conservation n’est pas
suffisante pour prévoir le sens effectif de l’évolution.
Si on suppose par exemple que T1 > T2 dans l’état initial, on constate toujours
que l’évolution se fait (pour un piston fixe mais perméable aux échanges thermiques,
c’est-à-dire diathermane) de sorte que l’équilibre thermique se fasse progressivement :
après une évolution de durée quelconque, T1′ < T1 et T2′ > T2 mais aussi U1′ < U1 et
U2′ > U2 : le transfert d’énergie s’est fait du système le plus chaud vers le plus froid.
Lorsque l’évolution est terminée, T1′ = T2′ et l’équilibre thermique est réalisé.
Pourtant, la seule loi de conservation n’est pas suffisante pour prévoir ce sens d’évolu-
tion puisque les transformations (U1 , U2 ) → (U1′ , U2′ ) et (U1′ , U2′ ) → (U1 , U2 ) vérifient
toutes les deux les lois de conservation. L’une des transformations est effectivement
observable, l’autre pas.
Il s’agit d’un effet purement statistique puisqu’on pourrait observer formellement l’in-
version du sens de n’importe quelle transformation par changement du sens d’écou-
lement du temps ; il suffirait en principe de figer le système, de changer le sens de
chaque vitesse de chaque particule sans la déplacer, pour observer le retour vers l’état
initial au bout de la même durée que celle de la transformation directe.
C’est seulement la très faible probabilité de réaliser de telles conditions initiales (( exac-
tement inversées )) qui garantit qu’on n’observe jamais certaines transformations mais
toujours leurs inverses. On dira donc que les évolutions spontanées des systèmes ther-
modynamiques se font dans un sens toujours prévisible, mais qui ne peut être prévu
à partir des seules lois de conservation (dont fait partie le premier principe de la
Thermodynamique).
2 Réversibilité : les transformations réelles, comme celles auxquelles on peut s’at-
tendre si on libère les contraintes mécaniques ou thermiques au niveau du piston de la
figure 11.7, se font en général dans un sens unique et prévisible : il s’agit de transfor-
mations irréversibles. Toute transformation causée par un déséquilibre (mécanique,
thermique, etc.) est nécessairement irréversible.
Au contraire, on parlera de transformations réversibles pour désigner la limite (théo-
rique) de transformations pouvant s’effectuer indifféremment dans un sens ou dans
un autre ; une première condition nécessaire pour qu’une telle réversibilité puisse se
manifester est que la transformation doit parcourir une suite continue d’états d’équi-
libre : une transformation réversible est forcément mécaniquement réversible, ou si on
préfère forcément quasi-statique.
Cette condition n’est cependant pas suffisante ; on peut par exemple imaginer que le
piston de la figure 11.7 soit soumis à des forces de frottement, même pour une trans-
formation très lente. Dans ce cas, le piston restera immobile tant que |p2 − p1 | S 6 f ,
si S est la surface du piston et f la norme maximale de la force de frottement. Ainsi, le
piston se déplacera vers la droite si p1 > p2 + f /s, et vers la gauche si p1 < p2 − f /S ;
le changement de sens de l’évolution exige ainsi une variation finie ∆p1 = 2f /S de la
pression. On généralise cet exemple en définissant de manière générale les transfor-
mations réversibles :
Transformations réversibles
X Une évolution d’un système thermodynamique est dite réversible si elle
est constituée d’une suite continue d’états d’équilibre (transformation
quasi-statique, parcourue de manière infiniment lente) dont on peut
changer le sens d’évolution par une modification infinitésimale des para-
mètres de contrainte.
11.3.2 Énoncé du principe

2 Sens d’évolution lors des transformations spontanées : pour rendre compte de
l’existence de transformations spontanées, donc irréversibles, se produisant dans un
sens prévisible, nous allons affirmer le second principe de la Thermodynamique sous
une forme analogue à l’énoncé du premier principe, c’est-à-dire en recherchant une
fonction d’état extensive.
Pour rendre compte du rôle fondamental du caractère statistique de l’irréversibilité,
on précise son lien avec les échanges d’énergie microscopiques (transferts thermiques
δQ), alors que les échanges d’énergie liés à des variables macroscopiques (transferts
de travail δW ) ne sont pas des causes d’irréversibilité. On cherche donc une fonction
d’état S qui, au contraire de U , n’est pas invariante par changement de sens des
évolutions irréversibles ; ce n’est donc pas une grandeur conservée. Nous adoptons la
formulation axiomatique suivante :
Second principe de la Thermodynamique

X Tout système thermodynamique est caractérisé par une fonction d’état
extensive appelée entropie S, qui vérifie les trois propriétés :
• Lors d’une évolution spontanée (irréversible) d’un système thermody-
namique, les variations de S ont une double origine :
dS = δStransféré + δScréé
Dans cette expression, δScréé > 0 par convention tandis que δStransféré est
lié seulement aux transferts thermiques et en particulier δStransféré = 0
pour une transformation adiabatique (δQ = 0).
• S est une fonction croissante de la température à volume fixé.
On remarquera bien que, conformément aux conventions générales de la Thermody-

namique, le terme transféré utilisé pour δStransféré désigne l’entropie transférée vers
le système depuis l’extérieur de celui-ci, lors des transferts thermiques algébrisés de
la même manière.
On remarquera les notations différentielles dS, δStransféré et δScréé ; elles signalent

que S est une fonction d’état, mais que ses variations se décomposent en deux termes,
transféré et créé, qui dépendent du choix de chemin utilisé pour transformer le système
d’un état initial donné à un état final donné ; les termes transféré et créé ne sont pas
des fonctions d’état. Pour la même raison, on écrira ∆S = Stransféré + Scréé pour une
transformation finie.
De cet énoncé, on peut tirer quelques conséquences immédiates :
• une transformation réversible pouvant être effectuée indifféremment dans un sens ou
dans l’autre avec dans chaque cas création d’entropie, on aura à la fois Scréé > 0
′
pour la transformation directe, et Scréé = −Scréé > 0 pour la transformation
réversible
inverse ; finalement Scréé = 0 : une transformation réversible ne crée pas
d’entropie, elle en transfert seulement ;
• pour une transformation adiabatique (en particulier pour un système isolé) Stransféré
est obligatoirement nul : ∆Sadiabatique = Scréé > 0 et ∆Sisolé = Scréé > 0 ;
• dans les deux inégalités ci-dessus, le cas de l’égalité à zéro correspond aux trans-
formations réversibles et les cas de l’inégalité stricte aux transformations ré-
versibles ; en particulier, S augmente toujours lors d’une évolution spontanée
(irréversible) d’un système isolé : dSisolé > 0 ;
• au contraire, S reste constante lors d’une évolution réversible d’un système isolé ou
au moins thermiquement isolé : une adiabatique réversible est une isentropique.
La propriété (dSisolé > 0) ne doit surtout pas être généralisée : l’entropie S d’un
système n’augmente pas forcément si le système n’est pas isolé car tout dépend
alors du sens des évolutions imposées par les contraintes extérieures au système.
2 Pression et température thermodynamique : l’entropie S étant une fonction d’état,

on peut, pour un système fermé simple, la considérer comme une fonction de deux
quelconques des variables d’état d’un tel
µ système
¶ ; nous choisirons
µ ¶ de définir les gran-
1 ∂S ∂S
deurs T̄ et p̄ par les relations = et p̄ = T̄ , considérant ainsi
T̄ ∂U V ∂V U
S somme une fonction des variables U et V , et définissant au passage la pression
thermodynamique p̄ et la température thermodynamique T̄ .
Nous montrerons ultérieurement que T̄ = T et p̄ = p, mais jusqu’à cette démonstration
nous conserverons provisoirement les écritures p̄ et T̄ , pour écrire les deux formes de
l’identité thermodynamique :
dU + p̄dV
dS = ou dU = T̄ dS − p̄dV (11.41)
T̄
2 Pression cinétique et pression thermodynamique : considérons une transformation

adiabatique réversible ; on sait alors d’une part que dS = 0 (par définition même de
S) et d’autre part que dU = δW = −pdV (puisqu’une transformation réversible est
aussi mécaniquement réversible, c’est-à-dire quasi-statique), ce qui permet d’affirmer
que p̄ = p.
La pression cinétique peut donc être identifiée à la pression thermodynamique, ce que
nous ferons systématiquement dans la suite en adoptant la notation unique :
µ ¶
∂U
p=− (11.42)
∂S V
2 Entropie transférée : considérons maintenant le cas d’un système non isolé, mais
échangeant de l’énergie avec un thermostat (E) de température fixée T̄E . La réunion
du système (Σ) et du thermostat (E) formant un système isolé, on pourra écrire
dSΣ + dSE > 0, l’égalité désignant le cas des seules transformations réversibles.
Un thermostat est, par définition, un système dont la quantité de matière est suffisante
pour que, quelles que soient ses évolutions, sa température reste quasiment constante
tandis qu’il n’échange de l’énergie que sous forme thermique. Du fait de sa très grande
extension, toute évolution d’un thermostat est réversible ; on peut donc écrire δWE ≃ 0
donc dVE ≃ 0 soit encore dUE = T̄E dSE .
L’ensemble formé de (Σ) et (E) est isolé donc l’application du premier principe mène
à dUΣ +dUE = 0 ; ces deux termes mesurent d’ailleurs le transfert thermique δQΣ reçu
par le système (Σ) de la part du thermostat (E) sous la forme δQ = dUΣ = −dUE . On
δQΣ
peut donc écrire le second principe sous la forme dSΣ − > 0. Cette somme me-
T̄E
surant le degré d’irréversibilité de l’évolution envisagée, on l’identifie immédiatement
à l’entropie créée par l’évolution. Finalement, avec des notations plus générales :
δQ
δStransféré = (11.43)
T̄ext
Dans le cas d’un système effectuant une évolution finie en contact avec un ou plusieurs
thermostats, on peut encore écrire ∆S = Stransféré + Scréé
Z , où Scréé > 0 est la création
δQ
totale d’entropie due à cette évolution, et Stransféré = . Dans le cas particulier
T̄ext
d’une évolution cyclique, l’état final et l’état initial sont identiques donc ∆S = 0 et
la relation prend le nom d’inégalité de Clausius :
δQ
I
∆Scycle = 0 ⇒ = −Scréé 6 0 (11.44)
T̄ext
11.3.3 Calculs d’entropie

2 Principe : le calcul de l’entropie de peut s’effectuer qu’à une constante additive
arbitraire près, puisque S n’est définie que par ses variations. Le choix de l’origine
des entropies est donc toujours conventionnel. On calculera donc toujours S − S0
pour la différence entre l’entropie d’un état E et l’entropie de référence S0 d’un état
de référence S0 , en imaginant un chemin réversible menant de E à E0 ; en effet, les
variations d’une fonction d’état ne dépendent pas du chemin particulier choisi pour
réaliser l’évolution, mais seulement des états extrêmes.
Lors d’une telle évolution réversible, l’équilibre thermique impose à tout instant de
l’évolution T̄ = T̄ext et, puisque δScréé = 0, on peut écrire :
E0
δQrév
Z
S − S0 = (11.45)
E T̄
2 Cas des gaz parfaits : dans le cas des gaz parfaits, on a vu qu’il est possible d’écrire
deux expressions de δQ selon (11.38) ; on aura alors, en fonction des variables T̄ et V
CV (T̄ ) nR
d’abord, δQrév = CV (T̄ )dT̄ +pdV donc dS = dT̄ + dV ; l’intégration depuis
T̄ V
l’état de référence (V0 , T̄0 ) jusqu’à un état arbitraire (V, T̄ ) se fait en deux temps, par
variations réversibles successives de T̄ (à V constant) puis de V (à T constant), pour
Z T̄
CV (T̄ ) V
obtenir S − S0 = dT + nR ln . Dans le cas particulier (fréquent) où γ
T̄0 T V 0
est constant, on peut réécrire cette expression :
· ¸
1 T̄ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.46)
γ − 1 T̄0 V0
Le même calcul, mené à partir de δQrév = Cp (T̄ )dT̄ − V dp, mène par des voies
Z T̄
Cp (T̄ ) p
analogues à l’expression S − S0 = dT − nR ln ou, si γ est constant :
T̄0 T p 0
· ¸
γ T̄ p
γ = Cte ⇒ SGP − S0 = nR ln − ln (11.47)
γ − 1 T̄0 p0
Enfin, l’emploi de la relation T = pV /nR permet de montrer aisément la troisième

forme pratique de l’entropie des gaz parfaits si γ est constant :
· ¸
1 p γ V
γ = Cte ⇒ SGP − S0 = nR ln + ln (11.48)
γ − 1 p0 γ − 1 V0
pV γ
La dernière expression (11.48) peut être recopiée SGP − S0 = CV ln . Une évo-
p0 V0γ
lution adiabatique réversible (donc isentropique) vérifie donc une des trois relations
de Laplace T̄ × V γ−1 = Cte, T̄ γ × p1−γ = Cte′ ou p × V γ = Cte′′ .
On retiendra les quatre conditions nécessaires à l’application d’une des relations de

Laplace : on doit étudier un gaz parfait, en évolution adiabatique et réversible au
cours de laquelle γ reste constant.
2 Généralisation : les calculs d’entropie pour un système quelconque peuvent se

faire en imaginant une évolution réversible menant de l’état initial à l’état final, avant
Z f Z f
δQrév
d’écrire Sf − Si = dS = .
i i T
On peut aussi utiliser les identités thermodynamiques, comme (11.41) ou celle qu’on
en déduit en écrivant H = U + pV donc dH = dU + pdV + V dp ; on obtient alors le
couple d’identités commodes pour le calcul de dS donc de Sf − Si :
dU = T̄ dS − pdV dH = T̄ dS + V dp (11.49)
11.4 Machines thermiques
11.4.1 Cycles dithermes

2 Nomenclature : une machine thermique (Σ) effectue un cycle ditherme si elle
effectue des transformations cycliques en contact énergétique avec seulement deux
thermostats (ou sources thermiques) aux températures T̄1 et T̄2 , supposées constantes
au moins au cours d’un cycle. Dans la suite, nous supposerons T̄1 > T̄2 ; le transfert
reçu par la machine (Σ) sera noté Q1 (de la part de la source chaude) et Q2 (de la
part de la source froide) ; en plus, la machine (Σ) reçoit un travail W au cours du
même cycle.
Les grandeurs W , Q1 et Q2 sont évidemment algébriques. Elles permettent une clas-

sification des machines cycliques dithermes, parmi lesquelles nous ne retiendrons que
celles qui présentent une utilité concrète.
Si W < 0, Q1 > 0 et Q2 < 0, la machine reçoit de l’énergie thermique d’une source

chaude (par exemple la combustion d’un carburant), en cède à une source froide (au
niveau d’un système de refroidissement) et sous forme mécanique à l’extérieur ; c’est
−W
un moteur thermique ditherme, de rendement η = ;
Q1
Si W > 0, Q1 < 0 et Q2 > 0, la machine utilise un travail (mécanique ou électrique)
pour inverser le sens naturel des échanges thermiques entre les deux thermostats,
prélevant de la chaleur à la source la plus froide pour en céder à la plus chaude. Selon
le cas, on parle :
– de réfrigérateur ou de climatiseur ditherme, si le but de l’opération est de refroidir
Q2
la source froide ; dans ce cas, on définit l’efficacité de l’appareil par ǫR = ;
W
– de pompe à chaleur ditherme, si le but de l’opération est de réchauffer la source
−Q1
chaude ; dans ce cas, on définit l’efficacité de l’appareil par ǫP = .
W
2 Théorèmes de Carnot : pour un cycle ditherme, on peut écrire l’expression du
premier principe pour un cycle de la machine (Σ) sous la forme ∆Ucycle = 0 donc
encore W + Q1 + Q2 = 0, tandis que le second principe s’exprime par l’inégalité de
Q1 Q2
Clausius + 6 0 ; on en déduit sans difficulté les valeurs maximales possibles
T1 T2
pour les rendement ou efficacité des machines ditherme, sous la triple forme :
T̄2 T̄2 T̄1

η 6 η∗ = 1 − ǫR 6 ǫ∗R = ǫP 6 ǫ∗P = (11.50)
T̄1 T̄1 − T̄2 T̄1 − T̄2
Dans chaque cas, la transformation (( idéale )) correspondant au rendement ou à l’effi-

cacité maximal est une transformation réversible, qui porte le nom de cycle de Carnot.
Dans un tel cycle, les évolutions se font soit en contact avec une des deux sources
thermiques T̄i (et la réversibilité impose alors à la transformation d’être isotherme :
T̄ = T̄i ) soit avec changement de température (et la réversibilité impose alors à la
transformation d’être adiabatique). Un cycle de Carnot minimal est donc formé de
deux transformations isothermes réversibles complété de deux transformations adia-
batiques réversibles.
Les cycles de Carnot ne constituent qu’une idéalisation correspondant à un fonction-

nement infiniment lent ; ils n’ont donc pas de réalisation pratique et les cycles réels
sont toujours moins performants que les cycles de Carnot. Profitons seulement pour
rappeler, à l’occasion de cette définition, l’énorme erreur qui consisterait à confondre
évolutions adiabatique ou isotherme : pour réaliser une évolution isotherme, on doit
imposer le contact thermique avec un thermostat et une telle évolution ne peut
jamais être celle d’un système isolé.
2 Température du gaz parfait et température thermodynamique : on peut représenter

un cycle de Carnot dans le cas d’un machine formée d’un gaz parfait ; en effet, γ > 1
et les courbes adiabatiques d’équation p × V γ = Cte ont en tout point une pente
plus élevée que les isothermes. L’allure, hors échelle, de ce cycle dans le diagramme
de Clapeyron p = p(V ) est reportéI sur la figure 11.8. Le sens ABCDA des évolutions
y est choisi de sorte que W = − pdV < 0 et il s’agit donc d’un moteur.
p
ibsoth
C e rme r
éversi
ble, T¯
= T¯1
ad
bD
ia b
ad
at
iq u
ia b
e
at
ré
iq u
v.
b v.
ré
B isother bA
m e rév., T¯
= T¯2 V
Figure 11.8 – Moteur de Carnot d’un gaz parfait
Même si ce schéma représente le summum de l’idéalisation (il n’existe ni gaz parfaits

ni cycles de Carnot. . . ), on peut en déduire une propriété importante en effectuant
un calcul direct du rendement, sans application du second principe. On peut en effet
Q2
écrire W +Q1 +Q2 = 0 donc −η +1+ = 0 ; les transferts thermiques Qi le long des
Q1
isothermes T̄i peuvent être Zcalculés selon dU = 0 = δW +δQ (pour une transformation
isotherme) donc Qi = − pi dVi ; utilisant la définition de la température du gaz
pi V i VC VA
parfait Ti = , on en déduit Q1 = nRT1 ln et Q2 = nRT2 ln .
nR VD VB
Enfin, une transformation adiabatique vérifie, toujours en fonction de la température
nR nR nRT
du gaz parfait, dU = δW ou encore dT = −pdV soit dT = − dV
γ−1 γ−1 V
γ−1
qui s’intègre en T × V = Cte, relation obtenue sans utilisation de la température
VC VA T2
thermodynamique. On a donc ln = − ln donc enfin η = 1 − .
VD VB T1
T2 T̄2
La comparaison des deux expressions du rendement du cycle moteur impose = ,
T1 T̄1
ce qui impose l’égalité des températures T et T̄ sous réserve d’un choix commun de
l’origine des températures, avec par exemple la valeur Tpt = T̄pt = 273, 16 K pour le
point triple de l’eau.
Dans toute la suite, nous noterons T la température définie indifféremment par les
deux expressions, correspondant au thermomètre à gaz parfait et à la définition ther-
modynamique :
µ ¶ µ ¶
pV ∂U
T = lim = (11.51)
gaz,p→0 nR ∂S V
11.4.2 Systèmes ouverts

2 Expression générale du premier principe : on considère le système thermodyna-
mique (Σ) délimité par la surface géométriquement fermée mais non nécessairement
matérielle (S) ; l’exemple de la figure 11.9 représente un système comportant une zone
d’entrée et deux zones de sortie à travers lesquelles s’écoulent des débits de matière,
comptés positivement dans le sens de la sortie, avec donc Dm1 < 0, Dm2 > 0 et
Dm3 > 0.
2
Dm
(S)
D m1
δQ Dm
3
Figure 11.9 – Système ouvert en écoulement
Considérons alors le système formé des N particules qui, à l’instant t, sont contenues
à l’intérieur de la surface (S) ; à cet instant, leur énergie peut être notée ES (t). À
l’instant t + dt, certaines de ces particules sont encore à l’intérieur de la surface (S)
et l’énergie de ces particules est E(S) (t + dt) ; d’autres sont sorties de cette surface et
leur énergie, comptée algébriquement, est celle I sortie entre t et t + dt, égale donc à
l’énergie convectée DE × dt soit, suivant (11.4), eV v · ndS × dt, où on peut aussi
(S) µ ¶
1
écrire la densité volumique d’énergie totale eV sous la forme eV = ρ u + v 2 + eext p ,
2
fonction des grandeurs massiques u et eext p .
Le premier principe de la Thermodynamique permet alors d’évaluer la variation

d’énergie de ce système, fermé car comportant un nombre fixe de particules, sous
la forme dE = E(S) (t + dt) + DE dt" − E(S) (t) = δW + δQ, où #on remarque que
∂e
Z Z I
E(S) (t) = e(t)dm et donc dE = dm + eV v · ndS dt = δW + δQ.
(V ) (V ) ∂t (S)
Utilisantµl’expression dD¶m = ρvI· ndSµ du débit massique

¶ à travers dS, on écrit encore
∂ 1 2 1 2 δW δQ
Z
ext ext
u + v + ep dτ + u + v + ep dDm = + .
(V ) ∂t 2 (S) 2 dt dt
Dans cette expression, δQ = Ptherm dt où Ptherm est la puissance thermique transférée
au système (S) à travers ses parois, tandis que le travail δW fait apparaı̂tre le travail
(11.29) des forces de pression, plus le travail mécanique (( utile )), autre que des forces
p
I
de pression. Le travail des forces de pression est une intégrale de surface − dDm ,
(S) ρ
p
qui se regroupe avec l’énergie interne massique puisque u + = h ; quant au travail
ρ
mécanique utile, fourni par exemple par les pièces mécaniques mobiles situées dans la
machine, on l’écrira δWutile = Putile dt. On regroupe enfin l’ensemble de ces expressions
sous la forme générale :
µ ¶
∂E 1
I
+ h + v 2 + eext
p dDm = Putile + Ptherm (11.52)
∂t (S) 2
en accompagnant cette expression de la loi de conservation de la matière :
∂M
I
+ dDm = 0 dDm = ρv · ndS (11.53)
∂t (S)
2 Cas des écoulements permanents : dans ce cas particulier important, on pourra

∂E ∂M
écrire = 0 et = 0 ; de plus, les intégrales de surface de (11.52) et (11.53) sont
∂t ∂t
en fait des sommes portant sur un petit nombre d’éléments de surface parcourus de
flux de masse algébriques, comme sur la figure 11.9 qui en comporte trois.
Le premier principe et la loi de conservation de la masse deviennent alors :
µ ¶
X 1 X
Dm,i hi + vi2 + eext
p,i = Putile + Ptherm Dm,i = 0 (11.54)
i
2 i
On peut par exemple considérer le cas particulier de la détente de Joule-Thomson,

réalisée en régime permanent dans un système calorifugé (donc Ptherm = 0) sans
aucune pièce mécanique mobile (donc Putile = 0), avec une zone d’entrée (débit de
masse Dm,1 = −Dm < 0) et une zone de sortie (débit de masse Dm,2 = +Dm > 0).
1 1 2
On obtient alors la relation h1 + v12 + eext ext
p,1 = h2 + v2 + ep,2 .
2 2
Si on peut négliger les variations d’énergie cinétique et potentielle, on en déduit encore
h1 = h2 : la détente de Joule-Thomson à faible vitesse et sans variation d’altitude est
en général isenthalpique. Dans le cas d’un gaz parfait, elle est donc aussi isotherme.
µ ¶ µ ¶
1 ∂ρ 1 ∂ρ
α=− et χT = . Dans le champ de pesanteur, grad p = ρg.
ρ ∂T p ρ ∂p T
Pour tous les gaz réels, on a le comportement limite à basse pression pM = ρRT
ou p = ρrT : c’est le gaz parfait avec α = 1/T et χT = 1/p.
Les variables extensives X sont définies
Z par une intégrale dans le volume inté-
rieur à la surface de contrôle, X = xdm avec dm = ρdτ .
(Σ)
Le débit de X sortant
I de (Σ) est un flux à travers la surface (S) fermée qui
limite (Σ), DX = jX ·n→ext dS, avec jX = ρxv. Le théorème d’Ostrogradski
I (S) Z
affirme W · n→ext dS = div Wdτ .
(S) (Σ)
∂ρ
Pour une grandeur conservée (masse, charge électrique, etc.), div (ρv)+ = 0.
∂t
Le premier principe affirme l’existence d’une fonction d’état extensive U telle
1 2
que la somme E = U + mvG +Epext vérifie le théorème de l’énergie mécanique,
2
dE = δW + δQ ou encore ∆E = W + Q. On a en général δW = −pext dV , en
en particulier δW = −pdV en cas de réversibilité mécanique.
µ ¶ µ ¶
∂U ∂H
On définit aussi H = U + pV , CV = et Cp = et γ = Cp /CV .
∂T V ∂T p
Dans le cas d’un
µ système ouvert¶ en écoulement, ce principe prend la forme
∂E X 1 2 ext
+ Dmi hi + vi + Ep,i = Putile + Ptherm .
∂t 2
Le second principe affirme l’existence d’une fonction d’état extensive S, non
conservée, dont les variations comportent un terme d’échange et un terme de
création : dS = δStransféré + δScréé ou ∆S = Stransféré + Scréé , avec δScréé > 0,
δQ
l’égalité correspondant aux transformations réversibles, et δStransféré = .
Tsource
On peut calculer S en utilisant dU = T dS − pdV ou dH = T dS + V dp. On
peut aussi imaginer un chemin réversible menant de l’état initial à l’état final
Z f
δQrév
et écrire Sf − Si = .
i T
δQi
I
Pour une transformation cyclique polytherme, = −Scréé 6 0 (inégalité
Ti
de Clausius) ; on en déduit les théorèmes de Carnot (rendement et efficacités
limites pour les cycles dithermes moteur, réfrigérateur et pompe à chaleur).
∂u ∂h
Pour un gaz parfait, cV = et cp = (Joule) et cp − cV = R (Mayer)
∂T ∂T
pV γ
donc cp = γR/(γ − 1) et cv = R/(γ − 1). On a aussi S − S0 = CV ln si
p0 V0γ
γ = Cte. Relations de Laplace, pV γ = Cte, T V γ−1 = Cte′ et p1−γ T γ = Cte′′
sous 4 conditions (GP, adiabatique, réversible, γ constant).
Chapitre 12
Thermochimie
Ce chapitre est consacré aux applications du premier principe de la Thermodynamique

aux évolutions de systèmes formés d’un mélange de plusieurs espèces, en particulier
dans le cas des réactions chimiques : on parle de Thermochimie.
12.1 Description énergétique d’un mélange
12.1.1 Description d’un mélange

2 Mélange et variables de Gibbs : un mélange est un système thermodynamique
formé d’au moins deux types d’entités microscopiques (molécules, ions) différentes.
Ce mélange peut être obtenu à partir de ses constituants par la simple ouverture
de robinets : c’est l’opération de mixage, qui aboutit au mélange, résultat de cette
évolution évidemment irréversible. La figure 12.1 représente un dispositif de mixage
permettant de former, à volume total constant, le mélange de deux constituants A1 et
A2 pris initialement sous la même température et sous la même pression ; on généralise
immédiatement le procédé au cas de plus de deux constituants.
R
gaz 1 gaz 2
n1 , T , p, V1 n2 , T , p, V2
Figure 12.1 – Mixage à volume total constant
L’opération de mixage de la figure 12.1 est supposée réalisée à volume extérieur

constant (on néglige ici le volume dégagé par l’ouverture du robinet R) et à travers des
parois calorifugées : le système ne reçoit donc ni travail ni transfert thermique exté-
rieur et le mixage se fait à énergie interne constante, ∆U = 0 donc Umélange = U1 +U2 .
Par contre, l’opération de mixage est a priori irréversible ; s’agissant d’une transfor-
mation adiabatique, on peut en déduire que ∆S > 0. Les conséquences du second
principe sur une telle opération étant plus complexes que celles du premier principe,
on les étudiera ultérieurement.
2 Mélange idéal de gaz parfaits : on dit que le résultat du mixage réalisé sur la
figure 12.1 est un mélange idéal de gaz parfaits si :
• les deux gaz A1 et A2 formaient, avant le mélange, deux gaz parfaits ;
• le résultat de l’opération de mixage est aussi un gaz parfait ;
• après mixage, la pression p et la température T du mélange ont même valeur
qu’avant le mixage.
n1 n2
Dans ce mélange, on note x1 = et x2 = les fractions molaires des
n1 + n2 n1 + n2
deux constituants du mélange, ainsi que p1 = x1 p et p2 = x2 p les pressions partielles
n1 RT
de ces deux constituants. En remarquant par exemple que p1 = , on remarque
V
que p1 et p2 sont les pressions qu’exerceraient les gaz A1 et A2 s’ils occupaient, seuls, le
volume total V du mélange à la température T . Plus généralement, nous retiendrons :
 X
 xi = 1
n(Ai ) 
i
pi = xi p où xi = donc X (12.1)
ntotal 
 pi = p
i
X
La relation p = pi porte parfois le nom (historique) de loi de Dalton.
i
12.1.2 Propriétés énergétiques des mélanges

2 Mélange idéal de gaz parfaits : après l’opération de mixage de la figure 12.1,
∆U = 0 ; comme d’autre part p n’a pas varié, et puisque Vmélange = V1 + V2 , on peut
écrire Hmélange = Umélange + p(V1 + V2 ) tandis que H1 = U1 + pV1 et H2 = U2 + pV2 ,
d’où enfin :
X X
Hmélange = Hi Umélange = Ui (12.2)
i i
2 Lien avec le modèle microscopique du gaz parfait : dans le cadre de ce modèle,

faisons l’hypothèse supplémentaire que les molécules des gaz A1 et A2 , qui sont sans
interactions intermoléculaires avant le mixage, le restent après celui-ci. Alors, ces
molécules, ponctuelles, forment par construction un gaz parfait : c’est la première des
conditions qui définit un mélange idéal.
3 3
On a alors, dans le cadre de ce modèle, U1 = n1 RT et U2 = n2 RT , on déduit de
2 2
3
∆U = 0 que Umélange = U1 + U2 = nRTmélange . Comme enfin n = n1 + n2 , on doit
2
donc avoir Tmélange = T ; c’est la deuxième de ces conditions.
Enfin, les équations d’état pV1 = n1 RT , pV2 = n2 RT et pmélange (V1 + V2 ) = nRT dé-
duites du modèle cinétique du gaz parfait imposent bien pmélange = p ; cette troisième
condition étant vérifiée, tout mélange de deux gaz parfaits sans interaction est, dans
le cadre du modèle du gaz parfait, un mélange idéal.
On peut encore dire que l’environnement des molécules individuelles du gaz n’a changé
que par l’augmentation du volume ; l’équilibre thermique avec les parois impose tou-
1 3
jours la même énergie cinétique moyenne mi u∗i 2 = kB T pour toutes les molécules
2 2
12 : Thermochimie 269
(mi = m1 ou m2 ) ; par contre, le volume du gaz ayant augmenté, la pression exercée

N1
par l’ensemble des molécules du gaz A1 a chuté de p = kB T avant le mixage à
V1
N1
p1 = kB T < p après celui-ci ; c’est la présence des deux gaz A1 et A2 qui assure la
V
constance de la pression totale p = p1 + p2 .
Nous verrons ultérieurement comment l’augmentation du volume offert aux molécules
de chaque constituant du gaz explique aussi la forte augmentation d’entropie qui
accompagne ce mixage irréversible.
2 Généralisation : lors du mélange idéal de deux (ou plusieurs) gaz parfaits, T ne
varie pas, donc H ne varie pas, tout comme U ; on peut donc écrire les relations :
X X
Hmélange idéal (T ) = ni hi,m (T ) Umélange idéal (T ) = ni ui,m (T ) (12.3)
i i
où ui,m et hi,m représente l’énergie interne molaire et l’enthalpie molaire du i-ème
constituant du mélange, calculée comme si ce constituant était seul dans les mêmes
conditions de température.
2 Mélange réel : dans le cas d’un mélange réel de gaz, l’enthalpie du mélange comme
les enthalpies molaires des divers constituants dépendent un peu de la pression ; nous
poserons donc, pour un mélange quelconque :
X
Umélange (T, p, ni ) = ni ui,m (T, pi ) + ∆Umixage (12.4)
i
ainsi que la relation en théorie équivalente mais en général plus utile en pratique :
X
Hmélange (T, p, ni ) = ni hi,m (T, pi ) + ∆Hmixage (12.5)
i
Dans cette équation, les ui,m (T, pi ) et hi,m (T, pi ) sont les énergies internes et enthal-
pies molaires des constituants Ai du mélange, déterminées pour des corps purs, à la
température T du mélange et déterminées comme si la pression du corps pur était
précisément la pression partielle qu’il exerce dans le mélange.
Les grandeurs ∆Umixage et ∆Hmixage désignent donc les variations d’énergie interne et
d’enthalpie lors de l’opération de mixage. Nous les négligerons souvent dans la suite.
12.2 La réaction chimique
12.2.1 Description des réactions chimiques

2 Stœchiométrie : une réaction chimique est une transformation qui s’accompagne
d’une réorganisation des liaisons interatomiques, mais avec conservation de la ma-
tière : le nombre et la liste des atomes sont inchangés, alors que certains édifices
polyatomiques (molécules, ions, etc.) disparaissent et d’autres apparaissent. Toute ré-
action chimique est donc d’abord décrite par son bilan, faisant apparaı̂tre les relations
stœchiométriques entre quantités de réactifs disparus et quantités de produits formés.
On notera en général ce bilan :

X X νréactifs < 0
νi Ai ⇋ 0 ou bien νi Ai = 0 avec (12.6)
νproduits > 0
i i
Le choix des coefficients stœchiométriques est relativement arbitraires puisqu’on

peut tous les multiplier par une même constante sans changer la signification du
bilan (12.6) ; on prend souvent un jeu d’entiers minimal mais même cette convention
de lève pas l’indétermination (on peut changer tous les signes et permuter le rôle
des réactifs et des produits). Toutes les grandeurs extensives étant liées au choix de
la stœchiométrie, on prendra garde à ne pas modifier le choix initial des coefficients
stœchiométriques une fois qu’il a été effectué.
Notons que certaines transformations physiques peuvent être décrites dans le voca-
bulaire des réactions chimiques ; on peut ainsi formellement décrire l’ébullition d’une
espèce A comme la transformation Aliquide ⇋ Avapeur , avec les coefficients stœchiomé-
triques νliquide = −1 et νvapeur = +1.
2 Avancement : la conservation des espèces exige que la variation dni de la quantité

de matière ni de l’espèce Ai vérifie la relation générale :
dni
= dξ ∀i (12.7)
νi
ce qui définit une caractéristique quantitative unique de l’état d’avancement de la

réaction chimique, appelé avancement ξ. C’est une grandeur extensive, mesurée en
mol, qui est définie seulement à une constante près ; on choisit souvent ξ = 0 au
moment où la réaction débute, avec les quantités de matière ni (0) = ni0 , ce qui
permet d’écrire :
ni (t) − ni0
= ξ(t) ∀i (12.8)
νi
à un instant t quelconque au cours de la réaction. Notons qu’avec un tel choix d’origine

ξ(t) peut parfaitement être négatif ; par contre, on doit évidemment avoir ni (t) > 0
pour tout i.
Si à partir d’un certain moment ni (t) = 0, on dit que l’équilibre chimique est rompu
par disparition du réactif limitant Ai .
Si au cours du temps ξ(t) augmente, on dit que l’équilibre chimique progresse (ou
progresse dans le sens ) ; si au contraire ξ(t) diminue, l’équilibre chimique régresse
(ou progresse dans le sens ) ; enfin, si ξ(t) reste constant sans que l’équilibre soit
rompu, on dira que l’état d’équilibre est atteint.
L’évolution vers cet état d’équilibre est, rappelons le, régie par les lois de la cinétique
chimique, en termes de vitesse de réaction. On définit celle-ci par la relation générale :
1 dξ 1 d [Ai ]
v= = (12.9)
V dt νi dt
2 Évolution des grandeurs extensives : considérons une grandeur extensive quel-

conque X définie pour le système thermodynamique constitué des ni moles des es-
pèces Ai (plus les éventuelles espèces chimiques ne participant pas au bilan : solvant,
etc.). La grandeur X est a priori fonction de la composition chimique du système,
donc des variables ni , mais aussi de la température T et de la pression p ; on écrira
donc X = X(T, p, ni ).
Les évolutionsde Xdépendent desvariations de la température et de la pression, donc
∂X ∂X
des dérivées et ; ces deux dérivées, calculées à composition
∂T p,ni ∂p T,ni
chimique constante, relèvent de l’étude des systèmes fermés et ne sont pas liées à
l’évolution de la réaction.
Par contre, au fur et à mesure de cette évolution, les quantités de matière ni évoluent
toutes selon dni = νi dξ, et la fonction X évolue
aussi ; la relation
générale(différen-

∂X ∂X ∂X
tielle totale d’une fonction d’état) dX = dT + dp + dξ
∂T p,ξ ∂p T,ξ ∂ξ T,p

∂X
devient ici dX = dξ à T et p constants.
∂ξ T,p

X ∂X
La même expression de dX s’écrit aussi dX = dni si on consi-
i
∂ni T,p,nj (j6=i)
dère X comme une fonction
des variables T , p et nj ; puisque dni = νi dξ, on en déduit
∂X X ∂X
= νi . L’ensemble des variations de X de nature pro-
∂ξ T,p i
∂ni T,p,nj (j6=i)
prement chimique est lié à la valeur de cette dérivée partielle, que l’on appellera
(( grandeur de réaction )).
On utilise pour cette dérivée deux notations, la seconde (qui peut prêter à confusion)
porte le nom de notation de Lewis :

∂X
= ∆r X(T, p, ξ) (12.10)
∂ξ T,p
Comme on l’a noté explicitement dans l’écriture (12.10), la grandeur de réaction est
en général une fonction de T , de p, et de la composition chimique du système donc,
pour un état initial donné, de l’avancement ξ de la réaction.

∂H
On définit ainsi l’enthalpie de réaction ∆r H = , l’énergie de réaction
∂ξ T,p

∂U ∂S
∆r U = ou l’entropie de réaction ∆r S = .
∂ξ T,p ∂ξ T,p
2 Variation des grandeurs extensives : considérons une réaction chimique évoluant
d’un état initial ξ = 0 jusqu’à un certain état final ξ = ξf , qui peut être l’équi-
libre chimique, ou sa rupture en présence d’un réactif limitant, ou encore un arrêt
provoqué par l’opérateur (trempe par refroidissement brutal, etc.) La grandeur ther-
modynamique extensive X varie alors, entre l’état initial et l’état final, d’une grandeur
∆X = Xf − Xi .
Malgré la similitude des notations, on ne doit en aucun cas confondre ∆X et ∆r X.

Le premier terme ∆X est une variation, extensive, de la fonction d’état ; elle ne
∂X dans l’unité de X, par

dépend que de l’état initial et de l’état final. ∆X se mesure
exemple ∆H se mesure en J. Au contraire, ∆r X = est une grandeur
∂ξ T,p
instantanée, intensive, qui dépend de l’instant particulier en cours d’évolution. ∆r X
se mesure dans l’unité de X divisée par l’unité de quantité de matière, par exemple
∆r H se mesure en J · mol−1 .
Lors d’une réaction menée à température etpression
constantes, on peut évaluer la
Z f Z f
∂X
variation de la grandeur X selon ∆X = dξ = ∆r X(T, p, ξ)dξ.
i ∂ξ T,p i
2 Cas des mélanges quasi-idéaux : la relation (12.5) Xmontre, si on peut négliger

l’enthalpie de mixage, la relation Hmélange (T, p, ni ) ≃ ni hi,m (T, pi ) ; cette rela-
i
tion est d’ailleurs exacte dans le cas d’un mélange idéal.
Le milieuXréactionnel étant
∂H dni
précisément un mélange, on peut, dans ce cas, écrire ≃ hi,m (T, pi ).
∂ξ T,p i
dξ
D’autre part, la relation (12.7) montre que toutes les variations des quantités de
dni
matière ni sont reliées par = νi , d’où encore :
dξ

∂H X
mélanges quasi-idéaux : ∆r H = ≃ νi hi,m (T, pi ) (12.11)
∂ξ T,p i
Cette dérivée étant

ici indépendante de ξ, l’intégration est immédiate pour trouver
Z ξ
∂H
∆H = dξ ′ lors d’une évolution monotherme et monobare entre l’état
0 ∂ξ ′ T,p
initial (T, p, ξ = 0) et l’état final (T, p, ξ) étudié, il vient :

∂H
mélanges quasi-idéaux : ∆H ≃ ξ × ∆r H = ξ × (12.12)
∂ξ T,p
12.2.2 Chaleurs de réaction

2 Chaleurs monobares : considérons un système thermodynamique en évolution
monobare. On sait que, si ce système est fermé, le premier principe s’écrit Qp = ∆H ;
cette grandeur est le transfert thermique reçu par le système au cours de la réaction.
Si la réaction est menée de plus à la température constante T (ou si au moins la
température finale est égale à la température initiale), cette grandeur Qp = ∆H
porte aussi le nom de chaleur de réaction monobare.
Si Qp = ∆H < 0, cela signifie que le système a du recevoir Qp < 0, c’est-à-dire
encore fournir à l’extérieur −Qp > 0 pour conserver une température constante. Cet
excès d’énergie qui a du être évacué pour éviter une augmentation de la température
provient bien sûr du déroulement de la réaction chimique, et on dira :
Réactions exothermiques et endothermiques

X Si Qp = ∆H < 0 lors d’une réaction monobare monotherme, la réaction
est dite exothermique.
Si Qp = ∆H > 0 lors d’une réaction monobare monotherme, la réaction
est dite endothermique.
Enfin, si Qp = ∆H = 0 lors d’une réaction monobare monotherme, la réaction est

dite athermique ; cette situation ne peut être qu’exceptionnelle ou approchée.
On traite souvent le cas des réactions monobares car il est le plus facile à réaliser ; il
suffit par exemple que le réacteur soit, en fin comme en début de réaction, soumis à la
pression atmosphérique. Toutefois, on connaı̂t aussi des réactions menées en réacteurs
fermés indilatables, c’est-à-dire dans des conditions isochores.
2 Chaleurs isochores : considérons maintenant un système thermodynamique en
évolution isochore ; on sait que le premier principe s’écrit alors QV = ∆U . Si la
réaction est menée de plus à la température constante T , cette grandeur QV = ∆U
porte aussi le nom de chaleur de réaction isochore.
Comme précédemment, on pourra classer les réactions chimiques en fonction du signe
de QV = ∆U ; toutefois, la classification a moins d’importance en pratique que celle
basée sur le signe de Qp = ∆H :
• si QV = ∆U < 0 lors d’une réaction isochore monotherme, la réaction est dite
exo-énergétique ;
• si QV = ∆U > 0 lors d’une réaction isochore monotherme, la réaction est dite
endo-énergétique ;
2 Lien entre les chaleurs de réaction : puisque H = U + pV , on peut encore

écrire ∆H = ∆U + ∆(pV ) pour n’importe quelle transformation. On peut toutefois
remarquer que, le volume des phases condensées (solides et liquides) étant en général
négligeables, il n’y a de différence significative entre U et H que pour les seules phases
gazeuses. On peut donc proposer une comparaison entre ∆H, variation d’enthalpie
lors de la réaction monobare monotherme, et ∆U , variation d’énergie interne lors de la
réaction isochore monotherme, si l’état initial et l’état final ont la même composition.
∆H ′ = ∆U + (p′ − p)V
iso-V , mono-T État final ξ
p′ , T, V
État initial ξ = 0
p, T, V
État final ξ
∆H p, T, V ′ ∆HT
mono-p et T iso-composition
Figure 12.2 – Lien entre les chaleurs de réaction
Sur la figure 12.2, la réaction isochore monotherme est caractérisée par QV = ∆U

et donc par ∆H = ∆U + (p′ − p)V puisque, à volume et composition constantes,
la pression peut varier. La réaction monobare monotherme est, elle, caractérisée par
Qp = ∆H. On peut compléter un cycle de transformations en envisageant une com-
pression ou une détente isotherme, à composition constante, caractérisée par la varia-
tion d’enthalpie ∆HT .
Si le système à l’état final est formé d’un gaz parfait, ∆HT = 0 à cause de la seconde
loi de Joule ; sinon, on considère en général en première approximation que ∆HT
est négligeable devant les diverses grandeurs de réaction, ce qui permet d’écrire enfin
∆H ≃ ∆U + (p′ − p)V .
Comme ce volume V est en général essentiellement celui des phases gazeuses, on peut
encore écrire pV ≃ ngaz ′ gaz
initial RT et p V ≃ nfinal RT , en assimilant les gaz du milieu
réactionnel à des gaz parfaits ; il vient donc :
Qp = ∆H ≃ QV + ∆ngaz RT = ∆U + ∆ngaz RT (12.13)
si les chaleurs de réaction isobare Qp et isochore Qp sont évaluées à la même tempé-

rature T , et si ∆ngaz est la variation de la quantité de matière des gaz au cours de la
réaction chimique.
Prenons l’exemple de la réaction de combustion totale de l’acétylène C2 H2 , réalisée en
phase gazeuse dans l’air, de bilan 2C2 H2 + 5O2 ⇋ 4CO2 + 2H2 O. Cette réaction étant
pratiquement totale, on l’étudie dans l’air à partir de 2 mol d’acétylène et 30 mol d’air
représentant 6 mol d’oxygène, pour obtenir en fin de réaction 1 mol d’oxygène, 4 mol
de dioxyde de carbone et 2 mol de vapeur d’eau (l’azote de l’air n’est pas concerné
par le bilan). On a donc ici ∆ngaz = −1 mol. Si on réalise la réaction à 298 K, il vient
∆ngaz RT = −2, 5 kJ, écart très faible entre Qp et QV puisqu’on peut estimer à cette
température Qp ≃ −2, 51 × 103 kJ ≃ QV pour cette réaction qui est donc à la fois
fortement exothermique et exo-énergétique.
12.3 Tables thermodynamiques
12.3.1 Réaction de référence

2 Importance : la détermination de ∆H = Qp ou de ∆U = QV se fait en général à
partir de tables thermodynamiques relatives aux réactifs et produits pris séparément.
L’existence de telles tables découle essentiellement de la loi de Hess, dont la formula-
tion historique (qui date de ) est la suivante : (( la chaleur dégagée ou absorbée
par une réaction chimique est la même, que la réaction procède en une seule étape ou
en plusieurs étapes successives )) ; on parle encore de loi de sommation constante des
chaleurs de réaction.
La décomposition en processus consécutifs évoquée ci-dessus prend, pour ce qui nous
concerne, la forme de l’étude des réactions de référence, et en particulier des réac-
tions de formation ; comme nous le verrons, l’importance de ces définitions dépasse
largement le cadre de la seule Thermochimie.
2 Conditions standard : on parle de conditions standard pour un corps pur pris
isolément (et non pas dans un mélange) sous la pression standard p◦ = 1 bar.
On notera que la notion de condition standard ne fait pas mention d’une valeur
particulière de la température. Les choix couramment faits (T = 273 K = 0 ◦ C, ou
encore T = 298 K = 25 ◦ C) ne sont que des choix usuels qui n’ont pas de caractère
obligatoire. On parlera donc éventuellement de conditions standard à la température
T pour préciser que le ou les corps étudiés le sont à cette température.
Lorsqu’on parle d’un ensemble d’espèces chimiques Ai prises dans les conditions stan-
dard, il faut comprendre qu’il s’agit de la réunion (( par la pensée )) de corps purs,
isolés, pris chacun dans l’état standard.
X
2 La réaction de référence : considérons une réaction chimique de bilan Ai ⇋ 0,
i
menée à partir de conditions initiales quelconques, et en particulier à partir d’un
mélange pouvant contenir des réactifs (coefficients stœchiométriques νr < 0) mais
aussi des produits (coefficients stœchiométriques νp > 0) en proportion quelconque.

Si cette réaction est menée à la température T , on lui associe la réaction de référence,
transformation fictive pour laquelle :
• l’état initial est constitué des seuls réactifs, pris dans leur état standard (purs, isolés,
sous p◦ = 1 bar), en proportions stœchiométriques (donc avec les quantités de
matière nr = |νr |) ;
• l’état final est constitué des seuls produits, pris dans leur état standard (purs, isolés,
sous p◦ = 1 bar), en proportions stœchiométriques (donc avec les quantités de
matière np = νp ) ;
• l’état initial comme l’état final sont définis à la même température T .
Pour réaliser cette transformation, on doit donc (cf. figure 12.3 dans le cas de la
réaction Fe3 O4solide + COgaz ⇋ 3FeOsolide + CO2gaz ), à partir de l’état initial, réaliser
le mélange, s’assurer que la réaction est bien totale, puis séparer les produits d’arrivée
et les ramener à la température de départ, sous la pression standard. Il n’est pas
toujours simple de réaliser cette transformation en pratique mais nous l’utiliserons
essentiellement pour des raisons théoriques.
Fe3 O4 CO Réaction de référence FeO CO2

1 mol 1 mol T = Cte, p = p ◦ 3 mol 1 mol
réaction réelle totale

mélange séparation
Figure 12.3 – Réaction standard pour la réduction de Fe3 O4 en FeO
La réaction de référence porte aussi le nom de réaction standard associée à la réaction

chimique réelle étudiée.
2 Grandeurs extensives standard : pour la réaction de référence, on définit les

grandeurs standard de réaction par la relation ∆r X ◦ (T ) = Xfinal − Xinitial , les états
initial et final étant ceux de la réaction standard. Par construction, ces grandeurs ne
dépendent que de T puisque la pression est ici fixée à p◦ et les états initial et final
parfaitement définis.
Les quantités de matière dans l’état initial et final étant les nombres purs νi (et non
pas des quantités de matière en mol), il est logique d’exprimer l’unité de ∆r X ◦ (T )
dans l’unité de X divisée par l’unité de quantité de matière ; on peut aussi dire que
∆r X ◦ (T ) est une grandeur intensive puisque rapportée à des quantités de matière
conventionnelles, et non pas à des quantités de matière réelles.
Ce caractère intensif ne doit pas faire oublier que, par définition même de la réaction
standard, ∆r X ◦ (T ) dépend de la définition des coefficients stœchiométriques ; ainsi,
1 3
si on étudie la synthèse de l’ammoniac par mole d’ammoniac N2 + H2 ⇋ NH3 ,
2 2
on trouve ∆r H ◦ (298 K) = −46 kJ · mol−1 , tandis que si on choisit un systèmes
de coefficients stœchiométriques entiers minimal, N2 + 3H2 ⇋ 2NH3 , on trouve
∆r H ◦ (298 K) = −92 kJ · mol−1 .
On définit ainsi l’énergie de réaction standard ∆r U ◦ (T ), l’enthalpie de réaction stan-

dard ∆r H ◦ (T ) (ces deux grandeurs s’expriment en J · mol−1 , ou plus couramment en
kJ · mol−1 ) et l’entropie de réaction standard ∆r S ◦ (T ) (exprimée en J · K−1 · mol−1 ).
L’oubli du facteur 103 dans la conversion des kJ · mol−1 en J · mol−1 est une cause
d’erreur un peu ridicule mais hélas fréquente.
Comme nous le verrons progressivement ici et plus tard lors de l’étude des lois de
l’équilibre chimique, les grandeurs de réaction de référence ∆r X ◦ (T ) peuvent faire
l’objet d’une mesure expérimentale.
12.3.2 Calcul des chaleurs de réaction

2 Réaction réelle et réaction de référence : supposant qu’on sache déterminer
∆r H ◦ (T ) pour une réaction de référence menée à la température T , on peut se de-
mander comment relier cette grandeur à la chaleur de réaction réelle Qp = ∆H pour
le même bilan, dans le cas de la réaction chimique réelle, monobare et monotherme.
X
Les relations ∆H ≃ ξ∆r H et ∆r H = νi hi,m résultent d’une double approxi-
i
mation : négliger l’enthalpie de mixage et considérer le mélange comme idéal pour
pouvoir affirmer l’additivité de l’enthalpie dans un mélange. Dans le cas de la réac-
tion de référence, ces deux approximations ne sont plus nécessaires :
• dans la réaction de référence, il n’y a jamais de mélange car les réactifs comme les
produits sont séparés ;
• dans la réaction de référence, il y exactement addition des enthalpies puisque le
système initial comme le système final sont des juxtapositions d’espèces séparées.
Enfin, lors de la réaction de référence, les proportions étant stœchiométriques en début
comme en fin de réaction, la relation ni = ni0 +νi ξ montre que l’état initial correspond
bien sûr à ξ = 0 (ni = ni0 pour les réactifs) et l’état final correspond à ξ = 1 (ni = νi
pour les produits). Dans ce cadre, on a exactement :
X
∆r H ◦ (T ) = νi hi,m (T, pi ) (12.14)
i
2 Calcul des chaleurs de réaction : la comparaison de (12.11), (12.12) et (12.14) per-

met d’écrire en général l’expression de la chaleur de réaction monobare monotherme :
Qp = ∆H ≃ ξ × ∆r H ◦ (T ) (12.15)
On remarque que, dans cette approximation, la chaleur de réaction isobare ne dépend

pas de la pression, le calcul de ∆r H ◦ (T ) étant par hypothèse effectué à p = p◦ = 1 bar.
La figure 12.4 illustre les approximations effectuées pour le calcul de Qp proposé en
(12.15) : on néglige les enthalpies de mixage et on suppose l’addition des enthalpies
des espèces isolées pour déterminer l’enthalpie du mélange. La figure est tracée dans
le cas d’une transformation exothermique (Qp < 0) ; le mixage initial et final (qui
permettrait de passer des réactifs ou produits séparés au mélange effectif formant le
milieu réactionnel) sont aussi supposés exothermiques.
H m désigne un mixage
b
idéa
ξfinal × ∆r H ◦
m lisa
b tion
:Q
≃ξ
∆r H ◦
p
Qp = ∆r H ∆r H
0
tran
s form
atio b
n ré
elle, m
Qp b
b ξ
b b b
0 ξfinal 1
Figure 12.4 – Approximations pour le calcul de Qp
12.3.3 Réaction de formation
2 État standard d’un élément : considérons un réactif (ou un produit) formé d’un
corps composé comme l’oxyde de fer Fe3 O4 envisagé plus haut. Il s’agit d’un corps
composé puisque l’espèce est formée de deux éléments chimiques, l’élément fer et
l’élément oxygène.
On appelle état standard d’un élément à la température T la forme la plus stable de

cet élément à la température T et sous la pression standard p◦ . Par exemple, l’état
standard de l’élément oxygène à 298 K est le gaz O2gaz (et non pas le gaz moléculaire
O, l’ozone O3 ou le dioxygène liquide) ; de même, l’état standard de l’élément fer à la
même température est le fer solide Fesolide .
2 La réaction de formation : on appelle réaction de formation d’une espèce chimique

donnée, à la température T , la réaction de référence conduisant à cette espèce à partir
des corps simples (éléments pris dans leur état standard). Le tableau 12.1 propose
quelques exemples de réactions de formation.
Espèce chimique Réaction de formation associée

Fe3 O4 solide 3Fesolide + 2O2 gaz ⇋ Fe3 O4 solide
1
FeOsolide Fesolide + O2gaz ⇋ FeOsolide
2
1
H2 Oliquide H2gaz + O2gaz ⇋ H2 Oliquide
2
1
H2 Ogaz H2 gaz + O2 gaz ⇋ H2 Ogaz
2
Hgliquide Hgliquide ⇋ Hgliquide
Table 12.1 – Réactions de formation à 298 K (soit 25 ◦ C)
On remarque (par exemple dans le cas de la dernière ligne du tableau 12.1) que,
si l’espèce étudiée est précisément la forme stable d’un corps simple, la réaction de
formation se réduit à l’identité.
On appelle alors grandeur de formation d’une espèce chimique la grandeur Xf◦ (T )

égale à la variation de la grandeur X lors de la réaction de formation de cette espèce :
Xf◦ (T ) = ∆r X ◦ (T, réaction de formation). Il s’agit, par construction, d’une fonction
seulement de la température ; des tables thermodynamiques permettent de déterminer
ces grandeurs de formation, au moins à une certaine température.
Le tableau 12.2 propose un extrait de telles tables thermodynamiques, présentant des

valeurs d’enthalpies de formation pour certaines espèces chimiques.
Espèce Hf◦ (298 K), kJ · mol−1 Espèce Hf◦ (298 K), kJ · mol−1
AgClsolide −127, 1 AgClgaz 97, 23
Cl2gaz Cl aq −167, 5
O2 gaz O3 gaz 142, 3
H2 Ogaz −241, 9 H2 Oliquide −286, 0
NH4 aq −132, 8 H aq 0
Table 12.2 – Enthalpies de formation
On notera :
• que l’enthalpie de formation de deux espèces dans deux états physiques différents
est en général différente ;
• que certaines valeurs sont absentes ; il s’agit en fait de valeurs nulles correspondant
à des espèces formées d’un corps simple dans son état standard ;
• que l’ordre de grandeur est en général quelques dizaines ou centaines de kilojoule
par mole ; un signe négatif accompagne la plupart des enthalpies de formation
des espèces stables.
On remarque aussi que ces enthalpies de formation sont définies pour des espèces
ioniques en solution aqueuse ; comme la formation d’une telle espèce isolée n’est pas
possible (un réacteur restant électriquement neutre au cours de la réaction), ces gran-
deurs font l’objet d’une convention supplémentaire : l’enthalpie de formation de l’ion
H aq est nulle à toute température.
On appelle ainsi enthalpie de formation de Cl aq l’enthalpie de référence associée à
la réaction de formation de H , Cl en phase aqueuse ; de proche en proche, on peut
ensuite mesurer l’enthalpie de formation de NH
4 , Cl pour en déduire celle de NH4 aq
(qui figure d’ailleurs dans le tableau 12.2), etc.
2 La loi de Hess : considérons par exemple la réaction de référence décrite sur la
figure 12.3, pour le bilan Fe3 O4 + CO ⇋ 3FeO + CO2 . L’état initial comme l’état final
de cette réaction de référence sont formés de trois moles d’élément fer, cinq moles
d’élément oxygène et une mole d’élément carbone ; on peut donc les former (au sens
des réactions de formation envisagées plus haut) à partir des mêmes états standard
de ces éléments, selon la figure 12.5.

1 mol 1 mol T = Cte, p = p ◦ 3 mol 1 mol
(Fr ) (Fp )
Fesolide O2gaz Cgraphite
5
3 mol mol 1 mol
2
Figure 12.5 – Réactions de formation pour la réduction de Fe3 O4 en FeO
Sur cette figure, (Fr ) désigne la somme des réactions de formation des réactifs, pour
lesquelles la variation d’enthalpie peut s’écrire ∆HF r = Hf◦ (Fe3 O4 ) + Hf◦ (CO), et (Fp )
désigne la somme des réactions de formation des produits, pour lesquelles la variation
d’enthalpie est ∆HF p = 3Hf◦ (FeO) + Hf◦ (CO2 ). Toutes ces enthalpies de formation
sont bien sûr supposées déterminées à la même température T , qui est celle de la
réaction de référence.
L’enthalpie étant une fonction d’état, on peut évaluer la même variation d’enthalpie
sur deux chemins différents, ce qui conduit à ∆HF p = ∆HF r +∆r H ◦ , ce qui constitue
la loi de Hess :
Loi de Hess
X L’enthalpie standard d’une réaction (à la température T ) est la somme
(affectée des coefficients stœchiométriques) des enthalpies de formation
des produits, diminuée de la somme (également affectée des coefficients
stœchiométriques)
X X des enthalpies de formation des réactifs : ∆r H ◦ (T ) =
Hf◦ (T ) − Hf◦ (T ).
produits réactifs
Ainsi généralisée à n’importe quelle réaction chimique (puisque le raisonnement ci-

dessus s’appuie seulement sur la conservation des espèces dans le bilan d’une réaction),
on peut aussi l’écrire plus formellement :
X X
À T donné : ∆r H ◦ = νi Hf◦ (Ai ) pour νi Ai ⇋ 0 (12.16)
i i
en tirant avantage de l’expression algébrique des coefficients stœchiométriques νi , avec

νi < 0 pour les réactifs et νi > 0 pour les produits.
On peut donc déterminer ∆r H ◦ (T ) pour n’importe quelle réaction, et par là même les
chaleurs de réaction Qp ≃ ξ∆r H ◦ (T ) et Qv ≃ Qp − ∆ngaz RT , à partir de la connais-
sance de tables thermodynamiques relatives aux espèces chimiques individuelles qui
figurent au bilan.
La seule restriction à la généralité de la méthode est la nécessité de disposer de
tables calculées ou mesurées à la même température T que celle pour laquelle on
étudie la réaction chimique. Toutefois, comme on va le voir, il existe aussi des tables
thermodynamiques de correction de la température, basées sur les lois de Kirchhoff
de la Thermochimie.
12.3.4 Lois de Kirchhoff

2 Enthalpie et capacité thermique : les variations d’enthalpie d’un système quel-
∂H
conque avec la température sont régies par l’expression Cp = ; cette dérivée
∂T p
doit être calculée à p constant, c’est-à-dire exactement dans les conditions de la réac-
tion de référence, effectuée à p = p◦ . La figure 12.6 présente le cas de la réduction de
l’oxyde mixte Fe3 O4 effectuée à deux températures T et T ′ > T .
On peut ainsi compléter un cycle en ajoutant, à la réaction de référence menée à T
ou à T ′ , le chauffage isobare des réactifs de T à T ′ , et le refroidissement isobare des
produits de T ′ à T . Ces deux transformations étant celles de réactifs séparés, on a
exactement addition des variations d’enthalpie associées, ce qui s’écrit par exemple
Z T′
pour le chauffage isobare ∆Hchauffage = Cp (θ, p◦ )dθ où la capacité thermique
T
étudiée Cp est celle d’une mole de Fe3 O4 et de une mole de CO à la température θ ;

′
1 mol à T 1 mol à T ′ ′
T = Cte, p = p ◦ 3 mol à T ′ 1 mol à T ′
Chauffage Refroidissement
isobare isobare
Fe3 O4 CO T = Cte, p = p◦ FeO CO2

1 mol à T 1 mol à T Réaction de référence 3 mol à T 1 mol à T
Figure 12.6 – Changement de température de réduction de Fe3 O4 en FeO
Z T′
on écrit bien sûr de même ∆Hrefroidissement = − Cp′ (θ, p◦ )dθ où Cp′ concerne trois
T
moles de Fe et une mole de CO2 .
Finalement, ∆r H ◦ (T ) = ∆Hchauffage + ∆r H ◦ (T ′ ) + ∆Hrefroidissement s’écrit encore
Z T′
∆r H ◦ (T ′ ) − ∆r H ◦ (T ) =
′
Cp − Cp dθ, faisant apparaı̂tre la grandeur ∆r Cp◦ (θ),

T
qu’on peut indifféremment définir comme la somme des capacités thermiques des
produits diminuée de cette des réactifs (tous pris dans les conditions standard et
dans les proportions stœchiométriques), ou encore comme la variation de capacité
thermique lors de la réaction de référence :
X X X
∆r Cp◦ (T ) = Cp − Cp = νi c◦p,m (Ai , T ) (12.17)
produits réactifs i
Cette grandeur permet d’établir les lois de variation de l’enthalpie de réaction, en

généralisant la relation établie plus haut dans un cas particulier, selon :
Z T′
∆r H ◦ (T ′ ) = ∆r H ◦ (T ′ ) + ∆r Cp◦ (θ)dθ (12.18)
T
On utilisera aussi sa forme locale, dite première loi de Kirchhoff, obtenue en écrivant
T ′ = T + dT :
d
∆r H ◦ (T ) = ∆r Cp◦ (T ) (12.19)
dT
2 Tables de correction de température : la lecture des tables thermodynamiques se

fait donc toujours en deux temps :
• d’abord, la lecture des tables des enthalpies de formation des réactifs et produits
Hf◦ (T ) à la température T imposée par la table thermodynamique ;
• ensuite, la lecture dans ces mêmes tables des valeurs des fonctions c◦p (T ), ou éven-
tuellement des grandeurs constantes c◦p , permet le calcul de l’intégrale (12.18).
Les capacités thermiques sont données soit sous forme numérique, soit sous forme
de fonctions d’interpolation données en fonction de la température T . La table 12.3
montre la forme prise par les tables thermodynamiques indiquant les enthalpies de
formation et capacités thermiques, dans le cas où celles-ci sont constantes.
Dans d’autres cas, on donne les capacités thermiques sous la forme de polynômes
d’interpolation, par exemple c◦p (T ) = α + βT + γT 2 , ce qui permet le calcul explicite
de l’intégrale (12.18) si on connaı̂t les valeurs numériques de α, β et γ.
Espèce Hf◦ (298 K), kJ · mol−1 c◦p , J · K−1 · mol−1

Alsolide 24, 4
Algaz 329, 7
Al3 −531, 6
Al2 O3solide −1 676 79, 1
Cgraphite 8, 5
Cdiamant 1, 9 6, 1
Fesolide 25, 1
FeOsolide −266, 4 48, 1
Fe2 O3solide −824, 6 103, 9
Fe3 O4solide −1 119 143, 5
Table 12.3 – Enthalpies de formation et capacités thermiques
2 Approximation d’Ellingham : on constate dans la table 12.3 l’absence de certaines

valeurs ; on les considère comme nulles, ce qui revient à négliger les variations de
∆r H ◦ (T ) avec la température. Plus généralement, dans le cas où ∆r Cp◦ est inconnu,
nul ou négligeable, on considère que ∆r H ◦ est constant :
Approximation d’Ellingham
X On dit qu’une réaction est traitée dans le cadre de l’approximation d’El-
lingham si on néglige ∆r Cp◦ ou, ce qui revient au même, si on considère
que ∆r H ◦ est une constante indépendante de la température.
2 Cas d’un changement d’état : considérons le cas d’une même réaction chimique
étudiée à deux températures situées de part et d’autre de la température de change-
ment d’état T ∗ d’un des réactifs ; on peut par exemple étudier la réaction de formation
1
de l’eau H2 gaz + O2 gaz ⇋ H2 O ; pour T < T ∗ on considérera la formation de H2 Oliquide
2
et pour T > T ∗ celle de H2 Ogaz , avec dans ce cas T ∗ = 373, 15 K puisque les réactions
standard sont étudiées sous p◦ = 1 bar.
Dans ce cas, on doit tenir compte du changement d’état, associé à la variation d’en-
thalpie molaire L∗ (T ∗ ) = ∆H, qui est aussi la différence ∆H = Hf◦ (T ∗+ ) − Hf◦ (T ∗− ) ;
finalement, on écrira par exemple :
Z T∗ Z T′
Hf◦ (T ′ ) − Hf◦ (T ) = c◦p (θ)dθ + L∗ (T ∗ ) + c◦p (θ)dθ (12.20)
T T∗
où on remarquera que, dans les deux intégrales, les valeurs de cp sont différentes et
concernent respectivement deux phases différentes, par exemple vapeur pour θ > T ∗
et liquide pour θ < T ∗ .
12.4 Applications des lois de la Thermochimie
12.4.1 Emploi des chaleurs de réaction

2 Température de flamme adiabatique : il s’agit de la première application classique
des résultats établis plus haut : on étudie une réaction monobare, menée dans des
conditions adiabatiques ; si cette réaction est exothermique, le dégagement énergétique
qui l’accompagne impose une augmentation de la température du milieu (réactifs,
produits, solvants et gaz inertes). On s’intéresse en général à la détermination de la
température atteinte en fin de réaction.
On étudie alors l’évolution décrite sur la figure 12.7 ; la transformation réelle qui mène
des réactifs (et espèces inertes) aux produits est monobare et adiabatique, donc isen-
thalpique (∆H = 0) ; on cherche alors à relier la température finale (ou température
de flamme adiabatique) Tf à la température initiale Ti .
∆H = 0 produits + inertes
p◦ , T f
réactifs + inertes
p◦ , T i chauffage
produits + inertes
∆H = Qp p◦ , T i
Figure 12.7 – Température de flamme adiabatique
On peut aussi considérer cette transformation comme la composée d’une transforma-

tion monobare, monotherme avec la même composition finale (et donc ∆H = Qp ou
∆H ≃ ξf × ∆r H ◦ (Ti ) ou ξf est l’avancement en fin de réaction) suivie d’un chauffage
Z Tf
isobare du mélange final de Ti à Tf ; on écrira donc 0 = Qp + Cp (T )dT , ce qui
Ti
constitue une équation pour l’inconnue Tf si Cp (T ) désigne la capacité thermique du
mélange en fin de réaction.
On ne confondra surtout pas Cp (T ) défini ici pour un mélange à composition donnée,

incluant les gaz inertes et autres espèces hors bilan, avec la grandeur ∆r Cp◦ (T ),
relative à une réaction de référence et aux seules proportions stœchiométriques.
On remarque bien sûr que Cp (T ) > 0 donc Tf > Ti pour les réactions exothermiques
pour lesquelles Qp < 0.
2 Pression d’explosion adiabatique : le même type de raisonnement permet d’étudier
les réactions isochores, aboutissant en général à une forte augmentation de tempéra-
ture, donc de pression. Cette augmentation est liée à la valeur fortement positive de
QV , donc au caractère exo-énergétique de la réaction.
La pression atteinte dans un réacteur isochore en fin de réaction adiabatique (donc
∆U = 0) porte le nom de pression d’explosion adiabatique.
12.4.2 Énergies de liaison

2 Définition : l’énergie de liaison de la liaison AB dans une molécule diatomique
AB est la variation d’énergie interne El = ∆r U ◦ , extrapolée à T = 0 K de la réaction
de dissociation ABgaz ⇋ Agaz + Bgaz .

On assimile en général cette énergie à l’enthalpie de la même réaction ∆r H ◦ ; dans
tous les cas, cette grandeur est positive ce qui signifie qu’il faut en général fournir
de l’énergie pour rompre la liaison. L’ordre de grandeur de l’énergie de liaison est en
général la centaine de kilojoules par mole.
2 Généralisation : on peut considérer l’énergie de liaison comme l’inverse d’une
réaction de formation de l’espèce AB à partir de ses atomes séparés ; plus générale-
ment, on peut montrer que l’enthalpie de formation d’une molécule quelconque est
approximativement la somme d’énergies de liaison relatives aux diverses liaisons qui
composent la molécule.
Ainsi, pour la réaction 3C + 8H ⇋ CH3 − CH2 − CH3 , on peut écrire l’enthalpie stan-
dard de réaction ∆r H ◦ = −8El (C − H)−3El (C − C) puisque la formation de cette mo-
lécule exige la formation de huit liaisons carbone-hydrogène et trois liaisons carbone-
carbone. Cette relation n’est qu’approximative puisque les diverses liaisons ne sont
pas forcément équivalentes, du fait par exemple de leur localisation différente dans la
molécule formée.
Un mélange idéal de gaz parfaits réalisé à pression constante est aussi réalisé
à T , U et H constants. Dans ce mélange idéal, on définit les fractions molaires
xi = ni /ntotal et les pressions partielles pi = xi p.
X
Pour une réaction chimique quelconque νi Ai ⇋ 0, on définit l’avance-
i
ment
par
dn([A]i ) = νi dξ. Pour toute grandeur extensive, on note alors
∂
∆r = : c’est la notation de Lewis.
∂ξ T,p
Les chaleurs de réaction sont données par Qp ≃ ξ∆r H ◦ (T ) pour une réaction
monobare monotherme et Qv ≃ Qp − ∆ngaz RT pour une réaction isochore
monotherme.
L’enthalpie standard de réaction ∆r H ◦ est relative à la réaction de référence :
réactifs et produits sont les corps purs pris dans leur état standard (p◦ = 1 bar).
On détermine les enthalpies
X standard de réaction par application de la loi de
◦ ◦
Hess, ∆r H (T ) = νi Hf (Ai , T ) en fonction des enthalpies de formation des
i
réactifs et produits Ai à la même température T .
On peut relier les enthalpies de réaction à deux températures différentes en
d
utilisant la forme différentielle de la loi de Kirchhoff, ∆r H ◦ (T ) = ∆r Cp◦ (T ).
dT
Lors de l’intégration de cette loi, on ajoutera l’enthalpie molaire de change-
ment d’état si l’intervalle d’intégration comprend la température de changement
Z T∗ Z T′
◦ ′ ◦ ◦ ∗
d’état : ∆r H (T ) = ∆r H (T ) + ∆r Cp (θ)dθ + L∗ (T ) + ∆r Cp◦ (θ)dθ.
T T∗
Une combustion adiabatique monobare (température de flamme) est caractéri-

sée par ∆H = 0 ; une réaction adiabatique isochore (pression d’explosion) est
caractérisée par ∆U = 0.
Chapitre 13
La conduction thermique
13.1 Les transferts thermiques
13.1.1 Les modes de transfert thermique

2 Importance des transferts thermiques : les expressions du premier comme du second
principe de la Thermodynamique reposent sur l’existence et les propriétés du transfert
thermique δQ ou Q reçu par un système thermodynamique (Σ) ; ce chapitre décrit
l’origine microscopique des transferts thermiques, et les moyens qui permettent de les
calculer. Ces transferts thermiques se font par trois modes : conduction, convection
et rayonnement.
2 Conduction thermique : le mode de transfert qui apparaı̂t toujours au sein d’un
milieu continu (solide ou fluide) thermiquement inhomogène est la conduction ther-
mique. Il s’agit de transferts thermiques de proche en proche, par chocs microscopiques
entre particules d’énergie cinétique moyenne différente. La conduction thermique sera
associée à un courant local d’échanges thermiques causés par l’existence d’un gradient
de la température dans le milieu continu étudié.
La figure 13.1 représente l’origine microscopique de ce courant ; la présence de par-
ticules en moyenne plus énergétiques à l’abscisse x impose, du fait des mouvements
aléatoires, un transport de ces particules vers l’abscisse x + dx d’où, au contraire, ne
partent que des molécules en moyenne moins énergétiques. Notons que la répartition
des vitesses est en fait supposée isotrope en tout point du matériau (il s’agit de l’agi-
tation thermique) ; les seules vitesses représentées sur la figure 13.1 sont celles qui
sont à peu près alignées avec (Ox).
b b b b
b b b b
grad T b Φc
b
b
b
bb bb
x x + dx
b b
Figure 13.1 – Un modèle microscopique de conduction thermique
Globalement, le transport d’énergie se fait dans le sens des x croissants puisque T (x) >
T (x + dx) est associé à un flux thermique algébrique de conduction Φc > 0 ; nous
verrons ultérieurement que Φc est proportionnel à −grad T .
2 Convection thermique : le terme convection désigne, en général, le transport d’une

quantité physique lié à un transfert de masse observable à l’échelle macroscopique.
On peut étudier divers phénomènes de convection, le transport d’énergie cinétique
d’agitation thermique n’en étant qu’un des aspects.
L’étude détaillée de la convection n’est pas au programme, pas plus que les équations
de la dynamique des fluides. Nous n’étudierons cette année que le couplage entre les
flux thermiques conductifs et l’existence de phénomènes de convection à la frontière
de systèmes thermodynamiques fluides et solides (parois, canalisations). On parlera
systématiquement de transfert pariétal (à travers des parois).
Zone de transports convectifs
Φp Φp Φp Φp Φp Φp Φp Φp
Zone de transports conductifs
Figure 13.2 – Transfert thermique pariétal
La figure 13.2 précise la géométrie d’un tel transfert pariétal, entre un milieu solide
(où le transport thermique est régi par les phénomènes conductifs) et un fluide en
écoulement (où les phénomènes conductifs et convectifs coexistent). Cette figure est
représentée dans le cas où le flux thermique pariétal est dirigé du solide vers le fluide,
par exemple s’il s’agit d’un refroidissement de solide par circulation de fluide. Le
transport convectif dans le fluide sert ensuite à évacuer le flux thermique Φp ainsi
transporté à travers la paroi.
2 Rayonnement thermique : il constitue le troisième mode de transfert thermique ;
il ne nécessite pas de support matériel car il s’agit d’un transport énergétique par
une onde électromagnétique qui, comme on le verra par la suite, est susceptible de se
propager dans le vide tout comme dans certains milieux matériels, dits transparents.
Rayt visible
Rayt infrarouge
Mars
Le Soleil
Terre
Figure 13.3 – Équilibre radiatif des planètes et du Soleil
Contrairement à l’étude des phénomènes optiques, le rayonnement thermique ne nous

intéresse pas pour ses directions de propagation, qui résultent de phénomènes collectifs
et sont donc souvent mal définies ; on ne se préoccupera que de l’énergie transférée. On
peut par exemple rendre compte, dans le cadre de l’étude du rayonnement thermique,
de la température d’équilibre des planètes, en fonction du rayonnement qu’elles re-
çoivent de la part du Soleil, et du rayonnement infrarouge qu’elles émettent à leur
13 : La conduction thermique 287
tour (figure 13.3) : plus les planètes sont éloignées du Soleil, moins elles reçoivent de
rayonnement et plus leur température d’équilibre est basse.
Plus généralement, les transferts thermiques radiatifs sont les seuls présents dans le
vide. Leur étude détaillée (en liaison avec la température de l’émetteur mais aussi
avec la répartition spectrale du rayonnement) est reportée à un chapitre ultérieur.
13.1.2 Historique : transferts thermiques conductifs et radiatifs
2 Chaleur et température : la controverse concernant la nature de la chaleur et des

transferts thermiques dura jusqu’au milieu du xixe siècle. Aujourd’hui encore règne la
confusion dans certains des esprits ; ainsi, si on pose la main sur le front d’un malade
pour savoir s’il a de la température, on répète cette confusion :
– on évalue le transfert thermique Q à l’interface de la main et du front, alors qu’on
parle de la température T ;
– le verbe (( avoir )) est adapté à une grandeur extensive comme l’énergie interne U
ou le transfert thermique Q, mais pas à une grandeur extensive ; T est une variable
d’état qui devrait être associée au verbe (( être )).
L’expression (( transfert thermique )) a récemment été introduite pour remplacer le

terme (( chaleur )), source de possibles confusions entre les notions de transfert ther-
mique (extensif, lié à une transformation) et de température (intensif, lié à un état).
Sur le plan historique, la confusion a été levée de façon explicite pour la première fois
vers  par le physicien britannique Black ; il nommait alors intensity of heat la
température et quantity of heat le transfert thermique.
2 Transferts thermiques : vers , Fourier‡ , reprenant des travaux antérieurs,

décida de faire complètement abstraction de la nature de la chaleur, pour se concen-
trer sur l’étude de sa transmission. Fourier supposa que la chaleur se transmet des
zones chaudes vers les zones froides perpendiculairement aux surfaces isothermes et
proportionnellement aux écarts de température existants.
Fourier aboutit ainsi à la première étude quantitative d’un mode de transfert ther-
mique, la conduction ; c’est aussi le premier que nous étudierons en détail. La réso-
lution de l’équation aux dérivées partielles obtenue amena Fourier à développer les
notions de séries et transformées (intégrales) de Fourier.
L’étude des transferts thermiques par rayonnement débute seulement à la fin du xixe
siècle, avec notamment les travaux du physicien autrichien Stefan‡ ; en  il montre
ainsi que l’intensité du rayonnement thermique du corps chauffé à la température T
est proportionnelle à T 4 . En , son élève Boltzmann‡ établit pour la première
fois les bases théoriques de cette propriété.
En , l’allemand Wien‡ étudie la répartition spectrale du rayonnement émis par

un corps chauffé, et établit en particulier la loi du déplacement : la longueur d’onde
du maximum d’émission d’un corps chauffé à la température T varie comme 1/T .
Ce n’est enfin qu’en  que l’allemand Planck‡ établit une loi générale expliquant
notamment les lois de Stefan-Boltzmann et de Wien, fondée sur l’étude statistique
des particules quantiques que sont les photons, constituants du rayonnement élec-
tromagnétique. Les travaux de Planck ont trouvé leur réinterprétation en mécanique
quantique générale dans le cadre de la théorie statistique de Bose et Einstein.
13.1.3 Le cadre de notre étude

2 Les systèmes étudiés : nous étudions ici un ensemble de systèmes thermodyna-
miques qui ne se trouvent pas à l’équilibre thermique : La température d’un système
particulier (Σ) n’est donc pas partout égale à la température du ou des autres systèmes
avec lesquels (Σ) est en contact ou en relation ; rappelons ici qu’il peut y avoir des
relations énergétiques à distance, sans contact, par l’intermédiaire du rayonnement
électromagnétique.
Nous allons donc chercher à relier ces inhomogénéités de température avec les trans-
ferts thermiques qui se feront en général des zones les plus chaudes vers les plus
froides ; ce chapitre est en particulier consacré à l’étude de ces transferts en volume,
au sein de l’intérieur des systèmes, par conduction.
2 Température du système : dans le système thermodynamique (Σ) (donc macro-
scopique) étudié, la température T (r, t) dépend du point r dans ce système et de
l’instant t. Le système servant de base à notre étude sera donc l’élément de volume
dτ , infinitésimal à notre échelle, et cependant macroscopique, c’est-à-dire contenant
un nombre dN de particules très élevé, même si la quantité de matière (nombre de
moles) dn correspondante est très faible ; on choisira ce volume de dimensions assez
faibles pour qu’on puisse y considérer la température comme uniforme. Rappelons ici
que l’échelle de dimensions correspondante est l’échelle mésoscopique, intermédiaire
entre les échelle microscopique (dimensions moléculaires) et macroscopique (échelle
du laboratoire) : microscopique ≪ mésoscopique ≪ macroscopique.
Nous rencontrerons des situations simples où la température T (r, t) est une fonction
continue de l’espace, mais aussi des modélisations extrêmes où cette température subit
des variations très rapides sur de faibles dimensions. On traitera parfois ces cas comme
des zones de discontinuité de la température, au niveau d’une paroi par exemple : la
température d’un fluide circulant dans une canalisation peut varier sur une petite
échelle au voisinage de cette canalisation.
13.1.4 Bilans thermiques

2 Bilan thermique pour un système ouvert : rappelons ici que, si (Σ) est le sys-
tème thermodynamique ouvert défini comme l’intérieur de la surface de contrôle (S),
l’application du premier principe pour ce système prend la forme :
∂E
I
h + eext ρv · ndS = Putile + Ptherm
¡ ¢
+ (13.1)
∂t (S)
où l’énergie
Z mécanique totale E du système s’écrit comme une intégrale de volume,
E= ρedτ où on a choisi de noter e = u+eext la densité massique d’énergie totale,
(Σ)
somme de l’énergie interne massique u et des termes massiques d’énergie extérieure,
1
cinétique et potentielle, eext = v 2 + ep ext.
2
La même relation fait intervenir un débit sortant, correspondant à la somme de l’en-
thalpie, de l’énergie cinétique et de l’énergie potentielle sortantes ; rappelons ici que
h désigne l’enthalpie massique du fluide en écoulement.
Enfin, dans cette même relation (13.1), Putile est la puissance mécanique utile et Ptherm
la puissance thermique reçue par le système.
Le premier principe (13.1) se ramène seulement à un bilan thermique si tous les termes
énergétiques d’origine mécanique (c’est-à-dire, non thermique) sont nuls :
• le travail mécanique utile est nul, Putile = 0, par exemple en l’absence de toute pièce
mobile en contact avec le système (Σ) ;
• l’énergie potentielle extérieure eext
p est constante ou nulle, par exemple si on peut
négliger le travail des forces de pesanteur ;
• l’énergie cinétique macroscopique massique v 2 /2 est nulle ou ses variations négli-
geables ; ce sera notamment le cas lors de l’étude d’un système au repos ou à
faible vitesse d’écoulement.
Dans ce cas, le bilan thermique prend la forme :
dU
= −ΦH + Ptherm (13.2)
dt
I
où on a choisi de noter ΦH = ρhv · ndS le flux d’enthalpie sortant de la surface de
(S)
contrôle (S), en fonction de la densité volumique de courant d’enthalpie jH = ρhv ;
en effet, h désigne ici l’enthalpie massique donc hV = ρh est l’enthalpie volumique et
on reconnaı̂t bien dans jH et ΦH les expressions générales des densités volumique de
courant et débit sortant associés à la grandeur extensive H.
2 Notion de flux thermique : lorsque les transferts thermiques reçus par le système
(Σ) se font effectivement à travers la surface (S) qui entoure (Σ), on cherchera à
exprimer la puissance thermique Ptherm reçue par (Σ) par analogie avec X(13.2), c’est-
à-dire sous la forme d’un flux entrant ; on écrira alors Ptherm = − Φk , l’indice
k
k désignant
I la nature du transfert thermique étudié. On cherchera alors à exprimer
Φk = jk dS, en définissant un flux thermique sortant de (S) et son vecteur densité
(S)
volumique, de projection jk = jk · n sur la normale sortante.
Notre programme porte essentiellement sur la modélisation des densités volumiques de

courants thermiques jk associés aux trois types de transferts thermiques, conduction,
convection (dans le cas très restreint des transferts pariétaux) et rayonnement ; on
notera bien sûr Φc , Φp et Φr les flux thermiques associés.
¶ de l’énergie interne : on détermine la variation de U en rappelant que

2 Variation
µ
∂u
cV = définit la capacité thermique isochore massique ; elle permet d’écrire,
∂T V Z
lors d’une évolution à volume constant dU = cV dm (T (r, t + dt) − T (r, t)) donc
(Σ)
dU ∂T
Z
aussi = ρcV dt.
dT (Σ) ∂t
Plus généralement, pour un milieu continu quelconque (solide, liquide ou gaz) su-
bissant une transformation également quelconque, nous écrirons indifféremment dans
dU ∂T
Z
toute la suite = ρc dt, où c porte le nom de capacité thermique massique
dT (Σ) ∂t
dans les conditions de la transformation.
Rappelons ici encore que la relation H = U + pV montre que H ≃ U pour les

phases condensées, de volume faible, ou de volume faiblement variable ; dans ce cas,
la distinction entre cp et cv n’a plus de raison d’être ; on notera cp ≃ cv ≃ c, où
la capacité thermique massique c est pratiquement indépendante de la nature de la
transformation subie par le système.
2 Bilan thermique général : en présence de phénomènes conductifs, convectifs,

pariétaux et radiatifs, le bilan thermique le plus général pour un système (Σ) (ne
recevant pas de travail utile, et dont l’énergie mécanique macroscopique ne varie pas)
prend la forme générale :
∂T
Z
ρc dτ = −ΦH − Φc − Φp − Φr (13.3)
(Σ) ∂t
où on a choisi de noter Φc + Φp + Φr = −Ptherm le flux thermique sortant de la

surface de contrôle (S) qui définit le système thermodynamique (Σ) étudié ; les indices
serviront à distinguer flux conductif Φc , flux pariétal Φp et flux radiatif Φr .
Insistons sur l’importance des signes − dans cette relation : lorsqu’il existe un flux
énergétique sortant, qu’il s’agisse d’un flux
I thermique conductif, pariétal ou radiatif
ou d’un flux d’enthalpie convecté ΦH = jH · ndS, l’énergie interne du système
(S)
thermodynamique diminue.
On peut encore modifier l’équation (13.3) ci-dessus pour tenir compte de sources ther-
miques réparties en volume dans le système (V ) étudié, comme par exemple l’existence
d’une réaction chimique exothermique, la désintégration radioactive ou l’effet Joule
dans un milieu conducteur. On ajoutera alors au second membre la puissance Plocal
localement dégagée à l’intérieur de ce système pour obtenir la forme définitive du
premier principe dans le cas des bilans thermiques :
∂T
Z
ρc dτ = Plocal − ΦH − Φc − Φp − Φr (13.4)
(Σ) ∂t
Pour les systèmes fermés, il n’y a pas de débit de grandeurs extensives à travers la
surface (S) qui définit le système, donc ΦH = 0 : les termes convectifs sont négligés.
Ce sera le cas de la plupart des systèmes que nous étudierons cette année.
2 Terme de création locale : le terme Plocal est bien sûr souvent nul ; toutefois,
lorsqu’il est présent, il est en général susceptible d’une modélisation simple. Consi-
dérons par exemple un cylindre conducteur du courant électrique, de section S et de
1
longueur dℓ, donc de résistance dR = dℓ si γ est la conductivité du milieu étudié.
γS
On en déduit la puissance dissipée par effet Joule sous la forme dPlocal = dRi2 , si on
note i le courant qui traverse la section S du conducteur.
µ ¶2
1 i
Finalement, dPlocal = dτ , où dτ = Sdℓ est l’élément de volume du conduc-
γ S
teur, et où i/S est une grandeur locale intensive, la densité de courant électrique. Plus
généralement, nous écrirons toujours :
Z
Plocal = plocal dτ (13.5)
(Σ)
pour la création thermique locale, avec une densité volumique (intensive) plocal ; cette
grandeur se mesure en watt par mètre cube, et dépend du phénomène modélisé.
13.2 Lois phénoménologiques des transferts thermiques
13.2.1 La loi de Fourier

2 Transferts thermiques conductifs : dans un milieu où existent des inhomogénéi-
tés locales de température, les chocs microscopiques entre particules animées d’un
mouvement d’agitation thermique important (provenant des zones chaudes) et par-
ticules animées d’une agitation thermique moindre (provenant des zones froides) se
traduisent par des transferts thermiques en volume, au sein du matériau.
Considérons une surface infinitésimale orientée dS = dSn ; nous définirons le flux
thermique conductif comme la quantité dΦc d’énergie transitant, par conduction ther-
mique, à travers dS, par unité de temps, dans le sens de n. Ce flux est, pour des raisons
d’extensivité, défini comme tous les flux de grandeurs extensives par la relation :
dΦc = jc · ndS (13.6)
On fait ainsi apparaı̂tre un vecteur densité volumique de courant thermique de conduc-

tion jc (r, t), champ fonction à la fois du point et du temps.
Notons que dΦc s’exprime en watt, et donc que l’unité de mesure de jc est le watt par
mètre carré. On écrira encore, pour le transfert thermique conductif associé à travers
une surface (S) finie :
Z
δQ(S) = jc · ndS × dt (13.7)
(S)
Rappelons ici encore un risque de confusion qu’on rencontre dans toutes les études
de transport de grandeurs extensives : jc est une densité volumique de courant
thermique (car les transferts thermiques se font en volume) mais son unité est celle
d’une puissance par unité de surface.
Notons que dans le cas particulier où la surface (S) est fermée,
I le transfert thermique
reçu par le système (Σ) intérieur à (S) vaut δQ→(Σ) = − jc · ndS, compte tenu
(S)
des conventions usuelles de la Thermodynamique. On retiendra :
Flux thermique conductif

X Le flux thermique reçu par conduction par un système thermodynamique
δQ→(Σ)
I
(Σ) de surface extérieure (S) s’écrit = Φc = − jc · ndS, si
dt (S)
n est la normale à (S) orientée vers l’extérieur de (Σ).
2 Loi de Fourier : un modèle phénoménologique de la conduction thermique a été

proposé par Fourier ; on peut le présenter par analogie à la loi d’Ohm, autre modèle
phénoménologique décrivant, lui, la conduction électrique (charge volumique ρc et
densité de courant j = ρc v) sous la forme j = γE = −γgrad V ; cette relation définit
une grandeur γ caractéristique du milieu conducteur, sa conductivité électrique.
L’hypothèse de Fourier est la suivante : comme les lignes de courant électrique sont
alignées avec les directions de décroissance du potentiel électrique, les lignes de trans-
port thermique sont alignées avec les directions de décroissance de la température.
Ainsi, la loi de Fourier, bien vérifiée dans de très nombreux milieux, est donnée par :
jc = −λgrad T (13.8)
La constante λ, dite conductivité thermique du milieu continu étudié, est caractéris-

tique de la nature du matériau. Comme on le voit ci-dessus, λ s’exprime en watts par
mètre et par kelvin puisque jc est un flux thermique surfacique en watts par mètre
carré, tandis que grad T s’exprime en kelvin par mètre.
Conductivités thermiques en W · m−1 · K−1

Ag Cu Al Quartz Verre
430 390 320 8, 0 ∼ 0, 8
Eau Glace PS Air H2
0, 54 0, 10 3, 0 × 10−2 2, 5 × 10−2 0, 18
Table 13.1 – Conductivité thermique de certains matériaux
Les valeurs de λ varient très largement d’un matériau à l’autre, comme le montre
le tableau 13.1 ; on remarque que la valeur de λ est directement liée à la densité du
milieu. Les isolants formés de matériaux expansés (c’est le cas du polystyrène expansé
PS cité dans la table) ont des conductivités thermiques faibles du fait de leur structure,
formée de gaz piégés dans une structure lacunaire.
2 Isolants parfaits, conducteurs parfaits : on peut parfois faire l’approximation
d’un milieu parfaitement isolant sur le plan thermique si λ est très faible ; c’est en
particulier l’approximation que l’on fera souvent pour les gaz et les matériaux expansés
ou mousseux. Un tel isolant est donc caractérisé par :
Isolant thermique : jc = 0 (λ faible) (13.9)
Au contraire, une conductivité thermique très élevée impose une valeur faible de
grad T , sauf en cas de transport d’énergie avec une densité très élevée ; on fera donc
souvent l’approximation :
Conducteur thermique parfait : T est uniforme (λ élevé) (13.10)
Le diamant est un des meilleurs conducteurs thermiques connus, avec pour conduc-
tivité thermique λ ∼ 2 000 W · m−1 · K−1 à 20 ◦ C. On notera quand même que le
rapport des conductivités thermiques les plus élevées aux plus faibles est de l’ordre de
104 à 105 seulement ; la réalisation d’isolants thermiques parfaits est beaucoup plus
difficile que, par exemple, celle de bons isolants électriques.
13.2.2 Les transferts thermiques pariétaux

2 Flux pariétaux : au sein d’un fluide en mouvement, la présence simultanée de la
convection (liée aux mouvements du fluide) et de la conduction (qui apparaı̂t auto-
matiquement dès lors que le fluide n’est pas isotherme) peut faire l’objet d’une étude
z
paroi solide
x
Φp Φp Φp Φp Φp
v
ΦH ΦH
fluide en mouvement
Figure 13.4 – Flux pariétal
simplifiée : c’est celle du flux conductif pariétal, à la limite du fluide et d’une paroi
qui le limite. La figure 13.4 présente la géométrie associée à une telle situation.
Sur cette figure, les flux thermiques pariétaux suivent la direction de l’axe (Oz) : ils
sont représentés sur la figure par l’algébrisation des flux pariétaux Φp qui sont ici
dirigés de la paroi solide vers le fluide, supposé donc plus froid que la paroi solide.
La paroi étant étanche, la vitesse v du fluide en écoulement n’a pas de composante sur
l’axe (Oz) ; on peut donc écrire v · ez = 0 donc le flux d’enthalpie dans la direction
de l’axe (Oz) est nul : les transferts thermiques convectifs sont orthogonaux aux
transferts pariétaux.
Sur la figure 13.4, on peut imaginer que la température dans le fluide est une fonction
décroissante de x : les flux enthalpiques convectés ΦH , dirigés le long de l’axe (Ox),
évacuent ici l’apport thermique des flux pariétaux dans le fluide en écoulement.
2 Les hypothèses d’étude des flux pariétaux : dans la géométrie simplifiée sur la
figure 13.4, qui décrit par exemple un écoulement permanent le long d’une paroi, le
phénomène de conduction apparaı̂t dans le sens de −grad T , c’est-à-dire le long de
l’axe (Oz) (normal à la paroi) si la différence entre les températures dans le fluide
TF et dans le solide TS sont nettement plus importantes que les inhomogénéités de
température dans le fluide et dans le solide, ce que nous supposerons ici : TF 6= TS
tandis que TF (r) et TS (r) sont supposées être des fonctions continues de part et
d’autre de la paroi qui sépare le fluide du solide.
Transferts thermiques pariétaux

X On doit prendre en compte les transferts thermiques pariétaux en pré-
sence de discontinuités de la température de part et d’autre d’une paroi.
2 Modèle local : l’étude détaillée des transferts thermiques pariétaux peut être
envisagée à partir des équations de base que sont les relations de continuité de la
température TS (z = 0+ ) = TF (z = 0− ) et de continuité du flux thermique à travers
la paroi (Oxy) ; comme onµl’a déjà
¶ indiqué, ceµflux ¶est par construction exclusive-
∂T ∂T
ment conductif, d’où −λS = −λF , en notant λS et λF les
∂z z=0+ ∂z z=0−
conductivités thermiques du solide et du fluide.
Cependant, cette étude locale détaillée impose l’étude préalable des lignes de courant
v(r) dans le fluide, qui sont bien sûr liées à la variation TF (r) de la température dans
celui-ci ; on parle de couplage entre la conduction normale ou transverse et la convec-

tion longitudinale. Seules des solutions numériques ont en général pu être proposées
pour ce problème, dont nous ne proposons ici qu’une étude phénoménologique.
2 Couche limite : on peut donner une expression approchée des flux thermiques
pariétaux en considérant l’existence de couches limites, dans les fluides au voisinage
des parois. Dans ces couches minces, la température varie très rapidement, passant,
sur une faible épaisseur (que nous noterons η) de la valeur pratiquement uniforme
TF 0 dans le fluide, pour z < −η à la valeur pratiquement uniforme TS0 dans le solide,
pour z > 0.
C’est précisément l’existence de cette zone où la variation de température est rapide
et transversale (cf. figure 13.5) qui permet de ne considérer que le seul flux conductif
transverse : il est lié à la variation rapide de température dans la couche limite. Ainsi,
même si on ne peut pas, par cette méthode, étudier les variations (lentes) de tempé-
rature longitudinales, on obtient une expression du flux thermique pariétal (mesuré
de long de l’axe (Oz), du fluide vers la paroi solide) selon jp = −λF (grad TF )−η<z<0
λF
donc aussi jp ≃ − (TS0 − TF 0 ) ez .
η
z z
grad TF
Paroi solide, T ≃ TS0 TS0
x jp T
Couche limite
−η −η
b b
Fluide, T ≃ TF 0 TF 0
Figure 13.5 – Couche limite au voisinage d’une paroi
La description complète des transferts pariétaux exige donc de connaı̂tre la conducti-

vité thermique λF du fluide, mais aussi l’épaisseur η de la couche limite dans ce fluide.
Pour cette raison, ces flux pariétaux portent aussi le nom de flux thermiques convecto-
conductifs puisque, bien que de nature conductive, ils dépendent des phénomènes de
convection qui régissent l’écoulement dans la couche limite de fluide.
2 Nature de l’écoulement : l’étude complète des écoulements (dynamique des fluides)

exige la prise en compte des forces exercées de l’extérieur du fluide (pesanteur, etc...)
et à l’intérieur de celui-ci (pression, viscosité) ; elle mène à des équations non linéaires
dont la résolution mathématique se révèle généralement assez lourde et, pour cette
raison, elle est exclue du programme.
Signalons seulement l’existence de deux cas limites : les écoulements laminaires, dans
lesquels les lignes de courant glissent les unes sur les autres tout en restant parallèles,
et les écoulements turbulents, dans lesquels la vitesse du fluide dans la canalisation
varient d’un point à l’autre de façon quasiment aléatoire.
La figure 13.6 montre la visualisation d’un écoulement d’un liquide injecté dans un
autre, à la sortie de la canalisation d’injection. Tant que le fluide s’écoule dans la
canalisation (de faible diamètre d), les lignes de courant restent parallèles aux pa-
rois de cette canalisation : l’écoulement est laminaire. Dès que les parois transverses
s’éloignent, l’écoulement devient rapidement turbulent.
Figure 13.6 – Flux laminaire et turbulent
Le passage d’un régime à l’autre se fait exclusivement en fonction d’un paramètre sans
dimension appelé nombre de Reynolds R qui, dans une canalisation cylindrique de
vd
diamètre d, vaut R = , où v est la vitesse moyenne du fluide et ν le coefficient
ν
de viscosité cinématique. Les forces volumiques de viscosité sont proportionnelles à ce
coefficient ν.
On remarquera qu’il se mesure en mètres carrés par seconde : c’est donc un coef-
ficient de diffusion, analogue à ceux qui seront définis au prochain chapitre dans
l’étude des bilans thermiques de régime variable. Ce coefficient est lié aux phé-
nomènes diffusifs liés à la viscosité. Les coefficients de viscosité cinématiques des
fluides sont du même ordre de grandeur que les coefficients de diffusivité thermique,
comme le montre le tableau 13.2.
Air Éthanol Glycérol Eau (20 ◦ C)

ν = 1, 56 × 10−5 1, 51 × 10−6 1, 18 × 10−3 1, 0 × 10−6 m2 · s−1
Table 13.2 – Valeurs numériques du coefficient de viscosité cinématique
Dans une canalisation cylindrique, l’écoulement devient en général turbulent pour

R > Rc ≃ 2 300 : c’est le cas des écoulements à faible viscosité, à forte vitesse ou
lorsque les parois de la canalisation sont très écartées. Au contraire, l’écoulement
devient en général laminaire pour R < Rc : c’est le cas des écoulements dans les
fluides très visqueux, ou à faible vitesse ou encore dans les canalisations de faible
diamètre.
13.2.3 Coefficient de transfert pariétal

2 Définition : généralisant l’étude précédente, le transfert thermique pariétal à
l’interface entre le solide et le fluide, compté positivement du fluide vers la paroi
solide, peut se mettre sous la forme |jp | = h|TF 0 − TS0 |, où le coefficient de transfert
thermique pariétal h est d’autant plus important que le fluide est bon conducteur de
la chaleur et que l’épaisseur de la couche limite est plus faible, favorisant par exemple
les transferts thermiques de surface lorsque l’écoulement est turbulent.
Reprenant les conventions d’algébrisation développées plus haut, le transfert ther-
mique pariétal reçu par le système (Σ) à travers la surface (S) qui le limite s’écrit :
δQ→Σ
I
= −Φp où Φp = jp dS avec jp = h (TΣ − Text ) (13.11)
dt (S)
où le flux thermique pariétal par unité de surface jp est positif s’il est sortant de
la surface (S) qui limite (Σ), c’est-à-dire aux points où la surface du côté intérieur
de (S) est à température TΣ plus élevée que celle Text du côté extérieur de (S). La
relation (13.11) porte parfois le nom de relation de Newton pour le transfert pariétal
convecto-conductif.
On prendra bien garde de ne jamais confondre le coefficient de transfert pariétal h

avec l’enthalpie massique h du fluide ! Il est hélas possible de rencontrer ces deux
grandeurs dans un même problème, par exemple lors de l’étude de l’écoulement d’un
fluide recevant une puissance thermique par transfert pariétal lors de son écoulement.
2 Ordres de grandeur : les flux de transfert thermique de surface jp se mesurant

en watts par mètre carré, le coefficient de transfert thermique pariétal h s’exprime en
watts par mètre carré et par kelvin. La valeur du coefficient h dépend de la nature
du fluide mais aussi de l’épaisseur de la couche limite (ordinairement de l’ordre d’une
fraction de millimètre), donc du type de régime d’écoulement dans le fluide :
• dans un régime de convection naturelle, l’écoulement du fluide s’établit spontané-
ment du fait des écarts de température dans le fluide ;
• dans un régime de convection forcée, un dispositif (pompe, ventilateur) impose les
conditions de circulation du fluide, en général à une vitesse supérieure à celle
observée dans le cas de la convection naturelle.
De plus, dans chaque cas, on peut rencontrer des gradations dans les valeurs de h,
selon par exemple les valeurs du nombre de Reynolds. Notons seulement les ordres de
grandeur de h présentées dans le tableau 13.3.
Nature du transfert Nature du fluide h, (W · m−2 · K−1 )

Convection Gaz 5 à 30
naturelle Eau 100 à 1 000
Gaz 10 à 300
Convection Eau 300 à 1, 2 × 104
forcée Huile 50 à 1, 7 × 103
Métal liquide 6 × 103 à 1, 1 × 105
Table 13.3 – Coefficient de transfert thermique pariétal
13.2.4 Application à l’étude des transferts thermiques :

2 Principe : la prise en compte des transferts pariétaux revient à remplacer un
problème réel de transfert thermique par un problème simplifié (cf. figure 13.7).
Dans le problème réel, l’étude de la variation de température dans la couche limite,
d’épaisseur η au voisinage de la position z0 de la paroi devrait se faire avec continuité
de la température et du flux thermique conductif : T (z0− ) = T (z0+ ) et jc (z0− ) = jc (z0+ ).
Dans le problème simplifié au contraire, la prise en compte de la couche limite n’est
plus nécessaire ; la température devient, dans ce modèle, une fonction discontinue :
TΣ = T (z0− ) 6= T (z0+ ) = TF . Par contre, on continue à prendre en compte la continuité
des flux thermiques avec égalité de l’apport conductif et du transfert pariétal convecto-
conductif, jc (z0− ) = jp (z0 ).
En effet, que le régime soit variable ou permanent, il ne peut y avoir discontinuité des
flux thermiques de part et d’autre d’une surface d’épaisseur η négligée, puisque un
bilan thermique pour cette couche mince (masse volumique ρ et capacité thermique
T T
TΣ b
F F
Σ
TF b
η Σ
z0 z z z
b b 0
Problème réel Problème simplifié
Figure 13.7 – Conditions aux limites pour un transfert pariétal
∂T
massique c) s’écrit, par unité de section droite, ρcη = jc (z0− ) − jp (z0 ) ; lorsque
∂t
η → 0, on retrouve bien la continuité des flux thermiques, c’est-à-dire l’égalité du flux
conductif arrivant du côté du solide avec le flux pariétal partant vers le fluide.
Cette condition se traduit¯ aussi pour la répartition de température T (z) par la condi-
∂T ¯¯
tion aux limites −λΣ = h (TΣ − TF ) ; plus généralement, on écrira :
∂z ¯ z0
Conditions aux limites en présence de transferts pariétaux

X Si (S) est la surface limitant le système thermodynamique (Σ), de nor-
male n orientée vers l’extérieur, la conservation du flux thermique à
la surface (S) s’écrit jc · n = jp , où la densité volumique de courant
thermique jc est calculée à la limite intérieure de (Σ), tandis que la
densité volumique de courant thermique pariétal jp a pour expression
jp = h (TΣ − Text ).
Les transferts thermiques peuvent être réalisés par trois processus : la convec-
tion (déplacement macroscopique de matière), la conduction (transfert d’agita-
tion thermique par déplacements microscopiques) et le rayonnement thermique
(transfert dans le vide de l’énergie associée à une onde électromagnétique).
Tout transfert thermique est associé à un flux thermique Φth : le transfert reçu
par (Σ) est δQ = Φth dt avec pourI flux thermique entrant à travers la surface
fermée (S) limitant (Σ) Φth = − jth · ndS, où jth est la densité volumique
(S)
de flux thermique pour le processus étudié.
∂ ¡
U + E ext + DH+E ext = Putile + Pth où
¢
Un bilan énergétique s’exprime par
∂t
on a noté E ext l’énergie externe 1/2mv 2 +Epext ; le débit de la grandeur extensive
H + E ext est lui-même un flux sortant, celui du vecteur (h + eext ) × v.
En l’absence de travail mécanique utile et d’énergies extérieures, on peut écrire
∂U
I
= Plocal − ΦH − Φc − Φp − Φr , où ΦH = hv · ndS est le flux d’enthalpie
∂t (S)
convectée sortant de (S), Φc , Φp et Φr sont les flux conductif, pariétal et radiatif
sortants de (S) et Plocal la puissance localement créée.
∂U ∂T
Z Z
Dans ce bilan thermique, = ρc dτ et Plocal = plocal dτ , ce qui
∂t (Σ) ∂t (Σ)
définit la capacité thermique c dans les conditions de la transformation et la
densité volumique locale de puissance créée.
Le transfert thermique conductif reçu par
I le système thermodynamique (Σ) est
δQ→Σ
donné par = −Φc avec Φc = jc · ndS. La loi de Fourier impose
dt (S)
jc = −λgrad T .
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le coefficient de transfert pariétal h augmente si le fluide est un bon conducteur
thermique et si la convection est efficace (ou forcée), c’est-à-dire si la couche
limite est peu épaisse.
Chapitre 14
Régimes de transfert thermique
14.1 Bilans thermiques conductifs
14.1.1 L’équation de diffusion thermique

2 Expression locale : l’application du théorème d’Ostrogradski au flux de jc permet
aussi d’écrire, Zpour le système thermodynamique (Σ) intérieur à une surface fermée
(S), Φc = − div jc dτ . La comparaison de cette expression avec le bilan ther-
(Σ)
mique (13.4) permet d’écrire, en présence seulement de flux
Z conductifs Zet de termes
∂T
Z
de création locale, l’égalité intégrale ρc dτ = − div jc dτ + plocal dτ .
(Σ) ∂t (Σ) (Σ)
Cette identité devant être vérifiée quel que soit le volume d’intégration, on en déduit
la relation locale traduisant le bilan thermique conductif :
∂T
div jc + ρc = plocal (14.1)
∂t
Cette équation différentielle exprime le bilan conductif local sous forme d’une équation
∂ρ
analogue à l’équation de continuité div (ρv) + = 0 pour la conservation de la
∂t
masse ; la présence du terme de création locale plocal traduit l’absence de conservation
de l’énergie thermique.
Rappelons les conditions d’application de la relation (14.1) : on étudie un système

fermé (absence de transports convectifs) et on néglige les phénomènes radiatifs ;
on suppose aussi que le système étudié n’échange aucun travail et que le premier
principe se ramène donc au seul bilan thermique.
Notons qu’on peut aisément retrouver cette équation différentielle dans un modèle
unidimensionnel simple, conformément à la figure 14.1.
L’application du premier principe à un système infinitésimal de longueur dx, de
section S, donc de volume S dx et de masse dm = ρSdx impose, en l’absence de
tout travail reçu, dU = δQ = δQc + δQlocal , où on a noté δQc le transfert ther-
mique reçu par conduction à travers les parois du système en x et x + dx et δQlocal
le transfert apporté localement par des sources réparties en volume. On écrit alors
δQc = (Φc (x) − Φc (x + dx)) dt où Φc (x) = Sjc (x) et δQlocal = plocal Sdxdt ; comme
Φc (x) Φc (x + dx)
b b
x x + dx
Figure 14.1 – Modèle unidimensionnel de conduction thermique
∂T ∂jc ∂T
enfin dU = ρcSdx dt, il vient bien sûr + ρc = plocal , qui est la forme
∂t ∂x ∂t
particulière de l’équation (14.1) dans le cas unidimensionnel.
Dans la plupart des cas, il est exigé des étudiants qu’ils retrouvent l’équation (14.1)
en utilisant par exemple le raisonnement unidimensionnel présenté ci-dessus ; il faut
donc à la fois savoir et savoir retrouver cette forme locale de l’équation de bilan
thermique.
2 Équation de diffusion thermique : l’emploi simultané de l’équation-bilan (14.1) et

∂T
de la loi de Fourier (13.8) mène à −λ∆ T +ρc = plocal puisque div grad f = ∆ f ; on
∂t
réécrit habituellement cette relation, pour faire apparaı̂tre les analogies et différences
1 ∂2f
avec l’équation de d’Alembert ∆ f = 2 2 , sous la forme :
c ∂t
ρc ∂T plocal ∂T plocal
∆T = − ou = Dth ∆ T + (14.2)
λ ∂t λ ∂t ρc
λ
Le coefficient Dth = porte le nom de coefficient de diffusion ou diffusivité ther-
ρc
mique ; il s’exprime en mètres carrés par seconde et traduit la plus ou moins grande
facilité de l’homogénéisation des écarts de température dans un matériau donné. Une
bonne diffusion thermique exige une conductivité thermique λ élevée (forte propension
à transmettre les flux thermiques) mais aussi une faible capacité thermique volumique
ρc (faible pouvoir de stockage de l’énergie sous forme thermique).
Matériau λ, W · m−1 · K−1 c, J · kg−1 · K−1 ρ, kg · m−3 Dth , m2 · s−1

Cuivre 390 385 8 920 1, 1 × 10−4
Eau 0, 54 4, 18 × 103 1 000 1, 3 × 10−7
Air 2, 6 × 10−2 1, 02 × 103 1, 28 2, 0 × 10−5
Table 14.1 – Diffusivité thermique des solides, liquides et gaz
La table 14.1 présente la détermination de la diffusivité thermique d’un solide (le

cuivre), d’un liquide (l’eau à 20 ◦ C) et d’un gaz (l’air dans les conditions normales de
température et de pression).
14.1.2 Régimes variables de diffusion thermique

2 Ordres de grandeur : dans tous les cas, on remarque l’ordre de grandeur des
coefficients de diffusion, qui est nettement inférieur à l’unité. On peut interpréter ce
14 : Régimes de transfert thermique 301
résultat de la manière suivante : une longueur ℓ et une durée τ caractéristiques des

ℓ2
phénomènes de diffusion thermique seront reliés par Dth ∼ .
τ
Attention, dans cette expression, ℓ désigne une longueur mesurée dans le sens où
le transfert thermique a effectivement lieu, comme l’axe (Ox) de la figure 14.1 ;
2
Z donc jamais de considérer ℓ comme une surface. Les flux thermiques
il ne s’agit
Φc = jc · ndS sont effectivement proportionnels à la surface d’une section
(S)
droite du vecteur jc , surface mesurée perpendiculairement au sens des transferts
thermiques.
p
Ainsi, si τ est de l’ordre de grandeur de la seconde, ℓ est de l’ordre de Dth τ ∼ 1 cm
avec le cuivre, matériau qui présente une diffusivité thermique parmi les plus élevées
connues. Dans ce cas, l’énergie thermique diffusera en unep seconde sur une profondeur
de 1 cm. Si on prend ensuite τ ∼ 100 s, on trouvera ℓ ∼ Dth τ ∼ 10 cm, et ainsi de
suite.
Avec tout autre matériau de diffusivité plus faible, les dimensions ℓ associées à la
même durée τ seront plus faibles ou, si on préfère, les échelles de temps τ associées
aux mêmes dimensions seront plus importantes :
Durée des phénomènes de diffusion thermique

X La durée d’un phénomène de diffusion thermique varie comme le carré
ℓ2
de la profondeur sur laquelle se fait cette diffusion, selon τ ∼ .
Dth
Pour des dimensions macroscopiques, ces durées sont en général longues,
de l’ordre de plusieurs minutes, voire plusieurs heures : les transferts
thermiques sont des phénomènes lents.
Cette lenteur relative des phénomènes de transfert thermique est souvent mise à
profit pour affirmer qu’un phénomène rapide peut, en première approximation, être
considéré comme adiabatique. L’absence d’isolants thermiques parfaits est ainsi com-
pensée, sur le plan pratique, par la lenteur des échanges thermiques en comparaison
des autres modes d’échange énergétique.
2 Diffusion thermique : l’équation (14.2) prend, en l’absence de toute phénomène

de création locale, le nom d’équation de diffusion thermique ou équation de la chaleur
(nom historique) ; plus généralement, on appellera équation de diffusion (ou équation
de Kelvin) toute équation différentielle de la forme :
∂f (r, t)
= D∆ f (r, t) (14.3)
∂t
où le coefficient de diffusion D se mesure en mètres carrés par seconde, quelle que soit
la nature de la grandeur f .
Au contraire de l’équation de d’Alembert, la dérivée temporelle apparaı̂t ici au premier
ordre ; les solutions de cette équation aux dérivées partielles ne sont donc en général
pas invariantes par renversement du sens du temps. On peut par exemple noter que si
∂f ∂f
on fait le changement t → t′ = −t, alors ′ = − et l’équation de diffusion (14.3)
∂t ∂t
n’est pas invariante par ce changement.
∂2f
Au contraire, dans le cas des solutions de l’équation de d’Alembert = c2 ∆ f , le
∂t2
même changement de variables laisse l’équation inchangée puisqu’une seconde dériva-
∂2f ∂2f
tion impose ′2 = (−1)2 2 .
∂t ∂t
Cette circonstance n’a rien d’inattendu dans la mesure où on se souvient du caractère
irréversible des transferts thermiques dus à des différences de température : les situa-
tions de transfert thermique privilégient un sens d’écoulement du temps. Au contraire,
les propagations d’onde sont des évolutions réversibles.
14.1.3 Méthodes d’étude des phénomènes conductifs en régime variable

2 Le problème étudié : on s’intéresse ici à un milieu conducteur de la chaleur,
caractérisé par une conductivité thermique λ, une capacité thermique massique c et
une masse volumique ρ ; ces trois grandeurs sont supposées constantes, ainsi donc que
la diffusivité thermique Dth = λ/ρc. Dans un tel milieu, que nous supposerons soumis
en volume aux seuls échanges thermiques conductifs, la température T est la solution
∂T plocal
de l’équation aux dérivées partielles = Dth ∆ T + , où la densité volumique
∂t ρc
de puissance thermique localement créée plocal est une fonction supposée donnée du
point et du temps.
2 Les cas particuliers : on a déjà vu qu’en régime permanent et en l’absence de tout
terme de création locale, l’équation de diffusion thermique prend la forme de l’équation
de Laplace ∆ T = 0 ; sa résolution mène au calcul des conductances thermiques.
Toujours en régime permanent, mais dans le cas où on ne néglige plus les termes de
création locale, l’équation de diffusion thermique prend le nom d’équation de Poisson ;
plocal
elle s’écrit ∆T = − . Il est possible de montrer que sa solution est unique pour
λ
des conditions aux limites données.
L’étude exhaustive des solutions en régime quelconque (variable) de l’équation de
la diffusion thermique n’est pas possible ; nous présenterons cependant quelques mé-
thodes de résolution, en supposant dans tout ce qui suit que le terme de création
locale est absent, plocal = 0.
∂T
2 Conditions aux limites : la résolution de l’équation de diffusion = Dth ∆ T im-
∂t
pose en général la connaissance de conditions initiales (à l’instant t = 0 par exemple)
et de conditions aux limites, aux bords du volume du système (Σ) dans lequel s’ap-
plique l’équation de diffusion.
Il est en général plus important de considérer d’abord l’existence et la nature des
conditions aux limites ; en particulier, la présence de deux conditions aux limites pour
la résolution dans un domaine borné de l’espace mène souvent à l’emploi de séries
de Fourier pour le développement des solutions, tandis que la résolution dans une
région de l’espace non bornée passe parfois par des méthodes de Fourier généralisées,
développant les solutions sous forme d’intégrales (ou transformées) de Fourier.
2 Nature des conditions aux limites : elles dépendent de la nature du milieu qui
entoure la région (Σ) de l’espace où on cherche à résoudre l’équation de diffusion
thermique.
• Lorsque le milieu étudié (Σ) est limité par un conducteur thermique parfait (C), on
impose T (r, t) = T0 (t) en tout point de la surface limite séparant (Σ) et (C) ;
T0 (t) désigne ici la température (uniforme) dans tout le volume du conducteur

parfait (C).
• Si de plus ce conducteur (C) est traité comme un thermostat (parce qu’il est par
exemple de grand volume), alors T0 (t) est aussi une constante au cours du temps.
• Lorsque le milieu étudié (Σ) est limité par une paroi (Π), on connaı̂t parfois le plus
pariétal Φp à travers la paroi (Π), par exemple si Φp peut être déterminé par
l’étude d’un autre mode de transfert thermique. On aura alors une condition
aux limites Zportant sur le flux de jc à travers la surface (Π), ce flux étant égal
à Φp , selon jc · ndS = Φp .
(S)
L’étude détaillée des transferts thermiques pariétaux convecto-conductifs est
proposée plus loin.
• Si le milieu (Σ) est limité par un isolant supposé parfait, le flux de jc doit être nul
à travers toute surface entourant (Σ) ou, si on préfère, la composante normale
jc · n doit être nulle en tout point de la surface extérieure de (Σ).
2 Méthodes d’intégration des équations de la diffusion : la résolution d’une équation

∂f
de diffusion = D∆f peut toujours se faire en recherche de solutions séparées, ce
∂t
qui revient à rechercher des solutions de la forme :
f (r, t) = f0 + R(r)Θ(t) (14.4)
1 dΘ 1
où les fonctions R et Θ vérifient alors nécessairement =D ∆ R(r). Les
Θ(t) dt R(r)
deux membres de cette égalité ne dépendent ni du temps (comme le montre la seconde
expression) ni de l’espace (comme le montre la première) ; il s’agit donc d’une vraie
constante, que nous noterons −1/τ :
• pour respecter sa dimension physique : τ est une durée, comme le montre l’équation
1 dΘ 1
différentielle =− ;
Θ(t) dt τ
• τ est vraisemblablement toujours négatif, puisque sinon la solution de cette même
équation différentielle serait une exponentielle réelle divergente pour t → ∞,
physiquement inacceptable.
dΘ Θ
Les équations vérifiées par Θ(t) et R(r) deviennent alors respectivement = − et
dt τ
τ
∆ R = − R. La forme de la solution R(r) dépend du système de coordonnées choisi et
D µ ¶
t
des conditions aux limites, mais la forme générale de la solution Θ(t) = Θ0 exp −
τ
montre qu’une telle méthode de résolution mène à l’étude de régimes transitoires
thermiques ; la forme la plus générale de la solution est a X priori une combinaison
linéaire de divers régimes transitoires, sous la forme f (r, t) = Rτ (r) exp (−t/τ ), où
τ
Rτ est solution de l’équation aux valeurs propres de Laplace ∆ Rτ (r) = −τ Rτ (r)/D.
∂f
2 Solutions harmoniques : on peut considérer l’équation de diffusion = D∆ f
∂t
comme une équation d’onde et en rechercher des solutionsn sous la forme d’ondes o
planes progressives et monochromatiques, f (r, t) = f0 + Re f 1 exp [i (ωt − k · r)] ;
on obtient alors l’équation de dispersion iω = −Dk2 qui montre la nature complexe

du vecteur d’onde, et donc la nécessité de l’absorption des ondes en même temps que
leur propagation. On obtient alors k = ku, où u est le vecteur unitaire de la direction
de propagation, donc Re(k) > 0 ce qui impose :
r
1−i ω 1−i
k= √ = (14.5)
2 D δ
On remarque que Im(k) < 0, ce qui traduit une absorption de l’onde ; on peut pour
s’en convaincre rappeler
n la forme explicite de f (r, t), par exemple
o avec u = ex , se-
lon f (r, t) = f0 + Re f 1 exp [i (ωt − Re(k)x)] × exp (Im(k)x) ; c’est l’exponentielle
³ x´
réelle exp (Im(k)x) = exp − qui rend compte de cette absorption. Celle-ci se fait
δ r
2D
sur une longueur de l’ordre de grandeur de l’épaisseur de peau δ définie par δ = ;
ω
plus les phénomènes thermiques sont rapides et plus ils s’atténuent après une courte
2π
longueur. Ainsi, un phénomène diurne, avec ω = dans un milieu ordinaire, avec
1 jour
−5 2 −1
Dth ∼ 10 m · s s’atténue sur une longueur δ ∼ 1 m. C’est par exemple pour cette
raison qu’une bonne cave (pour la conservation des boissons par exemple) doit être
enterrée à quelques mètres de profondeur seulement, pour assurer une atténuation
satisfaisante de l’amplitude des oscillations thermiques de surface.
2 Solutions remarquables : on rencontre souvent dans l’étude des phénomènes de
diffusion des répartitions de grandeurs physiques (température,
√courants thermiques,
etc.) fonctions de la variable réduite (sans dimension) u = x/2 Dt ; en particulier, la
fonction gaussienne et la fonction d’erreur :
u
1 2
Z
G(x, t) = √ exp −u2 et erf(u) = √ exp −v 2 dv
¡ ¢ ¡ ¢
(14.6)
t π 0
sont souvent utilisées pour l’étude de problèmes de diffusion, puisqu’on vérifie immé-
diatement que ces fonctions sont toutes deux solution de l’équation de diffusion à une
∂f ∂2f
dimension d’espace, = D 2 . La figure 14.2 représente le comportement de ces
∂t ∂x
fonctions paires de x pour des valeurs consécutives de t.
Le tracé de la gaussienne G(x) représente bien les évolutions des écarts de température
dans une barre, initialement chauffée en son centre, en fonction de la distance x
à ce centre : la température s’homogénéise progressivement, le pic de température
s’aplatissant progressivement tout en ralentissant régulièrement
√ sa diffusion puisque
sa largeur à mi-hauteur progresse seulement comme t.
Le tracé de la fonction d’erreur représente aussi assez bien une évolution vers l’équi-
libre thermique d’un milieu unidimensionnel, initialement à une température élevée,
si on impose brutalement et durablement une température plus faible à son extrémité
x = 0. Là aussi, on voit une évolution progressive qui va en ralentissant, le point√ où
la température est la moyenne des valeurs extrêmes ne progressant que comme t.
√
Dans les deux cas, on retrouve l’évolution caractéristique D ∼ ℓ2 /τ ou ℓ ∼ Dτ ,
comme prévu de manière générale par l’équation de diffusion. On pourra une fois
encore faire utilement la comparaison avec la conclusion c ∼ ℓ/τ ou ℓ ∼ cτ qu’on
obtiendrait pour des ondes de célérité c, solutions de l’équation de d’Alembert.
√
G(x, t) erf(u) = erf(x/2 Dt)
√ b
1/ t 1
t
t t′ > t
√ b b b
1/2 t 0, 5
t′ > t t′′ > t′
t′′ > t′
b
x b
x
√ √
2 ln 2 Dt 0, 95 Dt
Figure 14.2 – Fonction gaussienne et fonction d’erreur
14.1.4 Entropie et diffusion thermique

2 Application qualitative du second principe : le caractère irréversible des transferts
thermiques dans les phénomènes conductifs est du à l’existence de différence des tem-
pératures de divers points d’un système physique. cette irréversibilité impose certaines
conditions aux solutions de l’équation de diffusion thermique :
• Les phénomènes de diffusion thermique s’atténuent au cours du temps et tendent en
général vers un état d’équilibre thermique ; ce sont des phénomènes transitoires.
• Les phénomènes de transfert thermique ralentissent progressivement au fur et à
mesure que les gradients thermiques s’atténuent, donc au fur et à mesure que
l’on s’approche de l’équilibre.
2 Application quantitative du second principe : on peut vérifier le caractère irrévesible

des transferts thermiques conductifs en effectuant un bilan de création d’entropie pour
un système thermodynamique (Σ), de surface extérieure (S), soumis en volume aux
seuls transferts donnés par la loi de Fourier.
Nous envisageons pour ce système une transformation localement réversible, puisque
les différences de température T (M ) − T (M ′ ) → 0 lorsque M M ′ → 0 : c’est la
définition même du caractère continu des solutions T (r, t) recherchées. On peut alors
∂T
écrire, pour un volume élémentaire dτ dans le matériau, δ 2 Q = dU = ρc dτ dt donc
∂t
2
δ Q ρc ∂T div jc
d2 S = qui s’écrit aussi d2 S = dτ dt = − dτ dt.
T T ∂t T
Pour le systèmeZ (Σ) en entier, la variation d’entropie au cours d’une durée dt vérifie
dS div jc
donc =− dτ ; cette variation doit être la somme des entropies créée et
dt (Σ) T
dS δScréé δStransféré
échangée par unité de temps, = + , où on vérifiera le caractère
dt dt dt
irréversible de la transformation en calculant le terme transféré pour en déduire le
δScréé
caractère strictement positif de l’entropie créée par unité de temps .
dt
L’entropie transféré correspond à l’ensemble des transferts thermiques pariétaux, sur
la surface (A) qui limite le système thermodynamique (Σ). Ainsi, un élément d’aire
dA correspond à un transfert thermique δQ = −jc ·ndA dt, la normale n étant orientée
vers l’extérieur de (Σ) et δQ compté positivement s’il est reçu par (Σ). En ce point
de la surface, la température deIla source qui fournit ce transfert est notée T et on

δStransféré jc · n
peut donc écrire =− dA.
dt (A) T
µ ¶
δStransféré
Z
jc
Par application du théorème d’Ostrogradski, = − div dτ ; la
dt (Σ) T
dS
comparaison avec la variation d’entropie du système montre que l’entropie créée
dt Z · µ ¶ ¸
δScréé dS δStransféré jc div jc
par unité de temps est = − = div − dτ .
dt dt dt (Σ) T T
Tenant compte des formules de dérivation vectorielles div (f w) = f div w + grad f · w

1 grad f δScréé jc · grad T
Z
et grad = − , il vient =− dτ qu’on écrira encore, du
f f2 dt (Σ) T2
µ ¶2
δScréé grad T
Z
fait de la loi de Fourier, = λ dτ > 0 : les transferts thermiques
dt (Σ) T
par conduction sont toujours irréversibles, le seul cas d’annulation de l’entropie créée
correspondant à la fin de la transformation, lorsque T est uniforme en tout point du
milieu conducteur (ou bien au cas où λ = 0).
Irréversibilité et déséquilibre thermique

X Toute inhomogénéité de température entraı̂ne une irréversibilité des
transferts thermiques, sauf de part et d’autre d’un isolant thermique
parfait.
14.2 Régimes permanents thermiques
14.2.1 Conduction thermique en régime permanent
2 Équation de Laplace : en régime permanent, l’équation de diffusion thermique

prend alors la forme de l’équation de Laplace ∆ T = 0 ; la résolution ce cette équation
aux dérivées partielles se fait en général en deux temps :
• la géométrie du système impose le choix des coordonnées (cartésiennes, cylindriques
ou sphériques) adaptées à la géométrie du système thermodynamique ;
• la solution de l’équation de Laplace T (r) ainsi écrite ne dépend en général alors
plus que des conditions aux limites de ce système : valeurs de T ou de grad T
(donc de jc ) sur la surface limitant le volume étudié.
T2
jc
T 1 > T2
Figure 14.3 – Tube de champ du courant thermique

Nous étudierons dans la suite la géométrie résistive décrite sur la figure 14.3, le système
(Σ) étant délimité par deux zones parfaitement conductrices de températures fixées
T1 et T2 , et par les limites d’un tube de champ formé par les lignes de champ du
vecteur jc (on parle de lignes de courant thermique).
On peut aussi utiliser un milieu conducteur limité latéralement par un isolant ; les
lignes de courant de jc sont alors tangentielles à ces limites, par définition même d’un
isolant thermique.
On se rappellera que les lignes iso-T sont perpendiculaires aux lignes de champ
de grad T , donc de jc ; en effet, une variation de température est donnée par
dT = grad T · dr ; une ligne iso-T correspond donc à dT = 0 donc à un dé-
placement dr orthogonal à grad T . En représentant des schémas analogues à celui
de la figure 14.3, on prendra donc soin de représenter des lignes de courant thermique
perpendiculaires aux surfaces isothermes !
L’équation de diffusion thermique étant supposée résolue, on peut en déduire la fonc-
tion T (r) ainsi que ses dérivées, et en particulier jc = −λgrad T , dont les interpréta-
tions sont deux grandeurs intégrales, définies sur la figure 14.4.
Z M2
• L’intégrale ℑ(C) = grad T · dr, menée sur n’importe quelle courbe (C) joignant
M1
les surfaces (S1 ) et (S2 ) des deux conducteurs thermiques parfaits, a pour valeur
ℑ(C) = T2 − T1 .
Par définition même du gradient, cette intégrale est indépendante du choix de
la courbe (C).
Z
• L’intégrale ℑ(S) = grad T · nds, menée sur n’importe quelle surface (S) cou-
(S)
pant le tube de champ (les
Z surfaces (S1 ) et (S2 ) conviennent d’ailleurs) a pour
interprétation −λℑ(S) = jc · ndS = Φc , qui est le flux thermique à travers
(S)
la surface (S).
Notons toutefois que cette interprétation ne subsiste que si λ est uniforme dans
(Σ) ; si ce n’est pas le cas, on peut bien sûr toujours étudier Φc , qui n’est plus
forcément proportionnel à ℑ(S) .
Puisqu’en régime permanent div jc = 0, le vecteur jc est à flux conservatif, c’est-
à-dire que le flux thermique sortant d’une surface fermée est nulle ; on en déduit
immédiatement que Φc et ℑ(S) ne dépendent pas du choix de la surface (S).
T2
b surface (S2 )
(C) M2
bM milieu (Σ)
(S)
M1
b
surface (S1 )
T1
Figure 14.4 – Géométrie d’une résistance thermique
Le signe de Φc dépendant de l’orientation de la normale n, nous choisirons dans la

suite par convention cette normale dans le sens effectif du transfert thermique attendu,
c’est-à-dire dans le sens du vecteur jc ; par exemple, dans le cas de la figure 14.4, le
vecteur jc est orienté de (S1 ) vers (S2 ) car on a supposé T1 > T2 .
2 Conductance thermique : de façon évidente, l’ajout d’une constante quelconque
à T ne change ni son caractère de solution de l’équation de Laplace ∆ T = 0, ni les
intégrales ℑ(S) et ℑ(C) qui ne dépendent que de grad T ; ces intégrales ne dépendent
donc pas de T1 et de T2 , mais seulement de T1 − T2 .
En fait, ces deux intégrales dépendent linéairement de la différence T1 − T2 puisque
les équations ∆ T = 0 et jc = −λgrad T sont linéaires ; le rapport de ces deux
intégrales ne dépend donc pas de T1 − T2 . Il ne dépend que de la géométrie du milieu
matériel (Σ) et de sa conductivité thermique λ. Ce rapport, défini pour être positif
par construction, vaut :
Z
jc · ndS
Φc (S)
Gth = =Z (14.7)
T1 − T2
grad T · dr
(C)
Si de plus λ est une constante, on peut aussi écrire Gth = λℑ(S) /ℑ(C) et la conductance
thermique est le produit de la conductivité thermique par une grandeur de nature géo-
métrique, qui est le quotient d’une surface (orthogonale aux transferts thermiques) par
une longueur (mesurée parallèlement à ceux-ci) ; on se souviendra donc de l’expression
approchée générale :
S⊥
Gth ∼ λ >0 (14.8)
ℓk
1 1 ℓk
On définit aussi la résistance thermique Rth = ∼ . L’unité de mesure
Gth λ S⊥
des conductances thermiques est le watt par kelvin, et l’ordre de grandeur de ces
conductances dépend du matériau choisi et de sa géométrie.
Prenons d’abord un exemple dans le domaine du bâtiment ; la conductivité thermique
du béton est λ = 1, 3 W · m−1 · K−1 et un mur de béton de 10 cm d’épaisseur et de
20 m2 de surface a une conductance thermique Gth = 260 W · K−1 ; ceci signifie qu’un
écart thermique de 10 ◦ C de part et d’autre d’un tel mur impose un flux thermique
(pertes thermiques) égal à Φc = 2, 6 kW ! Cette valeur très élevée explique l’emploi
de matériaux isolants (matériaux expansés ou laines, ou encore circulation d’air dans
les murs de béton) dans la construction. Pour mieux visualiser l’importance d’une
telle fuite de 2, 6 kW, en termes de dépenses de chauffage. Elle représente près du
tiers de la puissance maximale disponible dans un abonnement électrique domestique
habituel, seulement pour compenser une fuite thermique sur un seul mur de 20 m2 .
Le cas de la laine de verre est justement intéressant, avec λ = 0, 045 W · m−1 · K−1 ,
la même épaisseur et la même surface mènent à Gth = 9, 0 W · K−1 et Φc = 90 W
pour le même écart de température. Si on comprend l’intérêt pratique de l’isolation
thermique, il reste à savoir commet associer les deux conductances calculées ici, en
développant les règles d’association en série et en parallèle.
2 Analogies électriques : les relations (14.7) et (14.8) suggèrent l’analogie avec les
conductances et résistances électriques, que l’on peut définir avec la même géométrie
que celle de la figure 14.4 par la relation :
Z
j · ndS
I (S) S⊥
G= =Z ∼γ >0 (14.9)
V1 − V2 ℓk
grad V · dr
(C)
où on peut suivre les règles de substitution du tableau 14.2 pour l’analogie entre
phénomènes électrocinétiques et thermiques.
Grandeur thermique Grandeur électrocinétique

Température T Potentiel V
Flux thermique Φc Courant électrique I
Conductance thermique Gth Conductance électrique G
Résistance thermique Rth Résistance électrique R
Conductivité thermique λ Conductivité électrique γ
Densité de courant thermique jc Densité de courant électrique j
Loi de Fourier, jc = −λgrad T Loi d’Ohm, j = γE = −γgrad T
Table 14.2 – Analogies entre conduction thermique et électrique
Gth G
En particulier, pour une même géométrie, on trouvera = . Nous verrons ulté-
λ γ
rieurement que la même analogie s’applique aussi aux calculs des capacités de conden-
Q
sateurs ; la définition C = de ces capacités montrera qu’elles sont l’analogue
V1 − V2
des conductances électriques et thermiques, et qu’on pourra étendre le résultat ci-
dessus sous la forme générale :
Gth G C
= = (14.10)
λ γ ε
où la permittivité diélectrique ε de l’isolant constituant l’espace de séparation des

deux armatures du condensateur sera, comme on le verra, de l’ordre de grandeur de
la constante ε0 , atteinte seulement dans le cas du vide.
Signalons ici une autre analogie possible entre phénomènes électriques et transferts
thermiques : la relation dU = CdT définit une capacité thermique C, qui décrit l’accu-
mulation d’énergie interne d’un système thermodynamique lors d’une augmentation
de température. De façon qualitativement semblable, la relation dq = CdU définit
un capacité de condensateur C, qui décrit l’accumulation de charges électriques d’un
système électrostatique lors d’une augmentation de la tension à ses bornes.
Enfin, quand le même flux thermique traverse deux isolants, ils sont dits placés en
série ; la chute de température aux bornes de l’ensemble est la somme des deux chutes
de température successives et on applique la règle d’addition des résistances, donc
1 1 1
= + ; la conductance thermique est donc moindre que la plus
Gth,série Gth,1 Gth,2
faible des deux conductances mises en série, comme dans le cas de l’isolation évoquée
plus haut d’un mur de béton par une couche de laine de verre.
De même, quand deux matériaux sont soumis à la même différence de température,
ils sont dits placés en parallèle ; le flux thermique à travers l’ensemble est la somme
des deux flux thermiques et on applique la règle d’addition des conductances, donc
Gth,parallèle = Gth,1 + Gth,2 ; la conductance thermique est donc plus élevée que la plus
élevée des deux conductances mises en parallèle.
Conductances et capacités
X Les règles d’addition des conductances, conductances thermiques et ca-
pacités sont les mêmes. Dans le cas d’une association en série, on fait la
somme des termes 1/G, 1/Gth ou 1/C. Dans le cas d’une association en
parallèle, on fait la somme des termes G, Gth ou C.
On reconnaı̂t une association en série car le flux extensif (le courant
électrique ou le flux thermique) est le même dans tous les éléments de
l’association.
On reconnaı̂t une association en parallèle car la contrainte intensive aux
bornes (la différence de potentiel ou la différence de température) est la
même pour tous les éléments de l’association.
2 Méthodes de résolution : la résolution d’un problème de transfert thermique en

régime permanent, c’est-à-dire la résolution de ∆ T = 0, suit les mêmes principes
que la résolution d’un problème d’électrostatique, dont il est l’analogue. On retiendra
deux méthodes, en fonction de la simplicité plus ou moins grande de la géométrie du
problème étudié :
• Si la géométrie est très simple, on peut directement affirmer la direction du vecteur

densité de courant thermique jc par une étude de symétrie et d’invariances.
Z
On détermine alors jc par application de la relation jc · ndS = Φc (comme
(S)
on déterminerait le champ électrique par application du théorème de Gauss).
On en déduit les expressions de grad T puis de T , grâce aux conditions aux
limites (comme on déduirait la répartition du potentiel de la donnée de E).
Le rapport Φc /(T1 − T2 ) ne dépend pas du choix de Φc mais seulement de la
géométrie ; il détermine la conductance thermique du système étudié.
• Si la géométrie ne permet pas une identification immédiate des symétries et in-
variances de jc , on développe l’expression de l’équation aux dérivées partielles
∆ T = 0, en utilisant un système de coordonnées orthogonal adapté au problème
posé.
La résolution de cette équation différentielle a, pour des conditions aux limites
données, une solution unique : c’est le théorème d’unicité.
On déduit de l’expression de T (r) le vecteur jc = −λgrad T puis son flux Φc ;
le quotient Φc /(T1 − T2 ) ne dépend pas du choix de Φc mais seulement de la
géométrie ; il détermine la conductance thermique du système étudié.
14.2.2 Géométrie unidimensionnelle en régime permanent
2 Présentation : trois situations classiques correspondant à des phénomènes unidi-

mensionnels simples méritent d’être retenues ; il s’agit des trois géométries cartésienne,
cylindrique et sphérique. Rappelons les expressions du laplacien dans ces trois sys-
∂2f ∂2f ∂2f 1 ∂2f ∂2f
µ ¶
1 ∂ ∂f
tèmes, ∆ f (x, y, z) = 2
+ 2 + 2 , ∆ f (r, θ, z) = r + 2 2 + 2
∂x ∂y ∂z ¶r ∂r ∂r r ∂θ ∂z
∂2f
µ ¶ µ
1 ∂ 2 ∂f 1 ∂ ∂f 1
et ∆ f (r, θ, ϕ) = 2 r + 2 sin θ + 2 2 .
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
d2 T
2 Problème unidimensionnel cartésien : ici, T = T (x) donc ∆ T = = 0 donc
dx2
dT
T (x) est une fonction affine de x, T (x) = T (0) + αx et jc = −λ ex = −λαex soit
dx
jc = −jc ex avec α = jc /λ ; ces résultats sont résumés sur la figure 14.5.
T T (0) + jc L/λ
b
T (0)
b
x
b b
0 L
S jc = −jc ex
Figure 14.5 – Régime permanent unidimensionnel cartésien
En particulier, la conductance thermique d’un barreau de section S et de longueur L

T (L) − T (0)
tel qu’il est représenté sur la figure 14.5 vérifie Φc = −jc S avec jc = λ
L
d’où on déduit immédiatement :
S
Cylindre à conduction axiale : Gth = λ (14.11)
L
2 Problème ¶ cylindrique : il vérifie T = T (r) en coordonnées cylindriques donc

µ radial
1 d dT dT a
∆T = r = 0 ; ainsi, r est une constante et on peut écrire jc = er où
r dr dr dr r
on peut interpréter a en calculant le flux de jc sortant d’un cylindre de rayon r et de
ϕc dT
hauteur h, soit Φc = 2πha ; on notera donc plutôt jc = er = −λ er où ϕc est
2πr dr
ϕc r
un flux thermique par unité de longueur. On en déduit T (r) = T (r0 ) − ln .
2πλ r0
z jc
r1 r0 jc ∝
1/r
b b
r
r0 r1
jc jc T
T∝
h ln r
+ ct
e
b b
r
r0 r1
Figure 14.6 – Régime permanent unidimensionnel cylindrique
La géométrie correspondante est rappelée sur la figure 14.6 ; on y constate une dilution
géométrique du courant thermique jc dont l’intensité décroı̂t quand r augmente, de
façon à préserver le flux thermique par unité de hauteur ϕc à travers des cylindres de
rayon de plus en plus grands.
En particulier, la conductance thermique d’un manchon cylindrique de rayons inté-
rieur r0 et extérieur r1 sur une hauteur h tel qu’il est représenté sur la figure 14.6 vérifie
ϕc r1
Φc = hϕc avec aussi T1 − T2 = ln ; on en déduit l’expression de la conduc-
2πλ r0
2πh
tance thermique de ce manchon cylindrique, Gth = λ ; on vérifie d’ailleurs
ln r1 /r0
la forme générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 sont voisins, puisque
r1 − r0
alors ln r1 /r0 ≃ , la section ouverte au passage du flux thermique est bien
r0
S⊥ ≃ 2πhr0 et la longueur le long de laquelle ce flux se répartit est ℓk = r1 − r0 . On
retiendra au moins :
2πh
Manchon cylindrique à conduction radiale : Gth = λ r1 (14.12)
ln
r0
2 Problèmeµ radial ¶sphérique : il vérifie T = T (r) en coordonnées sphériques donc

1 d dT dT a
∆T = 2 r2 = 0 ; ainsi, r2 est une constante et on peut écrire jc = 2 er
r dr dr dr r
où on peut interpréter a en calculant le flux de jc sortant d’une sphère de rayon r et
Φc dT
de hauteur h, soit Φc = 4πa ; on notera donc plutôt jc = er = −λ er . On en
µ ¶ 4πr2 dr
Φc 1 1
déduit T (r) = T (r0 ) + − .
4πλ r r0
jc
r0
jc ∝
1/r 2
jc jc
b b
r
b
r0 r1
T
T∝
1/r
jc + cte
jc
r
b b
r1 r0 r1
Figure 14.7 – Régime permanent unidimensionnel sphérique
La géométrie correspondante est rappelée sur la figure 14.7 ; on y retrouve une dilution
géométrique de l’intensité du vecteur jc au fur et à mesure que le flux thermique se
répartit sur des sphères de rayon croissant, tout comme on avait observé une dilution
de l’amplitude d’une onde sphérique au fur et à mesure qu’elle se propage loin de
sa source : il s’agit dans les deux cas d’assurer la répartition de la même quantité
d’énergie, en l’absence de pertes, cette énergie se répartissant sur une surface de plus
en plus grande.
En particulier, la conductance thermiqueµd’une coquille
¶ sphérique de rayons intérieur
Φc 1 1
r0 et extérieur r1 vérifie T1 − T2 = − ; on en déduit l’expression de la
4πλ r0 r1
4πr0 r1
conductance thermique de ce système, Gth = λ ; on vérifie d’ailleurs la forme
r1 − r0
générale λS⊥ /ℓk , au moins dans le cas où r1 et r0 dont voisins, puisque la section
ouverte au passage du flux thermique est alors S⊥ ≃ 4πr02 ≃ 4πr12 et la longueur le
long de laquelle ce flux se répartit est ℓk = r1 − r0 . On retiendra au moins :
4πr0 r1
Coquille sphérique à conduction radiale : Gth = λ (14.13)
r1 − r0
2 Généralisation : lors de la résolution d’une équation de Laplace ∆ f (r) = 0,

certaines solutions particulières méritent d’être mémorisées. On les retrouvera dans
d’autres domaines de la Physique ; elles sont résumées dans le tableau 14.3.
Géométrie Scalaire f (r) Gradient w = grad f (r)

(solution de ∆ f = 0) (solution de div w = 0)
Cartésien f = f (x) f (x) = ax + b w = aex
b
Radial cylindrique f = f (r) f (r) = a + b ln r w = er
r
b b
Radial sphérique f = f (r) f (r) = a − w = 2 er
r r
Table 14.3 – Solutions classiques de l’équation de Laplace
On peut retrouver ces résultats rapidement en mémorisant la nature de la surface à

travers laquelle le flux est déterminé, comme l’indique le tableau 14.4.
Surface Flux Φ de w Vecteur w

(à flux conservatif)
Φ
plane, aire S Φ=S×w w = wex ; w = = Cte
S
Φ 1
cylindrique, aire 2πrh Φ = 2πrhw(r) w = w(r)er ; w(r) = ∝
2πhr r
Φ 1
sphérique, aire 4πr2 Φ = 4πr2 w(r) w = w(r)er ; w(r) = ∝
4πr2 r2
Table 14.4 – Vecteurs classiques à flux conservatifs
14.2.3 Régime permanent convecto-conductif
2 Étude d’une ailette de refroidissement : considérons un solide supposé unifor-

mément à la température T1 , entièrement plongé dans un fluide à la température
uniforme T0 < T1 (sauf dans la couche limite au voisinage immédiat du solide). Cette
différence de température correspond à un transfert thermique constant de puissance
δQ
Ptherm = < 0 reçu par le solide. Ce refroidissement est supposé assuré exclusi-
dt
vement par un certain nombre N d’ailettes de refroidissement, la géométrie de l’une
d’elles étant précisée sur la figure 14.8.
Cette ailette, de longueur totale ℓ, est supposée avoir une section s assez faible pour
qu’on puisse considérer la température T dans toute section droite comme uniforme ;
ainsi, en régime permanent, la température T ne dépend que de x. On peut alors déter-
miner cette température en faisant un bilan thermique pour la longueur dx d’ailette,
selon s (jc (x) − jc (x + dx)) + jp (x)pdx = 0, où on a noté p le périmètre de l’ailette.
T1
Fluide, T0
O b b b b
x x + dx ℓ x
Figure 14.8 – Ailette de refroidissement
Dans le cas d’une ailette à section rectangulaire de côtés a et b, s = ab et p = 2(a + b) ;

ab
le rapport s/p est une longueur d⊥ qui vaut alors d⊥ = , en particulier pour
2(a + b)
une section carrée, d⊥ = a/4 est une dimension caractéristique transverse de l’ailette,
ce qui justifie sa dénomination. Finalement, il vient :
djc d2 T
−d⊥ = d⊥ λ 2 = h (T (x) − T0 ) (14.14)
dx dx
2 Résolution : la solutionrde l’équation d’ailette (14.14) ne dépend que de la

d⊥ λ
distance caractéristique δ = ; on l’écrit sous la forme générale T (x) = T0 +
³x´ ³x´ h
αch +βsh et les constantes d’intégration α et β peuvent être déterminées par
δ δ
la continuité de température en x = 0, T1 = T0 + α, et par la continuité des flux ther-
miques conductif et pariétal en·x = µ ℓ, qu’on
¶ écrira
µ j¶¸ c (ℓ) = · h(T (ℓ)
µ−¶T0 ) soit,µpuisque
¶¸
dT λ ℓ ℓ ℓ ℓ
jc = −λ , sous la forme − αsh + βch = h αch + βsh .
dx δ δ δ δ δ
r
th(ℓ/δ) − r d⊥ h
On en déduit α = T1 − T0 et β = (T1 − T0 ) où on a posé r = . On
rth(ℓ/δ) − 1 λ
peut donc décrire la répartition de température dans une telle ailette sous la forme
T (x) − T0 ³x´ th(ℓ/δ) − r ³x´
= ch + sh ; si l’ailette est longue (ℓ ≫ δ, on peut
T1 − T0 δ rth(ℓ/δ) − 1 δ
T (x) − T0 ³ x´
d’ailleurs remarquer que cette expressions s’écrit encore ≃ exp − .
T1 − T0 δ
dT
Le flux thermique conductif dans l’ailette est donné par jc (x) = −λ ; le flux total
¯ dx
dT ¯
¯
évacué par l’ailette peut donc se calculer par Φc = −λs ou encore, après
dx ¯ x=0
calculs, Φcr
= sheq (T1 −T0 ), où on a défini un coefficient de transfert pariétal équivalent
hλ r − th(ℓ/δ)
par heq = .
d⊥ rth(ℓ/δ) − 1
Φc
On peut aussi définir une conductance thermique de fuite par Gth = donc
T1 − T0
ici Gth = sheq ; ce résultat est d’ailleurs général, les transferts thermiques pariétaux
ayant pour analogue électrique les conductances décrivant les fuites de courant, par
exemple vers la masse.
Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
En présence seulement des phénomènes conductifs et de création locale, on doit
∂T
savoir et savoir retrouver par un bilan local la relation div jc + ρc = plocal ,
∂t
qui exprime localement la non-conservation de l’énergie thermique.
Du fait de la loi de Fourier, l’équation locale de bilan thermique devient alors
∂T plocal
l’équation de diffusion = Dth ∆ T + , où la diffusivité thermique Dth
∂t ρc
se mesure en m2 · s−1 .
En régime permanent, on définit la conductance thermique d’un milieu conduc-
Φc
teur par Gth = . On l’obtient en résolvant l’équation de Laplace
T2 − T1
∆ T = 0 dans le volume du milieu conducteur. Il y a analogie avec les conduc-
Gth G S⊥
tances électriques, = . En général, Gth ∼ λ > 0.
λ γ ℓk
Les solutions de l’équation de Laplace ∆ T = 0 en géométrie unidimensionnelle
sont des fonctions : affines T ∼ ax+b en coordonnées cartésiennes, T ∼ a+b ln r
en coordonnées cylindriques et T ∼ a − b/r en coordonnées sphériques.
Que la température soit une fonction continue ou non des coordonnées d’espace,
il suffit qu’elle ne soit pas uniforme pour que les phénomènes de conduction
thermique aient un caractère irréversible.
Le transfert thermique pariétal reçu par le système (Σ) en cas de discontinuité
δQ→Σ
de température sur sa surface frontière (S) est donné par = −Φp avec
I dt
Φp = jp dS, la densité volumique de flux pariétal étant donnée par la loi
(S)
de Newton jp = h(TΣ − Text ).
Le flux thermique pariétal permet d’établir une condition aux limites pour la
résolution de l’équation de diffusion thermique, sous la forme jc · n = jp en tout
point de la surface (S) extérieure au système (Σ), jp étant comme n compté
positivement vers l’extérieur de (Σ).
La résolution de l’équation de diffusion thermique en régime variable peut se
résoudre en notation complexe si on recherche des régimes harmoniques ; l’équa-
tion de dispersion est alors celle d’une onde évanescente, caractérisée par un
effet de peau.
On peut aussi rechercher des régimes transitoires, par séparation des variables
sous la forme T (r, t) = T0 + R(r)Θ(t) ; on choisira pour T0 la valeur attendue
en régime permanent. On procède ensuite en explicitant d’abord les conditions
aux limites puis ensuite les conditions initiales.
√
On peut enfin rechercher des fonctions de la variable réduite u = x/2 Dth t,
sous réserve que l’énoncé de la question posée suggère cette méthode.
Chapitre 15
Le rayonnement thermique
15.1 Rayonnement électromagnétique et bilans thermiques
15.1.1 Propriétés du rayonnement électromagnétique

Nous établirons, dans le cadre du cours d’électromagnétisme, certaines propriétés des
ondes électromagnétiques dans le vide et les milieux transparents, que nous affirmerons
seulement ici.
2 Le rayonnement électromagnétique : il consiste en la propagation simultanée d’un
champ électrique E (r, t) et d’un champ magnétique B (r, t). Dans un milieu isotrope
n
d’indice n, on montre la relation de structure B (r, t) = u∧E (r, t) si u est le vecteur
c0
unitaire de la direction de propagation, avec la géométrie des champs B (r, t) · u = 0
et E (r, t) · u = 0, conformément à la figure 15.1, où u = ex .
z
y
B(t′ )
t′ > t
E(t′ )
E(t) E∧B
x
B(t)
Figure 15.1 – Onde électromagnétique
c0 1
Ces deux champs se propagent ensemble à la vitesse de phase vϕ = , où c0 = √
n ε0 µ0
est la célérité de la lumière dans le vide, c0 ≃ 3, 00 × 108 m · s−1 .
2 Milieux, indices, longueurs d’onde : nous ne considérons que les milieux matériels
transparents. Ceci peut n’être vérifié que dans un certain domaine de fréquence, hors
de ce qu’on appelle les bandes ou zones d’absorption ; on peut alors, dans le cadre de
certains modèles, montrer que n > 1 pour les milieux moléculaires non absorbants.
L’indice optique n dépend (c’est le phénomène de dispersion) de la fréquence ν ou de la
pulsation ω = 2πν du champ ; on préfère souvent en pratique décrire ces oscillations au
c0 2π
moyen de la longueur d’onde dans le vide du rayonnement, définie par λ0 = = ,
ν k
si k = ku est le vecteur d’onde. Un abus de langage courant consiste à parler souvent
de longueur d’onde du rayonnement, alors que la (( vraie )) longueur d’onde de l’onde
électromagnétique dépend bien sûr de l’indice optique n.
Les ondes électromagnétiques sont réparties en divers domaines, selon la valeur de
cette longueur d’onde λ0 ; cette répartition est rappelée dans le tableau 15.2.
8 × 10−7
4 × 10−7
λ0 (m)
10−18
b
10−13
b
10−8
b b b
10−3
b
10−1
b
cosmiques
Rayons X
Rayons γ
Rayons
Ondes
Micro
ondes
radio
U.V.
Lumière
I.R.
visible
b b b b b b b
3 × 1021 3 × 1019 3 × 1016 3 × 1011 3 × 109
8 × 1014
4 × 1014
ν (Hz)
Figure 15.2 – Spectre des ondes électromagnétiques
Nous poursuivrons la description des ondes électromagnétiques dans le vide : dans

tout ce qui suit, nous supposerons n = 1.
2 Vecteur de Poynting : en tout point de l’espace où parvient une onde électroma-
gnétique, on montrera qu’elle transporte une puissance électromagnétique qui se met
sous forme d’une intégrale de flux, étendue à la surface (S) qui reçoit cette puissance :
Z
E (r, t) ∧ B (r, t)
Pém (t) = R (r, t) · ndS avec R (r, t) = (15.1)
(S) µ0
La grandeur R (r, t), qui porte le nom de vecteur de Poynting, est donc une densité
volumique de flux d’énergie, complètement analogue au vecteur jc pour le transport
d’énergie par conduction. On peut d’ailleurs rappeler l’étude dimensionnelle qui avait
déjà
I été proposée à propos de cette grandeur, en notant que le théorème d’Ampère
R UI
B · dr = µ0 I et la relation E · dr montrent que R à la dimension de 2 si ℓ est
ℓ
une longueur ; le vecteur de Poynting se mesure bien, comme jc , en watt par mètre
carré.
L’analogie avec les vecteurs densités de courant se poursuit puisqu’on montrera aussi,
pour une onde de direction de propagation u, la relation entre vecteur de Poynting et
densité volumique d’énergie électromagnétique wém (r, t) :
15 : Le rayonnement thermique 319
ε0 E2 B2
R (r, t) = c0 wém (r, t) u avec wém (r, t) = + (15.2)
2 2µ0
où la vitesse de transport de l’énergie est donc ici égale à vg = c0 u. Là aussi, on peut
brièvement évoquer l’analyse dimensionnelle
I des deux termes formant la Z somme wém ,
Q
en notant que le théorème d’Ampère E · ndS = et la relation E · dr = U
ε0
2
ε0 E QU
imposent pour l’unité de où ℓ est une longueur et S une surface ; on vérifie
2 Sℓ
immédiatement qu’il s’agit bien s’une énergie volumique.
Signalons dès à présent que, si on emploie une notation complexe pour l’étude
du champ électromagnétique associé à une onde, on doit se garder de l’appli-
quer aux grandeurs énergétiques (quadratiques) R (r, t) et wém (r, t); seul le calcul

E ∧ B∗
des valeurs moyennes reste possible, selon les relations hRi = Re et
ε E ∧ E∗ B ∧ B∗ 2µ0
0
hwém i = Re + . Tout autre calcul, en particulier de gran-
4 4µ0
deurs instantanées, doit être conduit en revenant au préalable aux grandeurs réelles.
15.1.2 Courant thermique radiatif

2 Définitions : la détermination de la puissance totale rayonnée, en moyenne tem-
porelle, à travers une surface (S) amène à sommer les contributions des différentes
directions et fréquences des rayonnements
Z qui se superposent au voisinage de cette
surface. On l’écrira hPém i = hR (r, t)i · ndS où le vecteur R lui-même est une
(S)
somme, portant sur l’ensemble des directions de propagation traversant (S).
Cette somme de flux de vecteurs de Poynting
Z est une puissance qu’on peut écrire sous
forme d’une intégrale de surface, hPém i = jr dS ; dans le cas d’une surface fermée
(S)
(S) entourant un système thermodynamique (Σ), cette puissance électromagnétique
fait partie du bilan énergétique, et on écrira :
I
δQ→Σ
= −Φr Φr = jr dS (15.3)
dt (S)
Notons ici que jr est algébrique ; on le compte positivement pour un courant énergé-
tique radiatif sortant de la surface fermée (S) qui limite le système thermodynamique
(Σ). C’est donc l’emploi des conventions thermodynamiques pour δQ qui explique
le signe − dans la relation ci-dessus.
Dans l’expression (15.3), on remarque que la densité volumique de courant thermique

radiatif jr n’est plus définie de façon vectorielle, puisqu’il s’agit en général d’une
somme sur plusieurs directions. C’est ce terme jr , analogue des grandeurs jc = jc · n
et jp définies plus haut lors des études de la conduction et des transferts pariétaux,
que nous étudierons dans ce qui suit.
Le rayonnement thermique déterminé par (15.3) est, par ailleurs, réparti a priori sur
l’ensemble du spectre des longueurs d’onde ; nous étudierons plus loin la répartition
spectrale de ce rayonnement..
2 Bilans énergétiques et rayonnement : les milieux transparents étudiés, siège de

la propagation des ondes électromagnétiques, seront limités par des corps solides ou
liquides considérés comme des matériaux opaques, sur la surface desquels la totalité du
rayonnement électromagnétique incident est soit réfléchi, soit absorbé. Ajoutant aux
flux réfléchi et absorbé un flux éventuellement émis (si le corps étudié est lui-même
un émetteur de rayonnement), on pourra faire un bilan thermique pour le système
(Σ) de surface extérieure (S) en écrivant la puissance thermique totale I reçue par (Σ),
δQ→Σ
par rayonnement et par transfert pariétal, sous la forme =− (jr + jp ) dS.
dt (S)
Le rayonnement joue ainsi dans certains cas le même rôle que les transferts pariétaux
dans l’étude des transferts thermiques : il sert à établir les conditions aux limites
sur la surface (S) qui limite le corps étudié, en termes de continuité des courants
thermiques.
15.1.3 Flux radiatifs hémisphériques

2 Flux incident, flux émergent : on peut, dans le calcul de la densité de courant
thermique radiatif au voisinage de la surface extérieure (S) d’un système thermo-
dynamique (Σ), distinguer les flux énergétiques incident et émergent ; il s’agit dans
chaque cas de distinguer parmi les composantes du champ électromagnétique celles
qui se dirigent vers (Σ), avec R · n < 0, et celles qui partent de (Σ), avec R · n > 0.
Comme la convention usuelle d’orientation des courants thermiques est la direction
de l’extérieur de (Σ), on notera :
jr = ϕ↑ − ϕ↓ (15.4)
|{z} |{z}
émergent de (S) incident sur (S)
Notons que, par hypothèse, ϕ↑ > 0 et ϕ↓ > 0 ; le signe de jr dépend du bilan thermique
local. On remarquera la notation ϕ, associée à la dénomination courant hémisphérique
pour ces grandeurs qui ne concernent que la somme des puissances transportées par le
rayonnement électromagnétique dans un seul sens, au contraire du courant thermique
total jr .
2 Absorption, réflexion : à l’abord de la surface extérieure (S) du système opaque
(Σ), le flux énergétique incident est soit réfléchi, soit absorbé : ϕ↓ = ϕréfl. + ϕabs. .
Le phénomène microscopique responsable de l’absorption du rayonnement électroma-
gnétique est l’excitation des modes de vibration des atomes du système (Σ), sous
l’effet du champ électromagnétique incident. C’est d’ailleurs ce couplage entre ondes
électromagnétiques et agitation thermique qui permet d’inclure le flux radiatif dans
les flux thermiques, à côté des flux conductif et pariétal.
La réflexion totale que l’on rencontre en Optique dans l’étude des miroirs représente
un cas exceptionnel ; plus généralement, la réflexion ne suit les lois de Snell-Descartes
que pour les matériaux à état de surface idéalement régulier. Nous étudierons donc
dans ce qui suit que les relations entre flux hémisphériques, sans nous préoccuper de
la direction de propagation de ces flux.
2 Émission : en plus des phénomènes de réflexion et d’absorption, que l’on rencontre
ordinairement en Optique par exemple, la surface d’un corps opaque peut aussi émettre
du rayonnement électromagnétique, en particulier en liaison avec la température de
ce corps émetteur.
Émission de rayonnement
X La désexcitation des atomes du système thermodynamique (Σ) peut
conduire à l’émission de rayonnement électromagnétique par la surface
extérieure (S) de (Σ). Ce rayonnement émis s’ajoute au rayonnement
réfléchi pour former le rayonnement total partant de la surface (S).
Ainsi, si on étudie le flux hémisphérique partant (ou émergent) ϕ↑ de l’élément de
surface du corps opaque (Σ), on constate qu’il est, en général, supérieur au seul flux
réfléchi ; le supplément est appelé courant thermique radiatif émis ϕémis par unité de
surface du corps opaque, avec la relation ϕ↑ = ϕréfl. + ϕémis .
2 Bilans radiatifs : on peut visualiser sur la figure 15.3 les bilans des phéno-
mènes d’absorption, de réflexion et d’émission. Chaque flux hémisphérique (ϕréfl. ,
ϕabs. , ϕémis ) est supposé positif dans les définitions ci-dessus. Sur ce schéma, les croix
désigne la conversion d’énergie électromagnétique en agitation thermique locale, c’est-
à-dire en énergie interne (dans le cas de l’absorption) ou réciproquement la création
d’une onde électromagnétique à partir de la vibration des particules chargées dues à
l’agitation thermique du matériau près de sa surface (dans le cas de l’émission).
ϕ↓ ϕ↑
ϕabs. ϕréfl. ϕréfl. ϕémis
ϕabs. ϕémis
système (Σ)
Figure 15.3 – Bilan radiatif
En faisant le bilan énergétique, on calcule le courant thermique radiatif total sortant

de (S) selon (15.4). Le flux hémisphérique réfléchi s’élimine naturellement de ce bilan,
qui prend donc aussi la forme équivalente :
jr = ϕémis − ϕabs. (15.5)

| {z } | {z }
émis par (S) absorbé par (S)
15.1.4 Étude spectrale

2 Définitions : chacun des courants thermiques radiatifs définis ci-dessus (incident
ou émergent, réflechi, absorbé ou émis) est une grandeur intégrale relativement à la
direction de propagation du rayonnement, mais aussi une somme relativement à la
longueur d’onde du rayonnement considéré.
On fait l’étude spectrale de ces courants radiatifs en restreignant par la pensée l’étude
à un certain intervalle de longueur d’onde [λ0 ; λ0 + dλ0 ] pour lequel les divers cou-
dϕx
rants radiatifs se mettent sous la forme dϕx = dλ0 , l’indice x désignant le flux
dλ0
hémisphérique particulier étudié (incident ou partant, absorbé, émis ou réfléchi).
dϕx
Le flux hémisphérique spectral par unité de longueur d’onde se mesure en watts
dλ0
par mètre carré et par mètre ; on évitera de confondre cette unité avec celle d’une
dϕ volumique même si on peut dans les deux cas faire l’analyse dimensionnelle
puissance
x
= W · m−3 = [wém ].
dλ0
On peut aussi étudier la répartition spectrale en fonction de la fréquence ν du rayon-

dϕx c0
nement, en écrivant de même dϕx = dν ; compte tenu de la relation ν = , on
dν λ0
2
c0 dϕx λ dϕx
peut écrire donc |dν| = 2 |dλ|. On a donc aussi = 0 .
λ0 dν c0 dλ0
dϕx
Le flux hémisphérique spectral par unité de fréquence se mesure en watts
dν
dϕ et par hertz ; c’est aussi, accidentellement, l’unité d’une énergie
par mètre carré
x
surfacique, = J · m−2 .
dν
Dans toute la suite, les études théoriques seront basées sur le calcul des flux hémi-
sphériques spectraux par unité de fréquence, tandis que les applications numériques
pratiques utiliseront plutôt les flux hémisphériques spectraux par unité de longueur
d’onde.
2 Coefficients d’absorption et d’émission : on définit les coefficients d’absorption
a(λ0 ) et de réflexion r(λ0 ) = 1 − a(λ0 ) du rayonnement électromagnétique par les
relations :
dϕabs. dϕ↓ dϕréfl. dϕ↓

= a(λ0 ) = r(λ0 ) (15.6)
dλ0 dλ0 dλ0 dλ0
Le tableau 15.1 montre quelques valeurs de coefficients d’absorption pour divers ma-
tériaux, pour deux longueurs d’onde : λ0 = 600 nm, qui correspond au maximum
de sensibilité de l’œil humain, dans le domaine visible, et λ0 = 9, 3 µm, située dans
le domaine de l’infrarouge lointain. Nous verrons bientôt que cette longueur d’onde
correspond au maximum d’émission des objets terrestres, lorsqu’ils sont chauffés à
une température de l’ordre de 310 K.
Surface a(λ0 = 600 nm) a(λ0 = 9, 3 µm)

Acier galvanisé 0, 89 0, 28
Marbre blanc 0, 47 0, 97
Verre 0, 10 0, 90
Papier blanc 0, 28 0, 95
Végétation 0, 80 0, 85
Table 15.1 – Coefficients d’absorption du rayonnement électromagnétique
Sur ce tableau, on remarque que des objets qui paraissent blancs ou transparents dans
le domaine visible (marbre, verre ou papier) sembleraient noirs pour une observation
dans l’infrarouge (ce sont quasiment des absorbeurs intégraux).
Dans le cas particulier d’une planète, le coefficient de réflexion calculé pour le maxi-
mum de sensibilité de l’œil porte le nom d’albédo, et on le note A = r(600 nm) soit
aussi A = 1 − a(600 nm). L’albédo dépend de la nature de la surface de la planète
(état de l’atmosphère, nature du sol, etc). L’albédo terrestre moyen est de l’ordre de
A ≃ 0, 34.
Nous verrons dans la suite comment on peut, dans certains cas, déterminer un flux
dϕ0
hémisphérique émis théorique, que nous noterons ; les bilans radiatifs ne se pla-
dλ0
çant pas toujours dans le cas du rayonnement idéal d’équilibre, on définit de même
un coefficient d’émission :
dϕémis dϕ0
= e(λ0 ) (15.7)
dλ0 dλ0
L’identité microscopique des phénomènes d’absorption et d’émission montre que, en

général, le coefficient d’émission et le coefficient d’absorption sont égaux :
a(λ0 ) = e(λ0 ) (15.8)
Le cas d’un émetteur idéal, tel qu’il sera décrit plus bas, correspond à e = 1 (par
définition) donc aussi à a = 1 et r = 0 : on parlera donc d’absorbeur intégral (pour
toutes les longueurs d’ondes) ou encore de corps noir ; la loi donnant l’expression
dϕ0
de en fonction de la longueur d’onde λ0 et de la température de surface T de
dλ0
l’émetteur porte le nom de loi du corps noir.
Un absorbeur ou un émetteur réel, pour lequel on a toujours a < 1 donc e < 1, porte
parfois le nom de corps gris.
2 Flux hémisphérique spectral et global : on peut repasser Z au flux hémisphérique
∞
dϕx
global à partir d’un flux hémisphérique spectral par ϕx = dν ou, selon le
Z ∞ ν=0 dν
dϕx
cas, ϕx = dλ0 . On peut bien sûr accompagner ces définitions de celles de
λ0 =0 dλ0
coefficients de réflexion ou d’émission intégraux ou moyens, seuls utiles pour un bilan
énergétique global :
ϕabs. = ā × ϕ↓ ϕréfl. = (1 − ā) × ϕ↓ ϕémis = ē × ϕ0 (T ) (15.9)
Dans cette expression, ϕ0 (T ) est le flux hémisphérique surfacique, intégré sur toutes
les longueurs d’ondes, émis par un émetteur idéal à la température T .
15.2 Rayonnement thermique d’équilibre
15.2.1 Loi de Planck (loi du corps noir)
2 Équilibre radiatif : en l’absence de transferts mécaniques, un système thrmodyna-

mique (Σ) sera en équilibre thermique (et son énergie interne sera constante au cours
du temps) si la puissance thermique totale reçue Ptotale est constamment nulle.
On parlera d’équilibre radiatif dans le cas particulier où ce système
I est en équilibre
thermique sous l’action du seul rayonnement, avec donc Φr = jr dS = 0. Enfin,
(S)
on parlera d’équilibre radiatif local (parfois improprement appelé équilibre thermody-
namique local, ETL) si cette relation est partout vraie localement : jr = 0.
Compte tenu des relations de bilan (15.4) et (15.5), on peut écrire la condition d’équi-
libre radiatif local sous la forme ϕ↓ = ϕ↑ et ϕémis = ϕabs. .
Nous nous placerons dans la suite dans le cas où cette relation d’équilibre thermody-
namique local est réalisée pour tout intervalle de fréquence ou de longueur d’onde, ce
dϕ↓ dϕ↑ dϕémis dϕabs.
qui permet d’écrire = et = .
dλ0 dλ0 dλ0 dλ0
2 Loi de Planck : nous allons ici préciser l’expression de la valeur commune des
flux ci-dessus, dans le cas d’un corps noir (absorbeur intégral). En effet, dans le cas
d’un absorbeur intégral, a = 1 pour toute longueur d’onde donc le flux hémisphérique
dϕréfl.
réfléchi est nul.
dλ0
dϕ↓ dϕ↑
Les flux hémisphériques radiatifs spectraux incident et partant d’un corps
dλ0 dλ0
noir à l’équilibre radiatif local sont égaux entre eux, et aussi égaux aux flux hémisphé-
dϕémis dϕabs.
riques radiatifs spectraux émis et absorbé par la surface de ce corps
dλ0 dλ0
dϕ0
noir. Cette valeur commune, , est la loi de Planck‡ , ou loi du corps noir. Elle
dλ0
sera pour l’instant seulement affirmée, sous la forme :
dϕ0 2πhc20 1
= (15.10)
dλ0 λ50 hc0
exp −1
λ0 kB T
Dans cette expression, h désigne la constante de Planck‡ introduite pour la première

fois en  à l’occasion de l’étude du rayonnement thermique d’équilibre :
h = 6, 6262 × 10−34 J · s (15.11)
et on rappelle les valeurs numériques de la célérité c0 de la lumière dans le vide, et de

la constante de Boltzmann kB :
c0 = 2, 99792458 × 108 m · s−1 kB = 1, 38065 × 10−23 J · K−1 (15.12)
On a vu qu’il était possible de transcrire cette loi de répartition spectrale en termes

de flux hémisphérique par unité de fréquence, par la relation λ0 = c0 /ν ; on obtient
alors la forme équivalente de la loi du corps noir :
dϕ0 2πhν 3 1
= (15.13)
dν c20 hν
exp −1
kB T
15.2.2 Conséquences de la loi de Planck
2 Étude spectrale du flux hémisphérique d’équilibre : pour analyser les conséquences

5 5
dϕ0 2πkB T
formelles de la loi de Planck, écrivons-la sous la forme = 4 3 f (u) où on a
dλ0 h c0
posé u = hc0 /kB λ0 T et f (u) = u5 / [exp (u) − 1].
f (u)
u
b
u0 = 4.9651
u5
Figure 15.4 – Tracé de f (u) =
exp (u) − 1
df u5
Le tracé de f est aisé ; sa dérivée vaut = (5 − u − u exp (−u)) soit
du (exp (u) − 1)2
df u5
encore, si exp (u) ≫ 1, ≃ (5 − u) qui s’annule lorsque u0 ≃ 5 (en
du (exp (u) − 1)2
fait, pour u0 = 4, 9651). On en déduit la forme de f (u), et donc de la loi de Planck,
à une température donnée ; f (u) est tracée sur la figure 15.4.
2 Loi du déplacement de Wien : comme le montre l’étude ci-dessus, le flux hémi-
sphérique spectral admet un maximum pour une certaine longueur d’onde λmax qui
vérifie la loi de déplacement de Wien‡ :
hc
λmax T = = 2, 8978 × 10−3 m · K (15.14)
kB u0
Le tableau 15.2 montre quelques valeurs de longueurs d’onde correspondant au maxi-

mum d’émission de certains corps chauffés, en fonction de leur température T .
Corps étudié Température Maximum d’émission

de surface λ0 Domaine spectral
Soleil 5 700 K 510 nm visible
Filament d’ampoule 2 500 K 1, 16 µm proche infrarouge
Objets terrestres 310 K 9, 34 µm infrarouge lointain
Fond cosmologique 2, 7 K 1, 07 mm radio
Table 15.2 – Applications de la loi du déplacement de Wien
On n’oubliera pas non plus que, si le maximum de f (u) est fixé à f (u0 ) ≃ 21, 2, le
5 5
dϕ0 2πkB T
maximum du flux hémisphérique d’équilibre = f (u) varie aussi avec la
dλ0 h4 c30
5
température, proportionnellement à T .
La figure 15.5 illustre la double influence de la température sur le flux hémisphérique
d’équilibre : déplacement de la valeur λmax et de la valeur de l’énergie maximale (ou
totale) émise.
La connaissance de la loi de Planck sous la forme (15.10) ou (15.13) n’est en général

pas exigée ; par contre, la forme générale de la loi de répartition du flux hémisphérique
spectral soit être connue. De même, la loi du déplacement de Wien (15.14) doit être
connue sous la forme λmax T = Cte, mais pas nécessairement l’expression littérale
de cette constante.
dϕ0
dλ0
T = 5 000 K
T = 3 500 K
λ0
b b
579 nm 827 nm
dϕ0
Figure 15.5 – Tracé de pour deux températures différentes
dλ0
2 Loi de Stefan-Boltzmann : on a constaté ci-dessus l’émission totale augmente

très fortement avec Zla température ; on peut caractériser cette émission totale par
∞ 4 4 Z ∞
dϕ0 2πhkB T u3
l’intégrale ϕ0 (T ) = dλ0 ou encore ϕ0 (T ) = du,
λ=0 dλ0 h4 c20 Z 0 exp (u) − 1
4 ∞ 3
2πk u
qu’on écrira encore ϕ0 (T ) = σT 4 , en posant σ = 3 B 2 J et J = du ;
h c0 0 exp (u) − 1
σ est la constante de Stefan‡ .
Z ∞ 3
u exp (−u)
Le calcul de J = du se fait par développement de Taylor du déno-
0 1 − exp (−u)
π4
minateur ; on trouve après quelques calculs classiques J = ; on en déduit la loi de
15
Stefan-Boltzmann et l’expression de la constante de Stefan :
2π 5 kB
4
ϕ0 (T ) = σT 4 σ= = 5, 6704 × 10−8 W · m−2 · K−4 (15.15)
15h3 c20
La loi de Stefan doit être connue sous la forme ϕ0 (T ) = σT 4 , mais ni l’expression

littérale de la constante de Stefan ni le calcul de l’intégrale J ne sont exigibles.
2 Flux pariétal équivalent : considérons une surface (S), d’aire S, d’un corps porté
à la température T , dont le rayonnement est donné par la loi de Planck. Les échanges
thermiques par rayonnement entre ce corps et son environnement se font par l’inter-
médiaire du flux émis (donc négatif), Φémis
r = −SσT 4 .
On peut souvent considérer l’extérieur du système étudié (par exemple l’atmosphère
qui l’entoure) comme un autre émetteur thermique, rayonnant à travers la même sur-
face S selon la loi de Stefan, mais avec une autre température T ′ , de sorte que le
flux thermique reçu par (S) s’écrit Φreçu
r = SσT ′4 . Dans le cas d’un faible écart de
température, on peut recopier le flux total reçu sous la forme Φr = Sσ(T ′4 − T 4 )
donc Φr ≃ 4SσT 3 (T ′ − T ), ce qui montre que les échanges thermiques par rayonne-
ment peuvent se mettre sous une forme équivalente aux transferts pariétaux convecto-
conductifs, avec le coefficient pariétal équivalent :
hr = 4σT 3 (15.16)
Remarquons que, dans le domaine ordinaire des températures terrestres, T ≃ 300 K

donc hr ≃ 6 W·m−2 ·K−1 ; il s’agit d’une valeur comparable à celles des flux pariétaux
à l’interface d’un solide et d’un gaz en convection naturelle : on ne peut donc pas
négliger le flux radiatif dans ce cas, puisqu’il sera du même ordre de grandeur que le
flux pariétal convecto-conductif.
2 Étendue spectrale : le spectre d’émission représenté par la loi de Planck est,
comme on le voit sur la figure 15.5, relativement peu étendu de part et d’autre de la
longueur d’onde maximale donnée par la loi de Wien ; cette extension est en fait plus
importante pour λ > λmax que pour λ < λmin .
On appelle étendue spectrale d’un émetteur thermique
à l’équilibre à la température T
λmax
l’intervalle de longueurs d’onde ; 8λmax car on peut montrer que cet intervalle,
2
dissymétrique autour de λmax pour les raisons évoquées ci-dessus, concentre 98 % de la
Z 8λmax
dϕ0
puissance émise : dλ0 = 0, 98 σT 4 . La figure 15.6 illustre cette propriété.
λmax /2 dλ 0
dϕ0
dλ0
0, 98 × σT 4
λ0
b b b
λmax /2 λmax 8λmax
Figure 15.6 – Étendue spectrale du rayonnement thermique d’équilibre
On peut, compte tenu de la loi de Wien, donner quelques valeurs numériques de limites
d’étendue spectrale, conformément au tableau 15.3 :
La première ligne (T = 2, 7 K), dans le domaine des ondes radio et centimétriques,
correspond au rayonnement électromagnétique fossile (rayonnement cosmologique)
considéré aujourd’hui comme un des indices essentiels prouvant la réalité des modèles
cosmologiques d’explosion initiale (big bang) de l’Univers.
Les deux lignes suivantes (T = 310 K et T = 2 500 K) relèvent essentiellement
du domaine infrarouge, mais à la température 2 500 K qui est celle des filaments
Température d’équilibre λmax /2 λmax 8λmax

2, 7 K 0, 53 mm 1, 07 mm 8, 56 µm
310 K 4, 67 µm 9, 34 µm 74, 7 µm
2 500 K 580 nm 1, 16 µm 9, 28 µm
5 700 K 255 nm 510 nm 4, 08 µm
Table 15.3 – Étendue spectrale en fonction de la température de l’émetteur
de Tungstène des lampes à incandescence, l’étendue spectrale s’étend jusque vers le

milieu du spectre visible : il s’agit d’une lumière de couleur rouge.
Enfin, la dernière ligne décrit assez bien le rayonnement solaire, avec une température
de surface T = 5 700 K ; le Soleil émet aussi dans les proches infrarouge et ultraviolet,
mais ces rayonnements sont largement absorbés pas la haute atmosphère et sont peu
sensibles au niveau du sol.
15.3 Exemples d’application
15.3.1 Flux radiatif en régime permanent

2 Dilution géométrique du rayonnement solaire : considérant le Soleil comme un
émetteur thermique à la température TS = 5 700 K, de forme sphérique de rayon
RS = 7, 0 × 108 m, la puissance totale rayonnée par la surface du Soleil est donnée
par PS = 4πRS2 σTS4 = 3, 68 × 1026 W. Cette puissance énorme n’est pas captée par
les planètes qui entourent le Soleil ; la majeure partie quitte le système solaire. Une
planète donnée intercepte seulement une fraction de cette puissance donnée (cf. figure
15.7) par une relation géométrique.
planète
dS⊥
dΩ
2RS b b 2Rp
Figure 15.7 – Dilution géométrique du rayonnement solaire
À la distance r du Soleil, la puissance totale PS est répartie uniformément sur une

sphère de surface 4πr2 , tandis que la planète étudiée intercepte seulement une partie
dS⊥ de cette surface ; la notation dS⊥ rappelle que cette surface est une section droite,
orthogonale à la direction moyenne du faisceau.
On note aussi sur la figure 15.7 que la partie du rayonnement intercepté est invariante
sur un cône donné dont le sommet est au centre du soleil ; la grandeur qui caractérise
ce cône est l’angle solide élémentaire :
dS⊥
dΩ = (15.17)
r2
En particulier, l’angle solide total sur lequel se répartit un rayonnement isotrope

comme celui du Soleil est Ωtotal = 4π, et la puissance reçue dans un cône d’angle
solide dΩ est donc :
dΩ dΩ
dP = Pisotrope = Pisotrope (15.18)
Ωtotal 4π
En particulier, pour une planète de rayon rp , on a dS ≃ πrp2 donc la puissance reçue

πrp2 πRS2 rp2
par la face éclairée de la planète est Pp = PS soit encore P p = σTS4 .
4πr2 r2
2 Température d’équilibre d’une planète simple : considérons une planète dépourvue
d’atmosphère, qui reçoit du Soleil la puissance Pp . En régime permanent d’équilibre
thermique, cette planète doit émettre une puissance exactement égale à celle qu’elle
reçoit. On peut alors, par exemple, assimiler chacune des faces de la planète à un corps
noir, et appelant Tj la température de la face éclairée (le jour local) et Tn celle de la
face sombre (la nuit locale) ; chacune des deux faces a une aire 2πrp2 et la puissance

totale réémise dans cette hypothèse est donc Pp = 2πrp2 σTj4 + σTn4 .
Si on fait enfin l’hypothèse
s raisonnable Tj ≫ Tn , on obtient la condition d’équilibre
RS
thermique Tj ≃ √ TS . Dans le cas de la Lune, r ≃ 1, 5 × 1011 m donc Tj ≃ 327 K
2r
ou 54 ◦ C ; c’est une approximation raisonnable pour la température de la face éclairée
de notre satellite.
2 Effet de serre atmosphérique : la présence de l’atmosphère modifie profondément le
bilan thermique d’une planète, par deux effets. Tout d’abord, la circulation atmosphé-
rique (les phénomènes de convection thermique en particulier) diminue très fortement
les écarts thermiques entre les températures de jour et de nuit, de sorte qu’on peut
en première approximation considérer la surface de la planète comme un émetteur
de température uniforme Tp . Le bilan thermique proposé ci-dessus devrait r donc être
RS
réécrit sous la forme Pp = 4πrp2 σTp4 , ce qui mène à l’expression Tp ≃ TS . Dans
2r
le cas de la Terre, r ≃ 1, 5 × 1011 m comme pour la Lune donc Tj ≃ 275 K ou 2 ◦ C ; la
température moyenne de la surface de la Terre est bien plus élevée que cette valeur,
du fait de la prise en compte de divers coefficients de réflexion et d’absorption.
Tout d’abord, la surface de la Terre elle-même n’absorbe que partiellement le rayon-
nement solaire, dont a vu qu’il était essentiellement situé dans le domaine visible ;
l’albédo terrestre moyen étant de l’ordre de A = 0, 34, seule la fraction 1 − A du
rayonnement solaire est absorbé, ce qui contribue à diminuer encore la température
d’équilibre de la planète.
Le facteur qui augmente nettement cette température est l’effet de serre, c’est-à-
dire l’absorption d’une fraction importante α du rayonnement réémis par la planète.
Compte tenu de la température de surface de celle-ci, on a vu que le rayonnement
qu’elle émet est essentiellement infrarouge, et l’atmosphère, qui est bien transparente
dans le domaine visible, est bien plus opaque dans l’infrarouge. La puissance réellement
émise par la planète s’écrit donc Pp′ = (1 − α)4πrp2 σTp4 . Si on préfère, on peut dire
que la planète avec son atmosphère se comporte globalement comme un corps noir
fictif de température de surface apparente Ta donnée par l’expression Pp′ = 4πrp2 σTa4 ,
1/4
donc Ta = Tp (1 − α) . Le nouveau bilan thermique de la planète fournit alors
r 1/4
Rs 1 − A
Pp′ = (1−A)PS soit Tp = TS . Avec α ≃ 0, 45, on trouve Tp ≃ 288 K,
2r 1 − α
soit 15 ◦ C, valeur plus raisonnable.
Le coefficient α dépend significativement de la composition chimique de la planète ; la
présence de certains gaz (CO2 , CH4 , etc.) augmente α donc tend à augmenter la tempé-
rature d’équilibre de la planète : c’est la lente dérive de l’effet de serre atmosphérique
qui est accompagnée de changements climatiques durables.
15.3.2 Flux radiatif en régime variable

2 Chauffage dans un four : considérons le chauffage d’un objet, assimilé à une sphère
(Σ), placé dans un four dont les parois sont entièrement portées à la température Tf
(figure 15.8). Nous négligerons tous les transferts convectifs et conductifs, comme si
l’intérieur du four était vide de tout gaz.
Sf
b
Ω
(Σ) T Tf
Figure 15.8 – Chauffage dans un four
Lors de l’étude du bilan thermique du système (Σ), il est clair que la totalité du
rayonnement thermique émis par la surface Sf du four ne doit pas être prise en
Ω
compte ; en un point donné de la paroi du four, seule une fraction du rayonnement
2π
atteint effectivement l’objet chauffé, le reste atteint d’autres parties du four. Ainsi,
tout se passe comme si la puissance effectivement reçue par le corps chauffé devrait
être écrite P = S ′ σTf4 , avec S ′ < Sf .
2 Cas de l’émission isotrope par les parois du four : il est possible de montrer,
dans le cas où l’émission est isotrope, et si le four entoure totalement le corps (Σ),
que la surface équivalente à prendre en compte est exactement la surface S du corps
chauffé (Σ) : S ′ = S. Dans ces conditions, le bilan thermique du chauffage de (Σ),
dT
traité comme un absorbeur integral, s’écrit Preçu − Pémis = C , où C est la capacité
dt
thermique du corps (Σ), avec Preçu = σSTf4 et Pémis = σST .
C dT
On obtient l’équation non linéaire Tf4 − T 4 = ; la résolution exacte de cette
σS dt
équation est bien sûr possible mais mène à des expressions difficiles à interpréter. Dans
le cas simple où T reste voisin de Tf , on peut se contenter de l’expression approchée
C dT
Tf4 − T 4 ≃ 4Tf3 (Tf − T ), ce qui conduit à l’équation plus simple Tf − T ≃ ,
4σTf3 S dt

t
dont la solution T (t) = Tf + a exp − fait apparaı̂tre une durée caractéristique de
τ
C
chauffage, τ = .
4σTf3 S
15.4 Interprétations de la loi de Planck
15.4.1 Flux radiatif et énergie volumique

2 Géométrie d’un corps opaque : dans toute la suite, nous étudierons les transferts
thermiques radiatifs d’un système thermodynamique (Σ) formé d’un corps opaque,
échangeant avec l’extérieur de la puissance thermique à travers la surface fermée (S)
qui limite (Σ) (cf. figure 15.9, à gauche).
Cas non isotrope

(S)
z
b
(Σ) b M
Figure 15.9 – Échanges thermiques par rayonnement d’un corps opaque
Au voisinage de chaque point de la surface de (Σ), le rayonnement peut être émis ou

reçu dans la totalité de l’espace hémisphérique correspondant à z > 0, si on choisit
de noter (Oz) la normale extérieure à la surface du système (Σ) en un de ses points.
Nous considérerons que la surface (S) est suffisamment peu accidentée pour qu’on
puisse traiter le rayonnement au voisinage de (S) comme isotrope, ce qui exclut par
exemple le cas de la figure 15.9, à droite.
2 Énergie volumique d’équilibre et puissance émise : considérons un élément de
surface dS de la paroi d’un corps opaque (Σ) ; on notera n = ez la normale extérieure
à la surface, orientée vers le milieu transparent qui entoure (Σ) sur l’ensemble des
directions de l’hémisphère z > 0 (figure 15.10).
dS
z
c0 dt
Figure 15.10 – Flux hémisphérique de rayonnement
Nous considérerons ici une situation d’équilibre radiatif local du solide (Σ) avec son
environnement : le rayonnement électromagnétique environnant la surface extérieure
(S) de (Σ) est alors isotrope, le rayonnement incident et le rayonnement émergent
ayant en tout point même intensité.
Étudions par exemple le rayonnement incident sur l’élément de surface dS du système
(Σ). L’énergie totale reçue par dS pendant la durée dt est δQ = ϕ↓ dSdt. Cette énergie
parvient sur dS en provenance de toutes les directions de l’hémisphère z > 0 situé
au-dessus de dS, de manière isotrope.
Considérons pour commencer le seul rayonnement incident sur la surface dS dans la

direction θ (cf. figure 15.10) ; elle correspond à l’énergie électromagnétique contenue
dans un cylindre de base dS, de normale n et de hauteur c0 dt, avec donc un volume
dτ = c0 cos θdSdt.
Si on note wém la densité volumique d’énergie électromagnétique au voisinage de la
dΩ
surface dS, seule une fraction de cette énergie se dirige effectivement dans la direc-
4π
tion θ, si dΩ = 2π sin θdθ désigne l’angle solide élémentaire dans la direction θ. Ainsi,
l’énergie qui parviendra sur la surface dS pendant la durée dt est, pour cette seule di-
sin θdθ wém c0 cos θ sin θdθ
rection θ, donnée par wém ×dτ × , soit aussi dSdt ; après inté-
2 Z2 π/2
1
gration sur les angles possibles du rayonnement incident, cos θ sin θdθ = donc
0 2
wém c0
on obtient pour énergie incidente δQ = dSdt, qu’on identifie à δQ = ϕ↓ dSdt.
4
On obtient donc la propriété fondamentale de l’équilibre radiatif local :
c0
Équilibre radiatif local : ϕ↓ = ϕ↑ = wém (15.19)
4
On notera que cette relation est d’origine exclusivement géométrique ; elle s’étend
donc automatiquement aux grandeurs spectrales, par unité de fréquence comme par
unité de longueur d’onde :
dϕ↓ dϕ↑ c0 dwém

Équilibre radiatif local : = = (15.20)
dν dν 4 dν
15.4.2 Le modèle de Rayleigh-Jeans

2 La loi de Rayleigh-Jeans : on peut donner une interprétation simple de la loi de
Planck (15.13), ou plutôt de la densité volumique d’énergie correspondante, dans le
cas des basses fréquences (ou des grandes longueurs d’onde). Dans ce cas en effet, on
dwém 4 dϕ0 8πhν 3 kB T
obtient = ≃ si on peut faire l’approximation hν ≪ kB T
dν
c0 dν c40 hν
hν hν
donc exp −1 ≃ . Dans le cas du spectre solaire, l’approximation impose
kB T kB T
kB T hc0
ν≪ ou λ0 ≫ ∼ 2 µm : elle ne peut décrire que l’infrarouge lointain.
h kB T
Dans ce domaine restreint, l’expression obtenue est toutefois simple à interpréter
d’un point de vue classique, car elle ne dépend pas de la constante (quantique) de
dwém 8πν 2
Planck h, avec ≃ kB T . On reconnaı̂t ici le théorème d’équipartition de
dν c30
l’énergie en associant l’énergie kB T à chaque degré de liberté d’oscillation du champ
électromagnétique ; un décompte de modes doit donc rendre compte du nombre de
8πν 2 dν
modes dN = pour les fréquences comprises dans l’intervalle [ν ; ν + dν].
c30
2 Onde dans une cavité : imaginons d’abord que le rayonnement électromagnétique
est limité par deux miroirs métalliques, distants de ℓ, qui constituent les deux limites
d’une cavité unidimensionnelle sur lesquelles le champ doit s’annuler (figure 15.11).
L’annulation impose la condition d’onde stationnaire dans la cavité, 2ℓ = nλ0 , où
n > 1 est un entier qui numérote les modes propres d’oscillation. On écrit encore le
mode 1
mode 4
mode 2 mode 3
Figure 15.11 – Cavité unidimensionnelle
vecteur d’onde de chaque composante progressive de cette onde stationnaire sous la

π
forme k = n ex , si (Ox) est la direction normale aux miroirs de cette cavité.
ℓ
On montre aisément la généralisation à une cavité tridimensionnelle formée de miroirs
π
limitant un volume cubique de côté ℓ, sous la forme k = [nex + pey + qez ], en
ℓ
fonction de trois nombres entiers positifs n, p et q. La fréquence correspondante est
c0 p 2
donnée par ω = c0 k donc aussi ν = n + p2 + q 2 .
2ℓ
Sur le plan géométrique, cela signifie que chaque point de coordonnées (n, p, q) d’un
réseau cubique de côté c0 /2ℓ correspond à deux modes de vibration, pour les deux
polarisations orthogonales possibles du champ électromagnétique : lorsque la direc-
tion de propagation du champ électromagnétique est celle de l’axe (Ox), le champ E
peut avoir deux composantes indépendantes sur ey et ez , tandis que la composante
longitudinale est nulle, Ex = 0.
Il suffit donc de compter le nombre de ces modes compris dans l’intervalle de fréquence
[ν ; ν + dν], c’est-à-dire le nombre de cubes élémentaires de volume c30 /8ℓ3 compris
entre les sphères de rayons ν et ν + dν, dans la partiede l’espace où n > 0, p > 0 et
4 3
q > 0. Entre ces deux sphères, le volume est d πν = 4πν 2 dν mais on ne doit en
3
compter que le huitième pour tenir compte de la condition n > 0, p > 0, q > 0.
πν 2 dν/2
Le nombre de modes est donc le rapport 2 × pour le volume ℓ3 entier de
c30 /8ℓ3
8πν 2 dν
la cavité et, par unité de volume, dN = , comme on l’attendait ci-dessus.
c30
Cette interprétation de la loi de Planck à basse fréquence est antérieure aux travaux
de Planck ; on la doit à Rayleigh‡ et Jeans.
2 Les limites du modèle de Rayleigh et Jeans : ce modèle ne prévoit que le comporte-
ment limite à faible fréquence du comportement électromagnétique, et les expressions
dwém 8πν 2 kB T dϕ0 4πν 2 kB T
≃ et ≃ du modèle de Rayleigh et Jeans prévoyaient
dν c40 dν c30
une divergence à haute fréquence (connue sous le nom historique de catastrophe ultra-
violette), que l’on n’observe pas. La figure 15.12 montre la différence entre les modèles
de Rayleigh et Jeans et de Planck. Le modèle de Planck évite la divergence à haute
hν
fréquence au moyen de la substitution kB T −→ .
exp (hν/kB T ) − 1
On peut interpréter qualitativement cette substitution en remarquant que
le terme
hν hν
correctif introduit par Planck s’écrit ≃ hν exp − sauf à très
exp (hν/kB T ) − 1 kB T
basse fréquence. Tout se passe donc comme si chaque mode d’oscillation du champ
dwém
dν
dwém 8πν 2 kB T
modèle de Rayleigh et Jeans, =
dν c40
dwém 8πhν 3 1
loi de Planck, =
dν c40 exp (hν/kB T ) − 1
Figure 15.12 – Catastrophe ultraviolette du modèle de Rayleigh-Jeans
(qui portera plus tard le nom de photon) emportait l’énergie hν, les modes de haute
fréquence, donc de haute énergie, étant moins probable dans un gaz de photons ther-
malisé
à la température
T , du fait de l’apparition du facteur statistique de Boltzmann,
hν
exp − .
kB T
15.4.3 Interprétation cinétique de la loi de Planck

2 Modèles du rayonnement thermique : l’interprétation statistique développée par
Planck pour introduire de façon exacte la loi du rayonnement thermique qui porte
dwém 8πhν 3 1
son nom, = est assez compliquée à développer ; elle
dν c40 exp (hν/kB T ) − 1
est de plus aujourd’hui remplacée par la théorie statistique de Bose et Einstein, qui
donne en particulier le même résultat dans le cas d’un gaz de photons, mais permet
d’autres applications. Le modèle de Bose-Einstein relève de la théorie quantique ; nous
ne présenterons donc ni ce modèle, ni le modèle historique de Planck.
Il est par contre assez facile de déterminer en partie la loi de Planck du rayonnement
thermique en suivant le modèle cinétique proposé par Einstein en  ; cette étude
présente aussi l’intérêt d’introduire un phénomène nouveau, le phénomène d’émission
stimulée du rayonnement électromagnétique.
2 Équilibre entre matière et rayonnement : pour décrire cet équilibre, Einstein
propose de décrire un milieu matériel comportant au moins deux états quantiques
d’énergie E1 et E2 > E1 , en interaction avec un flux de photons caractérisé par la
dwém
densité volumique d’énergie spectrale . On notera N1 et N2 le nombre d’atomes
dν
par unité de volume, respectivement dans les états d’énergie E1 et E2 .
Lors de l’interaction entre matière et rayonnement, des transitions entre ces deux états
sont possibles si le rayonnement a pour fréquence celle donnée par la loi de sélection
dwém
de Bohr, hν = E2 − E1 . Dans la suite, nous noterons ̟ = la densité
dν ν= E2 −E1
h
volumique spectrale d’énergie électromagnétique à la fréquence de la transition ; le
nombre de photons par unité de volume, susceptibles de réaliser cette transition, est
aussi proportionnel à ̟.
dN1 dN2
L’équilibre entre matière et rayonnement a lieu lorsque = = 0 ; on va
dt dt
donc proposer les divers phénomènes cinétiques susceptibles de faire varier les popu-
lations N1 et N2 des états d’énergie E1 et E2 , afin de voir dans quelles conditions ces
phénomènes peuvent se compenser exactement.
2 Absorption, émission spontanée, émission induite : l’absorption d’un photon d’éner-

gie hν peut conduire à des transitions de l’état d’énergie E1 vers l’état d’énergie E2 ;
ces transitions correspondent à une interaction entre un atome et un photon, pro-
cessus qu’on peut représenter par la réaction-bilan
A1 + γ → A2 , avec donc une loi
dN1 dN2
cinétique du second ordre, − = = B12 N1 ̟, proportionnellement
dt abs dt abs
donc au nombre d’atomes d’énergie E1 et au nombre de photons à la bonne fré-
quence, lui-même proportionnel à ̟. Le terme B12 est le coefficient d’Einstein pour
l’absorption.
On peut aussi observer des émissions spontanées de photons, un atome quittant son
état d’énergie E2 pour libérer un photon et redescendre sur l’état d’énergie E1 ; le
processus microscopique d’émission spontanée a pour équation-bilan
A2 → γ + A1 ,
dN1 dN2
avec donc une loi cinétique du premier ordre, =− = A21 N2 , où
dt é.sp dt é.sp
A21 est le coefficient d’Einstein pour l’émission spontanée.
Einstein a proposé un troisième phénomène, l’émission induite ou émission stimulée.
Un atome peut aussi quitter l’état d’énergie E2 pour libérer un photon et redes-
cendre sur l’état d’énergie E1 sous l’action du rayonnement électromagnétique, avec
pour équation-bilan γ + A2 → 2γ + A1 , avec donc une loi cinétique du second ordre,
dN1 dN2
=− = B21 N2 ̟. B21 est le dernier coefficient d’Einstein, pour le
dt é.st dt é.st
phénomène d’émission stimulée.
Globalement, on obtient pour condition d’équilibre N2 (A21 + B21 ̟) = N1 B12 ̟.
D’autre part, on sait qu’à l’équilibre thermique, la température T du milieu peut être
N1 exp (−E1 /kB T )
définie par la loi de répartition de Boltzmann, = qu’on écrira
N2 exp (−E2 /kB T )
N1 hν
encore = exp . La comparaison des deux conditions d’équilibre mène à
N2 B T
k
A21 + B21 ̟ hν
= exp
B12 ̟ kB T
À température très élevée, kB T ≫ hν et le rayonnement devient très intense, donc
̟ → ∞ ; cette condition d’équilibre impose alors B12 = B21 . On peut alors réécrire la
A21 /B12
condition d’équilibre sous la forme ̟ = . Cette expression constitue
hν
exp −1
kB T
A21 8πhν 3
la loi de Planck si on identifie le numérateur avec . Cette identification
B21 c40
est possible dans le cadre quantique, ou encore par comparaison avec le modèle de
Rayleigh et Jeans à basse fréquence ; nous nous contenterons de l’affirmer ici.
2 Importance du phénomène d’émission induite : l’importance du modèle d’Einstein
va au delà de la possibilité de retrouver précisément le dénominateur de la loi de
Planck : le phénomène d’émission induite (ou stimulée) en est la conséquence la plus
intéressante. On peut en effet montrer, dans le cadre quantique, que ce phénomène, de
bilan γ + A2 → 2γ + A1 peut être utilisé pour une amplification de l’onde lumineuse,
les photons émis par ce processus étant en phase avec ceux qui le provoquent.
L’amplification a d’abord été réalisée en  dans le domaine des micro-ondes (en
l’occurrence ν = 24 GHz), dans un dispositif connu sous le nom de maser (acronyme
de microwave amplification by stimulated emission of radiation) avant d’être réalisé
en , notamment par le français Kastler, dans le domaine visible : on parle alors
de laser pour light amplification by stimulated emission of radiation.
La difficulté technique qui a retardé l’observation du phénomène d’émission stimu-
lée trouve son explication dans la condition d’équilibre thermique : tous les photons
émis (spontanément ou de façon stimulée) sont aussitôt réabsorbés. Pour observer un
quantité significative de photons provenant de l’émission stimulée, il faut que ce phé-
nomène l’emporte sur l’absorption, donc que B21 N2 ̟ ≫ B12 N1 ̟, ou N2 ≫ N1 , ce
qui est incompatible avec la condition d’équilibre thermique N2 = N1 exp (−hν/kB T ).
L’effet laser (ou maser ) ne peut donc être observé qu’hors équilibre thermique, en pré-
sence d’un apport énergétique permanent (on parle de pompage) qui assure l’inversion
de population avec N2 ≫ N1 . Un émetteur laser est l’association de trois éléments :
• une cavité résonante (formée de deux miroirs), donc la longueur est accordée sur la
fréquence ν0 à laquelle l’effet laser est possible ;
• un milieu présentant les deux états d’énergie E1 et E2 , avec E2 − E1 = hν0 , qui
constituera le milieu amplificateur dans lequel l’onde circulera lors de ses allers
et retours entre les deux miroirs de la cavité ;
• un dispositif de pompage, assurant l’inversion de population donc l’amplification
cohérente de lumière par émission stimulée.
Un des miroirs de la cavité est très faiblement transparent ; la faible partie du faisceau
qui émerge de cette cavité est le faisceau laser.
Dans un milieu transparent, assimilé au vide, un rayonnement électromagné-

tique transporte de l’énergie. La puissance correspondante, reçuIpar un système
δQ→Σ
(Σ) de surface extérieure (S), s’écrit = −Φr avec Φr = jr dS.
dt (S)
Au voisinage de la surface d’un corps opaque, on peut décomposer ce courant

thermique radiatif sortant jr selon jr = ϕ↑ −ϕ↓ mais aussi jr = ϕémis −ϕabs. , le
flux réfléchi s’annulant dans le bilan : ϕ↑ = ϕémis + ϕréfl. et ϕ↓ = ϕabs. + ϕréfl. .
Chacun de ces flux est une
Z ∞somme étendue
Z ∞ à l’ensemble des longueurs d’onde
dϕx dϕx
ou des fréquences, ϕx = dν = dλ0 .
0 dν 0 dλ0
Pour un corps noir (ou absorbeur intégral) à l’équilibre thermique, la valeur
dϕ↑ dϕ↓ dϕémis dϕabs.
commune = = = est donnée par la loi de Planck qu’il
dλ0 dλ0 dλ0 dλ0
dϕ0 2πhc20 1
n’est pas nécessaire de connaı̂tre, = .
dλ0 λ50 exp (hc0 /λ0 kB T ) − 1
dϕ0
La longueur d’onde λmax pour laquelle est maximale est donnée par la loi
dλ0
de Wien, λmax T = Cte, avec Cte = 2, 90 × 10−3 m · K. L’étendue spectrale, qui
concentre 98 % du rayonnement thermique, s’étend de λmax /2 à 8λmax . Elle
s’étend dans le domaine visible pour un émetteur stellaire (T ∼ 6 000 K) et
dans le domaine infrarouge lointain pour un émetteur terrestre (T ∼ 300 K).
Le flux hémisphérique total émis par un corps noir est donné par la loi de
Stefan-Boltzmann, ϕ0 = σT 4 , avec σ = 5, 67 × 10−8 W · m−2 · K−4 .
Un bilan radiatif entre deux corps de même surface et de températures voisines
se met sous la forme d’un flux pariétal équivalent, jr ≃ h(T − T0 ), avec pour
constante caractéristique h ≃ 4σT 3 ≃ 4σT03 .
dϕabs. dϕ↓ dϕémis dϕ0
Pour un corps gris, = a(λ0 ) et = e(λ0 ) , où les coeffi-
dλ0 dλ0 dλ0 dλ0
cients d’absorption a(λ0 ) et d’émission e(λ0 ) sont en général égaux.
Chapitre 16
Le potentiel chimique
16.1 Grandeurs molaires partielles
16.1.1 Variables de Gibbs

2 Système polyphasé : on étudie ici un système thermodynamique formé de plusieurs
phases ; chaque phase est un sous-ensemble macroscopiquement homogène. Ce système
pourra comporter une ou plusieurs phase(s) solide(s) (des solides de natures différentes
n’étant en général pas miscibles), une ou plusieurs phase(s) liquide(s) (en fonction de
la miscibilité des liquides présents) et au plus une phase gazeuse (des gaz de toutes
natures étant en général miscibles en toutes proportions). Nous noterons dans la suite
φ le nombre de phases différentes présentes dans le système étudié.
Ce système présentera aussi plusieurs corps Ai de natures chimiques différentes, cha-
cun des corps étant éventuellement présent dans les diverses phases, sans exclure que
tel ou tel corps soit absent de telle ou telle phase. Nous noterons dans la suite N le
nombre de corps chimiquement différents présents dans le système étudié.
2 Variables de Gibbs : la description du système thermodynamique polyphasé
étudié passe par la détermination des variables de Gibbs‡ du système, constituées
de la donnée de deux variables intensives, la pression p et la température T , et de
la quantité de matière (nombre de moles) de chaque corps dans chaque phase. On
notera dans la suite nψ i cette quantité de matière, pour le corps Ai dans la phase
ψ. Ces quantités de matière forment N × φ variables extensives, dont certaines sont
éventuellement nulles.
La donnée des N φ+2 variables de Gibbs (T, p, nψ i ) constitue la détermination complète
de l’état d’équilibre thermodynamique du système. Nous allons montrer certaines
relations vérifiées, à l’équilibre thermodynamique, entre ces variables.
2 Réactions chimiques : le système polyphasé étudié sera éventuellement le siège
d’une
X p ou plusieurs réactions chimiques simultanées ; chacune d’entre elles sera notée
p
νi,ψ Ai ⇋ 0, où νi,ψ est le coefficient stœchiométrique (algébrique) pour l’espèce
i
Ai , réagissant dans la phase ψ, au cours de la réaction p. On a bien sûr 1 6 i 6 N ,
1 6 ψ 6 φ et 1 6 p 6 r, où r est le nombre de réactions chimiques indépendantes.
Lorsque le corps Ai dans la phase ψ ne participe pas à la réaction p, on notera bien
p p
sûr νi,ψ = 0 ; dans tous les autres cas, νi,ψ est négatif pour un réactif, et positif pour
un produit.
2 Avancement : on a vu que la conservation de la matière au cours d’une réaction

chimique donnée se traduit par la définition d’un avancement ξp pour chacune des r
réactions qui, simultanément, font varier les quantités de matière de toutes les espèces
figurant au bilan d’une réaction au moins. L’addition des causes de variation mène à :
r
X
dnψ
i =
p
νi,ψ dξp (16.1)
p=1
16.1.2 Grandeurs molaires partielles

2 Définition : considérons une grandeur extensive quelconque E définie pour le sys-
tème thermodynamique polyphasé tout entier : volume V , énergie interne U , entropie
S, etc. On appelle alors grandeur molaire partielle associée à la grandeur extensive E
pour l’espèce Ai dans la phase ψ la grandeur :
!
∂E
eψ
i = (16.2)
∂nψ
i T,p,nα
j (α,j)6=(ψ,i)
On notera qu’une grandeur molaire partielle est intensive ; ainsi, le volume molaire
partiel viψ de l’espèce Ai dans la phase ψ s’exprime en mètres cube par mole.
La définition (16.2) permet ainsi de définir une énergie interne molaire partielle upi si,
une enthalpie molaire partielle hpi si et une entropie molaire partielle spi si pour l’espèce
∂U ∂H ∂S
Ai dans la phase ψ, respectivement par uψ i = ψ
, hψ
i = ψ
et sψi = , chaque
∂ni ∂ni ∂nψi
dérivée partielle se calculant en gardant constantes toutes les autres variables de
Gibbs.
2 Théorème d’Euler : considérons une fonction f (x, y) de deux variables x et
y (on généralisera aisément le résultat à un nombre quelconque de variables). La
fonction sera dite homogène de degré q relativement à ses variables si, pour tout réel
λ, f (λx, λy) = λq f (x, y).
Ainsi, une grandeur thermodynamique extensive est fonction homogène de degré 1
des variables nψ i ; une grandeur thermodynamique intensive est fonction homogène
de degré 0 des mêmes variables. Dans d’autres domaines de la Physique, on rencontre
d’autres fonctions homogènes : dans une interaction newtonienne, l’énergie potentielle
est homogène de degré −1 en fonction des coordonnées d’espace ; l’énergie potentielle
élastique est homogène de degré 2 des mêmes coordonnées, etc.
La relation f (λx, λy) = λq f (x, y) est, à x et y fixés, vraie pour tout λ ; dérivée
∂f ∂f ∂f ∂f
relativement à λ, elle mène à x +y = qλq−1 f (λx, λy), les dérivées et
∂x ∂y ∂x ∂y
devant être calculées pour le couples de valeurs (λx, λy). Cette égalité peut s’écrire
∂f ∂f
pour λ = 1 sous la forme x +y = qf (x, y).
∂x ∂y
Dans le cas particulier d’une grandeur extensive, q = 1 si la liste des variables com-
prend toutes les quantités de matière, et exclusivement celles-ci ; nous écrirons donc
X ψ ∂E
le théorème d’Euler des fonctions extensives ni = E, les dérivées partielles
i,ψ ∂nψ
i
étant calculées à p et T constant. On notera donc encore :
16 : Le potentiel chimique 341
φ
N X
X
E= nψ ψ
i ei (16.3)
i=1 ψ=1
Cette relation, qui est la marque de l’extensivité de E, est la forme particulière de la loi
d’addition pour les grandeurs extensives ; on notera toutefois que l’addition concerne
des grandeurs molaires partielles, dérivées partielles calculées dans les conditions du
mélange, et non pas relatives aux corps purs qu’on aurait pu mélanger.
La loi d’addition simplifiée rencontrée pour l’énergie interne et l’enthalpie, au moins
de manière approchée, dans le cours de Thermochimie, ne s’applique pas dans le cas
général. On remarque expérimentalement, par exemple, qu’il n’y a pas addition des
volumes lors d’un mélange. La loi d’addition est encore moins vérifiée dans le cas des
grandeurs entropiques, du fait du caractère irréversible de l’opération de mixage.
16.1.3 Évolution des grandeurs extensives

2 Notations de Lewis : rappelons que, pour toute grandeur extensive
E évoluant
∂E
lors d’une réaction chimique, on a défini la dérivée ∆r E = ; en présence
∂ξ T,p

∂E
éventuellement de plusieurs réactions simultanées, on écrira ∆r Ep = :
∂ξp T,p,ξq
c’est la dérivée qui exprime la variation de la grandeur extensive E due à la seule
réaction numéro p.
La grandeur E étant a priori fonction des 2 + N φ variables de Gibbs, on écrira
∂E ∂E X ψ ψ
sa variation infinitésimale sous la forme dE = dT + dp + xi dni . Si la
∂T ∂p
i,ψ
réaction chimique numéro p est la seule cause de variation
X p de E, alors dT = 0, dp = 0
et dnψ i = ν p
i,ψ dξp , ce qui permet d’écrire dE = ν xψ
i,ψ i dξp ; on identifie ainsi la
i,ψ
dérivée partielle de Lewis :
φ
N X
X p ∂E
∆r Ep = νi,ψ xψ
i = (16.4)
i=1 ψ=1
∂ξp T,p,ξq ,q6=p
2 Exemple : considérons la réaction CH2 = CH2 + Cl2 ⇋ CH2 Cl − CH2 Cl menée

en solution aqueuse. Au cours de cette réaction, le volume V varie du fait de l’avan-
cement ξ de la réaction selon dV = ∆r V dξ, avec pour dérivée partielle (notation
de Lewis) ∆r V = −vCH2 CH2 − vCl2 + vCH2 ClCH2 Cl , chacune des grandeurs vA étant le
volume molaire partiel de A dans la solution aqueuse ; il s’agit, dans les trois cas, de
fonctions relativement complexes de la composition chimique, de la température et de
la pression dans le mélange réactionnel.
Le volume total V de la solution est donné par V = vCH2 CH2 n(CH2 CH2 ) + vCl2 n(Cl2 ) +
vCH2 ClCH2 Cl n(CH2 ClCH2 Cl) + vH2 O n(H2 O) ; aucun de ces volumes partiels n’ayant a
priori pas la même valeur dans une solution de composition différente, le volume V
de la solution étudiée (S) n’est en général pas égal à la somme des volumes Vk des
solutions (Sk ) qu’on pourrait mélanger pour obtenir (S).
16.2 Évolutions monobares et monothermes
16.2.1 L’enthalpie libre, potentiel thermodynamique

2 Notion de potentiel thermodynamique : considérons une évolution spontanée d’un
système isolé, mécaniquement et thermiquement. Le second principe de la Thermody-
namique affirme que l’entropie S de ce système augmentera au cours de toute évolution
spontanée, donc irréversible. Un état d’équilibre ne pourra être atteint que si S atteint
une valeur maximale et ne peut donc plus augmenter.
Par analogie avec la notion d’énergie potentielle en mécanique, on dira que −S est le
potentiel des évolutions des systèmes isolés : la décroissance du potentiel −S est un
critère d’évolution, et le minimum du potentiel −S est une condition d’équilibre.
2 Évolutions monobares et monothermes : le systèmes isolés thermiquement et méca-
niquement sont rares ; on s’intéressera plutôt dans la suite à des évolutions monobares
et monothermes, par exemple du fait d’un contact mécanique et thermique avec l’at-
mosphère, qui imposera dans les états d’équilibre initial et final sa pression pext et
sa température Text . Notons qu’au cours de l’évolution, il est tout à fait possible de
passer par des états tels que p 6= pext ou T 6= Text , ou même des états hors d’équilibre
pour lesquels on ne peut pas définir de pression ou de température unique dans le
système.
L’application des deux principes de la Thermodynamique à un tel système impose
δQ
dU = δW ′ −pext dV +δQ et dS = +δScréé , où δW ′ représente le travail des forces
Text
autres que les forces de pression, tandis que δScréé > 0 est la condition d’évolution
irréversible.
On peut éliminer δQ entre ces relations en écrivant dU + pext dV − Text dS 6 δW ′ , le
cas de l’égalité correspondant aux transformations réversibles. On peut encore définir
le potentiel de Gibbs G∗ = U + pext V − Text S pour écrire cette relation dG∗ 6 δW ′
ou encore, pour une transformation finie, ∆G∗ 6 W ′ .
Remarquant que p = pext et T = Text dans l’état initial comme dans l’état final de la
transformation, on a aussi G∗ = U + pV − T S dans ces deux états initial et final, et
on définit encore l’enthalpie libre de Gibbs :
G = U + pV − T S = H − T S (16.5)
Ainsi, G = G∗ dans l’état initial comme dans l’état final, donc ∆G = ∆G∗ ; on pour
donc écrire la condition d’évolution spontanée ∆G 6 W ′ ou encore −W ′ 6 −∆G′ :
cette relation se lit ainsi :
Interprétation de l’enthalpie libre

X Lors d’une transformation finie monobare monotherme, le système de
peut pas fournir à l’extérieur un travail −W ′ plus grand que la dimi-
nution −∆G de l’enthalpie libre G. Ce cas limite idéal n’est atteint que
dans le cas des transformations réversibles.
Dans la suite, nous nous intéresserons d’abord au cas où δW ′ = 0 ; alors, toute trans-
formation spontanée s’accompagne d’une diminution de G, ∆G 6 0, le cas d’égalité
correspondant à la condition d’équilibre.
Évolutions spontanées monobares monothermes

X Lors d’une évolution spontanée monobare monotherme en l’absence de
tout travail autre que des forces de pression, l’enthalpie libre G diminue ;
l’équilibre correspond donc au minimum de G.
On peut encore affirmer que l’enthalpie libre est le potentiel des transformations mo-
nobares et monothermes.
Dans la définition de G, on constate qu’une évolution spontanée doit réaliser un
compromis entre une diminution de H (critère énergétique) et une augmentation de
S (critère entropique).
2 Identités thermodynamiques : à partir de l’identité dU = T dS − pdV , la transfor-
mation U (S, V ) → H(S, p) = U + pV mène à l’identité dH = T dS + V dp, remplaçant
la variable V par p en à la fonction de départ U le terme de transformation
ajoutant
∂U
de Legendre pV = −V . On peut généraliser cette méthode de transformation
∂V S
pour définir quatre fonctions thermodynamiques mathématiquement équivalentes, se-
lon le schéma 16.1.
U (S, V ) +pV H(S, p) = U + pV
dU = T dS − pdV −pV dH = T dS + V dp
+
pV
−
−T S +T S −T S +T S
−
pV
T
+
S
T
S
F (T, V ) = U − T S +pV G(T, p)
dF = −SdT − pdV −pV dG = −SdT + V dp
Figure 16.1 – Fonctions énergétiques de la Thermodynamique
Ce schéma montre que G, fonction de Gibbs, est fonction des variables intensives (de
Gibbs) T et p, avec l’identité thermodynamique dG = −SdT + V dp. Toutefois, cette
identité a été établie pour un système ne subissant que des variations des paramètres
thermodynamiques T et p ; nous devons généraliser cette identité au cas où les autres
variables de Gibbs nψ i évoluent.
16.2.2 Potentiel chimique et affinité chimique

2 Potentiel chimique : la variation du potentiel thermodynamique G dans le cas
∂G ∂G X ∂G ψ
le plus général peut s’écrire dG = dT + dp + dni ; les deux premières
∂T ∂p ∂nψ
i
i,ψ
dérivées partielles étant calculées à composition chimique constante, on les identifie

∂G ∂G
immédiatement à = −S et = V comme sur le tableau 16.1 ; quant aux autres
∂T ∂p
∂G
dérivées , il s’agit des grandeurs molaires partielles giψ associées à G.
∂nψi
Du fait de l’importance de la fonction G, ces grandeurs molaires partielles ont reçu
∂G
un nom spécifique : giψ = porte le nom de potentiel chimique de l’espèce Ai dans
∂nψ
i
la phase ψ du mélange étudié ; on le note µψ
i et :
φ
N X
X
dG = −SdT + V dp + µψ ψ
i dni (16.6)
i=1 ψ=1
Ce potentiel chimique est une grandeur intensive qui se mesure en joules (ou plus
souvent kilojoules) par mole. La localité des interactions chimiques (qui ne dépendent
souvent que des termes d’interaction à courte distance) explique que le potentiel chi-
mique µψi est en général une fonction de la seule composition chimique de la phase
ψ, en plus des grandeurs intensives p et T : il ne dépend pas de la présence ou de la
composition des autres phases.
2 L’enthalpie libre en fonction des potentiels chimiques : la fonction G étant extensive,
on peut aussi réécrire la relation générale d’extensivité 16.3 sous la forme :
φ
N X
X
G= nψ ψ
i µi (16.7)
i=1 ψ=1
Remarquons qu’on
X peut encore évaluer la différentielle dG à partir de (16.7) sous la
forme dG = ψ ψ
dni µi + nψ ψ
i dµi et, en comparant le résultat obtenu à (16.6), on
i,ψ
obtient l’identité de Gibbs-Duhem :
φ
N X
X
dµψ ψ
i ni = −SdT + V dp (16.8)
i=1 ψ=1
16.3 Affinité chimique
16.3.1 Définition
2 Affinité : la relation générale (16.4) devient, dans le cas particulier de l’enthalpie
XN X φ
p
libre, ∆r Gp = νi,ψ µψ
i . Toutefois, comme on s’intéresse à une condition de
i=1 ψ=1
diminution de l’enthalpie libre, on s’intéresse à l’opposé de la dérivée de Lewis, qui
prend le nom d’affinité chimique de la réaction numéro p :
φ
N X
∂G X p
Ap = −∆r Gp = − Ap = − νi,ψ µψ
i (16.9)
∂ξp T,p,ξq ,q6=p i=1 ψ=1
2 Cas d’une réaction unique : dans le cas très courant d’une réaction chimique
unique, la relation (16.9) prend la forme :

∂G
A = −∆r G = − (16.10)
∂ξ T,p
Ainsi, une évolution spontanée

se faisant dans le sens d’une diminution de G, l’étude
∂G X
du signe de sa dérivée = −A, avec A = − νi,ψ µψ
i , nous renseignera
∂ξ T,p
i,ψ
directement sur le sens effectif d’évolution de la variable ξ au cours du temps.
16.3.2 Équilibre et évolution chimiques

2 Condition d’équilibre : puisque G évolue vers un minimum atteint à l’équilibre,
on pourra définir une condition d’équilibre :
Condition d’équilibre chimique

X La p-ième réaction chimique est à l’équilibre lorsque son affinité chimique
Ap s’annule.
2 Condition d’évolution : en dehors de l’état d’équilibre, lors d’une évolution à T et

r
X
p fixés, on pourra écrire dG = − Ap dξp ; en particulier, en présence d’une réaction
p=1
chimique unique (ou si l’avancement d’une seule réaction est variable, les autres étant
par exemple arrêtées par défaut d’un réactif limitant), le signe de −dG sera celui de
Adξ. Puisque G doit diminuer, on en conclut que Adξ doit être positif :
Condition d’évolution chimique

X Lorsqu’une réaction chimique a lieu seule à pression et température
fixées, la réaction évolue dans le sens direct −→ (ou sens 1) lorsque
A > 0 ; elle a lieu dans le sens inverse ←− (ou sens 2) lorsque A < 0.
Cette propriété justifie la dénomination (( affinité chimique )) : on peut dire que les
réactifs ont une affinité (positive) les uns pour les autres lorsque la réaction progresse,
donc lorsque A > 0.
2 Exemple : reprenons l’exemple de la réaction CH2 = CH2 +Cl2 ⇋ CH2 Cl − CH2 Cl,
pour laquelle on peut écrire A = µCH2 CH2 + µCl2 − µCH2 ClCH2 Cl ; la réaction évoluera
dans le sens direct −→ si la somme des potentiels chimiques des réactifs dépasse le
potentiel chimique du produit, donc dans le sens d’une diminution de cette somme de
potentiels chimiques : c’est cette circonstance qui justifie l’emploi du terme (( potentiel
chimique )) pour la dérivée partielle µψ
i .
16.4 Équilibre entre plusieurs phases
16.4.1 Condition d’équilibre

2 Expression générale : la condition d’évolution spontanée d’un système à tempé-
rature et pression fixées est dG < 0 soit, compte tenu de l’identité thermodynamique
(16.6), la condition :
φ
N X
X
dGT,p fixés = µψ ψ
i dni 6 0 (16.11)
i=1 ψ=1
Dans cette expression, l’égalité correspond soit à une évolution réversible, soit au cas
où G atteint son minimum, c’est-à-dire à la condition d’équilibre.
2 Cas d’un, corps sous deux phases : on peut en particulier s’intéresser au cas d’un
seul corps A (N = 1) pouvant changer d’état, c’est-à-dire en général présent dans
deux phases (φ = 2), que nous noterons α et β. La condition (16.11) prend alors la
β β
forme simple dG = µα α
A dnA + µA dnA 6 0. Comme de plus la conservation
de la matière
β β β
impose dnα α
A + dnA = 0, la condition d’évolution s’écrit dnA µA − µA > 0.
Ainsi, l’espèce A quittera la phase où son potentiel chimique est le plus élevé puisque
dnβA > 0 correspond à µα β
A > µA et réciproquement ; enfin, l’équilibre entre les deux
phases sera atteint si G atteint son minimum, donc si dG = 0 :
Équilibre entre phases

X Il y a équilibre entre deux phases d’un même corps pur lorsque le poten-
tiel chimique de ce corps A a même valeur dans les deux phases α et β
β
où il est présent : µα
A = µA .
16.4.2 Règle des phases

2 Fractions molaires : pour définir de manière intensive la composition chimique
de la phase ψ, on introduit les fractions molaires dans une phase par les relations :
nψ nψ
xψ
i = P N
i
= i
(16.12)
j=1 nψ
j
ni
Bien qu’il soit formellement possible d’étendre la définition ci-dessus à une réunion
de plusieurs phases, voire au système tout entier, nous ne le ferons pas dans la suite :
les fractions molaires ne sont définies qu’à l’intérieur d’une phase donnée.
On a alors la relation évidente entre fractions molaires :
N
X
xψ
i =1 pour toute phase ψ (16.13)
i=1
2 Variance : les potentiels chimiques sont des fonctions d’état intensives, dont on
a vu qu’elles imposent, à l’équilibre, certaines relations entre les paramètres intensifs
formés de la température T , de la pression p, et des N φ paramètres intensifs de
nψ
composition que sont les fractions molaires xψ i = i
.
nψ
i
Ainsi, ces N φ + 2 paramètres intensifs ne sont pas indépendants ; le nombre de pa-

ramètres intensifs effectivement indépendants porte le nom de variance, et nous le
noterons v.
Un système physico-chimique de variance v permet à l’opérateur de fixer au plus v

paramètres intensifs de composition sans empêcher la réalisation des conditions d’équi-
libre ; par contre, si on essayer de fixer un nombre de paramètres intensifs supérieur à
v, on rendra forcément impossible au moins une des conditions d’équilibre (physique
ou chimique), et un de ces équilibres sera rompu. S’il s’agit d’un équilibre chimique, il
y aura par exemple disparition d’un réactif limitant ; dans le cas d’un équilibre entre
phases, une phase disparaı̂tra, etc.
Variance
X On appelle variance v d’un système physico-chimique le nombre maxi-
mum de paramètres intensifs, choisis parmi T , p et les fractions molaires
xψi , qu’un opérateur peut librement fixer sans rompre nécessairement
l’équilibre.
Il est important de remarquer que ce décompte ne concerne que les paramètres in-
tensifs. Il n’est pas possible de faire un décompte analogue des paramètres extensifs,
puisque par exemple un opérateur peut librement doubler toutes les quantités de
matière du système physico-chimique sans modifier aucunement l’équilibre.
2 Règle des phases : il s’agit du décompte effectif de la variance, obtenu en retirant

au nombre N φ+2 de paramètres intensifs le nombre de relations entre ces paramètres.
Il s’agit :
N
X
• pour chaque phase, de la relation xψ
i = 1 ; on dispose ainsi de φ relations
i=1
indépendantes ;
β
• pour chaque couple de phases, de la relation µα i = µi exprimant l’équilibre de
l’espèce Ai entre les phases α et β. Notons que si une espèce est absente d’une
phase, on dispose d’une relation de moins, mais il existe une inconnue de moins
puisque la fraction molaire correspondante est nulle. Au total, on fixe ainsi
N × (φ − 1) relations indépendantes ;
• pour chaque réaction chimique, de la relation Ar = 0 ; on dispose ainsi de r relations
indépendantes ;
• enfin, de toutes les k relations supplémentaires imposées par exemple par la stœ-
chiométrie spécifique des conditions initiales.
Finalement, v = N φ + 2 − φ − N φ + N − r − k s’écrit aussi :
v =N −r+2−φ−k (16.14)
où on note parfois c = N −r ; cette relation est connue sous le nom de règle des phases
de Gibbs.
2 Exemples : considérons un système physique formé d’une seule espèce présente
sous deux phases, en l’absence de toute réaction chimique et de toute relation spéci-
fique ; on aura donc N = 1, φ = 2, r = k = 0 donc v = 1 ; on dit que le système est
monovariant. Ainsi, l’opérateur peut fixer seulement la pression p, l’équilibre imposera
la valeur de la température de changement d’état T ∗ (p). Il n’y a ici pas de variable de
composition puisque le corps est pur dans chacune des deux phases où il est présent.
Considérons maintenant les deux équilibres chimiques de déshydratation des hy-
droxydes de cuivre et d’argent, à savoir 2Ag(OH)2 solide ⇋ Ag2 Osolide + 2H2 Ogaz et
2Cu(OH)2 solide ⇋ Cu2 Osolide + 2H2 Ogaz ; à haute température, la vapeur d’eau forme
une phase gazeuse et les deux oxydes et les deux hydroxydes forment quatre phases
solides non miscibles ; en présence des deux réactions indépendantes, N = 5, φ = 5 et
r = 2 donc v = 0 ; on dit que le système est zérovariant ou nilvariant. Un opérateur
ne peut rien imposer à l’équilibre puisque les deux conditions d’équilibre chimique
p2 p2
imposent respectivement K1 (T ) = ◦ 2 et K2 (T ) = ◦ 2 , p désignant la pression par-
p p
tielle de vapeur d’eau qui, en l’absence de toute autre espèce dans la phase gazeuse,
se confond avec la pression totale. Cette double condition n’est possible que pour une
valeur fixée de T , qui à son tour impose une valeur fixée de p.
Considérons enfin la réaction chimique de dissociation de l’eau en oxygène et hydro-

gène, 2H2 O ⇋ 2H2 + O2 ; menée en phase homogène gazeuse, avec donc φ = r = 1 et
N = 3 on obtient en général v = 3 : le système est trivariant. L’existence d’une condi-
tion d’équilibre chimique et de la relation xH2 O +xH2 +xO2 = 1 fixe bien deux relations
entre les cinq paramètres T , p, xH2 O , xH2 et xO2 . Toutefois, si on part de vapeur d’eau
initialement pure, la stœchiométrie de la réaction impose de plus xH2 = 2xO2 ; cette
relation supplémentaire, imposée par les conditions initiales, correspond à k = 1 donc
v = 2 ; après cette réduction de la variance, le système physico-chimique n’est plus
que divariant.
16.5 Évolutions et Physique statistique
16.5.1 Entropie et évolutions spontanées
2 Création d’entropie : au cours d’une réaction chimique spontanée isobare et iso-

therme, on peut écrire dG = δW +δQ−pdV −T dS qui s’écrit encore −dG = T δScréé ;
ainsi, la diminution de l’enthalpie libre est une mesure directe de l’enthalpie créée,
A
avec δScréé = dξ. L’augmentation d’entropie qui résulte des réactions spontanées
T
ou plus généralement des transformations spontanées admet une interprétation mi-
croscopique.
Considérons par exemple une réaction de dissolution d’une espèce ionique dans l’eau,
H2 O
par exemple de bilan NaClsolide −→ Na+ + Cl+ . Cette réaction est spontanée, ce qui
se traduit par une forte diminution de G lors de la dissolution. L’étude quantitative
montre que cette diminution ne peut pas s’interpréter seulement par une diminution
de l’enthalpie H ; il y a aussi une forte augmentation de l’entropie S.
CV dT + pdV Cp dT − V dp
Si on se rappelle les expressions dS = ou dS = établies
T T
pour un gaz parfait, on retrouvera donc une forte augmentation d’entropie dans divers
cas :
• dans le cas de la dissolution d’un solide ionique, lors de la dispersion des ions qui
le formaient dans le solution aqueuse ;
• pour un gaz en évolution isotherme, lors d’une augmentation de volume (ou d’une
diminution de pression) qui disperse les molécules du gaz à une plus grande
distance moyenne les unes des autres ;
• pour un gaz en évolution isobare ou isochore, lors d’une augmentation de la tem-
pérature, qui augmente l’agitation thermique des molécules du gaz.
Nous admettrons la généralisation de ces affirmations sous la forme générale :
Interprétation statistique de l’entropie

X L’entropie d’un système thermodynamique est une mesure du désordre
moléculaire ; elle augmente lorsque les évolutions macroscopiques du sys-
tèmes diminuent l’information disponible sur l’état microscopique des
particules qui composent ce système.
Dans certains cas, cette interprétation qualitative permet de justifier les sens d’évo-
lution physique ou chimique calculés à partir des propriétés des potentiels chimiques.
2 Macroétats et microétats : lorsqu’on affirme qu’un système thermodynamique,
donc macroscopique, se trouve dans un macroétat M donné (défini par un certain
ensemble de variables d’état), on ne précise en fait pas complètement son état mi-
croscopique puisqu’il peut se trouver dans n’importe lequel des Ω(M ) microétats m
correspondant à M , macroscopiquement indiscernables.
L’hypothèse fondamentale de la thermodynamique statistique est l’équiprobabilité
de tous les microétats possibles d’un système isolé, c’est-à-dire compatibles avec les
différentes lois mécaniques décrivant le système. Ainsi, un système (Σ) isolé d’énergie
interne totale U peut se trouver, à un certain instant, dans n’importe quel microétat
N
X
tel que l’énergie totale des particules soit égale à U , ǫi = U .
i=1
Ce système, même lorsqu’il a atteint l’équilibre macroscopique, reste en évolution

rapide au niveau microscopique, le système passant de l’un à l’autre des Ω(M ) mi-
croétats possibles. Observer un système thermodynamique, c’est donc observer une
moyenne entre ces microétats qui se succèdent. Manifestement, du fait de l’hypothèse
d’équiprobabilité, le système thermodynamique passera la plupart de sont temps dans
le macroétat µ qui réalise la plus grande valeur possible de Ω(M ), et ceci de façon di-
rectement proportionnelle à ce nombre Ω(M ). Ainsi, les systèmes thermodynamiques
isolés évoluent-ils tous spontanément vers le macroétat le plus probable, c’est-à-dire
qui réalise la valeur de Ω(M ) la plus élevée.
On peut donner une illustration des nombres mis en jeu dans le cas simple des systèmes
constitués de particules à deux états seulement, comme par exemple des particules qui
peuvent être soit à droite, soit à gauche d’une boı̂te divisée en deux compartiments
égaux (cf. figure 16.2).
b4
b3
b2
b1 b5 b6
Figure 16.2 – Exemple de système simple
Si ce système contient en tout N particules (sur la figure, N = 6), le macroétat

caractérisé parD particules
à droite (ici D = 2) peut être réalisé de Ω(D) façons,
D N!
avec Ω (D) = = ; la fonction de distribution Ω(D) admet son
N D! (N − D)!
N
maximum pour D = , avec un pic très resserré si N ≫ 1.
2
2 Entropie statistique : la fonction Ω(M ) caractérise un macroétat M donné, et

c’est donc une fonction d’état. Puisque, au cours d’une évolution spontanée, Ω(M )
augmente, cette fonction pourrait être un candidat pour une fonction entropie définie
de façon uniquement statistique, à condition d’avoir les autres propriétés de l’entropie ;
et en particulier à condition d’être extensive.
Considérons donc deux systèmes thermodynamiques (Σ1 ) et (Σ2 ) et juxtaposons-les
par la pensée. Un macroétat M du système (Σ) global est défini par la donnée des
deux macroétats particuliers M1 et M2 de (Σ1 ) et (Σ2 ). Comme ces deux macroé-
tats sont réalisés de façon indépendante –les deux systèmes étant sans interaction–,
respectivement par Ω1 (M1 ) et Ω2 (M2 ) microétats, on en conclut immédiatement que
Ω(M = (M1 , M2 )) = Ω1 (M1 )×Ω2 (M2 ) ce qui montre qu’on peut choisir pour fonction
entropie statistique :
S = k ln Ω (16.15)
pour toute constante positive k ; de façon générale, l’entropie statistique mesure ainsi
l’étendue de l’ignorance relativement à l’état microscopique d’un système, pour un ob-
servateur qui n’en connaı̂t que l’état macroscopique ; c’est ce qu’on appelle en général
la mesure du désordre moléculaire sous-jacent à la donnée d’un macroétat.
Cette interprétation statistique de l’entropie est due à Boltzmann‡ ; on va mon-
trer qu’on peut l’identifier à l’entropie classique sous réserve du choix pour k de la
constante de Boltzmann kB .
2 Constante de Boltzmann : considérons à nouveau le système de la figure 16.2, et
imaginons qu’il décrit un gaz parfait qui subit une détente de Joule, Gay-Lussac qui
double son volume. Dans l’état initial, toutes les N molécules sont du même côté de la
paroi et l’entropie du système vérifie Si = k ln Ω(0) = k ln 1 = 0. Par contre, dans l’état
final, l’entropie du système peut s’écrire Sf = k ln Ω(N/2) = k [ln(N !) − 2 ln ((N/2)!)].
Vu les valeurs élevées de N pour tous les systèmes thermodynamiques, on se contentera
ici de l’expression approchée de Stirling : pour n assez grand, ln n! ≃ n ln n − n.
Ainsi, la variation d’entropie lors de la détente de Joule,Gay-Lussac s’exprime selon
N
∆S = Sf − Si soit ∆S = k N ln N − N − N ln + N ou enfin S = kN ln 2.
2
Un calcul classique de la même variation d’entropie se fait selon dU = T dS − pdV
p dV
soit, la détente de Joule- Gay-Lussac étant isotherme, dS = dV = nR ; l’aug-
T V
mentation d’entropie lors de la détente envisagée ici vaut ∆S = nR ln 2 = N kB ln 2
où kB est la constante de Boltzmann.
Ce résultat, conforté par des études menées notamment dans le cadre quantique per-
mettent de montrer que l’entropie statistique coı̈ncide bien avec l’entropie classique à
R
condition de choisir pour k la constante de Boltzmann k = kB = .
NA
16.5.2 Principe de limite thermique

2 Lien entre énergie et nombre de microétats : la fonction Ω(U ), tout comme la
fonction entropie S = kB ln Ω(U ), augmente pratiquement toujours très fortement
avec U . Il s’agit d’une conséquence logique de la structure quantique de la matière ;
si on se souvient en effet de l’existence, pour chacun des N atomes ou molécules d’un
échantillon macroscopique, d’une liste d’états d’énergie croissante, on réalise que, plus
l’énergie totale est élevée, plus le nombre de façons de la réaliser l’est aussi.
Prenant pour exemple un système de N particules dont tous les états d’énergie sont
régulièrement espacés de ǫ. Il existe une seule façon de réaliser l’état d’énergie mini-
male U = 0 : toutes les particules doivent être dans l’état fondamental. Il existe N
façons de réaliser l’état d’énergie U = ǫ, selon la particule qu’on place au premier
N (N − 1) N2
niveau excité ; de même, il existe ≃ façons de réaliser l’état d’énergie
2 2
U = 2ǫ, etc.
Inversement, la quasi totalité de systèmes thermodynamiques condensés en phase
cristalline réalisent, à basse température, un état d’entropie minimale, voire nulle
dans certains cas, avec un seul microétat correspondant au macroétat de plus basse
énergie possible : si U = Umin alors Ω(U ) → 1 et donc S → 0.
2 Énoncé du principe : l’ensemble des considérations qualitatives ci-dessus justifie
le principe de Nernst ou principe de limite thermique (aussi appelé troisième principe
de la thermodynamique), dont nous admettrons la généralisation à tous les systèmes
thermodynamiques :
Principe de limite thermique
X L’entropie S de toutes les phases condensées tend vers zéro lorsque la
température du système tend vers zéro.
Ainsi, l’entropie n’est pas définie à une constante arbitraire près ; il existe un état de
référence d’entropie nulle, même s’il est impossible à réaliser en pratique et ne peut
donc être déterminé que par extrapolation.
Remarquons que, s’il n’en allait pas ainsi, l’enthalpie libre G = H −T S, qui dépendrait
des états de référence choisis pour H et pour S, serait définie à une fonction affine
arbitraire de T près ! Il n’en est rien et nous verrons ultérieurement comment la donnée
d’une seule constante arbitraire, relative à l’enthalpie H, suffit à déterminer G. Cette
constante a d’ailleurs déjà été définie dans le cours de Thermochimie : c’est l’enthalpie
de formation.
16.6 Expressions du potentiel chimique
16.6.1 Propriétés générales

2 Importance : l’emploi des propriétés énoncées ci-dessus pour le potentiel ther-
modynamique G des transformations monothermes et monobares impose de savoir
calculer G, et donc ses dérivées partielles que sont les potentiels chimiques. Nous
allons ici apprendre à identifier certaines expressions simples du potentiel chimique.
2 Variables de composition : le potentiel chimique µψi de l’espèce Ai dans la phase
ψ dépend, comme on l’a vu, de la température T , de la pression p, et en général de
la seule composition chimique de la phase ψ : il est indépendant de la présence et de
la composition d’autres phases.
Le potentiel chimique est d’autre part une grandeur intensive ; il de dépend donc pas
des quantités de matière nψ
j dans la phase ψ (avec j = 1, . . . , N ) mais seulement de
leurs valeurs relatives, donc des fractions molaires déjà définies.
Nous considérerons toujours dans la suite que les potentiels chimiques sont des fonc-
tions de T , p et des N − 1 fractions
molaires indépendantes de la phase ψ, sous la
forme µψi = µψ
i T, p, xψ
j j=1,···N .
Dans le cas d’un mélange idéal de gaz parfaits, pV = nRT et pi V = ni RT donc

pi
xi = et la fraction molaire est égale à la pression partielle relative (loi de Dalton).
p
On peut aussi définir le volume Vi qu’occuperaient les ni moles de l’espèce i si elles
étaient amenées à la pression p du mélange à la même température T par pVi = ni RT ,
ce qui permet encore d’écrire xi = Vi /V , ce qui justifie le nom de pourcentage en
volume parfois donné aux fractions molaires des phases gazeuses ; Ainsi, dire que l’air
contient 21 % d’oxygène en volume revient à affirmer que la fraction molaire de O2
est égale à xO2 = 0, 21 dans l’air.
16.6.2 Influence de T et p sur le potentiel chimique

2 Influence de la température : considérons le cas particulier d’une phase unique,
α
présentant un constituant
unique A, pour lequel on peut donc
écrire G = nµA = nµ.
∂G ∂µ
La relation générale = −S permet ici d’écrire = −s, où on a appelé
∂T p,n ∂T p
s l’entropie molaire de ce corps pur dans cette phase.
Cette entropie molaire est en général une fonction relativement complexe de T et
p ; pour cette raison, les données thermodynamiques doivent permettre une prise en
compte phénoménolgique des variations de température ; en particulier, il n’existe
en général pas de température privilégiée pour laquelle l’expression des potentiels
chimiques serait simple.
Nous ne définirons donc pas de température standard ; l’étude d’un problème thermo-
dynamique à la température T exige la lecture de tables prévues pour cette tempéra-
ture, ou bien la prise en compte de tables de correction de température (comme les
lois de Kirchhoff établies dans le cours de Thermochimie).

∂G
2 Influence de la pression : dans le même cas que ci-dessus, = V donc
∂p T,n

∂µ
= v, qui est le volume molaire de ce corps dans cette phase. Le volume
∂p T
molaire est en général une fonction assez simple de T et p ; ainsi, pour un gaz parfait,
RT
v= ; pour une phase condensée (liquide ou solide), v est pratiquement constant
p
et de toutes façons assez faible. Pour cette raison, les données thermodynamiques
permettent une compensation aisée des effets de la pression.
Nous définirons donc dans la suite une pression standard, égale à p◦ = 1 bar ; l’étude
d’un problème thermodynamique à la pression p 6= p◦ exige bien sûr une compensa-
tion, qui sera simple dans tous les cas. La quasi-totalité des tables thermodynamiques
sont par ainsi construites par convention pour la pression standard.
16.6.3 Potentiel chimique en phase gazeuse

2 Potentiel chimique d’un gaz parfait : considérons un gaz parfait unique A, seul
dans sa phase GP. Le potentiel chimique correspondant s’identifie à l’enthalpie libre
molaire Gm de ce gaz, puisque G(T, p, n) = nGm (T, p). L’identité thermodynamique
dGm = −Sm dT + Vm dp où Sm est l’entropie molaire et Vm = RT /p le volume molaire
du gaz parfait.
Z p
RT
On en déduit immédiatement que Gm (T, p) − Gm (T, p◦ ) = dp que l’on écrira
p◦ p
p
encore µGP (T, p) = µGP (T, p◦ ) + RT ln ◦ . C’est cette expression que nous choisirons
p
de généraliser, en notant µ◦,GP (T ) = µGP (T, p◦ ) le potentiel chimique du corps A

dans l’état de référence, formé du gaz pur A à la température T et à la pression p◦ .
La différence entre le potentiel chimique dans l’état (T, p) et le potentiel chimique dans
p
l’état de référence (T, p◦ ) fait intervenir l’activité a = ◦ , sous la forme générale :
p
µψ
i = µ◦,ψ
i +RT ln aψi (16.16)
|{z} |{z}
état de référence acivité
avec dans le cas d’un gaz parfait les expressions de l’activité et de l’état de référence :
Potentiel chimique d’un gaz parfait pur

État de référence Activité ai
X Gaz parfait, pur µ = µ◦ GP

(T )
p
p◦
p = p◦ = 1 bar, T
Attention à ne pas confondre affinité chimique A et activité a ; ces deux grandeurs

interviendront toutes deux dans les conditions d’équilibre physique ou chimique mais
n’ont pas la même signification, ni la même unité : A se mesure en joule par mol,
et a est un nombre pur.
2 Mélange idéal de gaz parfaits : considérons (cf. figure 16.3) n1 moles du gaz parfait
G1 , sous la pression p1 , à la température T ; ce gaz occupe le volume V = n1 RT /p1 .
Avant de le mélanger à n2 moles du gaz parfait G2 , on va porter celui-ci à la même
température T et sous la pression p2 telle que le gaz occupe lui aussi le volume V ;
ainsi on doit avoir p2 V = n2 RT .
S
p1 , V, n1 , T p2 , V, n2 , T
v
P
Figure 16.3 – Mélange idéal de gaz parfaits
Le mélange se fait en retirant la séparation S, donc sans aucun apport d’énergie

mécanique ; si les parois du système sont adiabatiques, l’énergie totale du système
est conservée (sauf en cas de réaction chimique entre les gaz, ce que nous exclurons
ici). En particulier, si le mélange se comporte comme un gaz parfait, il conserve la
température T des constituants du mélange puisque Uf = U1 + U2 .
Par contre, chaque molécule du mélange ainsi formé se voit offrir un volume plus
important, et on s’attend donc à une perte d’information sur les microétats, donc à
une augmentation de l’entropie : le mélange est bien sûr irréversible. Pour restituer
l’entropie de départ, on peut imaginer de déplacer le piston P de la figure 16.3 dans le

sens indiqué par v, tout en maintenant constante la température T , jusqu’à ramener
le volume total de 2V à V . Si le mélange s’est comporté comme un gaz parfait, la
température et le volume en fin de transformation étant T et V , la pression totale
RT n1 p n2 p
vaut p = (n1 + n2 ) et les pressions partielles p1 = et p2 = sont
V n1 + n2 n1 + n2
égales aux pressions initiales des gaz qui ont été mélangés.
Au cours de ce déplacement du piston, on a diminué l’espace offert à chaque molécule
du mélange ; chacune de ces molécules se retrouve en fin de mélange dans le même
environnement géométrique que celui qu’elle avait avant le mélange. Nous admettrons
donc que l’entropie en fin d’opération est identique à l’entropie de départ. On peut
aussi dire que l’augmentation d’entropie due au mélange (irréversible, système isolé) a
été compensée par la diminution d’entropie de la compression (isotherme, réversible).
L’ensemble de cette transformation a conservé la température donc l’énergie interne
et l’enthalpie, mais aussi les pressions partielles, ainsi que l’entropie S. On en déduit
que G = H − T S n’a pas non plus été modifiée par le mélange, ce qui permet de
redéfinir un mélange idéal :
Mélange idéal de gaz parfaits
X On appelle mélange idéal de gaz parfaits le résultat du mixage de gaz
parfaits, qui, s’il est réalisé à température T et pressions partielles pi
constantes, conserve aussi les fonctions d’état U , H, S et G.
2 Potentiel chimique en mélange idéal : dans un tel mélange de deux gaz on peut
écrire, conformément à ce qui précède, G = G1 + G2 , où G1 et G2 sont déterminées
n1 p n2 p
avant mélange, soit G = n1 µ◦1 (T )+n1 RT ln +n2 µ◦2 (T )+n2 RT ln . On
n 1 + n2 n1 + n2
∂G
en déduit alors µ1 = où on dérive la somme des trois termes n1 µ◦1 (T ),
∂n1 n2 ,T,p
n1 RT ln(n1 p) et −(n1 + n2 )RT ln(n1 + n2 ) pour obtenir respectivement les dérivées
µ◦1 (T ), 1 + RT ln(n1 p) et −1 − RT ln(n1 + n2 ). Sommant les trois termes, on obtient
n1 p
µ1 = µ◦1 (T ) + RT ln , ce qui permet d’identifier la forme générale (16.16) avec
n1 + n2
les expressions de l’activité et de l’état de référence :
Potentiel chimique d’un gaz parfait en mélange idéal
X Gaz parfait, pur µ = µ◦ GP

(T )
pi
◦
p
= xi ◦
p p
p = p◦ = 1 bar, T
2 Mélange gazeux quelconque : l’étude de mélanges de gaz non parfaits se fait

toujours conventionnellement à partir du modèle du mélange idéal, auquel on apporte
une rectification, connue sous le nom de coefficient d’activité γi :
Potentiel chimique d’un gaz en mélange quelconque
X Gaz pur µ = µ◦ G
(T ) γi
pi p
= γi xi ◦
p◦ p
p = p◦ = 1 bar, T
Le coefficient d’activité de tous les constituants d’un mélange de gaz réels tend vers
1 lorsque la pression du mélange tend vers zéro : tout mélange devient un mélange
idéal de gaz parfaits à basse pression.
On remarquera que, dans toutes les phases gazeuses, l’état de référence se confond
avec l’état standard à la température T : corps pur et pression p = p◦ = 1 bar.
16.6.4 Potentiel chimique en phase liquide
2 Solutions idéales : les mélanges liquides (quand ils sont possibles ; tous les liquides
ne sont pas miscibles) s’éloignent en général beaucoup des mélanges idéaux de gaz
parfaits. Toutefois, il existe certaines situations exceptionnelles pour lesquelles les
propriétés physiques des molécules des deux liquides mélangées sont assez semblables
pour qu’on puisse parler de mélange idéal.
Un tel mélange idéal sera l’analogue d’un mélange idéal de gaz parfaits pour ce
qui concerne l’influence des concentrations (c’est-à-dire, des fractions molaires) ; par
contre, il ne le sera pas pour ce qui concerne l’influence de la pression qui est,
comme on l’a vu, bien plus réduite pour les phases condensées. Ainsi, nous défini-
rons le mélange idéal réalisé à la pression p par l’expression du potentiel chimique
µi (T, p, xi ) = µ◦i (T, p) + RT ln xi ; ainsi, l’état de référence, atteint pour xi = 1, est le
corps pur seul dans sa phase liquide.
Son potentiel chimique µ◦i (T, p) dépend toujours de la température, mais très peu de
la pression puisqu’on peut écrire
G◦ = nµ◦i (T, p) pour n moles de ce corps pur, et
∂µi
dG = −SdT + V dp impose ici = vi◦ , volume molaire de ce liquide pur.
∂p T
Le volume molaire d’un liquide reste en général faible, et souvent constant ; par
exemple pour l’eau liquide, v ◦ = 18 × 10−3 L · mol−1 donc la variation de poten-
Z p′
tiel chimique associée est µ◦i (T, p′ ) = µ◦i (T, p) = vi◦ dp ≃ vi◦ (p′ − p) ; elle sera
p
souvent négligeable devant les termes de l’ordre de RT puisque, avec T = 300 K, il
RT
faudrait une variation de pression p′ − p de l’ordre de ◦ ∼ 1 400 bar pour qu’il n’en
vi
aille pas ainsi.
Finalement, nous devrons distinguer l’état de référence de l’état standard, mais en

remarquant que la différence reste toujours faible :
Potentiel chimique d’un liquide en mélange idéal

X Liquide pur µ = µ◦ L (T, p) xLi =

nLi
nL
p, T
Le potentiel
◦ Lchimique
de l’état de référence dépend un peu de la pression,
∂µ ◦
avec = v ; on négligera souvent cette variation.
∂p T
Le cas des solutions liquides réelles peut être pris en compte, comme dans le cas des
gaz, par la définition et la mesure d’un coefficient d’activité ; on écrira alors :
Potentiel chimique d’un liquide en mélange réel

X Liquide pur µ = µ◦ L (T, p) γi xLi = γi

nLi
nL
p, T
Le potentiel
◦ Lchimique
∂µ
avec = v ◦ ; on négligera souvent cette variation.
∂p T
On observe expérimentalement que le coefficient d’activité tend vers 1 (et la solution

se comporte comme une solution idéale) dans deux cas :
• lorsque les structures électroniques des constituants du mélange sont presque iden-
tiques : ainsi, l’environnement électronique d’une molécule dans le mélange est
presque le même que l’environnement électronique de la même molécule dans le
corps pur ; elle ne subit que l’effet de dilution avec xLi < 1 ;
• lorsque l’espèce Ai étudiée est fortement majoritaire ; là aussi, on explique cette
propriété en remarquant qu’un composant majoritaire d’un solvant a un envi-
ronnement électronique presque inchangé par rapport à la situation où il est
pur. De plus, on doit avoir µi → µ◦i lorsque xi → 1 puisqu’on retrouve le cas du
corps pur ; il faut donc que ln(γi xi ) → 0, donc γi → 1.
2 Solutions diluées : une telle solution est formée d’un solvant S majoritaire (xS / 1)
et d’un (ou plusieurs) soluté(s) A fortement dilué(s) (xA ≪ 1). Nous pouvons consi-
dérer que l’environnement chimique de chaque molécule du solvant est suffisamment
semblable à celui du corps pur pour qu’on puisse le traiter comme une solution idéale,
et nous écrirons donc µS (T, P, xS ) = µ◦S (T, p) + RT ln xS :
Potentiel chimique du solvant d’une solution diluée

X Solvant liquide pur µ = µ◦ L (T, p) xLS / 1

p, T
Le potentiel
◦ Lchimique
∂µ ◦
∂p T
C’est une erreur courante que d’oublier de prendre en compte le solvant et les
variations de son potentiel chimique dans l’étude de l’enthalpie libre G =
X
ni µi
i
du mélange liquide ; en effet, même si le solvant n’apparaı̂t pas dans les bilans des
équations chimiques qui ont lieu dans la solution, sa quantité de matière est toujours
prépondérante. Du fait de la valeur élevée de nS , le coefficient nS µS n’est jamais
négligeable, pas plus que les variations dues au terme RT ln xS .
Considérons une solution comportant un solvant S et un soluté unique A ; considérons

alors une variation isotherme et isobare de la composition de cette phase liquide. La
relation de Gibbs-Duhem (16.8) mène dans ce cas à nLS dµLS + nLA dµLA = 0, ce qu’on
écrira plutôt xLS dµLS + xLA dµLA = 0. D’autre part, µLS = µ◦S L (T, p) + RT ln xLS donc
dxLS dxLS dxLA

dµLS = RT . On en déduit l’équation différentielle dµ L
A = −RT = RT
xLS xLA xLA
L L
puisque xA + xS = 1.
L’intégration de cette équation différentielle mène à µLA = f (T, p) + RT ln xLA ; l’inter-
prétation de la constante d’intégration f (T, p) n’est pas aisée puisqu’elle correspond :
• à la limite où xLA → 1, c’est-à-dire au soluté pur ;
• dans une expression approchée qui n’a de signification que si xLA ≪ 1, c’est-à-dire
pour un soluté infiniment dilué.
Un tel état de référence est donc fictif ; il correspond seulement à une valeur numérique
de potentiel chimique de référence, ce qui n’empêche d’ailleurs pas de calculer cette
valeur.
L’usage veut d’ailleurs qu’on modifie légèrement l’expression établie ci-dessus, en re-
nL nL
marquant que xLA = AL ≃ LA ; de même, la concentration molaire volumique de
n nS
nLA
l’espèce A est [A] = . Le volume V de la solution tout comme la quantité de
V
L
matière nS du solvant restent en général constants au cours des diverses réactions
[A] C ◦V
chimiques en phase diluée, et on peut donc écrire xLA = ◦ × k où k = est
C nLS
une constante et C ◦ n’importe quelle concentration molaire volumique choisie par
convention. Dans toute la suite, on prendra C ◦ = 1 mol · L−1 .
[A]
On peut donc encore écrire µLA = f ′ (T, p) + RT ln ◦ , et donc définir un état de réfé-
C
rence fictif adapté à l’étude des solutions diluées, en particulier des solutions aqueuses :
Potentiel chimique d’un soluté en solution diluée
[A]
X Soluté infiniment dilué, extra- µ = µ◦ sd
(T, p)
C◦
polé à C ◦ = 1 mol · L−1 .
p, T
Le potentiel chimique de l’état de référence dépend peu de la pression.
Convertissant logarithmes naturels et décimaux, on pourra écrire le potentiel chimique

[A]
d’une espèce A en solution aqueuse diluée sous la forme µaq A ≃ µA
◦ aq
(T ) + RT ln ◦
C
RT [A]
ou encore µaq A ≃ µA
◦ aq
(T ) + lg ◦ puisque ln 10 ≃ 2, 30. L’étude des réactions
2, 30 C
en solution aqueuse se faisant généralement à 298 K, on peut recopier cette relation
[A]
µaq
A ≃ µA
◦ aq
(298 K) + 1, 08 kJ · mol−1 × lg ◦ . On remarque bien sûr que ce facteur de
C
conversion est important (1, 08 kJ · mol−1 ) ; il n’est pas rare de voir des concentrations
varier de 10−2 à 10−12 mol·L−1 , donc une variation du potentiel chimique de l’ordre de
plusieurs dizaines de kilojoules par mole : l’effet de la concentration est ici clairement
visible. Il justifie d’ailleurs le fait qu’on ne prenne pas en compte les corrections de
pression.
2 Cas de non-miscibilité : il existe des liquides qui ne se mélangent pas ; chaque
liquide reste seul dans sa phase et constitue donc dans celle-ci un corps pur, dont
l’état est confondu avec l’état de référence et dont l’activité reste égale à l’unité :
Potentiel chimique d’un liquide seul dans sa phase

X Le liquide pur lui-même. µ = µ◦ L (T, p) 1

p, T
Le potentiel
◦ Lchimique
∂µ
avec = v ◦ ; on négligera souvent cette variation.
∂p T
16.6.5 Phases solides

L’étude générale des mélanges entre solides est encore plus complexe que le cas des
liquides. Nous ne retiendrons que deux cas limites : la miscibilité parfaite (mélange
idéal de deux solides) et la miscibilité nulle.
2 Solutions solides idéales : c’est un cas assez rare ; il correspond à des molécules
présentant de très fortes affinités de structure : isomères géométriques par exemple.
On définit de telles solutions solides idéales par analogie avec les solutions liquides
idéales :
Potentiel chimique d’un solide en mélange idéal
X Solide pur µ = µ◦ S (T, p) xSi =

nSi
nS
p, T
Le potentiel
◦ Schimique
∂µ ◦
∂p T
2 Cas de non-miscibilité : dans la majorité des cas, les solides ne sont pas miscibles
entre eux. Dans ce cas de non-miscibilité absolue, chaque solide reste seul dans sa
phase ; s’agissant d’un corps pur, il est dans un état confondu avec l’état de référence
et son activité est égale à l’unité :
Potentiel chimique d’un solide seul dans sa phase

X Le solide pur lui-même. µ = µ◦ S (T, p) 1

p, T
Le potentiel
◦ Schimique
∂µ ◦
∂p T
Un système physico-chimique est caractérisé par les N φ + 2 variables de Gibbs,

T , p et les nψ
i . Si on ne s’intéresse qu’aux paramètres intensifs de composition,
nψ
on utilisera les fractions molaires xψ i = i
.
nψ
En évolution monotherme monobare, un système évolue spontanément dans
le sens d’une diminution de l’enthalpie libre G = H − T S = U + pV − T S.
Cette diminution peut être due à une diminution de l’enthalpie H, ou à une
augmentation de l’entropie S, qu’on interprète alors comme une augmentation
du désordre moléculaire.
P
L’évolution de la fonction G est régie par dG = −SdT + V dp + i,ψ µψ ψ
i dni ,
!
∂G
où µψi = est le potentiel chimique de l’espèce i dans la phase ψ.
∂nψi α
T,p,nj
X ψ ψ
Du fait de l’extensivité de G, on a aussi G = ni µi .
i,ψ
β
Lors du changement d’état d’un corps pur, l’équilibre est donné par µα i = µi ;
hors équilibre, l’évolution se fait dans le sens qui diminue le potentiel chimique.
Lors d’une
réaction
chimique, l’équilibre est donné par A = 0, où on a défini
∂G
A=− = −∆r G ; hors équilibre, l’évolution se fait dans le sens donné
∂ξ T,p
X
par le signe de A. Puisque dnψ
i = νi,ψ dξ, on a aussi A = − νi,ψ µψi .
i,ψ
Du fait des conditions d’équilibre, les N φ+2 paramètres intensifs d’équilibre ne

sont pas équivalents ; le nombre de paramètres intensifs qu’un opérateur peut
librement fixer sans rompre l’équilibre est donné par la variance v, donc par
la règle des phases v = N − r + 2 − φ − k, où r est le nombre de réactions
chimiques et k le nombre de relations stœchiométriques spécifiques.
Le potentiel chimique µψ i d’un corps i dans une phase ψ s’exprime en fonction
du potentiel chimique µ◦i ψ dans l’état de référence (qui dépend peu de la
température) et de l’activité aψ ψ ◦ ψ
i , selon µi = µi (T ) + RT ln aψ
i , avec :
Phase, à p et T Référence à la temp. T Activité

Gaz parfait Gaz pur, p◦ pi /p◦ = xi p/p◦
Solution idéale (liq. ou sol.) Corps pur, p xi
Solvant en phase liquide Liquide pur, p xi
Soluté dilué Extrapolé à C ◦ , p [A] /C ◦
Corps pur (liq. ou sol.) Corps pur, p 1
Pour les solutions et mélanges réels, on multiplie l’activité du cas parfait par
un coefficient d’activité γi . Par convention, C ◦ = 1 mol · L−1 et p◦ = 1 bar.
Chapitre 17
Changement d’état des corps purs
17.1 Équilibre d’un corps pur sous deux phases
17.1.1 Condition d’équilibre

2 Le système étudié : on étudie ici le système formé d’un corps pur unique, présent
sous deux phases α et β, qui seront par exemple, mais pas nécessairement, la phase
liquide et la phase vapeur. En l’absence de toute réaction chimique, ce système a une
variance v = N − r + 2 − φ − k = 1 − 0 + 2 − 2 − 0 soit v = 1 ; un tel système
est monovariant. Les deux phases étant formées d’un corps pur unique, il n’y a pas
de variable de composition et le caractère monovariant indique seulement l’existence
d’une relation entre les variables p et T lorsque l’équilibre monobare et monotherme
est réalisé.
2 La condition d’équilibre : elle s’écrit sous la forme µα (T, p) = µβ (T, p) ; l’égalité
des potentiels chimiques du corps étudié dans les deux phases impose une relation
implicite entre la température et la pression, lorsque l’équilibre est réalisé.
On notera cette relation sous la forme p = p∗ (T ) si on exprime la pression d’équilibre
p∗ en fonction de T , ou encore T = T ∗ (p) dans le cas contraire. Ces deux fonctions
sont réciproques. On parlera en particulier :
• pour un changement d’état liquide → vapeur, de la pression de vapeur saturante
(on rencontre encore parfois le terme tension de vapeur saturante) psat (T ) et de
la température d’ébullition T éb (p) ;
• pour un changement d’état solide → liquide, de la température de fusion T f (p) ;
• pour un changement d’état solide → vapeur (sans passer par la phase liquide), de
la température de sublimation T s (p).
En dehors du domaine où µα (T, p) = µβ (T, p), l’équilibre entre les deux phases n’est
pas possible ; il y a changement d’état complet jusqu’à disparition de la phase dont le
potentiel chimique est le plus élevé.
17.1.2 Diagrammes d’équilibre

2 Diagramme (p, T ) : le tracé de la courbe d’équilibre (p, T ) définit un diagramme
d’équilibre, sur lequel on porte de part et d’autre de la courbe d’équilibre la nature
de la phase stable. Dans le cas des diagrammes solide–liquide et liquide–vapeur, l’in-
tersection des deux courbes d’équations µS (T, p) = µL (T, p) et µL (T, p) = µV (T, p)
correspond à un point pour lequel on a aussi l’égalité µS (T, p) = µV (T, p) : cette inter-
section est commune avec l’équilibre liquide–vapeur ; on parle de point triple. L’allure
de l’ensemble des trois courbes associées aux trois états solide, liquide et vapeur figure
sur le diagramme 17.1.
p Fluide
bC
solidification ⇋ fusion Liquide
⇋ vaporisation
liquéfaction
Solide AL
T b AV Gaz
⇋ sublimation
condensation T
Figure 17.1 – Diagramme d’équilibre (p, T )
Sur ce diagramme, le point T est le point triple où coexistent les trois états liquide,
vapeur et solide ; avec φ = 3, il s’agit d’un état zérovariant dont la pression et la
température sont fixées ; c’est d’ailleurs un tel état qui sert de référence pour l’échelle
légale de température, le point triple de l’eau ayant pour température TT = 273, 16 K
ou encore tT = 0, 01 ◦ C. À titre documentaire, la pression d’équilibre du même point
triple de l’eau est particulièrement faible, pT = 612 Pa = 6, 12 mbar.
Pour des températures supérieures à celle TC du point critique C (ou, ce qui revient
au même, pour des pressions supérieures à celle pC du point critique), il n’existe plus
de changement d’état liquide–vapeur, mais un seul état qui porte le nom de fluide
hypercritique. Dans le cas de l’eau, les coordonnées du point critique sont pC = 218 bar,
tC = 375 ◦ C. Signalons aussi les coordonnées du point critique de CO2 , beaucoup plus
facile à atteindre avec pC = 73 bar et tC = 32 ◦ C ; c’est pour ce gaz que la notion de
point critique a été mise en évidence pour la première fois par Andrews en .
2 Diagramme (p, V ) : considérons, sur le diagramme de la figure 17.1, une ligne
verticale correspondant à une température donnée, comprise entre le point triple et le
point critique. À cette température, l’évolution par augmentation de pression permet
de passer progressivement de l’état gazeux (au point AV ) à l’état liquide (au point
AL ). On peut étudier l’évolution du volume et de la pression d’un système fermé au
cours de cette évolution ; la courbe p = p(V ) correspondante porte le nom d’isotherme
d’Andrews et l’allure de trois isothermes d’Andrews est tracée sur la figure 17.2.
p
Cb T > TC
psat (T ) b b b T = TC
A0 A A1
ion
ros
ée
llit
T < TC
ébu
équilibre L ⇋ V V
Figure 17.2 – Isothermes d’Andrews pour le changement d’état liquide–vapeur

17 : Changement d’état des corps purs 363
Les isothermes d’Andrews sont parfois tracées pour l’unité de masse (V est alors
remplacé par le volume massique 1/ρ) ou pour l’unité de quantité de matière (en
fonction du volume molaire v). L’interprétation de principe du diagramme est in-
changée. Pour un tracé numérique, il est en tous cas indispensable de préciser la
qualtité de matière totale étudiée.
Pour T > TC , il n’y a pas de changement d’état et l’isotherme est une courbe mo-
notone décroissante,
dont la pente est reliée à la compressibilité isotherme du fluide
∂p 1
hypercritique par =− .
∂V T χT V
Pour T = TC , le passage par le point critique se manifeste par
un point d’inflexion à
∂2p

∂p
dérivée nulle, donc par la double condition = 0 et = 0.
∂V TC ∂V 2 TC
On peut aussi remarquer qu’en ce point,les variations dedensité
en fonction de la
∂ρ m ∂V
pression sont extrêmement rapides, avec =− 2 → 0 ; les rapides
∂p TC V ∂p TC
fluctuations qui en résultent se traduisent expérimentalement par un aspect particulier
du fluide au point critique ; cet aspect (( laiteux )) porte le nom d’opalescence critique.
Pour T < TC , le fluide est soit liquide (à haute pression ou faible volume) soit gazeux
(à basse pression ou pour un un grand volume) le changement d’état étant marqué
par un palier de pression, pour la valeur égale à la pression d’ébullition péb (T ) à cette
température. Lors d’un changement d’état isotherme par abaissement de pression,
l’ébullition commence donc par l’apparition de la première bulle de vapeur au point
A0 et se termine par la disparition de la dernière goutte de liquide au point A1 .
L’ensemble des points A0 porte le nom de courbe d’ébullition ; l’ensemble des points
A1 le nom de courbe de rosée. Les deux courbes se coupent au point critique C et
forment ensemble la courbe de saturation. La courbe de saturation et l’isotherme
critique divisent le plan (p, V ) en quatre domaines :
• à haute température (T > TC ), on a le domaine du fluide hypercritique, tandis qu’en
dessous de cette température, on a les domaines du liquide et de la vapeur ;
• à basse température (T < TC ) :
• à gauche de la courbe d’ébullition, on a le domaine du liquide ;
• à droite de la courbe de rosée, on a le domaine de la vapeur ;
• enfin, sous la courbe de saturation, on a le domaine du système diphasé ; un
point A de ce domaine s’interprète en terme de théorème des moments.
2 Théorème des moments : au point A du palier de changement d’état de la figure
17.2, le volume du mélange est donné par la relation d’extensivité (théorème d’Euler)
V = nL v ◦L (T, p) + nV v ◦V (T, p), en notant nL et nV les quantités de matière sous
forme liquide et vapeur, et v ◦L (T, p) et v ◦V (T, p) les volumes molaires partiels du
liquide et de la vapeur à la température T de l’isotherme et à la pression p = péb (T )
correspondante ; comme toute grandeur intensive, donc locale, ces volumes molaires
partiels ne dépendent que de paramètres intensifs, c’est-à-dire qu’ils sont indépendants
de nL et nV .
Les volumes molaires partiels ayant même valeur en tout point de l’isotherme de
changement d’état, on peut les déterminer aux points A0 et A1 , où la totalité de la
matière se retrouve respectivement sous forme liquide et vapeur, avec donc les volumes
V0 = (nL + nV ) v ◦L (T, p) et V1 = (nL + nV ) v ◦V (T, p).

On en déduit immédiatement les différences V − V0 = nV v ◦V (T, p) − v ◦L (T, p) et

V1 − V = nL v ◦V (T, p) − v ◦L (T, p) , d’où le quotient, connu sous la nom de théorème
des moments, qui exprime le rapport des quantités de matière dans les deux phases :
nL V1 − V V A1 − V A
= = (17.1)
nV V − V0 V A − V A0
Naturellement, dans le cas d’un diagramme d’Andrews tracé en termes de volumes

massiques ou molaires, les quotients du théorème (17.1) sont inchangés : il s’agit dans
tous les cas de grandeurs extensives.
Le théorème des moments porte ce nom car la simple comparaison des bras de levier
(au sens mécanique du terme) AA1 et A0 A permet de savoir la proportion de matière
qui a achevé son changement d’état le long du palier de pression ; le schéma de la
figure 17.3 illustre cette interprétation.
A0 A A1
nV
nL
Figure 17.3 – Illustration du théorème des moments
17.2 Propriétés énergétiques des changements d’état
17.2.1 Propriétés énergétiques

2 Enthalpie de changement d’état : considérons à nouveau un changement d’état
quelconque, α ⇋ β, caractérisé en tout point de la courbe de changement d’état
par la relation µα (T, p) = µβ (T, p). Chacune des phases correspondant à un corps
pur, on peut aussi écrire cette condition d’équilibre µ◦α (T, p) = µ◦β (T, p), mais aussi
Gα β
m (T, p) = Gm (T, p), si Gm désigne l’enthalpie libre molaire du corps étudié.
Toutefois, Gm = Hm − T Sm pour chacune des deux phases, mais l’égalité des en-
thalpies libres ne signifie pas l’égalité des enthalpies ni des entropies molaires ; on
définira donc indifféremment l’enthalpie molaire de changement d’état par une des
deux relations :
α→β β α
β α

Lm (T ) = Hm (T ) − Hm (T ) = T Sm (T ) − Sm (T ) (17.2)
Le changement d’état étant une transformation monobare, la variation d’enthalpie qui

β α
accompagne celui-ci vérifie aussi Qp = ∆H = Hm −Hm pour une mole de changement
d’état. L’enthalpie molaire de changement d’état porte donc aussi le nom de chaleur
latente molaire de changement d’état, avec :
α→β
Qp = ∆H = Lm (T ) pour une mole de réaction α → β (17.3)
Pour un changement d’état partiel, si on note dξ la quantité de matière qui change

d’état (avec donc une notation analogue à celle de l’avancement d’une réaction chi-
mique), on écrira pour le transfert thermique isotherme isobare nécessaire au change-
ment d’état :
α→β
δQp = dH = Lm (T ) × dξ (17.4)
Le changement d’état étant aussi une transformation réversible lorsqu’il est mené
aux conditions T, p∗ (T ) de la courbe d’équilibre, on peut écrire lors d’une mole de
changement d’état la seconde relation :
Qp Lα→β (T )
∆S = = m pour une mole de réaction α → β (17.5)
T T
avec de même pour un changement d’état partiel :
δQp Lα→β (T )
dS = = m × dξ (17.6)
T T
Le caractère extensif de la chaleur latente qui apparaı̂t dans (17.4) et (17.6) permet
aussi de définir une chaleur latente de changement d’état massique ℓα→β , avec la
Lα→β (T )
relation ℓα→β (T ) = m , si M est la masse molaire de l’espèce qui change
M
d’état.
Le tableau 17.1 présente quelques valeurs de chaleurs latentes massiques de change-
ment d’état ; on notera la valeur très élevée de la chaleur latente de vaporisation de
l’eau (en particulier si on la compare à celle de son analogue structurel H2 S). L’abon-
dance de l’eau sur terre, et ces propriétés thermiques exceptionnelles, liées aux liaisons
intermoléculaires spécifiques entre molécules d’eau (on parle de liaisons hydrogène),
expliquent le rôle de l’eau comme volant thermique de régulation dans les systèmes
industriels, comme d’ailleurs à la surface de la biosphère terrestre.
Corps Changement d’état T p ℓ

Fusion 0 ◦C 1 bar 334 kJ · kg−1
60 ◦ C 0, 2 bar 2 360 kJ · kg−1
Eau Ébullition 100 ◦ C 1 bar 2 260 kJ · kg−1
213 ◦ C 20 bar 1 890 kJ · kg−1
H2 S Ébullition −60 ◦ C 1 bar 548 kJ · kg−1
Azote Fusion −210 ◦ C 1 bar 25, 5 kJ · kg−1
Ébullition −196 ◦ C 1 bar 201 kJ · kg−1
Table 17.1 – Chaleurs latentes de changement d’état
2 Interprétation entropique : le signe positif des chaleurs latentes présentées dans

le tableau 17.1 ci-dessus peut s’interpréter simplement, en vertu de l’interprétation
statistique de l’entropie : lors des passages solide → liquide puis liquide → vapeur,
l’augmentation du désordre moléculaire s’accompagne logiquement d’une perte d’in-
formation au niveau microscopique, donc d’une augmentation d’entropie. En vertu de
la relation (17.6), les chaleurs latentes correspondantes sont positives :
Lfusion > 0 Lébullition > 0 (17.7)
On peut rendre compte de façon quantitative de cette augmentation d’entropie en

remplaçant le diagramme p = p(V ) proposé ci-dessus pour le tracé des isothermes
d’Andrews par un diagramme T = T (S).
Comme dans le cas de l’isotherme d’Andrews, on rencontre sur le plan pratique des
tracés en fonction de l’entropie massique ou de l’entropie molaire.
L’allure de ce diagramme entropique d’ébullition d’un fluide a l’allure générale de

la figure 17.4 ; on y représente en général les courbes correspondant à une évolution
isobare.
T p>p C
C p < pC
b
ll.
u
éb
T éb (p) b b b
A0 A A1 ros
ée
équilibre L ⇋ V S
Figure 17.4 – Diagramme entropique pour le changement d’état liquide–vapeur
Dans ce diagramme, la disposition relative des zones monophasées liquide et vapeur est
identique au diagramme d’Andrews : pour p < pC , les zones de faible température ou
de faible entropie correspondent au domaine du liquide, tandis qu’à haute température
ou pour les grandes valeurs de l’entropie on retrouve les gaz.
Bien sûr, pour p > pC , il n’y a pas de changement d’état et les courbes d’évolution sont
des isobares du fluide hypercritique, courbes S(T ) toujours monotones croissantes.
Notons que les diagrammes d’Andrews p(V ) et entropique T (S) sont analogues
en ceci que δW = −pdV et δQ = T dS pour une transformation réversible, les
aires dans les deux diagrammes étant donc respectivement l’opposé du travail ou le
transfert thermique fourni au système. Dans les deux cas, le diagramme exprime un
paramètre intensif (p ou T ) en fonction d’une grandeur extensive (V ou S).
17.2.2 Relation de Clapeyron
2 Établissement de la relation de Clapeyron : la relation établie ici ne figure pas au

programme ; elle est proposée à titre d’illustration des propriétés différentielles de la
grandeur µ, potentiel chimique d’une espèce dans sa phase.
La relation générale décrivant la courbe d’équilibre α ⇋ β s’écrit µ◦α (T, p) = µ◦β (T, p),
relation qui doit être vraie en tout point de la courbe d’équilibre T = T ∗ (p), ou de la
fonction réciproque p = p∗ (T ), qui décrit évidemment la même courbe.
On peut donc différencier cette relation le long de la courbe de changement d’état sous
∂µ◦α ∂µ◦α ∂µ◦β ∂µ◦β
la forme dT + dp = dT + dp, ce qui fournit la relation entre dp
∂T ∂p ∂T ∂p
et dT , c’est-à-dire la pente de la courbe d’équilibre pour le changement d’état α ⇋ β.
On remarque alors que les potentiels chimiques µ◦α et µ◦β sont ceux d’un corps pur ;
l’identité thermodynamique dG = −SdT + V dp peut donc s’écrire, pour une mole
du corps dans une des deux phases, sous la forme dµ◦ = −s◦ dT + v ◦ dp, soit encore
∂µ◦α ∂µ◦β
= −s◦α et = −s◦β en fonction des entropies molaires des deux phases, et
∂T ∂T
∂µ◦α ∂µ◦β
= v ◦α et = v ◦β en fonction des volumes molaires des deux phases.
∂p ∂p
On réécrit donc encore −s◦α dT + v ◦α dp = −s◦β dT + v ◦β dp ; en tenant compte de la
relation (17.5), qui peut s’écrire aussi sous la forme Lα→β = T s◦β − s◦α , il vient la

relation de Clapeyron :
dp∗ 1 Lα→β(T )
= (17.8)
dT T v ◦β − v ◦α
2 Exemples : considérons d’abord le cas de la fusion de la glace, pour lequel on

a déjà affirmé que Lfusion > 0, tandis qu’on sait que v ◦S > v ◦L ; on en déduit que la
courbe d’équilibre solide–liquide présente une pente négative, qui est d’ailleurs très
élevée car la différence des volumes molaires des deux phases condensées est très faible.
Au contraire, le volume molaire de la vapeur est très élevé et la pente de la courbe
d’ébullition est bien plus faible ; on utilise d’ailleurs souvent les trois approximations
RT
v ◦V ≫ v ◦L , v ◦V ≃ et Léb (T ) ≃ Cte pour obtenir une expression approchée de
p
dpsat pLéb
la courbe d’équilibre liquide–vapeur, sous la forme = 2
qu’on écrit encore
dT RT
sat éb sat éb

dp L dT p L 1 1
= qui s’intègre sous la forme ln ◦ = − , si T0 est la
psat R T2 p R T0 T
température d’ébullition sous la pression standard p ; T0 = 373 K pour l’eau.
◦
17.2.3 Changements d’état de seconde espèce

2 Courbes de refroidissement : considérons le refroidissement progressif d’un liquide,
à pression constante ; à partir du moment où la température de fusion est constante,
on observera un palier de température pendant la durée nécessaire à l’évacuation de
la totalité de l’énergie correspondant à la chaleur latente de l’échantillon, avant que
le refroidissement de l’échantillon solide ne reprenne.
T
Tf
m × ℓf
Q
Figure 17.5 – Courbe de refroidissement d’un liquide
Si on trace la courbe d’évolution de la température en fonction du transfert thermique

Q évacué depuis le début de l’opération, on obtient la représentation de la figure
17.5 ; les pentes de part et d’autre du palier de changement d’état sont simplement
les capacités thermiques isobares CpL et CpS des échantillons solide et liquide.
On peut d’ailleurs aussi observer (en pointillés sur la figure 17.5) un retard au chan-
gement d’état : la solidification ne se produit pas dès la température de changement
d’état atteinte, mais un peu plus tard, et on observe un liquide surfondu métastable
pour T < T f , jusqu’à ce qu’une perturbation provoque l’apparition d’un premier
cristal de solide et la solidification rapide avec retour au palier de changement d’état.
2 Changements d’état de seconde espèce : la courbe de refroidissement présentée

ci-dessus présente deux caractéristiques :
• la présence du palier, liée à l’existence de la chaleur latente de changement d’état,
ℓf
définie par exemple en notations massiques par f = sS − sL , donc par une
T
discontinuité de l’entropie massique de part et d’autre de la courbe d’équilibre
solide–liquide ;
• la différence de pente de part et d’autre de ce palier, liée à la discontinuité
des
1 ∂s
capacités thermiques massiques, dont on rappelle ici que cp = . Ainsi,
T ∂T p
il y a en général aussi discontinuité de la dérivée première de l’entropie massique
de part et d’autre de la courbe d’équilibre solide–liquide.
Toutefois, on rencontre dans certains cas des changements d’état de seconde espèce,
dans lesquels la première discontinuité disparaı̂t, c’est-à-dire pour lesquels la chaleur
latente de changement d’état est nulle. La courbe de refroidissement ne présente alors
plus de palier de température et prend simplement la forme de la figure 17.6.
T
b
Tf
Figure 17.6 – Courbe de refroidissement et changement d’état de seconde espèce
La seule marque du changement d’état est donc la rupture de pente lors du changement
d’état ; il est donc nettement plus difficile à mettre en évidence, sur le seul plan
thermique, qu’un changement d’état de première espèce.
L’ébullition réalisée au point critique vérifie cette propriété (annulation de la chaleur

latente de changement d’état). Le changement d’état conducteur–supraconducteur à
basse température est un autre exemple de changement d’état de seconde espèce (au
moins en l’absence de champ magnétique) ; il s’accompagne toutefois de changements
importants de propriétés physiques non thermiques qui le rendent facile à mettre en
évidence, et peuvent d’ailleurs avoir aussi des conséquences thermodynamiques :
• dans l’état supraconducteur, le champ magnétique éventuel est expulsé hors du

volume du matériau supraconducteur, ce qui se traduit par l’apparition de cou-
rants supraconducteurs à la surface de l’échantillon de matériau ainsi refroidi
sous la température de transition.
• dans l’état supraconducteur, la conductivité électrique du matériau s’annule, ce
qui n’est évidemment pas le cas d’un conducteur ordinaire. Remarquons donc
qu’un supraconducteur ramené accidentellement et localement au-dessus de sa
température de changement d’état peut donner lieu à un phénomène d’(( em-
ballement )) : le retour à l’état conducteur s’accompagne d’une réapparition de
l’effet Joule, donc d’un apport thermique supplémentaire qui échauffe encore le
matériau, etc.
17.2.4 Propriétés colligatives

2 Principe de l’étude : certaines propriétés d’une solution lors d’un changement
d’état du solvant dépendent seulement du potentiel chimique du solvant, donc de
la concentration particulaire de soluté ; on parle de propriétés colligatives (ce terme
signifiant (( dépendant de l’ensemble ))). Nous étudierons pas exemple dans ce cadre
les modifications des propriétés du changement d’état d’un corps pur A, lorsque ce
corps n’est pas tout à fait pur, mais présent à l’état de mélange dans au moins une
des phases.
Nous supposerons toutefois que ce mélange se comporte simplement vis-à-vis des
variables de concentration, c’est-à-dire qu’il est idéal vis-à-vis de A, au moins parce
que A y joue le rôle de solvant, fortement majoritaire. On décrit par exemple dans ce
cadre :
• de faibles variations de la température de congélation d’un liquide, lorsque le liquide
n’est pas tout à fait pur : c’est l’étude de la cryométrie ;
• de faibles variations de la température d’ébullition d’un liquide, lorsque le liquide
n’est pas tout à fait pur : c’est l’étude de la ébulliométrie ;
• de faibles variations de la pression de vapeur saturante d’un liquide, lorsque le
liquide n’est pas tout à fait pur : c’est l’étude de la tonométrie.
Dans tous les cas, le principe de l’étude est le même :

• on écrit, pour le corps A qui est en équilibre dans deux phases (ou de part et d’autre
de la membrane) la condition d’équilibre, c’est-à-dire l’égalité des potentiels
chimiques ;
• on écrit ensuite la même condition pour l’équilibre (( idéal )), non perturbé par
la petite modification introduite par l’opérateur (présence du soluté, écart de
température, etc.) ;
• on fait enfin la différence des deux équations, tous les écarts étant assimilés à des
différentielles.
2 L’exemple de la cryométrie : considérons l’équilibre liquide–solide entre l’espèce

A, seule dans la phase solide, et l’espèce A, majoritaire dans la phase liquide, mais en
présence d’une certaine quantité, faible de solutés divers X, dont on notera xX ≪ 1 la
fraction molaire. L’équilibre sera supposé réalisé à la pression p◦ ; il se fait alors à la
température T , qui est en fait l’inconnue du problème. L’équation fondamentale qui
régit l’équilibre est µLA = µSA . Le solide étant seul dans sa phase et la solution liquide
supposée idéale pour le solvant A, on écrit aussi µLA ◦ (T ) + RT ln xA = µSA ◦ (T ).
L’équilibre entre les deux phases de A se faisant, pour le corps pur A, à la température
T ∗ , on écrit aussi l’équation d’équilibre dans ces conditions µLA ◦ (T ∗ ) = µSA ◦ (T ∗ ). Il
reste à comparer les deux équations en en faisant la différence ; on suppose pour
cela que T = T ∗ + ∆T , avec |∆T | ≪ T ∗ , ce qui permet par exemple d’écrire de
façon approchée µLA ◦ (T ) − µLA ◦ (T ∗ ) ≃ −sLA ◦ (T∗ )∆T puisque l’entropie molaire de A,
L ◦

∂µ
liquide et seul dans sa phase, vérifie sLA ◦ = − A
.
∂T p=p◦
On a donc obtenu −sLA ◦ (T ∗ )∆T +RT ln(1−xX ) ≃ −sSA ◦ (T ∗ )∆T , où on doit continuer
le développement limité en se limitant au premier ordre seulement, sous la forme
RT ln(1 − xX ) ≃ −R(T ∗ + ∆T )xX ≃ −RT ∗ xX si on suppose que xX et ∆T sont du
même ordre. Il reste donc sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) ∆T = −RT ∗ xX .
On réécrit cette expression en fonction de la chaleur molaire de changement d’état
du solvant pur A, calculée à la température du changement d’état du corps pur T ∗ ,
L∗
sLA ◦ (T ∗ ) − sSA ◦ (T ∗ ) = ∗ , pour obtenir la loi de Raoult de la cryométrie, sous la
T
RT ∗ 2
forme ∆T = − ∗ xX .
L
2 Applications : on peut considérer la relation obtenue comme une méthode de
détermination de l’abaissement du point de congélation (puisque ∆T < 0 dans tous
les cas), par exemple de l’eau salée par rapport à l’eau pure. La propriété ∆T < 0 se
généralise d’ailleurs à des fractions molaires xX non nécessairement faibles, comme on
le montre plus loin ; cet abaissement est mis à profit :
– dans la protection des routes contre la formation de verglas lors des pluies d’hiver,
par un salage préventif ;
– pour la réalisation de thermostats à des températures Celsius négatives, en présence
de glace fondante dans de l’eau salée.
On peut aussi remarquer que la mesure de ∆T permet d’accéder à une fraction molaire
xX , alors qu’un opérateur contrôle habituellement une fraction massique en réalisant
une solution diluée avec une balance de précision. La relation entre ces grandeurs,
l’une mesurée et l’autre préparée, permet d’accéder aux valeurs (relatives) des masses
molaires des espèces que l’on peut mettre en solution ; ce type de mesure est donc à la
base des méthodes d’analyse chimique pour la détermination des formules chimiques
brutes du composé X.
Pour déterminer la masse molaire d’une espèce X, il suffit de trouver un solvant A de
cette espèce et d’observer l’abaissement du point de congélation, ou bien l’élévation
du point d’ébullition de cette phase liquide (A majoritaire, X minoritaire).
2 Interprétation chimique : en réalisant une solution de X dans A, on abaisse le
potentiel chimique du liquide A, ce qui impose un changement dans l’équilibre entre
phases de A : la phase liquide est stabilisée par la baisse de son potentiel chimique.
Le domaine de stabilité en température de cette phase liquide s’élargit lorsque la
température de fusion s’abaisse et la température d’ébullition augmente.
Le chapitre suivant généralise l’étude des propriétés colligatives en décrivant les chan-
gements d’état de mélanges, sans faire obligatoirement d’hypothèse restrictive sur la
nature de ces mélanges.
Un changement d’état est une transformation qu’on peut mener de manière

réversible, isotherme et isobare, en un point de la courbe d’équilibre d’équation
implicite µα (T, p) = µβ (T, p).
La relation explicite T = T ∗ (p) qui résulte de la condition d’équilibre porte le
nom de température de fusion (solide → liquide), d’ébullition (liquide → gaz)
ou de sublimation (solide → gaz).
La relation réciproque p = p∗ (T ) porte le nom de pression de vapeur saturante
(liquide → vapeur).
Le changement d’état d’une mole d’un corps pur à la température d’équilibre
T ∗ (p) est caractérisé par les variations d’enthalpie ∆H = L∗ (T ∗ ) et d’entropie
L∗ (T ∗ )
∆S = ; la grandeur L∗ est la chaleur latente de changement d’état.
T∗
Dans le cas d’augmentation du désordre moléculaire (transformations solide →
liquide, liquide → gaz et solide → gaz), on a forcément L∗ > 0.
Dans le cas particulier de l’équilibre liquide-vapeur, les isothermes p = p(V )
et les isobares T = T (S) délimitent une zone d’équilibre diphasé délimitée par
la courbe de saturation, formée de deux branches, la courbe de rosée pour la
formation de la première goutte de liquide, et la courbe d’ébullition pour la
formation de la première bulle de vapeur.
La position d’un point de la zone d’équilibre diphasé sous la courbe de satu-
ration permet de déterminer le rapport des quantités de matière dans les deux
phases, par application du théorème des moments.
La courbe de saturation culmine au point critique, point stationnaire sur la
courbe isotherme p(V ) ou isobare T (S) ; au delà de ce point, il n’y a plus de
changement d’état et le fluide est hypercritique.
Les courbes d’équilibre T ∗ (p) pour la sublimation, la fusion et l’ébullition se
croisent au point triple, domaine triphasé et zérovariant de caractéristiques
(T, p) fixées pour un corps pur donné.
Chapitre 18
Mélanges et diagrammes binaires
18.1 Tracé des diagrammes binaires
18.1.1 Mélanges binaires

2 Le système étudié : ici et dans toute la suite de chapitre, nous considérons un mé-
lange binaire forme de N = 2 corps présents dans au plus φ = 2 phases, sans réaction
chimique. Nous étudierons essentiellement les binaires en équilibre liquide-vapeur,
bien que des méthodes analogues s’appliquent à l’étude des mélanges en équilibre
solide-liquide.
Nous considérerons dans toute la suite que les phases vapeur éventuellement présentes
forment des mélanges idéaux de gaz parfaits ; en effet, les écarts à l’idéalité dans les
phases condensées (liquide et solide) sont toujours assez importants, de sorte que la
prise en compte de faibles défauts des phases vapeur n’a guère d’importance.
Par contre, l’hypothèse d’un mélange idéal liquide (ou solide) n’est vérifiée que de
façon exceptionnelle.
2 Variance et miscibilité : la variance du système est ici v = N + 2 − φ − r − k avec
r = k = 0 donc v = 2 : un mélange binaire des corps A1 et A2 , présents dans les deux
phases, est un système divariant. Nous choisirons dans la description de considérer
les fractions molaires x1 du corps A1 ; de plus, nous adopterons ici les notations xL1
et xV1 pour ces fractions molaires, les deux phases étant, provisoirement au moins,
supposées respectivement liquide (L) et vapeur (V).
Un tel mélange binaire liquide-vapeur peut être décrit par les paramètres intensifs T ,
p, xL1 et xV V V L L
1 , dont on peut déduire x2 = 1 − x1 et x2 = 1 − x1 . De plus, un tel système
étant divariant, il existe nécessairement deux relations entre ces quatre paramètres
intensifs ; ces deux relations sont formées des égalités des potentiels chimiques des
corps présents dans les deux phases. Plus généralement :
Mélange binaire avec miscibilité totale

X Dans le cas où les deux corps A1 et A2 sont présents dans les deux
phases α et β du mélange binaire, les deux relations entre les para-
β β β
mètres intensifs T , p, xα α α
1 et x1 s’écrivent µ1 (T, p, x1 ) = µ1 (T, p, x1 ) et
α α β β
µ2 (T, p, 1 − x1 ) = µ2 (T, p, 1 − x1 ).
On remarque bien que chaque potentiel chimique ne dépend que de la composition de

la seule phase correspondante, et pas de la composition de l’autre phase du binaire.
2 Étude qualitative de l’équilibre liquide–vapeur : considérons le cas particulier de

l’équilibre liquide–vapeur d’un mélange des deux corps A1 et A2 , étudié par exemple
à pression p fixée. La double condition d’équilibre µL1 (T, p, xL1 ) = µV V
1 (T, p, x1 ) et
L L V V V
µ2 (T, p, 1 − x1 ) = µ2 (T, p, 1 − x1 ) permet d’éliminer par exemple x1 entre ces deux
relations, pour en déduire T = T (xL1 ), tout comme on peut éliminer xL1 pour exprimer
T = T (xV 1 ).
Reportés sur un même système d’axes (fractions molaires en abscisse, température

en ordonnée), on s’attend bien sûr à ce que ces deux relations ne coı̈ncident pas : on
obtient la même valeur de T pour deux compositions différentes des phases liquide et
vapeur ; ce sont les points L et V de la figure 18.1.
T
p fixé
V′ b b
T′
L′
V b b
T
L
xL1 ou xV
1
Figure 18.1 – Construction progressive des diagrammes binaires isobares
Reprenant la même construction à une autre température T ′ , on retrouve deux points

L′ et V ′ qui s’interprètent de la même façon, construisant ainsi de proche en proche
les courbes T = T (xL1 et T = T (xV 1.
Le même principe permet bien sûr de construire de la même façon les courbes p = p(xL1
et p = p(xV
1 si c’est la variable T que l’on fixe pour l’étude de l’équilibre.
18.1.2 Diagrammes binaires liquide–vapeur

2 Définitions : les relations d’égalité des potentiels chimiques imposent des relations
β
entre les paramètres intensifs T , p, xα 1 et x1 , dont on déduit de façon évidente les
β
paramètres xα 2 et x2 . Nous décrirons d’abord ces relations dans le cas particulier de
l’équilibre liquide–vapeur (α = L et β = V), mais on peut aisément généraliser cette
étude à d’autres cas.
L’étude exacte des expressions des potentiels chimiques µL1 , µV L V
1 , µ2 et µ2 étant sou-
vent très délicate, on se contentera souvent d’une étude expérimentale des relations
d’équilibre, par le tracé de diagrammes :
Diagrammes binaires
X On parle de diagramme binaire isobare si on fait une étude à pression p
fixée ; un tel diagramme est formé de deux courbes, T = T xL1 qui est

la courbe d’ébullition et T = T xV 1 qui est la courbe de rosée.

On parle de diagramme binaire isotherme si on fait une étude à tempé-
L
rature T fixée ; un tel diagramme est formé de deux courbes, p = p x1
V
qui est la courbe d’ébullition et p = p x1 qui est la courbe de rosée.
18 : Mélanges et diagrammes binaires 375
Il est facile de mémoriser les noms des deux courbes si on réfléchit à la signification
de ces courbes. Ainsi, étudier un paramètre (p ou T ) en fonction de xL1 signifie impli-
citement que xL1 est connu, donc qu’on a préparé un mélange liquide de composition
précise et qu’on étudie la pression ou la température à laquelle il se mettra en équilibre
avec la phase vapeur ; le point de la courbe d’ébullition est donc un point de début
d’ébullition, ou de formation d’une première bulle de vapeur.
Les diagrammes binaires isobares sont les plus courants et les plus conformes à
l’expérience usuelle : pour réaliser l’ébullition d’un mélange, on augmente sa tempé-
rature, souvent à pression constante égale, par exemple, à la pression atmosphérique.
Toutefois, on peut aussi réaliser la même ébullition par abaissement de la pression à
température constante, par exemple à la température ambiante : on doit alors faire
appel aux diagrammes isothermes.
De même, étudier le même paramètre intensif p ou T en fonction de xV 1 signifie impli-

citement que xV 1 est connu et qu’on a donc préparé un mélange vapeur de composition
précise et qu’on étudie les conditions dans lesquelles il se mettra en équilibre avec la
phase liquide ; le point de la courbe de rosée est donc un point de formation d’une
première goutte de liquide.
2 Forme générale des diagrammes : les courbes d’ébullition et de rosée correspondent,

pour xL1 → 0 et xL1 → 1, au changement d’état d’un corps pur, respectivement le corps
A2 ou le corps A1 ; ceci explique l’allure particulière, en fuseau des diagrammes bi-
naires, comme par exemple ceux qui sont représentés sur la figure 18.2 : le resserrement
aux extrémités du fuseau correspond aux caractéristiques du changement d’état du
corps pur.
T T p p
p fixé T fixé
V) b T éb psat b p=
x1 1 2 p(x L
T( 1)
=
T
n
éb
tio
e
ro
u
sé
lli
lli
sé
ro
tio
u
e
éb
L ) p=
x1
T( p(x V
T2éb b T= 1 )
b psat
1
x2 x1 x2 x1
Figure 18.2 – Forme en fuseau des diagrammes binaires
Sur ces diagrammes, le domaine d’existence du liquide (monophasé) se trouve du côté

des basses températures (à pression fixée, sur le diagramme de gauche) ou des hautes
pressions (à température fixée, sur le diagramme de droite) ; ceci explique (au moins
qualitativement) la position relative des courbes d’ébullition (du côté du liquide) et
de rosée (du côté de la vapeur).
On a ici choisi de tracer l’allure de diagrammes binaires pour un composé A2 plus

volatil que le composé A1 ; dans le cas du diagramme isobare (à gauche), on a donc
une température d’ébullition plus basse pour le composé A2 ; dans le cas du diagramme
isotherme (à droite), on a au contraire une pression de vapeur saturante plus élevée
pour ce composé A2 plus volatil.
Nous reviendrons bien sûr plus en détail sur ces diagrammes et sur leur interprétation ;
remarquons pour l’instant qu’on a choisi de tracer des fuseaux de courbes monotones
en fonction de xL1 ou xV
1 ; nous allons étudier cette propriété.
2 Azéotropie : considérons par exemple le cas d’un diagramme isotherme (avec

donc dT = 0). Si une des courbes d’équilibre qui forme ce diagramme, la présence
d’un éventuel extremum impose donc dp = 0 en ce point.
On comprend bien que l’étude des diagrammes isobares (dp = 0) et des extrema
associés (dT = 0) correspond aux mêmes calculs que pour les diagrammes isothermes.
Dans les deux cas, on peut écrire, le long de la courbe d’équilibre (courbe d’ébullition
ou courbe de rosée selon le paramètre choisi en abscisse) dµL1 = dµV 1 ; supposant alors
dxV 1
V
que la phase vapeur est idéale, on a aussi dµ1 = RT V donc aussi dµL2 = dµV 2 =
x1
dxV
1
−RT .
1 − xV1
Rappelons alors, à dT = 0 et dp = 0, l’expression de l’identité thermodynamique

dGL = µL1 dnL1 + µL2 dnL2 pour des variations de l’enthalpie libre de la phase liquide du
fait de variations de sa composition. La relation GL = µL1 nL1 + µL2 nL2 peut aussi être
différenciée sous la forme dGL = dµL1 nL1 + dµL2 nL2 + µL1 dnL1 + µL2 dnL2 .
En comparant les deux expressions de dGL , on obtient 0 = dµL1 nL1 + dµL2 nL2 qui
s’écrit encore, après division par la quantité de matière totale de la phase liquide,
0 = dµL1 xL1 + dµL2 xL2 : c’est l’identité de Gibbs-Duhem.
1 − xL1 V xL1 V
Les relations établies ci-dessus imposent alors 0 = −RT dx 1 + RT dx1 , ce
1 − xV
1 xV
1
qui impose enfin xL1 = xV
1 : les deux courbes se coupent au point extremum s’il existe.
Théorème de Gibbs-Konovalov
X Dans un diagramme binaire, les deux courbes d’ébullition et de rosée
ne peuvent présenter que des extrema communs, situés au même point
(mêmes valeurs de la pression, de la température et de la composition
des deux phases). Un tel extremum porte le nom de point azéotrope.
La figure 18.3 montre un diagramme binaire isobare présentant un point azéotrope ;

la composition commune des deux phases au point azéotrope est notée xZ1 .
Notons bien que l’établissement des propriétés développées ici n’est pas exigible ; le
résultat par contre (le théorème de Gibbs-Konovalov) doit être connu.
On remarque qu’un mélange ayant, dans les phases solide ou vapeur, la composition
du point azéotrope se comporte comme un corps pur : la température de début d’ébul-
lition et celle de début de rosée sont confondues, à une valeur T1Z qui simule donc une
température d’ébullition d’un corps pur.
Il existe en général des diagrammes binaires avec des azéotropes à maximum ou

à minimum. Par ailleurs, s’il n’est pas exclu théoriquement qu’un binaire puisse
présenter plusieurs points azéotropes, cette situation est exceptionnelle et ne nous
concernera pas ici.
T T
p fixé
b
TZ
b T éb
1
T2éb b
x2 xZ1 x1
Figure 18.3 – Diagramme binaire isobare avec azéotrope
2 Exemples : la figure 18.4 présente un diagramme binaire isobare sans azéotrope,

celui du mélange eau–méthanol. La figure 18.5 présente un cas d’azéotropie, le mélange
eau–éthanol. Ils sont tous deux tracés pour p = p◦ = 1 bar.
100 ◦ C
90 ◦ C
Méthanol
80 ◦ C
70 ◦ C
64, 0 ◦ C
60 ◦ C
Eau
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Figure 18.4 – Exemple de diagramme binaire sans azéotrope
Dans le cas du mélange eau–éthanol sous 1 bar, la température d’ébullition de l’éthanol

pur est 78, 8 ◦ C, tandis que la température d’ébullition de l’azéotrope est de 78, 4 ◦ C.
Z
La composition de celui-ci est xéthanol ≃ 0, 9. On remarque dans ce cas que, pour
Z
xéthanol 6 xéthanol 6 1, il n’est pas possible à cette échelle de distinguer les courbes
d’ébullition et de rosée du mélange.
18.1.3 Diagrammes binaires sans miscibilité à l’état liquide

2 Cas de non-miscibilité : il arrive que certains corps ne soient pas miscibles dans
toutes les phases ; si une telle situation ne se rencontre jamais pour la phase vapeur,
on connaı̂t par contre des cas de non-miscibilité à l’état liquide et, encore plus fré-
quemment, à l’état solide.
Considérons à titre d’exemple l’ébullition d’un ensemble formé des deux phases li-
quides, non miscibles entre elles, composées des deux corps purs A1 et A2 ; la présence
100 ◦ C
95 ◦ C
90 ◦ C
Éthanol
85 ◦ C
80 ◦ C
78, 8 ◦ C
Eau
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Figure 18.5 – Exemple de diagramme binaire avec azéotrope
d’une phase supplémentaire diminue d’une unité la variance et on pourra donc ren-
contrer trois cas :
• la présence simultanée des trois phases (A1 liquide, A2 liquide et le mélange gazeux
de A1 et A2 ) ; cette situation, monovariante, impose une valeur unique de la
composition de la phase vapeur et de la température, si la pression est fixée ou,
de manière analogue, une valeur unique de la composition de la phase vapeur
et de la pression, si c’est la température qui est fixée.
Cette composition particulière de la phase vapeur porte le nom de point hété-
roazéotrope.
• la présence simultanée de deux phases seulement, le liquide A1 étant seul présent
en équilibre avec le mélange gazeux de A1 et A2 , forme un système divariant ;
• de même, la présence simultanée de deux phases seulement, le liquide A2 étant seul
présent en équilibre avec le mélange gazeux de A1 et A2 , forme aussi un système
divariant.
Nous retiendrons donc le résultat :
Mélange binaire avec miscibilité nulle
X Dans le cas où les deux corps A1 et A2 sont présents dans la phases β
mais ne sont pas miscibles dans la phase α, on peut observer :
• l’équilibre entre A1 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
1 (T, p, x1 = 1) = µ1 (T, p, x1 ) ;
• l’équilibre entre A2 seul dans la phase α et l’autre phase β, avec pour
β β
loi d’équilibre µα α
2 (T, p, x2 = 1) = µ2 (T, p, x2 ) ;
ou enfin le point hétéroazéotrope, les trois phases étant présentes, à l’in-
tersection des deux conditions définies ci-dessus.
2 Diagrammes liquide–vapeur en cas de non-miscibilité : en plus des diagrammes

simples en fuseau et des diagrammes comportant un point azéotrope (qu’il s’agisse
d’un minimum ou d’un maximum), on peut rencontrer un troisième type de dia-
gramme, en cas d’absence de miscibilité. Considérons pour cela un mélange de deux
espèces A1 et A2 , non miscibles dans l’état liquide, mais en équilibre avec leur mélange
à l’état de vapeur. On a déjà affirmé qu’un tel système ne peut présenter d’équilibre
diphasé qu’en cas d’équilibre avec une seule phase liquide ; considérons donc l’équilibre
entre A1 , liquide pur, et le mélange gazeux.
pxV1
La condition d’équilibre µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln , écrite dans l’hypothèse d’un
p◦
mélange idéal de gaz parfaits, est l’équation de la seule courbe d’équilibre qu’on puisse
définir ici : la pression p ou la température T en fonction de xV 1 , donc la courbe de
rosée.
Il n’y a pas de courbe d’ébullition à proprement parler, car il n’y a pas de mélange
liquide à faire bouillir, seulement une ou deux phases liquides qui ne se mélangent
pas.
On voit clairement qu’à T fixé, cette partie de la courbe de rosée a pour équation
pxV1 = Cte ; c’est une branche d’hyperbole, au moins dans l’approximation d’un mé-
lange idéal de gaz. On peut même préciser l’expression de la constante, en remarquant
que l’équilibre du corps pur A1 impose, lorsqu’il est réalisé à la température T , la rela-
psat
1 psat
1
tion µ◦L ◦V
1 (T ) = µ1 (T ) + RT ln ; la courbe de rosée a donc pour équation p ≃
p◦ xV1
psat
2
en présence de A1 liquide pur, et donc p ≃ en présence de A2 liquide pur.
1 − xV 1
p p
T fixé
ébullition b pZ
rosé
e, A L b psat
1 ⇋V 1
L V
psat b A2 ⇋
2 rosée,
x2 xZ1 x1
Figure 18.6 – Diagramme binaire isotherme sans miscibilité
La figure 18.6 montre la construction de ces deux branches de la courbe de rosée, et

leur point d’intersection, qui porte le nom de point hétéroazéotrope.
En présence simultanément des trois phases (vapeur, liquide A1 et liquide A2 ), le
système est monophasé et la pression imposée, à température fixée, à la valeur lue
à l’intersection des deux branches de la courbe de rosée ; on peut donc interpréter
l’horizontale passant par ce point comme une pseudo-droite d’ébullition, décrivant la
pression de début d’ébullition du système liquide diphasé.
Notons que, lors de cette ébullition commençante, la composition de la phase vapeur
qui se forme initialement est celle donnée par le point hétéroazéotrope, de composition
donnée par la fraction molaire xZ1 . Par construction, cet hétéroazéotrope a une pression
d’équilibre plus élevée que les deux constituants purs : l’hétéroazéotrope est toujours
plus volatil que les corps purs qui le composent.
Il n’est pas aussi simple d’étudier les deux branches de la courbe de rosée isobare
psat (T ) psat (T )
d’un binaire, puisqu’elle consiste à résoudre l’équation p = 1 V ou p = 2 V
x1 1 − x1
pour p fixée, cette équation ayant T pour inconnue. On peut procéder par exemple
numériquement au moyen de tables de valeurs de la pression de vapeur saturante ; nous

nous contenterons d’un tracé qualitatif, basé sur la forme du diagramme isotherme de
la figure 18.6, et sur les remarques suivantes :
• quand on passe du diagramme isobare au diagramme isotherme, les positions des
phases liquide et vapeur sont inversées ; il en va donc de même des courbes de
rosée et d’ébullition ;
• l’hétéroazéotrope est plus volatil que les corps purs ; son point d’ébullition est donc
plus faible que celui des deux corps purs.
Dans ces conditions, le tracé de la figure 18.7 représente, logiquement, les deux
branches de la courbe de rosée et l’horizontale de température T Z , assimilé ici en-
core à la courbe d’ébullition.
T T
p fixé
T2éb b rosé
e, A L
2 ⇋V
V b T éb
L ⇋ 1
e, A
1
é
ros
b
TZ
ébullition
x2 xZ1 x1
Figure 18.7 – Diagramme binaire isobare sans miscibilité
Ce diagramme représente bien le comportement de nombreux binaires sans miscibilité,

comme dans le cas eau–benzène ; la température d’ébullition de l’hétéroazéotrope est
69, 3 ◦ C, à comparer à 80, 1 ◦ C pour le benzène et 100 ◦ C pour l’eau (sous 1 bar).
18.1.4 Diagrammes binaires solide–liquide

2 Définitions : bien que l’étude des diagrammes binaires de fusion (équilibre solide–
liquide) ne figure pas à notre programme, on peut dans les cas les plus simples géné-
raliser simplement les résultats décrits dans le cas de l’ébullition au cas de la fusion.
Nous noterons seulement d’ores et déjà deux différences :
• du fait de la faible influence de la pression sur les phases condensées (liquide et
solide), on n’étudiera que des diagrammes isobares, pour l’étude de la fusion en
fonction de la température ;
• les courbes de rosée et d’ébullition changent ici de nom ; on parle de courbe liquidus
pour le tracé de T = T (xL1 ) et de courbe solidus pour le tracé de T = T (xS1 ).
2 Exemples : les espèces qui sont miscibles à l’état solide comme à l’état liquide
sont très rares ; il s’agit toujours d’espèces ayant de fortes analogies de structures
électroniques. On peut dans ce cas observer des diagrammes binaires en fuseau, ou
éventuellement avec azéotropie.
Toutefois, le cas le plus fréquent est celui des corps non miscibles en phase solide ;
les diagrammes correspondants sont alors semblables à celui de la figure 18.7 ; on
présente plus bas (figure 18.8) un diagramme binaire solide–liquide à relativement

basse température, celui du naphtalène N et du paradichlorobenzène P. Le mélange
liquide obtenu à l’équilibre en présence des deux phases solides porte ici le nom de
mélange eutectique cet équilibre est réalisé à 31, 9 ◦ C, température inférieure aux
températures de fusion de N pur (56, 0 ◦ C) et de P pur (82, 1 ◦ C).
90 ◦ C
82, 1 ◦ C
70 ◦ C
idus
Liqu
56, 0 ◦ C
b Solidus 31, 9 ◦ C
30 ◦ C
Eutectique
N
P
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Figure 18.8 – Diagramme binaire solide-liquide naphtalène–paradichlorobenzène
Le même type de diagramme décrit les mélanges cristallins étudiés en Géologie ; le dia-
gramme de la figure 18.8 est celui du mélange d’anorthite (CaAl2 Si2 O8 ) et de diopside
(CaMg2 Si2 O8 ).
1 600 ◦ C
1 557 ◦ C
1 500 ◦ C Liqu
idus
Eutectique
1 400 ◦ C 1 391 ◦ C
1 300 ◦ C
Solidus b 1 270 ◦ C
D
A
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Figure 18.9 – Diagramme binaire solide-liquide anorthite–diopside
On remarque bien sûr la valeur très élevée des températures de fusion mises en jeu dans
ce second diagramme ; les matériaux concernés sont des roches, étudiés en particulier
pour leur importance dans la minéralogie des champs pétroliers.
18.2 Lecture des diagrammes binaires
18.2.1 Diagrammes binaires isobares

2 Domaines monophasés : considérons d’abord un diagramme binaire isobare en
fuseau, sans azéotrope, comme celui de la figure 18.10. Supposons qu’on prépare un
mélange liquide de A1 et A2 , de composition donnée par la fraction molaire x1 , à
suffisamment basse température pour que l’ébullition ne puisse pas avoir commencé.
Le point représentatif de cette situation monophasée est M0 (ici et dans toute la suite
de la description, les notations sont celles de la figure 18.10).
T T
p fixé bM
4
b T éb
1
M3
b b T3
VAPEUR rosée L3
V2 b
M2 b b T2
V1 L2
b b T1
M1
T2éb b ébullition M0 b
LIQUIDE
x2 x1 x1
Figure 18.10 – Lecture d’un diagramme binaire isobare
Lors du chauffage isobare de ce mélange M0 , l’équilibre liquide-vapeur ne sera pas

atteint avant la température T donnée par T = T (x1 ) sur la courbe d’ébullition,
puisque ici x1 = xL1 ; c’est le point M1 de la courbe d’ébullition. Ainsi, tout le domaine
situé sous la courbe d’ébullition est le domaine monophasé d’existence exclusive de la
phase liquide.
Considérons de la même façon un mélange initial gazeux de même composition, pré-
paré à température assez élevée pour se trouver à l’état gazeux ; c’est le point M4 . Un
refroidissement isobare ne permettra pas de faire apparaı̂tre de liquide avant le point
M3 , dont la température vérifie T = T (x1 ) sur la courbe de rosée, puisqu’ici x1 = xL1 .
Tout le domaine situé au-dessus de la courbe de rosée est le domaine monophasé
d’existence exclusive de la phase vapeur.
Cette interprétation justifie évidemment que, même en cas d’intersection des courbes
(par exemple dans le cas d’azéotropie), l’ordre de ces courbes est fixé : il ne saurait
y avoir de croisement des courbes de rosée et d’ébullition.
2 Étude de l’ébullition : reprenons à nouveau l’étude de l’évolution d’un mélange

de composition initiale M0 , par chauffage isobare en système globalement fermé. La
température T1 = T (M1 ) est donc celle du début de l’ébullition. Lors de ce début
d’ébullition, il se forme une première bulle de vapeur dont la composition chimique
est donnée par T1 = T1 (xV 1 ) sur la courbe de rosée : c’est le point V1 .
On remarque que la première bulle de vapeur qui se forme est fortement enrichie (par
rapport au mélange initial en train de bouillir) dans le composé A2 qui, ici, est le
composé de plus basse température d’ébullition, et qui est donc aussi le composé le
plus volatil. Comme la phase liquide a conservé la composition du mélange de départ,
la conservation de la matière impose la formation d’une bulle de vapeur en quantité
infinitésimale à la température T1 . L’ébullition ne peut donc se poursuivre de manière
quantitative que par augmentation de la température.
2 Poursuite de l’ébullition : lorsque la température a atteint la valeur T2 , les com-
positions des phases liquide et vapeur ne sont plus identiques ; elles sont données par
les abscisses des points L2 et V2 , disposés respectivement sur la courbe d’ébullition et
sur la courbe de rosée. Le point M2 ne représente plus qu’un rappel de la composition
initiale du mélange.
À la température T2 , la vapeur formée est toujours plus riche que le mélange initial
dans le composé le plus volatil, mais cette différence est moins marquée qu’au début
de l’ébullition, car la quantité de vapeur formée est de plus en plus importante. Au
contraire, la composition du liquide restant est de plus en plus riche dans le composé
A1 qui est le moins volatil : ceci signifie bien sûr aussi qu’il reste de moins en moins
de liquide.
Lorsque la température atteint la valeur T3 , l’ébullition de termine : la composition
de la phase vapeur a repris la valeur de la composition du mélange initial au point M3
tandis que le point L3 désigne la composition d’une dernière goutte de liquide, qui
prend une composition très enrichie en composé moins volatil avant de disparaı̂tre. Un
chauffage ultérieur ne concerne plus qu’une phase vapeur homogène, jusqu’au point
M4 par exemple.
On pourrait bien sûr reprendre l’étude de l’évolution en sens inverse par refroidisse-
ment isobare de la phase vapeur donnée par M4 :
• la première goutte de liquide apparaı̂t à la température T3 ; sa composition, donnée
par l’abscisse du point L3 , est fortement enrichie dans le composé le moins
volatil ;
• plus tard, en cours de liquéfaction, les compositions des phases liquide (L2 ) et
vapeur (V2 ) sont différentes entre elles et de celle du mélange initial (M2 ) ; ces
compositions dépendent de la température T2 et varient de façon continue avec
celle-ci ;
• la dernière bulle de vapeur disparaı̂t à la température T1 , avec une composition
donnée par l’abscisse du point V1 , très riche dans le composé le moins volatil.
2 Courbes de chauffage : on remarque bien sûr que la température évolue tout au

long de l’ébullition : le point M1 de température T1 désignait le début de l’ébullition,
et le point M3 de température T3 désignera la fin de celle-ci et la disparition de la
dernière goutte de liquide.
T T
FE
T3
Ébullition
DE
T1
Ébullition d’un binaire t Ébullition d’un corps pur t
Figure 18.11 – Courbes d’évolution de température lors d’une ébullition
On remarquera donc l’absence de palier de température lors du chauffage d’un mélange

binaire ; la courbe décrivant les variations de température étant représentée, pour un
mélange binaire comme pour un corps pur, sur la figure 18.11. Dans le cas d’un
binaire, on observe une différence entre les températures de début (DE) et de fin (FE)
d’ébullition.
L’existence d’un palier de température lors du changement d’état n’existe que lorsque
les courbes de rosée et d’ébullition ont un point d’intersection : pour les corps purs
mais aussi pour les azéotropes, qui simulent donc, comme on l’a déjà dit, le compor-
tement d’un corps pur lors de l’ébullition.
Il est en principe facile de mettre en évidence la différence entre un mélange azéo-

trope et un corps pur : la composition d’un mélange azéotrope dépend un peu de
la pression. Ainsi, si l’ébullition d’une phase liquide donnée présente un palier de
température à une certaine pression, on peut refaire l’expérience avec le même mé-
lange à une autre pression ; si le palier ne subsiste pas, on a identifié un mélange
azéotrope.
18.2.2 Théorème des moments chimiques

2 Nécessité du théorème des moments : la lecture d’un diagramme binaire fournit par
lecture directe les compositions de la phase liquide et de la phase vapeur en fonction
de la température et de la pression ; par contre, on n’en déduit pas directement la
proportion respective de ces deux phases.
Lors de la réalisation d’une ébullition par exemple, c’est l’étude de ces proportions
respectives qui indique si on est plus ou moins avancé dans l’opération d’ébullition.
Considérons par exemple le diagramme binaire isobare sans azéotrope de la figure
18.10 ; l’ensemble des résultats établis ici se généralisent sans difficulté à tous les
types de diagrammes binaires, isobares ou isothermes, avec ou sans azéotrope.
À la température T2 , le point M2 a pour abscisse la fraction molaire de l’espèce A1
dans le mélange (( initial )) (le liquide qu’on fait bouillir, ou la vapeur qu’on cherche
à refaire passer à l’état liquide), tandis que les points L2 et V2 sont respectivement
situés sur la courbe d’ébullition et sur la courbe de rosée. Plus les points M2 et L2
sont proches, plus on est proche de la zone d’existence exclusive de la phase liquide ;
au contraire, plus les points M2 et V2 sont proches, plus on est proche de la zone
d’existence exclusive de la phase vapeur.
Les proportions respectives des deux phases liquide et vapeur peuvent donc être déter-
minées en considérant la distance respective de ces divers points ; on a déjà rencontré
le principe d’une telle analyse graphique dans le théorème des moments pour l’ébul-
lition d’un corps pur (lors de l’étude des isothermes d’Andrews) ; on va ici proposer
une règle analogue pour les mélanges binaires.
2 Expression du théorème des moments : les abscisses de L2 et V2 sont par définition
nL nV nL
égales à xL2 = xL1 = L 1 L et xV2 = xV 1 = V
1
V
, soit aussi xL2 = L1 ,
n1 + n2 n1 + n2 n
nV n L
+ nV
n1
xV2 = 1V . L’abscisse de M2 s’écrit de même xM2 = L 1 1
= L .
n n1 + nL2 + nV 1 + n2
V n + nV
n1 nV − nV L V

1 n +n
Considérons alors la mesure algébrique V2 M2 = xM2 − xV2 =
nV (nL + nV )
L V V L
n n −n n
soit V2 M2 = 1V L 1 V .
n (n + n )
nL1 nL + nV − n1 nL

De la même façon, M2 L2 = xL2 − xM2 = que l’on écrit encore
nL (nL + nV )
nL nV − nV nL
sous la forme M2 L2 = 1L L 1 V .
n (n + n )
On remarque bien sûr que les deux numérateurs sont égaux, ce qui permet de déter-
miner le rapport des quantités de matière des deux phases, qui constitue le théorème
des moments chimiques :
M2 L2 nV
= L (18.1)
V 2 M2 n
L’interprétation de ce théorème en termes de bras de levier mécaniques, comme dans

le cas du théorème des moments pour l’ébullition d’un corps pur, est évidente ; la
proportion de la phase vapeur augmente lorsqu’on s’approche du domaine exclusif
de la vapeur, donc lorsque V2 M2 diminue. Il est donc très facile de retrouver ce
théorème si on ne l’a pas mémorisé.
18.2.3 Généralisations
2 Fractions massiques : certains diagrammes isobares ou isothermes sont tracés en
termes de fractions massiques au lieu des fractions molaires ; ils se lisent et s’inter-
prètent exactement de la même façon que les diagrammes en fractions molaires, mais
toutes les lectures d’abscisse sur l’axe horizontal se font en termes de masses.
En particulier, le théorème des moments s’interprète comme un rapport de masses
dans les deux phases, liquide et vapeur. La figure 18.12 fournit par exemple le dia-
gramme binaire du mélange d’eau et d’acide nitrique, tracé à pression constante p = p◦
L V
et en termes de fractions massiques wHNO 3
(pour la courbe d’ébullition) et wHNO 3
(pour
la courbe de rosée). Ce diagramme présente un azéotrope.
130 ◦ C
120 ◦ C b
Rosée
HNO3
110 ◦ C
ion
Ébullit
100 ◦ C
90 ◦ C Azéotrope
H2 O
wHNO3
0, 0 0, 2 0, 4 0, 6 0, 8 1, 0
Figure 18.12 – Diagramme binaire isobare eau–acide nitrique
2 Diagrammes isothermes : considérons une dernière fois trois points V2 , M2 et L2

du diagramme binaire isobare de la figure 18.10. S’agissant de trois points situés sur
la même horizontale, donc à la même température, en retrouvera les mêmes points
sur un diagramme isotherme, comme celui de la figure 18.13.
Le corps A1 étant toujours ici supposé plus volatil que le corps A2 , la disposition
relative des pressions de vapeur saturante est à l’opposé de celle des températures
d’ébullition, et plus généralement l’ensemble du diagramme est inversé. Par contre, on
conserve l’interprétation des courbes de rosée et d’ébullition, qui permettent toujours
de relier la pression à la composition des deux phases.
Ainsi, le théorème des moments permet toujours de déterminer, pour p2 fixée dans le
domaine diphasé, la proportion des quantités de matière dans les deux phases :
p p
b T fixé bM
psat
2
0
LIQUIDE
ébullition
rosé M1
e b b p1
V1 M2 L
b b b 2 p2
V2
L
b b 3 p3
M3 b psat
1
M4 b
VAPEUR
x2 x1 x1
Figure 18.13 – Lecture d’un diagramme binaire isotherme
M2 L2 nV
= L (18.2)
V 2 M2 n
L’expression du théorème est exactement identique quel que soit le diagramme utilisé.
De même, l’étude d’une ébullition isotherme par diminution de pression se fait par
lecture des points successivement parcourus sur le diagramme, à composition globale
constante pour un système fermé, donc sur une verticale dont l’abscisse indique la
composition x1 du système que l’on fait bouillir ; on observe :
• au point M0 , le mélange initial est totalement liquide et se trouve dans le domaine
monophasé, en grisé sur la figure 18.13 ;
• en diminuant la pression, la première goutte de vapeur apparaı̂t à la pression p1 ;
sa composition, donnée par l’abscisse du point V1 , est nettement enrichie, par
rapport au mélange de départ, dans le composé A2 le plus volatil ;
• au fur et à mesure que l’ébullition se poursuit, la pression diminue et la composition
de la phase vapeur (l’abscisse du point V2 à la pression p2 ) se rapproche de celle
du mélange de départ. Au contraire, la composition du liquide restant s’éloigne
de celle du mélange initial et ce liquide s’enrichit dans le composé le moins volatil
A1 , comme on le voit en lisant l’abscisse du point L2 à cette même pression p2 ;
• la dernière goutte de liquide disparaı̂t à la pression de fin d’ébullition p3 ; cette
dernière goutte était très fortement enrichie dans le composé le moins volatil,
et au même moment la composition de la phase vapeur est devenue identique à
celle du mélange de départ ;
• une diminution ultérieure de la pression ne modifie plus l’état du mélange gazeux,
qui évolue dans le domaine monophasé vapeur (grisé sur la figure) à faible pres-
sion.
2 Cas d’azéotropie : l’existence d’un point azéotrope, qu’il s’agisse d’un diagramme
isobare ou isotherme, ne modifie pas non plus l’interprétation des courbes du dia-
gramme. Considérons par exemple le diagramme isobare de la figure 18.14 : l’ébullition
d’un mélange de composition x1 par augmentation de température.
Lors de l’ébullition, on retrouve en particulier les températures et compositions suc-
cessives des deux phases par lecture des points (M1 , V1 ) pour le début d’ébullition,
T M4 T
p fixé b
VAPEUR
b M3
b b
L3 M2 V2
b b b
ée
ros L2 V1
b b
n
itio
M1
b T éb
ull 1
éb
M0 b
T2éb b
x2 LIQUIDE x1
b b b
x′1 xZ1 x1
Figure 18.14 – Diagramme binaire avec azéotrope
(L2 , M2 , V2 ) pour un point en cours d’ébullition puis (V3 , M3 ) pour la fin d’ébul-
lition. Le théorème des moments s’applique bien sûr toujours pour déterminer le
rapport des quantités de matière dans les deux phases en cours d’ébullition, selon
nL /nV = M2 V2 /L2 M2
La seule particularité à noter dans le cas des diagrammes avec azéotrope est l’exis-
tence, dans certains cas, de plusieurs intersections des courbes de rosée ou d’ébullition
avec une horizontale (isotherme) donnée. Le système évolue bien sûr continûment,
donc en restant toujours sur la même branche des courbes de rosée et d’ébullition.
Par exemple, dans le cas de l’ébullition décrite sur la figure 18.14, tout se passe
comme si on réalisait l’ébullition d’un mélange du corps A1 et du corps fictif Z formé
du mélange azéotrope ; seul un fuseau du diagramme est utilisé, et les compositions
des deux phases restent toujours, au cours de l’évolution, supérieures à celle xZ1 de
l’azéotrope. Au contraire, si on avait réalisé l’ébullition d’un mélange de composition
initiale donnée, sur la figure 18.14, par l’abscisse x′1 , les compositions des deux phases
en cours d’ébullition seraient à tout instant restées inférieures à celle de l’azéotrope.
2 Cas de non-miscibilité : nous allons à nouveau montrer comment l’étude du
changement d’état d’un système binaire peut se faire par simple lecture du diagramme,
y compris dans le cas d’absence de miscibilité à l’état liquide.
Le diagramme étudié (isobare) est celui de la figure 18.15 ; compte tenu que le système
triphasé formé du mélange des gaz et des deux phases liquides ne peut exister qu’au
seul point hétéroazéotrope, ce diagramme fait apparaı̂tre cinq zones du plan :
• les zones monophasées liquide et vapeur, grisées sur la figure ;
• les zones diphasées pour l’équilibre de la vapeur avec un seul des liquides purs, en
blanc sur la figure ;
• la zone triphasée d’équilibre des deux phases liquides et de la phase vapeur, qui se
réduit au point hétéroazéotrope H.
Considérons par exemple l’ébullition isobare d’un système liquide préparé avec une
nL
composition donnée par l’abscisse x1 = L 1 L du point M0 de la figure 18.15.
n1 + n2
On remarquera que le système de départ n’est pas un mélange, mais seulement la
juxtaposition de deux phases liquides non mélangées. Pour cette raison, x1 n’est pas
une fraction molaire.
T T
M4 b p fixé
VAPEUR
T2éb
M3
L3 b b
ée
b
M2
b
V
b 2 ros
L2
A2 , L ⇋ V A1 , L ⇋ V
M1 Hb
L1 b b T1éb
b ébullition
x2
M0 LIQUIDES x1
b b
x1 H
x1
Figure 18.15 – Diagramme binaire sans miscibilité à l’état liquide
Lors de l’élévation de température, on va comme dans les autres cas observer plusieurs
phases dans l’évolution du système :
• lorsque la température atteint celle du point M1 , l’ébullition commence ; la compo-

sition de la première bulle de vapeur est celle du point hétéroazéotrope H.
• pendant un certain temps, le dégagement de vapeur de composition xH 1 provoque
l’ébullition d’un mélange gazeux de A2 et A1 plus riche en A1 que le système
initial ; ainsi, l’ensemble des deux phases liquide restantes s’appauvrit régulière-
ment en A1 ;
• après une certaine durée d’ébullition à température constante (avec donc un palier
comme pour l’ébullition d’un corps pur), il ne reste plus que le seul liquide A2
pur : le point représentatif de la phase liquide a donc régulièrement évolué de
M1 à L1 , ce qui justifie qu’on considère l’horizontale M1 L1 comme une branche
de la courbe d’ébullition ;
• le système étant diphasé depuis la disparition de la dernière goutte de A2 liquide,
l’évolution de la température peut reprendre ; en particulier, lorsque la tempé-
rature est celle de l’horizontale L2 M2 V2 , la composition de la phase liquide est
donnée par L2 (le corps A2 est toujours pur), celle de la phase vapeur formée
est donnée par le point V2 (on voit qu’elle se rapproche progressivement de la
composition globale du mélange) et le théorème des moments permet d’écrire,
pour cette température, nV /nL = L2 M2 /M2 V2 ;
• l’ébullition du liquide restant (A2 pur) se poursuit alors, et la phase vapeur s’enrichit
en A2 jusqu’à retrouver la composition de l’ensemble du système de départ ; c’est
la fin de l’ébullition, acquise au point M3 ;
• un chauffage ultérieur du mélange vapeur monophasé ne change plus l’état du sys-
tème, jusqu’au point M4 .
Les courbes d’évolution de la température lors de l’ébullition montrent donc, dans ce

cas, un palier partiel, comme on le voit sur le schéma 18.16.
Pendant ce palier, le système est triphasé et la composition de la phase vapeur est celle
de l’hétéroazéotrope. Lorsque le palier se termine, le mélange n’est plus que diphasé
avec disparition d’une des deux phases liquides.
T diphasé
triphasé Fin d’ébullition

THéb
Début d’ébullition
t
Ébullition
Figure 18.16 – Ébullition sans miscibilité à l’état liquide
18.3 Distillation
18.3.1 Distillation simple
2 Opération de distillation : l’opération de distillation simple consiste à réaliser

l’ébullition d’un mélange liquide et à récupérer la vapeur formée au fur et à mesure de
sa formation. Cette vapeur, une fois condensée, forme le distillat, tandis que le liquide
restant forme le résidu de la distillation.
T T
T2éb b p fixé
VAPEUR
ébu rosée
lliti
on
D2
b b
R2
D1
b b
R1 b T éb
1
bM
0
LIQUIDE
x2 x1 x1
Figure 18.17 – Distillation d’un mélange binaire
Considérons la distillation isobare d’un mélange binaire sans azéotrope, dont le dia-
gramme binaire est représenté sur la figure 18.17. Lors du début de l’ébullition, la
composition du résidu est celle du mélange de départ (point R1 ) tandis que les pre-
mières bulles de vapeur, formées à la composition du point D1 , vont fournir un distillat
très enrichi dans le composé le plus volatil.
Le système n’étant pas fermé, la composition de l’ensemble n’est pas constante au

cours du temps. Puisqu’on évacue un mélange, dans le distillat, particulièrement riche
dans le composé A1 qui est ici le plus volatil, le résidu s’appauvrit en A1 . Au bout
d’un certain temps, la composition du résidu est donné par le point R2 , et les bulles
de vapeur produites à ce moment ont pour composition celle du point D2 .
Au fur et à mesure de la distillation, le résidu acquiert une composition donnée par la

courbe d’ébullition, tandis que la masse de résidu diminue. Le distillat étant évacué
de ce système binaire au fur et à mesure de sa formation, la composition du résidu
évolue également, formant une moyenne des compositions des vapeurs évacuées sur la
courbe de rosée.
2 Résultat de la distillation simple : dans le cas de la distillation d’un mélange sans

azéotrope, comme celui de la figure 18.17, on constate immédiatement que le distillat
est en général plus riche dans le composé le plus volatil que le mélange de départ. La
distillation simple peut n’avoir pour but que cet enrichissement partiel. Dans le même
temps, la composition du résidu s’enrichit en composé le moins volatil.
Si la distillation pouvait être menée à son terme, elle aboutirait à un résidu pur,
constitué uniquement du composé le moins volatil (ici, A2 ). Comme on va le voir,
cette purification est en fait impossible.
La purification de A2 présente en effet deux limitations ; on ne peut obtenir comme

composé pur que le seul composé le moins volatil du mélange ; de plus, le distillat
évacué a emporté une partie notable du composé A2 , partie qui est d’autant plus im-
portante que la distillation progresse ; le rendement de la distillation en A2 quasiment
pur est toujours faible.
De plus, la présence éventuelle d’un azéotrope avec maximum sur les courbes de
rosée et d’ébullition limite l’opération ; si cet azéotrope est présent, la composition
limite du résidu est celle de l’azéotrope.
La figure 18.18 montre un montage destiné à la distillation simple au laboratoire de
Chimie.
Figure 18.18 – Montage de distillation simple
La distillation simple est aussi utilisée pour modifier la composition d’un mélange, sans
provoquer de purification totale ; la distillation des alcools alimentaires (la figure 18.19
montre un alambic traditionnel) s’accompagne de réactions chimiques catalysées par
le cuivre des cuves de l’alambic, qui contribuent à la modification de la composition
chimique de l’alcool distillé.
Figure 18.19 – Bouilleur pour la distillation d’alcools
18.3.2 Distillation fractionnée

2 Principe de la distillation fractionnée : l’opération consiste à réaliser l’opération
de distillation dans une colonne réfrigérée permettant de recondenser plusieurs fois de
suite le distillat au fur et à mesure de sa formation. On utilise pour cela une colonne
à plateaux superposés, chaque plateau étant à température un peu moins élevée que
ceux au-dessus desquels il est situé.
T T
T2éb p fixé
VAPEUR
rosée V1′
b b V1
L′1 b b
L1
ébul V2′
litio
n b b V2
b b
L′2
L2 b b b
T1éb
L3
LIQUIDE
x2 x1 x1
Figure 18.20 – Distillation fractionnée d’un mélange binaire
Considérons la distillation fractionnée (isobare) d’un binaire sans azéotrope, dont le

diagramme binaire est représenté sur la figure 18.20. Au début de la distillation, la
composition du mélange est donnée par le point L1 , qui est aussi la composition
(provisoire) du résidu.
La vapeur qui se forme immédiatement au dessus de cette phase en équilibre, et en
équilibre avec celle-ci, à une composition donnée par le point V1 , enrichie dans le com-
posé le plus volatil par rapport à L1 . Sur le premier plateau refroidi à la température
TL2 < TV1 , la vapeur en question se condense avec conservation de la composition,
formant des gouttes de liquide à la composition donnée par le point L2 .
Si ce liquide est en équilibre avec de la vapeur, celle-ci, de composition donnée par V2
monte au dessus de ce plateau pour atteindre le plateau de refroidissement suivant,
où la condensation forme de nouvelles gouttes de liquide de composition L3 .

Ainsi s’établit dans la colonne de distillation (cf. figure 18.21) un gradient de tem-
pérature dirigé vers le bas, tandis que la composition de la vapeur varie de façon
pratiquement continue, le gaz formé en haut de la colonne étant pratiquement formé
du composé A1 le plus volatil, quasiment pur si le nombre de plateaux de la colonne
est suffisant.
Figure 18.21 – Montage de distillation fractionnée
Dans le cas d’une distillation fractionnée réalisée en système ouvert, la composition

du résidu évolue de façon continue, selon L1 L′1 . . ., jusqu’à atteindre celle du corps A2
pur ; le point représentatif de la composition du résidu de distillation se déplace donc,
au fur et à mesure de l’opération, jusqu’à la limite du corps pur.
2 Résultat de la distillation fractionnée : on peut récupérer en sommet de colonne le
composé le plus volatil, pur. Au fur et à mesure que ce composé est récupéré, le résidu
et l’ensemble du contenu de la colonne s’appauvrissent progressivement en composé
A1 le plus volatil, et la composition du résidu s’approche progressivement de celle du
composé A2 pur. Si on arrête à ce moment la distillation fractionnée, on a donc pu
séparer A1 pur (dans le distillat) et A2 pur (dans le résidu).
Toutefois, ces prédictions sont infirmées en présence d’azéotrope, l’évolution de com-
position des phases liquide restante et vapeur formée étant limitées au fuseau de
courbes exploité. Ainsi, en présence d’un azéotope à maximum de température, il est
impossible de (( monter )) le point représentatif du résidu au delà du point corres-
pondant ; la distillation est limitée. Par exemple, le mélange d’eau et d’acide nitrique
ne peut être distillé au delà du point azéotrope, comprenant environ 70 % d’acide
nitrique en masse (voir le diagramme binaire de la figure 18.12). La distillation d’un

mélange industriel, moins riche que cet azéotrope, ne peut pas purifier l’acide ni-
trique au delà de cette proportion ; l’obtention d’acide nitrique pur (acide fumant) est
réalisée industriellement par d’autres voies (synthèse directe en autoclave).
De la même façon, en présence d’un azéotope à minimum de température, il est impos-

sible de (( descendre )) le point représentatif du distillat en deçà du point azéotrope ;
la distillation est limitée. Par exemple, le mélange d’eau et d’éthanol présente un
azéotrope à minimum de température (voir le diagramme binaire de la figure 18.5)
qui comprend environ 98 % d’éthanol (en volume). La distillation d’un mélange in-
dustriel, moins riche que cet azéotrope, ne peut pas purifier l’éthanol au delà de cette
proportion. L’obtention d’éthanol pur est réalisée industriellement par distillation de
mélanges ternaires eau, benzène, éthanol.
2 Colonne de raffinage : il est possible de récupérer, dans une colonne à distillation

fractionnée à plateaux multiples, des mélanges de composition variée selon le niveau
de la colonne. La figure 18.22 présente une telle colonne.
Figure 18.22 – Colonne de distillation fractionnée industrielle
C’est ce principe qui est adopté pour la distillation du pétrole brut ; de la base au
sommet des tours de distillation, la composition chimique des produits extraits varie
depuis les huiles lourdes jusqu’au méthane, en passant par le gazole, le kérosène,
l’essence, le butane et le propane.
18.4 Le cas des binaires idéaux
18.4.1 Mélanges idéaux

2 Définition : on parle de diagramme idéal lorsque le mélange forme une solution
idéale dans les deux phases en équilibre. Par exemple, un diagramme binaire idéal
liquide–vapeur impose de considérer la phase liquide et la phase gazeuse comme deux
mélanges idéaux ; il s’agit d’une approximation qu’on peut souvent faire lorsque les
deux composants A1 et A2 ont une structure moléculaire suffisamment voisine : il peut
s’agir par exemple de molécules isomères, comme le propan-1-ol et le propan-2-ol.
2 Loi de Raoult : dans le cas d’un mélange binaire idéal, on peut écrire le potentiel
chimique de l’espèce A1 dans les deux phases sous la forme µL1 = µ◦L 1 (T ) + RT ln x1
L
p1
et µV ◦V
1 = µ1 (T ) + RT ln ; la condition d’équilibre des deux phases est µL1 = µV
1,
p◦
L p 1
donc µ◦L ◦V
1 (T ) + RT ln x1 = µ1 (T ) + RT ln ◦ .
p
On explicite cette loi en la comparant à la définition de la pression de vapeur saturante
du corps A1 pur, pression d’équilibre au-dessus du liquide pur à la même température,
sat(T )
p1
ce qui impose µ◦L1 (T ) = µ ◦V
1 (T ) + RT ln . La comparaison des deux relations
p◦
permet d’écrire la loi de Raoult, caractéristique des mélanges idéaux :
p1 = xL1 psat
1 (T ) (18.3)
On ne confondra pas cette loi avec la loi de Dalton, p1 = xV

1 p, qui est simplement
la définition de la pression partielle de l’espèce A1 .
18.4.2 Diagrammes isobares idéaux

2 Expression des courbes d’ébullition et de rosée : l’écriture de la loi de Raoult pour les
deux constituants du mélange impose p1 = xV L sat V L sat
1 p = x1 p1 (T ) et p2 = x2 p = x2 p2 (T ) ;
on obtient la courbe d’ébullition en éliminant les fractions molaires de la phase vapeur,
xV V L sat L sat
1 + x2 = 1 donc p = x1 p1 (T ) + 1 − x1 p2 (T ). La courbe d’ébullition est donc
ici une droite, passant par les points x1 = 0, p = psat
L L sat

2 (T ) et x 1 = 1, p = p1 (T ) ,
correspondant à l’ébullition des corps purs A1 et A2 .
On obtient de même la courbe de rosée en éliminant les fractions molaires de la phase
1 xV 1 − xV
liquide, xL1 + xL2 = 1 donc = sat1 + sat 1 . C’est une hyperbole équilatère,
p p1 (T ) p2 (T )
dont on peut remarquer bien sûr qu’elle passe par les mêmes points extrêmes que la
courbe d’ébullition.
2 Tracé du diagramme isobare idéal : l’allure d’un diagramme isotherme idéal est
représenté sur la figure 18.23, dans le cas où le corps A1 est plus volatil que A2 à la
température T .
p p
T fixé
LIQUIDE
psat
1
n
litio
ébul
rosée
psat
2
VAPEUR
x2 x1
Figure 18.23 – Diagramme binaire isotherme idéal

18.4.3 Diagrammes isothermes idéaux

Le tracé des diagrammes isothermes est a priori plus difficile que celui des diagrammes
isobares, car ce tracé exige de déterminer les expressions des pressions de vapeur
saturante psat sat
1 (T ) et p2 (T ) en fonction de la température T . Nous n’en ferons donc
aucune étude générale.
Notons tout de même que cette étude peut se faire en application de la relation de
Clapeyron, dont l’intégration fournit précisément les relations psat sat
1 (T ) et p2 (T ) ; on
peut par exemple intégrer ces relations dans le cadre de l’approximation d’Ellignham,
qui consiste à affirmer que les chaleurs latentes d’ébullition des deux corps A1 et A1
sont indépendantes de la température.
L’équilibre diphasé d’un mélange binaire est divariant ; les deux relations entre
L V
les quatre paramètres intensifs T , p, xL1 et xV
1 sont les deux égalités µ1 = µ1
L V
et µ2 = µ2 .
On traduit ces relations par le tracé de deux courbes. Pour la courbe d’ébullition,
T est tracé en fonction de xL1 (dans le cas des diagrammes à p fixé) ou bien p
est tracé en fonction de xL1 (dans les diagrammes à T fixé). Pour la courbe de
rosée, le même paramètre intensif est tracé en fonction de xV
1.
Les deux courbes sont monotones et toujours disposées dans le même ordre
entre deux points d’intersection ; elles ne se coupent que dans le cas des corps
purs et des éventuels mélanges azéotropes.
Les deux courbes délimitent des régions monophasées : le domaine du liquide
pur (T faible ou p élevé) est limité par la courbe d’ébullition, qui permet de
déterminer le début de l’ébullition d’un mélange, tandis que le domaine de la
vapeur pure (T élevé ou p faible) est limité par la courbe de rosée, qui permet
de déterminer la fin de l’ébullition.
T p fixé M4 T
b
VAPEUR
b M3
b b
e V2
sé L3 b M2
ro R 1
b b
b b
V1
C1 L2 b b
n
itio
M1 b T éb
1
ull
C2
b b
éb
M0 b
T2éb b LIQUIDE x1
x′1 xZ1
b b b
Au cours de l’ébullition M0 → M4 d’un mélange de composition x1 (ci-dessus),

on atteint des états intermédiaires (point M2 ) pour lesquels on lit la composition
des deux phases (xL1 = xL2 , xV 1 = xV2 ) et l’avancement de l’ébullition par le
théorème des moments, nV /nL = L2 M2 /M2 V2 .
Seule l’ébullition d’un azéotrope (composition xZ1 simule celle d’un corps pur,
avec palier de température. Dans les autres cas, la température varie au cours
de l’ébullition isobare (et la pression au cours de l’ébullition isotherme).
Lors d’une opération de distillation, le système est ouvert et les compositions
du résidu et du distillat évoluent le long des deux courbes d’équilibre. Pour
une distillation fractionnée, le grand nombre de plateaux permet d’avoir un
gradient de température vers le bas dans la colonne (points C1 , C2 , . . . ), une
composition en tête de colonne quasiment pure (sauf azéotrope à minimum
de température) et un résidu quasiment pur (sauf azéotrope à maximum de
température, comme sur la figure ci-dessus).
Pour un mélange idéal (liquide et vapeur), on retrouve les équations des courbes
d’ébullition et de rosée en écrivant les lois de Dalton (pi = xV
i p) et de Raoult
(pi = xLi psat L V
i (T ), conséquence de µi = µi .)

Cours de Physique - Lycee Claude Fauriel - Eléctricité - Optique

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours de Physique - Lycee Claude Fauriel - Eléctricité - Optique

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre 1

Électricité dans les réseaux linéaires

1.1 Réseaux linéaires

Prenons encore l’exemple du courant industriel, à la fréquence f = 50 Hz, donc avec

1.1.2 Lois de Kirchhoff

2 Loi des mailles : puisqu’on a fait X

1.1.3 Dipôles linéaires

Figure 1.1 – Dipôle électrocinétique

– soit, si le courant ne dépend pas seulement de u, par la donnée d’une méthode de

Figure 1.2 – Modèles de Thévenin et de Norton

1.1.4 Quadrupôles linéaires

1.1.5 Théorèmes généraux des réseaux linéaires

X en série et en parallèle : l’association en série (même courant i, tension

Figure 1.5 – Associations de générateurs en série

Figure 1.6 – Associations de générateurs en parallèle

Figure 1.7 – Diviseur de tension

On remarque sur la figure 1.7 qu’une association se comporte comme un diviseur de

Figure 1.8 – Diviseur de courant

On remarque sur la figure 1.6 qu’une association se comporte comme un diviseur de

Figure 1.9 – Théorème de Millman

[G] [V ] = [J] (1.8)

On prendra garde, dans une telle application du théorème de Helmholtz, à ne pas

2 Théorème de Thévenin-Norton : considérons (cf. figure 1.10 à gauche) un réseau

Figure 1.10 – Théorème de Thévenin-Norton

On peut bien sûr en donner la forme équivalente :

1.2 Régimes transitoires

1.2.1 Régimes d’évolution

Figure 1.11 – Amplificateur opérationnel de différence

Formes canoniques des systèmes du second ordre

Il est important de noter que la condition de stabilité ci-dessus (a, b et c de même

Stabilité des systèmes du premier et du second ordre

2 Nature des régimes du second ordre : le discriminantréduit de l’équation carac-

Figure 1.12 – Régime transitoire pseudo-périodique

Figure 1.13 – Régime transitoire apériodique

1.2.2 Conditions initiales

Figure 1.14 – Distributions de Heaviside et de Dirac

2 Applications : considérons d’abord le réseau de la figure 1.15 ; D est un dipôle

Figure 1.16 – Réseau R, L parallèle

Ce résultat est plus utile si on considère le montage de Norton formé de η(t) et R

1.3 Régime harmonique forcé des réseaux linéaires

1.3.1 Principes d’étude

X(t) = Xmax cos (ωt + ϕ) −→ X(t) = X 0 exp (jωt)

u=Zi Z = |Z| (1.10)

Dans la relation 1.10, Z porte le nom d’impédance complexe et Z celui d’impédance

En particulier, les dipôles R = 1/G, L et C sont caractérisés par les relations :

1.3.2 Diagrammes de Bode

Figure 1.17 – Quadrupôle linéaire en régime harmonique

Figure 1.18 – Diagrammes en gain de filtres du premier ordre

On y a noté G0 = 20 lg H0 et on remarque que, lorsque x = 1 donc ω = ω0 (c’est la

Figure 1.19 – Diagrammes en phase de filtres du premier ordre

deux cas, la constante de temps τ de l’équation homogène associée au régime libre

Figure 1.20 – Filtre passe-bas du second ordre

Le changement de facteur de qualité influe exclusivement sur le comportement au voi-

Figure 1.21 – Filtre passe-haut du second ordre

Dans ce cas, le régime transitoire est pseudo-périodique amorti, de pseudo-pulsation

Figure 1.22 – Filtre passe-bande du second ordre

1.4 Puissance et énergie électriques

1.4.1 Échanges d’énergie d’un dipôle

En convention des générateurs, les expressions analogues δWg = Pg × dt et Pg = ug i

Échanges énergétiques des dipôles

Malgré leur ressemblance apparente, on ne doit jamais confondre P = Ri2 (une

2 Énergie et conditions initiales : en régime variable, on a vu que, sauf cas particulier,

1.4.2 Puissance en régime harmonique

Figure 1.24 – Grandeurs RMS pour différents signaux périodiques