Vous êtes sur la page 1sur 23

Contenu physique du formalisme

Table des matières


1 Postulats généraux 2

2 Spectre discret non-dégénéré 3

3 Mesures de deux grandeurs 5

4 Grandeurs incompatibles : inégalité de Heisenberg 6

5 Mesure d’un moment magnétique ; expérience de Stern et Gerlach 6


5.1 Interaction avec un champ d’induction magnétique . . . . . . . . . . . . . . 7
5.2 Description de l’expérience de Stern et Gerlach . . . . . . . . . . . . . . 8
5.3 Résultats expérimentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5.4 Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.5 Représentations matricielles des composantes du moment magnétique . . . 12

6 Polarisation de la lumière 13
6.1 Polarisation rectiligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.2 Polarisation circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.3 Polarisation du photon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.4 Polarisation rectiligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.5 Polarisation circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.6 Transformation des états par rotation . . . . . . . . . . . . . . . . . . . . . 17

7 Cryptographie quantique 17

8 Spectre discret dégénéré 18

9 Ensemble complet d’observables qui commutent 20

10 Opérateur densité 20
10.1 États purs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
10.2 Mélanges statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
10.3 Propriétés générales de l’opérateur densité : indice de pureté . . . . . . . . . 22
10.4 Populations et cohérences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1
La mécanique quantique a été inventée pour interpréter des expériences réalisées sur
des atomes. Contrairement à la vieille théorie quantique, elle a montré sa validité pour
l’étude des atomes à plusieurs électrons, les molécules et les solides. Plus tard, elle a per-
mis d’étudier avec succès les phénomènes nucléaires ainsi que les particules élémentaires.
Conçue pour expliquer des phénomènes à basses énergies (quelques dizaines ou centaines
d’eV ), elle a été confirmée à des énergies très élevées (des dizaines de M eV en physique
nucléaire et des GeV en physique des particules). Elle a permis de suggérer des expériences
et de faire des prévisions qui ont toujours été vérifiées. Pour faire le lien avec l’expérience
il faut se donner des règles d’interprétation du formalisme qui jouent le rôle de postulats
de la mécanique quantique.

L’approche opérationnelle présentée ici est pratiquement toujours celle qui est utilisée
dans un premier cours de mécanique quantique. Elle est connue sous le nom d’interprétation
de Copenhague. Malgré ses défauts ou ses insuffisances, elle permet d’appliquer de manière
efficace la théorie quantique à un grand nombre de situations. L’observateur et la notion de
mesure jouent un rôle central dans l’interprétation du formalisme. En physique classique,
une théorie peut décrire l’évolution d’un système en faisant abstraction de l’observateur.
La mesure peut confirmer ou infirmer la théorie mais elle ne joue pas un rôle essentiel dans
l’évolution du système.
Selon l’interprétation de Copenhague le monde est divisé en deux parties : un système
microscopique et un appareil de mesure macroscopique. Le premier obéit aux lois de la
physique quantique tandis que le second obéit aux lois de la physique classique. La physique
classique joue donc un rôle central dans la formulation des lois de la physique quantique
alors qu’elle en constitue une approximation. Cette séparation arbitraire entre l’objet étudié
et l’appareil de mesure ne permet pas d’étudier, par exemple, l’univers dans son ensemble.
L’interprétation de Copenhague a fait l’objet de nombreuses critiques pour d’autres rai-
sons. En particulier, l’application de la logique quantique au monde macroscopique donne
lieu à des situations paradoxales. Les théories alternatives visant à éliminer ces paradoxes
n’ont pas connu beaucoup de succès. Une approche plus féconde a consisté à essayer de com-
prendre comment la logique quantique applicable aux niveaux atomique et sub-atomique
conduit à la logique familière à l’échelle macroscopique. La clé de cette compréhension se
trouve dans la notion de décohérence.

1 Postulats généraux
Les trois postulats présentés ici concernent tous les systèmes. Ils seront complétés par
d’autres qui dépendent de la nature du spectre de la grandeur mesurée.

Postulat 1.
A chaque instant l’état d’un système est complètement défini par la donnée d’un
vecteur d’état |ψ(t)i appartenant à un espace de Hilbert qu’on appelle espace des
états. En conséquence, la connaissance de ce vecteur permet de calculer toutes les
grandeurs mesurables rendant possible la comparaison théorie-expérience. Ce postu-
lat implique le principe de superposition des états.

Postulat 2.
A toute grandeur physique A on associe un opérateur hermitien  dont les kets
propres forment une base de l’espace des états. Cet opérateur est appelé observable.
N.B. Certains auteurs utilisent le nom d’observable pour la grandeur physique elle-même.

2
Postulat 3.
La mesure d’une grandeur physique ne peut donner comme résultat que l’une ou
l’autre des valeurs propres de l’observable associée. Les résultats possibles ne dé-
pendent pas de l’état du système. La connaissance du vecteur d’état va permettre de
calculer la probabilité de chaque résultat possible.
Pour aller plus loin, il faut préciser la nature du spectre de la grandeur mesurée. Nous
commencerons par le cas d’un spectre discret non-dégénéré puis nous étudierons le cas d’un
spectre discret dégénéré. Le cas d’un spectre continu sera considéré au chapitre 6.

2 Spectre discret non-dégénéré


La grandeur mesurée A est représentée par l’observable  dont les valeurs propres
sont toutes non-dégénérées. En notant |φk i ses kets propres, l’équation aux valeurs propres
s’écrit :
Â|φk i = ak |φk i (k = 1, 2, . . . , N )
Les kets propres étant orthogonaux, il est toujours possible de les normer pour former une
base orthonormée de l’espace des états. Tout vecteur peut être développé sur cette base :
N
X
|ψi = cj |φj i
j=1

Les valeurs propres représentent les résultats possibles d’une mesure. La connaissance de
l’état permet de calculer la probabilité de chacune et d’en déduire l’espérance mathéma-
tique de la grandeur mesurée.
Postulat 4 (spectre non-dégénéré).
La probabilité d’obtenir la valeur propre ak est donnée par :

P (ak ) = |hφk |ψi|2 = |ck |2

La somme des probabilités peut s’écrire sous la forme :

N
X N
X
P (ak ) = hψ|φk ihφk |ψi
k=1 k=1

Les kets propres de  vérifiant la relation de fermeture, l’équation précédente peut


s’écrire :

N
X
P (ak ) = hψ|ψi
k=1

La normalisation du vecteur d’état entraîne celle des probabilités.

L’espérance mathématique de la grandeur mesurée est donnée par :


N
X
< A >= akP (ak ) (1)
k=1

En utilisant l’expression de la probabilité il vient :

3
N
X
< A >= ak hψ|φk ihφk |ψi (2)
k=1

A l’aide de la représentation spectrale de l’observable Â, cette relation s’écrit sim-


plement :

< A >= hψ|Â|ψi (3)

Dans le cas général il est impossible de prédire le résultat d’une mesure car seules
les probabilités sont calculables. Il existe cependant un cas particulier pour lequel le
résultat de la mesure est prévisible avec certitude. En effet, si le système est dans un
état propre |φn i de la grandeur mesurée, on a :

P (ak ) = |hφk |φn i|2 = δkn

La mesure donnera certainement la valeur propre an . Un dernier postulat indique


comment un système peut être préparé dans un état donné.

Postulat 5 (spectre non-dégénéré).

L’état du système immédiatement après la mesure d’une grandeur est représenté par
le ket propre de l’observable associée correspondant à la valeur propre trouvée. La
mesure a donc pour effet de projeter l’état du système sur un des états propres de
cette observable. En général un système peut changer d’état au cours du temps d’où
la nécessité de préciser qu’il s’agit de l’état immédiatement après la mesure. Nous
verrons au chapitre 5 qu’il existe des états stationnaires pour lesquels cette précision
n’est pas nécessaire.

Si la mesure est répétée sans délai, elle donne le même résultat. En effet la première
mesure laisse le système dans un état propre de l’observable associée à la grandeur
mesurée de sorte que la seconde mesure donne certainement la valeur propre associée.

Remarque. Les expressions (1), (2) et (3) représentent l’espérance mathématique de


la grandeur A c’est à dire la valeur attendue lorsque l’on mesure une moyenne. On
utilise souvent le mot "moyenne" au lieu d’espérance mathématique. Il est important
de réaliser que la moyenne fait référence à des mesures indépendantes faites une seule
fois sur des systèmes identiques préparés de la même manière. Il ne s’agit pas de me-
sures répétées sur un même système car dans un tel cas, le résultat de la première
mesure se répète chaque fois.

Le processus de mesure est assimilable à une projection. Si la valeur propre trouvée


est an , le projecteur sur l’état propre correspondant donne :

Pˆn |ψi = |φn ihφn |ψi

Dans le membre de droite, le produit scalaire donne l’amplitude de probabilité d’obte-


nir la valeur propre an tandis que le ket représente l’état du système après la mesure.
Une seconde mesure est représentée par un autre projecteur :

Pˆm Pˆn |ψi = |φm ihφm |φn ihφn |ψi

4
soit :
Pˆm Pˆn |ψi = δmn |φm ihφn |ψi

Le résultat est nul, c’est à dire physiquement impossible, sauf si am = an .


Si l’état avant la mesure est normé, la projection sur un état propre de la grandeur
mesurée fait perdre la normalisation. On peut la retrouver en définissant l’état final
comme suit :
Pˆn |ψi
|ψf i = q (4)
hψ|Pˆn |ψi

3 Mesures de deux grandeurs


Considérons deux grandeurs A et B auxquelles sont associées des observables qui com-
mutent. Ces observables ont une base de vecteurs propres communs notés |φk i. Si la mesure
de A donne comme résultat la valeur propre an , l’état du système immédiatement après
cette mesure est |φn i. Des mesures subséquentes de la même grandeur donneront toutes le
même résultat (à condition que les mesures soient rapprochées dans le temps ou que l’état
soit stationnaire). On peut dire, dans ce sens, qu’après la première mesure la grandeur A
a une valeur bien définie.

Supposons qu’après cette première mesure de la grandeur A, on effectue une mesure


de la grandeur B. L’état |φn i dans lequel se trouve le système après la mesure de A est
un état propre de l’observable B̂. La mesure de cette grandeur donnera certainement la
valeur bn . Une nouvelle mesure de A donnera certainement an et et une nouvelle mesure
de B donnera bn , et ainsi de suite. Dans ce sens on peut dire que les grandeurs A et B ont
des valeurs bien définies simultanément. On dit qu’elles sont compatibles.

Considérons maintenant le cas où les observables ne commutent pas. Il peut arriver que
certains kets propres de  soient également kets propres de B̂ mais ceux-ci ne sont pas
assez nombreux pour former une base.
On note |φk i les kets propres de  et |χk i ceux de B̂ :

Â|φk i = ak |φk i B̂|χk i = bk |χk i

Si la première mesure de la grandeur A donne comme résultat la valeur propre an ,


l’état du système n’est pas en général un ket propre de B̂. La mesure de la grandeur
correspondante peut donner différentes valeurs bm avec les probabilités :

P (bm ) = |hχm |φn i|2

L’état du système après cette seconde mesure est |χm i. En général ce n’est pas un ket
propre de  de sorte que la mesure de la grandeur A peut donner différents résultats avec
les probabilités :
P (al ) = |hφl |χm i|2
L’information contenue dans la première mesure a été détruite par la mesure de la
grandeur B. On ne peut pas attribuer des valeurs bien définies simultanément aux deux
grandeurs. On dit qu’elles sont incompatibles.

5
4 Grandeurs incompatibles : inégalité de Heisenberg
Considérons deux grandeurs A et B dont les observables associées ne commutent pas.
Le produit de deux opérateurs peut s’écrire comme la demi-somme de leur commutateur
et de leur anti-commutateur :
1 1
ÂB̂ = [Â, B̂] + {Â, B̂}
2 2
Les opérateurs étant hermitiens, l’espérance mathématique de l’anti-commutateur est
réelle tandis que celle du commutateur est imaginaire. La valeur absolue de l’espérance
mathématique du produit vérifie donc l’inégalité :
1
hψ|ÂB̂|ψi > hψ|[Â, B̂]|ψi (5)

2
Le membre de gauche fait apparaître le produit scalaire du vecteur B̂|ψi par le vecteur
Â|ψi. L’inégalité de Schwarz appliquée à ces vecteurs permet d’écrire :
q
hψ|Â2 |ψihψ|Bˆ2 |ψi > hψ|ÂB̂|ψi

Compte tenu de l’inégalité (5), cette relation permet d’écrire :


q
1
hψ|Â2 |ψihψ|Bˆ2 |ψi > hψ|[Â, B̂]|ψi (6)

2
Introduisons les nouveaux opérateurs :

Â0 = Â− < A > Iˆ et B̂ 0 = B̂− < B > Iˆ

Ils vérifient eux aussi une inégalité du type (6). Dans le membre de gauche on a alors les
variances de  et de B̂. Le membre de droite est identique à celui de (6) car les nouveaux
opérateurs ont le même commutateur que  et B̂. Le produit des écarts-types de deux
grandeurs incompatibles vérifie donc l’inégalité de Heisenberg :
1
σA σB > hψ|[Â, B̂]|ψi

2
Il ne peut donc pas être rendu arbitrairement petit et les deux grandeurs ne peuvent pas
avoir des valeurs bien définies simultanément.

5 Mesure d’un moment magnétique ; expérience de Stern et


Gerlach
L’expérience réalisée en 1922 par Stern et Gerlach pour mesurer le moment magné-
tique d’un atome a joué un rôle majeur dans le développement de la mécanique quantique.
Nous en donnons une description détaillée car elle illustre bien l’échec d’une tentative d’ex-
plication classique et les règles d’interprétation du formalisme quantique.

En physique classique, un moment magnétique est associé à une boucle de courant


électrique. C’est un vecteur perpendiculaire au plan de la boucle dont la norme est égale
au produit de l’intensité du courant par l’aire de la boucle. Le sens du vecteur est donné
par la règle de la main droite : lorsque les doigts parcourent la boucle dans le sens du
courant, le pouce indique le sens du moment magnétique.

6
Le courant électrique est produit par le mouvement de particules matérielles chargées.

→ →

Le moment magnétique M est proportionnel au moment angulaire L des particules par-
courant la boucle. On écrit :

→ →

M = γ L où γ est le facteur gyromagnétique.

En prenant l’exemple du mouvement circulaire exécuté par une particule de charge q


q
et de masse m, on trouve facilement : γ = .
2m
Si la charge est positive, le moment magnétique est dans le même sens que le moment
angulaire et si la charge est négative, il est dans le sens opposé.

5.1 Interaction avec un champ d’induction magnétique




La présence d’un champ d’induction magnétique B produit un moment de force (ou


couple) Γ donné par :

− −
→ →

Γ =M∧B
La relation fondamentale de la dynamique de la rotation permet d’écrire :


dL −
→ → −
=M∧B
dt
En multipliant les deux membres par le facteur gyromagnétique, il vient :


dM −
→ → −
= γM ∧ B
dt
Cette équation décrit l’évolution du moment magnétique. Il est facile d’identifier deux


constantes du mouvement. En multipliant scalairement les deux membres par M , on ob-
tient :



→ dM
M. =0
dt
Cette relation implique que la norme du moment magnétique est une constante du mou-
vement. De même, le produit scalaire des deux membres par un vecteur unitaire ~k dans la


direction de B donne : −

~k. dM = 0
dt
La projection du moment magnétique sur la direction du champ est donc également une
constante du mouvement. Ses composantes perpendiculaires au champ oscillent en quadra-
ture. Dans son mouvement le moment magnétique décrit un cône. On dit qu’il exécute une
précession autour du champ.

L’énergie potentielle U du dipôle magnétique dans le champ d’induction magnétique


est donnée par le produit scalaire :

→→−
U = −M . B

→ →

Il existe deux orientations d’équilibre. Lorsque M est parallèle à B , le moment de force
est nul et l’énergie potentielle atteint son minimum. L’équilibre est donc stable. Lorsque

→ →

M est opposé à B , le moment de force est encore nul et l’énergie potentielle atteint son
maximum. Un tel équilibre est instable. Lorsque le champ d’induction magnétique est

7
uniforme, l’énergie potentielle ne dépend pas de la position et la force agissant sur le dipôle
est nulle. Si le champ d’induction magnétique n’est pas uniforme, l’énergie potentielle
dépend de la position et la force agissant sur le dipôle magnétique n’est pas nulle. Dans le
cas général, elle est donnée par :

− −−−→
F = −grad U
c’est à dire pour un dipôle dans un champ :

− −−−→ −→→ −
F = grad (M . B )
Ainsi il est possible de dévier un atome neutre avec une force magnétique créée par un
champ non uniforme.

5.2 Description de l’expérience de Stern et Gerlach


Les atomes d’une substance paramagnétique possèdent un moment magnétique perma-
nent dont la norme est une caractéristique de l’atome. Ils s’échappent d’un four porté à
haute température par une fente verticale (figure 1). Un collimateur permet de sélection-
ner ceux qui se déplacent dans la direction de l’axe Oy. Ils passent ensuite dans l’entrefer
d’un électroaimant où règne un champ magnétique fortement inhomogène qui produit une
force perpendiculaire à Oy. Ils sont recueillis sur un écran qui permet de mesurer leur
déplacement dans la direction Oz.

Figure 1 – Appareil de Stern et Gerlach

La géométrie de l’électro-aimant est telle que la principale composante du champ est


Bz et que son gradient est uniforme dans l’entrefer. La précession rapide du moment
magnétique autour de Oz a pour conséquence que les valeurs moyennes de Mx et MY sont
nulles en chaque point de la trajectoire. Le force nette agissant sur l’atome est, à une très
bonne approximation :

dBz
Fz = Mz
dz
Elle est uniforme dans l’entrefer et il en est de même pour l’accélération.

En négligeant les effets de bords, on peut dire que la trajectoire d’un atome est para-
bolique dans l’entrefer et rectiligne à sa sortie. En effet, la composante vy de la vitesse est

8
constante durant tout le mouvement alors que vz est uniformément variée dans l’entrefer
et constante après sa sortie. La longueur de l’entrefer est L1 alors que la distance qui le
sépare de l’écran est L2 .

L1
La durée du transit dans l’électroaimant est donc : t1 =
vy
L2
alors que le temps de parcours après la sortie est : t2 =
vy

On fait coïncider le point d’entrée avec l’origine des coordonnées. À l’instant t = 0,


l’atome pénètre dans l’entrefer avec une vitesse dirigée selon Oy (vx = 0 grâce à la fente
verticale dans la paroi du four et vz = 0 grâce au collimateur).
Dans l’entrefer, la vitesse acquise par l’atome est donnée par : vz = az t
Il lui correspond un déplacement latéral : z = 21 az t2

Ces deux dernières relations sont valides pour 0 6 t 6 t1 .


 2
1 L1
À la sortie, le déplacement latéral vaut : z1 = 2 az et la vitesse acquise est conservée
vy
pour la suite du mouvement.   
L1 L2
Le déplacement z2 après la sortie de l’atome est donné par : z2 = az
vy vy
C’est le déplacement total z = z1 + z2 qui est mesuré sur l’écran. Il est donné par :
 2  
1 1 2
z = az L + L1 L2
vy 2 1

Mz dBz
L’accélération az est donnée par : az = où m est la masse de l’atome.
m dz
Elle est connue, de même que le gradient du champ et les longueurs caractéristiques
de l’appareil L1 et L2 . La vitesse vy peut être estimée à partir de la température du
four. La mesure du déplacement permet donc de déterminer Mz qui est une constante du
mouvement. Il est raisonnable de supposer que la norme M du moment magnétique est
une caractéristique de l’atome. À la sortie du four son orientation est aléatoire et il en est
donc de même pour la composante z. Celle-ci n’a donc aucune signification fondamentale.
C’est pourtant cette grandeur qui est déterminée par l’expérience. On doit donc s’attendre
à trouver toute une gamme de valeurs comprises entre les extrêmes Mz = M et Mz = −M .
C’est précisément la mesure des valeurs extrêmes qui permet de remonter à la norme du
moment magnétique. Les atomes doivent donc se répartir sur l’écran entre deux valeurs
extrêmes du déplacement z.

5.3 Résultats expérimentaux


L’expérience de Stern et Gerlach a d’abord été réalisée avec des atomes d’argent.
D’après la physique classique, on devait s’attendre à ce qu’ils soient répartis sur un seg-
ment de droite de longueur finie car toutes les valeurs de Mz comprises entre +M et −M
sont possibles. Le résultat obtenu montrait plutôt deux taches situées symétriquement par
rapport à l’axe Oy. La distance entre les taches est proportionnelle au gradient du champ
magnétique. La répartition des atomes sur l’écran dépend de l’intensité du champ et de
son gradient (figure 2).

9
Lorsque le champ est nul, les atomes ne sont pas déviés, on observe une seule tache.

Lorsque le gradient du champ augmente, on voit apparaître deux taches qui se che-
vauchent puis qui se séparent en champ fort.

Figure 2 – Répartition des atomes sur l’écran

La largeur des taches n’est pas attribuée à une dispersion des valeurs de Mz mais plutôt
à une dispersion des vitesses. En effet les atomes rapides sont moins déviés que les atomes
plus lents. Les résultats expérimentaux sont compatibles avec deux valeurs pour Mz qui
sont notées +µ et −µ.
Des résultats semblables ont été obtenus avec d’autres atomes. Lorsqu’il y a un seul
électron à l’extérieur de couches complètes et qu’il se trouve sur une orbitale "s", le moment
magnétique de l’atome coïncide avec celui de l’électron. Il existe bien sûr des atomes
pouvant produire plus de taches. Le modèle de Bohr de l’atome d’hydrogène suggérait la
quantification de la projection du moment magnétique sur un axe (quantification spatiale).
Le résultat de l’expérience de Stern et Gerlach a apporté un appui solide à cette idée
contraire à la physique classique. Cependant, l’interprétation complète de l’expérience n’est
devenue possible qu’avec le développement de la mécanique quantique.

5.4 Interprétation des résultats


A la composante z du moment magnétique on associe l’observable M̂z . Puisque la
mesure de cette grandeur ne peut donner que deux résultats possibles, on en déduit que
cette observable n’a que deux valeurs propres : +µ et −µ. On peut dire que les atomes qui
arrivent en P1 (figure 1) sont dans l’état |z+i et ceux que arrivent en P2 sont dans l’état
|z−i. La mesure du moment magnétique fournit une façon de préparer les atomes dans
un état donné. On peut vérifier expérimentalement que les états |z+i et |z−i sont ortho-
gonaux. Pour cela, on fait passer les atomes du faisceau |z+i dans un autre appareil de
Stern et Gerlach (SG) identique au premier. A la sortie du second appareil, on observe
que tous les atomes sont dans l’état |z+i ; il n’y a qu’un seul faisceau. La probabilité pour
qu’un atome préparé dans l’état |z+i par le premier appareil soit trouvé dans l’état |z−i
par le second est donc nulle.

10
L’amplitude de probabilité est également nulle et on a : hz−|z+i = 0
C’est la signification qu’il faut donner à l’orthogonalité des états.
On peut s’assurer expérimentalement que ces états forment une base, c’est à dire qu’ils
vérifient la relation de fermeture :

|z+ihz + | + |z−ihz − | = Iˆ

En insérant cette équation entre le bra et le ket il vient :

hψ|ψi = hψ|z+ihz+|ψi + hψ|z−ihz−|ψi

Les probabilités pour trouver un atome dans les états |z+i et |z−i sont données respecti-
vement par :

P + = |hz+|ψi|2

P − = |hz−|ψi|2
Si la relation de fermeture est vérifiée leur somme vaut 1. Cette condition est satisfaite
si la probabilité pour trouver un atome ailleurs que dans l’un des deux faisceaux est nulle.
Le fait qu’il n’existe pas une troisième tache montre que la relation de fermeture est vérifiée.

Peut-on dire qu’à la sortie du four chaque atome est soit dans l’état |z+i soit dans
l’état |z−i ? Répondre par l’affirmative équivaudrait à donner un rôle privilégié à l’axe Oz.
Cependant il est toujours possible de dire que chaque atome est dans une superposition de
ces deux états car ils forment une base. L’état le plus général peut toujours s’écrire sous
la forme :
|ψi = c+ |z+i + c− |z−i
On peut mesurer la composante x du moment magnétique en imposant à l’appareil
une rotation de 90◦ autour de l’axe Oy. Les résultats obtenus sont les mêmes que pour la
composante z car il n’y a pas de direction privilégiée. Les états correspondant aux valeurs
trouvées sont notés respectivement |x+i et |x−i. Ils sont évidemment orthogonaux entre
eux mais ils ne peuvent pas être orthogonaux aux états |z+i et |z−i car aucun vecteur ne
peut être orthogonal à tous les vecteurs d’une base. Chacun des produits scalaires suivants
est non nul :
hx+|z+i hx−|z+i hx+|z−i hx−|z−i
Si l’atome est préparé dans l’état |z+i par un premier appareil de Stern et Gerlach,
il peut être trouvé dans l’état |x+i ou dans l’état |x−i par un second appareil qui mesure
la composante x du moment magnétique. Nous verrons plus loin que les deux résultats ont
la même probabilité.
Imaginons un troisième appareil qui mesure à nouveau la composante z du moment
magnétique. Supposons que le faisceau correspondant à l’état |x+i soit sélectionné. Le
troisième appareil peut trouver les deux valeurs possibles avec les probabilités |hz+|x+i|2
et |hz−|x+i|2 . En fait ces deux probabilités sont égales.
Même si l’atome a été préparé dans l’état |z+i par le premier appareil, le résultat
d’une nouvelle mesure de Mz est incertain si elle intervient après une mesure de Mx . Les
composantes du moment magnétique sont des grandeurs incompatibles. Les observables
M̂z et M̂x ne commutent pas. L’information obtenue par la première mesure est détruite
par la suivante. Nous avons ici une illustration du fait qu’une mesure d’une grandeur peut
modifier l’état du système d’une manière aléatoire.

11
5.5 Représentations matricielles des composantes du moment magné-
tique
Puisque l’espace des états est de dimension deux, les composantes du moment magné-
tique sont représentées par des matrices 2 × 2 dans une base. Pour des raisons qui seront
données plus loin, des particules de ce type sont dites de "spin un demi". Il existe bien
sûr des particules pour lesquelles les états de spin ou de moment magnétique sont plus
nombreux mais l’électron, le proton et le neutron appartiennent à la catégorie étudiée ici.

Les matrices qui représentent les composantes du moment magnétique doivent être
hermitiennes. Le résultat d’une mesure de l’une ou l’autre composante est toujours +µ
ou −µ. En conséquence, elles doivent s’exprimer au moyen de matrices dont les valeurs
propres sont +1 et -1. Ces matrices ne commutent pas et, dans toute base, une seule peut
être diagonale. La représentation matricielle donnée ici est arbitraire mais elle correspond
à la convention universellement adoptée. C’est la base standard. Les états de base sont
|z+i et |z−i et c’est la composante z qui est diagonale. Les matrices introduites ici, sont
appelées matrices de Pauli :
     
0 1 0 −i 1 0
σx = σy = σz =
1 0 i 0 0 −1
Chaque composante du moment magnétique est représentée par une matrice de Pauli :

M̂i ⇒ µσi (i = x, y, z)

Dans la base standard c’est la composante z qui est représentée par une matrice diagonale.
Les vecteurs de base sont donc les kets propres de Mz . Ils vérifient les relations :

M̂z |z+i = µ|z+i et M̂z |z−i = −µ|z−i (7)

Leurs représentations matricielles sont données par :


   
1 0
|z+i ⇒ et |z−i ⇒
0 1

Les relations (7) sont bien vérifiées par les représentations matricielles.
Les matrices de Pauli possèdent des propriétés remarquables qui seront utiles dans la
suite. Nous les présentons ici.
I Les valeurs propres de chaque matrice sont +1 et -1 et leur trace est donc nulle.
I Le carré de chacune est égal à la matrice identité :
 
2 2 2 1 0
σx = σy = σz =
0 1
I Toute matrice 2 × 2 peut s’écrire comme une combinaison de la matrice identité et
des matrices de Pauli.

I Le produit de deux matrices de Pauli est proportionnel à la troisième :

σx σy = iσz σy σz = iσx σz σx = iσy

I Les matrices de Pauli anti-commutent :

σx σy + σy σx = 0

12
I Les matrices de Pauli vérifient les relations de commutation :

[σx , σy ] = 2iσz

Les deux dernières relations sont vraies pour toutes les permutations circulaires des
indices.

Le carré de la norme du moment magnétique est représenté par la matrice :


 
2 2 2 2 1 0
M̂x + M̂y + M̂z = 3µ
0 1

La norme du moment magnétique vaut donc 3µ. La valeur absolue d’une composante
ne peut donc jamais atteindre la norme, contrairement au cas d’un vecteur classique. Si
une composante était égale à la norme, les deux autres seraient nulles et les trois auraient
des valeurs bien définies simultanément, ce qui est impossible pour des grandeurs incom-
patibles. Un moment magnétique ne peut jamais être aligné dans une direction donnée.
Le carré de la norme commute avec chaque composante. On peut donc caractériser un
moment magnétique par la donnée de sa norme et d’une composante, c’est à dire deux
nombres. En physique classique il faut trois nombres, par exemple, les trois composantes
cartésiennes.

6 Polarisation de la lumière
En physique classique la lumière est considérée comme une onde électromagnétique
transversale. Le champ électrique et le champ magnétique sont mutuellement perpendi-
culaires et perpendiculaires à la direction de propagation. Par convention, la direction de
polarisation est celle du champ électrique.

On suppose que l’onde se propage dans le sens positif de l’axe Oz. Les deux composantes
du champ électrique dépendent de z et du temps, mais en un point donné elles ne dépendent
que du temps. Un choix approprié de l’origine des temps permet d’écrire :

Ex (t) = E0x cos(ωt) et Ey (t) = E0y cos(ωt − φ)

où ω est la pulsation et φ est le déphasage des composantes. Les amplitudes E0x et E0y
sont des grandeurs positives. La direction du champ électrique fait un angle θ par rapport
à l’axe Ox. Cet angle est déterminé par le rapport des composantes du champ électrique
et il dépend du temps :

Ey (t) E0y cos(ωt − φ)


tan(θ) = =
Ex (t) E0x cos(ωt)
Dans le cas général le champ électrique décrit une ellipse durant son évolution temporelle.
La polarisation est dite elliptique. Le déphasage φ détermine l’orientation des axes de l’el-
lipse dans le plan xOy.

Dans le cas particulier φ = π2 , Ey (t) = E0y sin(ωt)


Le champ électrique tourne dans le sens trigonométrique ou anti-horaire (figure 3a).

Dans le cas particulier φ = 3π


2 , Ey (t) = −E0y sin(ωt)
Le champ électrique tourne dans le sens horaire (figure 3b).

13
Figure 3 – Polarisation elliptique

Le sens de rotation du champ électrique définit l’hélicité de l’onde. Elle est positive
pour la rotation dans le sens trigonométrique et négative lorsque la rotation est dans le
sens opposé. La règle de la main droite permet de déterminer le signe de l’hélicité : lorsque
les doigts s’enroulent autour de l’axe de propagation dans le sens de la rotation du champ
électrique, l’hélicité est positive si le pouce est dans le sens de la propagation et négative
s’il est dans le sens opposé à la propagation. L’hélicité est donc positive sur la figure 3a et
négative sur la figure 3b.

6.1 Polarisation rectiligne


Dans les cas particuliers φ = 0 et φ = π, le rapport des composantes du champ
électrique est constant et on a respectivement :

Ey (t) E0y Ey (t) E0y


= et =− (8)
Ex (t) E0x Ex (t) E0x
La direction d’oscillation du champ électrique est alors constante et la polarisation est
dite rectiligne ou linéaire.

Figure 4 – Polarisation rectiligne

On peut toujours écrire les amplitudes sous la forme :

E0x = E0 cos(θ) et E0y = E0 sin(θ)

où θ est l’angle entre la direction du champ électrique et l’axe Ox (Fig. 4).


Pour θ = 0, l’onde est polarisée selon Ox alors que pour θ = π2 , elle est polarisée selon Oy.
Toute polarisation rectiligne est une superposition de ces deux polarisations.
Il est commode de représenter les états de polarisation à l’aide des vecteurs de Jones.
Ecrivons la relation (8) sous la forme :
   
E0x cos θ
= E0
E0y sin θ

14
Les états de polarisation selon Ox et Oy correspondent respectivement aux vecteurs :
   
1 0
et
0 1

Un polariseur rectiligne idéal est un appareil qui transmet intégralement la composante


du champ électrique dans la direction de son axe et qui élimine complètement la compo-
sante perpendiculaire. La lumière transmise est donc polarisée dans la direction de son
axe. Si elle rencontre un autre polariseur rectiligne celui-ci est appelé analyseur. Si son axe
est dans la même direction que celui du polariseur la lumière est intégralement transmise.
Si l’axe de l’analyseur est perpendiculaire à celui du polariseur (on dit alors qu’ils sont
croisés) aucune lumière n’est transmise.

On note Ei l’amplitude du champ électrique transmis par le polariseur et incident sur


l’analyseur. L’amplitude du champ électrique transmis par l’analyseur est notée Et .
Si l’angle entre leurs axes est θ alors Et = Ei cos(θ).
On retrouve bien Et =Ei pour θ = 0 et Et = 0 pour θ = π2 .
La puissance transmise par unité de surface perpendiculaire à la direction de propagation
est proportionnelle au carré de l’amplitude du champ électrique. La relation entre la puis-
sance transmise par le polariseur Ii et celle transmise par l’analyseur It est donc donnée
par :
It = Ii cos2 θ
C’est la loi de Malus. Si les axes du polariseur et de l’analyseur sont parallèles ce dernier
transmet toute l’intensité reçue tandis que s’ils sont perpendiculaires rien n’est transmis.

6.2 Polarisation circulaire


Lorsque les amplitudes des deux composantes sont égales et que celles-ci sont en qua-
drature la polarisation est dite circulaire.
π
Pour φ = , Ex (t) = E0 cos(ωt) Ey (t) = E0 sin(ωt) (9)
2
π
Pour φ = − , Ex (t) = E0 cos(ωt) Ey (t) = −E0 sin(ωt) (10)
2

Figure 5 – Polarisation circulaire

Dans les deux cas, la norme du champ électrique est constante et le vecteur décrit un
cercle. Les relations (9) correspondent à une hélicité positive ou à une polarisation circu-
laire droite. Les relations (10) correspondent à une hélicité négative ou à une polarisation
circulaire gauche. Tout état de polarisation peut être considéré comme une superposition
de ces deux états.
Un polariseur circulaire droit (gauche) transmet intégralement un faisceau de lumière de
polarisation circulaire droite (gauche) et élimine complètement un faisceau de polarisation

15
opposée. Si un faisceau de lumière est préparé dans un état circulaire droit en étant trans-
mis par un tel polariseur, il sera complètement bloqué par un polariseur circulaire gauche.
En représentation complexe, un déphasage de ± π2 est équivalent à une multiplication par
±i. Les vecteurs de Jones correspondant respectivement à la polarisation circulaire droite
et circulaire gauche sont :
   
1 1 1 1
√ et √
2 i 2 −i

6.3 Polarisation du photon


La théorie ondulatoire de la lumière fournit une bonne description des phénomènes de
polarisation en présence d’un grand nombre de photons. D’un point de vue microscopique
la polarisation correspond à un degré de liberté interne du photon.

La loi de Malus donne la fraction de l’énergie incidente qui est transmise par l’ana-
lyseur en fonction de l’angle entre son axe et celui du polariseur. D’un point de vue mi-
croscopique, le facteur cos2 θ représente la fraction des photons transmis par l’analyseur.
C’est également la probabilité pour qu’un photon soit transmis car il est intégralement
transmis ou absorbé. La mécanique quantique ne permet de calculer que la probabilité de
transmission, il est donc impossible de prédire le sort d’un photon particulier.

6.4 Polarisation rectiligne


Un photon qui vient d’être transmis par un polariseur rectiligne dont l’axe est selon
Ox est par définition dans l’état de polarisation |xi. Si l’axe du polariseur est selon Oy,
l’état du photon est |yi. Les représentations matricielles de ces états sont :
   
1 0
|xi ⇒ et |yi ⇒
0 1

Ces états sont orthogonaux ce qui traduit le fait que la probabilité de transmission d’un
photon à travers un polariseur et un analyseur croisés est nulle. Tout état de polarisation
peut s’écrire comme une superposition de ces deux états qui forment une base de l’espace
des états de polarisation du photon.

6.5 Polarisation circulaire


Un photon est dans un état de polarisation circulaire s’il vient d’être transmis par un
polariseur circulaire. Ces états sont notés respectivement |di et |gi selon que le polariseur
est circulaire droit ou gauche. Leurs représentations matricielles sont :
   
1 1 1 1
|di ⇒ √ et |gi ⇒ √
2 i 2 −i
Ces états sont normés et orthogonaux. Un photon préparé dans un état circulaire droit
ne peut pas être transmis par un polariseur circulaire gauche, c’est à dire qu’il ne peut
pas être trouvé dans un état circulaire gauche et vice-versa. L’état de polarisation le plus
général peut s’écrire comme une superposition de ces deux états. Ils forment une autre
base orthonormée de l’espace des états de polarisation du photon.

16
Les états circulaires peuvent s’exprimer sur la base des états rectilignes :

1 i
 |di = √2 |xi + √2 |yi

 |gi = √1 |xi − √i |yi



2 2

Ces relations peuvent s’inverser facilement pour donner :



1 1
 |xi = √2 |di + √2 |gi

 |yi = −i √i |gi
√ |di +

2 2

6.6 Transformation des états par rotation


La matrice représentant la rotation d’un angle θ autour de la direction de propagation
est :
 
cos θ −sin θ
R(θ) =
sin θ cos θ
Après une telle rotation, les états rectilignes ont pour représentations matricielles :
   
0 cos θ 0 −sin θ
|x i ⇒ et |y i ⇒
sin θ cos θ
 0
 |x i = cos θ |xi + sin θ |yi
Ces états peuvent s’écrire de manière équivalente :
|y 0 i = −sin θ |xi + cos θ |yi

Les états transformés restent orthogonaux mais la rotation a pour effet de mélanger les
deux polarisations. Les états circulaires se transforment selon les relations :

|d0 i = exp(−iθ)|di et |g 0 i = exp(iθ)|gi


La rotation ne change pas les états car les vecteurs ne sont modifiés que par un facteur
de phase. D’un point de vue classique, les états circulaires correspondent à des champs
tournants. Une rotation du polariseur ne change pas leur nature.

Les états |di et |gi sont des états propres de l’opérateur rotation c’est à dire que les
vecteurs correspondants sont des vecteurs propres de la matrice de rotation. Leurs valeurs
propres sont respectivement exp(−iθ) et exp(iθ). Comme la matrice est unitaire et non
hermitienne, il n’est pas étonnant que ses valeurs propres ne soient pas réelles.

7 Cryptographie quantique
La cryptographie a pour objet de coder un message de telle sorte que seul son destina-
taire puisse le décoder pour en prendre connaissance. L’idée de la cryptographie quantique
présentée ici est de nature différente car le but est simplement de détecter la présence
éventuelle d’un espion. Nous verrons que les lois de la mécanique quantique permettent
d’empêcher une personne de prendre connaissance d’un message sans laisser de trace. Tout
message numérique peut se ramener à une suite de 0 et de 1. Une convention peut faire
correspondre ces nombres aux deux états de polarisation d’un photon ou aux deux états
de moment magnétique d’une particule de spin 12 . Nous prendrons ici le cas d’une telle

17
particule. Alice et Bob conviennent qu’une particule dans l’état |z+i représente 0 tandis
qu’une particule dans l’état |z−i représente 1. Alice dispose d’une source de particules et
d’un appareil de Stern et Gerlach pour les préparer dans l’un des états |z+i ou |z−i.
Bob utilise le même type d’appareil pour déterminer l’état de la particule envoyée par
Alice. Un tel protocole n’est pas sécurisé car une espionne, conventionnellement appelée
Eve, disposant du même appareil peut intercepter la particule émise par Alice et envoyer
vers Bob une particule identique dans le même état. Elle prend alors connaissance du mes-
sage sans laisser de trace. En effet, la convention définissant le 0 et le 1 se transmet par
un canal classique non crypté et peut donc être connue de tout le monde. Ce protocole
est de type classique. Pour empêcher la copie sans laisser de trace, il faut le modifier pour
exploiter les spécificités de la physique quantique.

Alice et Bob conviennent de la procédure suivante. Alice prépare une particule dans
l’état |z+i ou |x+i pour signifier 0 et dans l’un des états |z−i ou |x−i pour signifier 1. Bob
choisit au hasard de mesurer la composante z ou la composante x du moment magnétique
de chaque particule. Si l’orientation de son appareil n’est pas la même que celle choisie par
Alice le résultat est aléatoire et la mesure n’est pas exploitable. Eve choisit également de
mesurer la composante z ou la composante x du moment magnétique et elle émet vers Bob
une particule dans l’état qu’elle a trouvé.

Après avoir envoyé un certain nombre de particules, Alice demande à Bob (par un canal
classique) de lui donner l’orientation de son appareil pour chaque particule sans mentionner
le résultat obtenu. Elle sait alors pour quelles particules leurs appareils avaient la même
orientation. Elle demande à Bob de lui donner les résultats obtenus pour les particules
correspondantes. Si certains résultats ne correspondent pas à l’état qu’elle avait choisi, il
est clair qu’une mesure a été faite sur la particule entre l’émission et la réception. Elle en
déduit que leur communication est espionnée.

On donne ci-dessous deux séquences d’états possibles à l’émission (par Alice) et à la


détection (par Bob). La première séquence indique que la communication a été espionnée
contrairement à la seconde.
I Première séquence.
Alice z+ x+ x− z− z+ z− x− x− z+ x+ x+ z− z−
Bob z+ x− z+ z− x+ z+ x− z− z− z+ x+ z− x+
I Deuxième séquence.
Alice z+ x+ x− z− z+ z− x− x− z+ x+ x+ z− z−
Bob z+ x+ z− z− x+ z− x− z− z+ z+ x+ z− x−
Il peut arriver que les orientations des appareils d’Alice et de Bob coïncident et que
l’état détecté soit le même que celui choisi par Alice même en présence d’espion(ne). En
effet, Eve a pu faire le même choix par hasard. Même si elle oriente son appareil diffé-
remment et qu’elle envoie en conséquence une particule dans un autre état à Bob, celui-ci
peut trouver la particule dans l’état choisi par Alice. Même si une telle situation peut se
produire, en considérant un grand nombre de particules la probabilité que Bob trouve un
résultat différent de celui choisi par Alice deviendra très grande.

8 Spectre discret dégénéré


L’équation aux valeurs propres pour une observable dont le spectre est discret et dégé-
néré s’écrit :
Â|φin i = an |φin i (i = 1, 2, . . . , gn )

18
où gn est le nombre de vecteurs propres linéairement indépendants correspondant à la va-
leur propre an .
Les résultats possibles d’une mesure de la grandeur A sont toujours les valeurs propres
de l’observable associée. Cependant, si la valeur propre obtenue est dégénérée, l’état du
système n’est pas complètement déterminé. Il est représenté par un vecteur appartenant
au sous-espace correspondant à la valeur propre trouvée. Les trois premiers postulats sont
toujours valides mais il faut revoir les deux derniers.

Deux kets propres correspondant à des valeurs propres différentes sont nécessairement
orthogonaux. Cependant, à l’intérieur d’un sous-espace associé à une valeur propre dégé-
nérée, les vecteurs propres linéairement indépendants ne sont pas forcément orthogonaux.
Il est toujours possible de combiner ces vecteurs pour former une base orthonormée de ce
sous-espace. L’ensemble des kets |φin i constitue alors une base orthonormée de l’espace des
états. Tout état |ψi peut se développer sur cette base :
gn
XX
|ψi = cin |φin i
n i=1

où les coefficients du développement sont donnés par : cin = hφin |ψi

Les deux derniers postulats peuvent donc s’énoncer d’une manière plus générale.
Postulat 4 (spectre dégénéré).
La probabilité d’obtenir la valeur propre an est donnée par :
gn gn
X i 2 X
P (an ) = cn = hψ|φin ihφin |ψi
i=1 i=1

On définit le projecteur dans le sous-espace associé à la valeur propre an :


gn
X
Pˆn = |φin ihφin |
i=1

La probabilité d’obtenir la valeur propre an est donnée simplement par :

P (an ) = hψ|P̂n |ψi

La formule est la même que pour un spectre non-dégénéré ; seule la définition du


projecteur est modifiée.

Postulat 5 (spectre dégénéré).


L’état du système immédiatement après la mesure est la projection normée du vecteur
d’état dans le sous-espace associé à la valeur propre trouvée.
La projection du vecteur d’état dans le sous-espace associé à an est :
gn
X
P̂n |ψi = cin |φin i
i=1

ˆ
Le vecteur final normé peut donc s’écrire encore sous la forme : |ψf i = √ Pn |ψi
ˆ
.
hψ|Pn |ψi
C’est la même forme que la relation (4), seule est modifiée la définition du projecteur.
Dans le cas particulier gn = 1, on retrouve bien la forme des postulats 4 et 5 pour
un spectre non-dégénéré.

19
9 Ensemble complet d’observables qui commutent
La mesure d’une grandeur A dont le spectre est dégénéré ne suffit pas pour préciser l’état
d’un système puisqu’il existe plusieurs vecteurs propres linéairement indépendants corres-
pondant à la valeur propre trouvée. Pour compléter l’information sur l’état du système il
faut mesurer une autre grandeur B compatible avec A pour ne pas perdre l’information
contenue dans la première mesure.
La mesure de A projette l’état du système dans le sous-espace associé à la valeur propre
an . Les résultats possibles d’une mesure de B sont les valeurs propres de l’observable as-
sociée, calculées dans ce sous-espace. Si les valeurs propres de B̂ ne sont pas dégénérées,
l’état du système est complètement déterminé par cette seconde mesure. Si certaines va-
leurs propres de B̂ sont dégénérées, l’état du système n’est pas complètement déterminé.
Il est représenté par un vecteur appartenant au sous-espace commun aux deux valeurs
propres trouvées. Pour aller plus loin dans la détermination de l’état du système, il faut
une troisième grandeur C compatible avec les deux premières, et ainsi de suite.
Les grandeurs compatibles forment un ensemble complet lorsque l’ensemble des résul-
tats de leurs mesures permet de déterminer complètement l’état du système. Les obser-
vables associées Â, B̂, Ĉ ... forment alors un ensemble complet d’observables qui commutent
(ECOC). À un ensemble de leurs valeurs propres correspond un seul vecteur propre de sorte
que leur donnée définit complètement l’état du système.

10 Opérateur densité
Il n’est pas toujours possible de définir un vecteur d’état pour un système. Par exemple
la lumière naturelle ne correspond à aucun état de polarisation bien défini. Un polariseur
rectiligne d’axe Ox placé sur le trajet d’un faisceau de lumière transmet la moitié de
l’intensité incidente.
Ce seul fait est compatible avec les deux hypothèses suivantes :
a) la polarisation est rectiligne à ± π4 par rapport à Ox.
b) la polarisation est circulaire gauche ou droite.
Aucune variation de l’intensité transmise n’est observée lors d’une rotation du polari-
seur. L’hypothèse a) doit être rejetée car si elle était vraie, l’intensité transmise serait égale
à l’intensité incidente pour l’une des orientations et nulle pour l’autre. En remplaçant le
polariseur rectiligne par un polariseur circulaire, on trouve encore que la moitié de l’inten-
sité incidente est transmise ce qui est incompatible avec l’hypothèse b). En effet, si elle
était vraie un polariseur (gauche ou droit) transmettrait toute l’intensité incidente alors
que l’autre ne transmettrait rien.
Il est donc impossible d’attribuer un état de polarisation bien défini à la lumière na-
turelle. Un autre exemple est celui d’un gaz en équilibre thermique à une certaine tem-
pérature. Les molécules sont réparties dans les différents états accessibles selon la loi de
Boltzmann. Il n’est pas possible de définir un vecteur d’état permettant de calculer toutes
les grandeurs mesurables.
Un opérateur peut être défini dans tous les cas permettant de calculer toutes les gran-
deurs mesurables. Pour des raisons historiques, on l’appelle opérateur densité même si le
nom d’opérateur statistique serait plus judicieux. Lorsqu’il est possible de définir un vec-
teur d’état, l’opérateur densité constitue une approche alternative. On dit que le système
est dans un état pur. Lorsque le système se trouve dans un mélange statistique d’états, le
recours à l’opérateur densité est indispensable.

20
10.1 États purs
Considérons un système auquel est associé un vecteur d’état |ψi.

L’opérateur densité est défini par : ρ̂ = |ψihψ|.

Le vecteur d’état est indéterminé à un facteur de phase près mais une telle modifica-
tion du vecteur d’état laisse invariant l’opérateur densité. Le vecteur d’état étant normé,
l’opérateur densité vérifie la relation : ρ̂2 = ρ̂.
Le vecteur d’état peut être développé sur une base orthonormée :
X
|ψi = ck |uk i
k

L’opérateur densité est alors représenté par une matrice dont un élément typique est :

ρjk = huj |ρ̂|uk i = huj |ψihψ|uk i = cj c∗k

Cette matrice est hermitienne et son déterminant est nul. En effet, les différentes lignes
(ou colonnes) ne diffèrent que par un facteur multiplicatif.
Un élément diagonal de la matrice densité a pour expression :

ρkk = huk |ρ̂|uk i = huk |ψihψ|uk i = ck c∗k

C’est la probabilité pour trouver le système dans l’état |uk i. La trace de la matrice densité
est donnée par : X X
tr(ρ) = ρkk = ck c∗k = 1
k k
Cette condition équivaut à la normalisation des probabilités.

Une matrice vérifie son équation caractéristique. Pour un état pur, celle-ci est donc de
la forme λ(λ − 1) = 0. Les valeurs propres de la matrice densité sont donc 0 et 1. La somme
des valeurs propres étant égale à la trace, la valeur propre +1 n’apparaît qu’une seule fois.

La valeur moyenne d’une grandeur représentée par l’observable  peut s’exprimer au


moyen de la matrice densité. En utilisant la relation de fermeture il vient :
X X
< A >= hψ|Â|ψi = hψ|Â|uk ihuk |ψi = huk |ψihψ|Â|uk i = tr(ρA)
k k

ˆ
On retrouve la condition de normalisation dans le cas particulier  = I.

10.2 Mélanges statistiques


Lorsqu’un système peut se trouver dans plusieurs états |ψn i avec des probabilités pn ,
l’opérateur densité associé est de la forme :
X
ρ̂ = pn |ψn ihψn |
n

Ces différents vecteurs d’état sont normés mais pas nécessairement orthogonaux. Contrai-
rement au cas d’un état pur, ρ̂2 6= ρ̂ mais l’opérateur est toujours hermitien. La condition
de normalisation est toujours la même. En effet on a :
X XX
tr(ρ) = ρkk = pn huk |ψn ihψn |uk i
k k n

21
En changeant l’ordre des facteurs et des sommations puis en utilisant la relation de ferme-
ture on obtient :
X X X X
tr(ρ) = pn hψn |uk ihuk |ψn i = pn hψn |ψn i = pn = 1
n k n n

La valeur moyenne d’une grandeur représentée par une observable  implique un calcul
quantique de sa valeur moyenne lorsque le système est dans l’état |ψn i pondéré par les
probabilités pour trouver le système dans ces différents états. Elle est donc donnée par :
X
< A >= pn hψn |Â|ψn i
n

L’utilisation de la relation de fermeture permet d’écrire :


X X
< A >= pn hψn |Â|uk ihuk |ψn i
n k

En changeant l’ordre des facteurs et des sommations, il vient :


XX X
< A >= pn huk |ψn ihψn |Â|uk i = huk |ρ̂Â|uk i = tr(ρA)
k n k

L’expression de la valeur moyenne est donc la même dans les cas d’un état pur et d’un
mélange.

10.3 Propriétés générales de l’opérateur densité : indice de pureté


L’opérateur densité est dit positif car, quel que soit le vecteur d’état |φi, il vérifie
l’inégalité : hφ|ρ̂|φi > 0. En effet, dans le cas général on peut écrire :
X X
hφ|ρ̂|φi = pn hφ|ψn ihψn |φi = pn |hφ|ψn i|2 > 0
n n

Aucun terme ne pouvant être négatif, leur somme est nécessairement positive.

Dans tous les cas, l’opérateur densité est hermitien et les éléments diagonaux de la ma-
trice représentative sont positifs. Ses valeurs propres λi sont réelles et les vecteurs propres
associés |φi i forment une base orthonormée de l’espace des états.

La représentation spectrale de l’opérateur densité s’écrit :


X
ρ̂ = λi |φi ihφi |
i

Dans la base de ses états propres, un élément de matrice est donné par :
X
ρjk = hφj |ρ̂|φk i = λi hφj |φi ihφi |φk i = λj δjk
i

Les valeurs propres sont les éléments de la diagonale. Ce sont les seuls éléments non
nuls. Comme les éléments diagonaux ne peuvent pas être négatifs, les valeurs propres sont
donc positives ou nulles. Leur somme vaut 1 car elle est égale à la trace de la matrice.
Toutes les valeurs propres sont donc comprises entre 0 et 1.

22
Pour un état pur, on a : tr(ρ2 ) = tr(ρ) = 1.

Pour un mélange, dans la base des états propres de l’opérateur densité, on peut écrire :
X X
tr(ρ2 ) = λ2i ≤ λi = 1 car λ2i ≤ λi .
i i

On définit l’indice de pureté d’un état par l’expression : P (ρ) = tr(ρ2 ).


Il vaut 1 pour un état pur et sa limite inférieure est N1 dans un espace de dimension N .
Il est donc limité par la double inégalité : N1 ≤ tr(ρ2 ) ≤ 1.
La limite inférieure correspond au cas où la matrice densité est un multiple de la matrice
identité.

10.4 Populations et cohérences


Un élément diagonal de la matrice densité est donné par :
X X
ρkk = pn huk |ψn ihψn |uk i = pn cnk cn∗
k
n n

Il est nécessairement réel et positif. Il représente la probabilité moyenne pour trouver


le système dans l’état |uk i compte tenu du manque d’information sur son état avant la
mesure. En présence d’un grand nombre de systèmes identiques, ρkk est proportionnel au
nombre de systèmes se trouvant dans l’état |uk i. Les éléments diagonaux de la matrice
densité sont appelés populations.

Un élément non-diagonal typique est de la forme :


X X
ρjk = pn huj |ψn ihψn |uk i = pn cnj cn∗
k
n n

Il peut être nul sans que chaque terme soit nul. Il traduit les effets d’interférences entre
les états |uj i et |uk i. Il représente la moyenne des termes croisés.

Si ρjk = 0, la moyenne fait disparaître les effets d’interférences. On dit alors qu’il n’y
a pas de cohérence entre les états |uj i et |uk i. Les éléments non-diagonaux de la matrice
densité sont appelés cohérences.

23

Vous aimerez peut-être aussi