Vous êtes sur la page 1sur 479

Mécanique Quantique

Tome I. Histoires, bases et anciennes théories


I. Introduction
II. Histoire
III. Bases physiques
IV. La théorie de Bohr
V. L'expérience de Young
VI. Principes de base
Tome II. L'équation de Schrödinger
I. Hamiltonien
II. Equation de Schrödinger
III. Applications
IV. Etats liés
V. Théorie des collisions
VI. Formulation matricielle
Annexes
Tome III. Symétries et spin
I. Théorie des groupes
II. Symétries
III. Spin
IV. Particules identiques et spin
V. Physique statistique
VI. Formulation matricielle
Annexes
Tome IV. L'atome d'hydrogène, les atomes et la matière
I. Atomes et molécules
II. Rayonnement
III. Structure hyperfine
IV. Maser et Laser
V. Matière
VI. Le magnétisme
VII. Supraconductivité
Tome V. Mécanique quantique relativiste
I. Vers une équation d'onde relativiste
II. Equation de Dirac
III. Solutions
IV. Hydrogénoïdes
V. Théorie des trous
VI. Propagation et diffusion
Tome VI. Théories à variables cachées, théorèmes et décohérence
I. L'intrication quantique
II. Contextualité
III. Autres théorèmes
IV. Logique quantique
V. Applications
VI. Décohérence
VII. Théorie de Bohm
Tome VII. Interprétation de la mécanique quantique et classicalité
I. Introduction
II. Position du problème
III. Interprétations
IV. Expériences
V. Du quantique au classique
VI. Références
Tome VII. Interprétation de la mécanique quantique et classicalité
I. Introduction
II. Position du problème
II.1. Interprétation probabiliste
II.2. Le problème de la mesure
II.2.1. Le problème de la mesure
II.2.2. Interprétation de Copenhague
II.2.3. Critique du principe anthropique
II.2.4. Réalisme et positivisme
II.2.5. Le rasoir d'Ockham
II.2.6. Les bases privilégiées
III. Interprétations
III.1. Les histoires consistantes
III.1.1. Interprétation
III.1.2. Evaluation
III.2. Réduction physique
III.2.1. Considérations générales
III.2.2. Le formalisme : un schéma concis
III.2.3. Le problème de l'objectivation macroscopique
III.2.4. La naissance des théories avec réduction physique
III.2.5. Le modèle de réduction original
III.2.6. Le modèle de localisation spontanée continu
III.2.7. Une version simplifiée du modèle de localisation spontanée continu
III.2.8. Succès des théories avec réduction
III.2.9. Modèles de réduction dynamique relativistes
III.2.10. Théories avec réduction et perceptions définies
III.2.11. L'interprétation de la théorie
III.2.12. Le problème des queues de la fonction d'onde
III.2.13. Evaluation
III.3. Les interprétations modales
III.3.1. La variante de Copenhague
III.3.2. Les interprétations de Kochen-Dieks-Healey
III.3.3. Motivations des premières interprétations modales
III.3.4. Ensembles de réalité : le problème de la mesure imparfaite
III.3.5. L'approche algébrique
III.3.6. Dynamique
III.3.7. Projets ouverts
III.3.8. Evaluation
III.4. La théorie de Bohm
III.5. Transactionnel
III.5.1. Introduction
III.5.1.1. Définition contrafactuelle
III.5.1.2. Non localité et formalisme
III.5.2. Règles de base
III.5.3. L'interprétation transactionnelle de la mécanique quantique
III.5.3.1. Ondes avancées et théorie des absorbeurs de Wheeler-Feynman
III.5.3.2. Le modèle transactionnel des émetteurs - absorbeurs
III.5.3.3. Le modèle transactionnel et la mécanique quantique relativiste
III.5.3.4. L'interprétation transactionnelle
III.5.3.5. L'interprétation transactionnelle et la notation formelle de la mécanique
quantique
III.5.3.6. Identité et complexité dans l'interprétation transactionnelle
III.5.3.7. Réduction et non localité dans l'interprétation transactionnelle
III.5.3.8. Complétude et prédictivité dans l'interprétation transactionnelle
III.5.3.9. Relativité et causalité dans l'interprétation transactionnelle
III.5.3.10. La flèche du temps dans l'interprétation transactionnelle
III.5.4. Evaluation
III.6.Etats relatifs
III.6.1. Introduction
III.6.2. Le problème de la mesure
III.6.3. La proposition d'Everett
III.6.4. La théorie nue
III.6.5. Mondes multiples
III.6.6. Consciences multiples
III.6.7. Histoires multiples
III.6.8. Faits relatifs, corrélations sans corrélats et mécanique quantique relationnelle
III.6.9. Evaluation
III.7. Mondes multiples
III.7.1. Introduction
III.7.2. Définitions
III.7.2.1. Qu'est-ce qu'un "monde" ?
III.7.2.2. Qui suis-"je"
III.7.3. Correspondance entre le formalisme et notre expérience
III.7.3.1. L'état quantique d'un objet
III.7.3.2. L'état quantique qui correspond à un monde
III.7.3.3. L'état quantique du Monde
III.7.3.4. FAPP
III.7.3.5. La mesure de l'existence
III.7.4. Probabilité dans l'interprétation des mondes multiples
III.7.5. Tests de l'interprétation des mondes multiples
III.7.6. Objections à l'interprétation des mondes multiples
III.7.6.1. Le rasoir d'Ockham
III.7.6.2. Le problème de la base privilégiée
III.7.6.3. Dérivation du postulat de probabilité du formalisme de l'interprétation des
mondes multiples
III.7.6.4. Comportement social d'un partisan de l'interprétation des mondes
multiples
III.7.7. Pourquoi l'interprétation des mondes multiples ?
III.7.8. Evaluation
III.8. Relationnel
III.8.1. Introduction
III.8.1.1. Le problème
III.8.2. Vue relationnelle des états quantiques
III.8.3. Corrélations
III.8.4. Auto-référence et auto-mesure
III.8.4.1. Aspect logique du problème de la mesure
III.8.4.2. Impossibilité d'une auto-mesure complète
III.8.5. Autres vues relationnelles
III.8.5.1. Systèmes de référence quantiques
III.8.5.2. Sigma algèbres des propriétés interactives
III.8.5.3. Théorie quantique de l'univers
III.8.5.4. Relation avec l'interprétation des états relatifs d'Everett
III.8.6. Quelques conséquences du point de vue relationnel
III.8.7. Conclusion
III.8.8. Evaluation
III.9. Choix et solutions
IV. Expériences
IV.1. Le chat de Schrödinger et l'ami de Wigner
IV.2. Expérience de Young
IV.3. Expérience EPR
IV.4. Expérience de Renninger
IV.5. Expérience du choix différé de Wheeler
IV.6. L'expérience de Freedman-Clauser et le paradoxe de Herbert
IV.7. L'effet Hanbury-Brown-Twiss
IV.8. Les prédictions de Albert-Aharonov-D'Amato
IV.9. L'expérience d'Afshar
IV.10. L'expérience de Marlan Scully
IV.11. Problème d'Elitzur-Vaidmann
IV.12. Action sans interaction
IV.13. Le paradoxe des trois boites
IV.14. Le paradoxe de Hardy
V. Du quantique au classique
V.1. Principe de correspondance
V.2. Théorème optique
V.3. Grands nombres
V.4. Décohérence
V.6. Déterminisme et flèche du temps
VI. Références
Tome VII. Interprétation de la mécanique quantique et classicalité
Notre principal objectif dans ce tome sera de "comprendre" les fondements de la mécanique
quantique.

 Quelle est la signification physique de la fonction d'onde ?


 Pourquoi la mécanique quantique est-elle indéterministe ?
 Comment concilier la non-localité quantique et la relativité ?
 Comment expliquer le monde classique à partir de la mécanique quantique ?
I. Introduction
En guise d'introduction, nous reprendrons ici ce que Feynman dit des implications philosophiques
de la mécanique quantique dans son cours.

Nous reviendrons ensuite plus en détail sur nos objectifs et motivations.

Nous allons discuter brièvement quelques-unes des implications philosophiques de la mécanique


quantique. Comme toujours, il y a deux aspects du problème : d'une part les implications
philosophiques de la physique, et d'autre part l'extrapolation de sujets philosophiques dans d'autres
domaines. Lorsque des idées philosophiques associées avec la science sont appliquées à d'autres
domaines, elles sont d'habitude complètement distordues. Nous allons donc, autant que possible,
limiter nos remarques à la physique.

Tout d'abord, l'idée la plus intéressante est celle du principe d'indétermination, faire une
observation affecte un phénomène. On a toujours su que faire des observations affectait les
phénomènes, mais le point important est que cet effet ne peut pas être négligé ou minimisé ou
rendu arbitrairement petit en arrangeant l'appareil. Lorsque nous observons un certain phénomène,
il n'y a rien à faire pour éviter de perturber le système. Il y a une perturbation minimum et elle est
nécessaire à la cohérence de l'interprétation. L'observateur était quelquefois important en physique
préquantique, mais seulement d'une façon triviale. On a soulevé la question : si un arbre tombe au
milieu d'une forêt et s'il n'y a personne pour l'entendre tomber fait-il du bruit ? Un véritable arbre
tombant dans une véritable forêt fait évidemment du bruit même si personne n'est présent. Même si
personne n'est là pour l'entendre, il y a d'autres traces qui restent. Le son aura secoué quelques
feuilles et si nous étions suffisamment attentifs nous pourrions trouver que quelque épine a frotté
contre une feuille et a fait une petite rayure qui ne pourrait pas être expliquée, sauf si nous
supposions que la feuille vibrait. Il nous faudrait donc admette, en un certain sens, qu'il y a eu un
son de produit. Nous pourrions demander : y eut-il sensation de son ? Non, car les sensations ont à
faire avec la conscience, probablement. Et nous ne savons pas si les fourmis sont conscientes et s'il
y avait des fourmis dans la forêt ou encore si l'arbre était conscient. Laissons le problème à ce
point.
Une autre chose sur laquelle les gens ont beaucoup insisté depuis que la mécanique quantique a été
développée est l'idée que nous ne devrions pas parler de choses que nous ne pouvons pas mesurer
(en fait, la théorie de la relativité dit aussi cela). Une chose n'a aucune place dans la théorie, sauf si
elle peut être définie par la mesure. Et, comme on ne peut pas définir par la mesure une valeur
précise de l'impulsion d'une particule localisée, l'impulsion n'a par conséquent aucune place dans la
théorie. L'idée que c'était là ce qui n'allait pas dans la théorie classique est une idée fausse, qui vient
d'une analyse grossière de la situation. Ce n'est pas parce que nous ne pouvons pas mesurer
l'impulsion et la position simultanément que, a priori, nous ne pouvons pas en parler. Cela signifie
seulement que nous n'avons pas besoin d'en parler. Dans les sciences, la situation est la suivante :
un concept ou une idée qui ne peuvent pas être mesurés ou qui ne peuvent pas être reliés
directement à l'expérience peuvent être utiles ou ne pas l'être. Ils ne sont pas nécessaires dans la
théorie. En d'autres termes, supposons que nous comparions la théorie classique du Monde avec la
théorie quantique du Monde et supposons qu'il soit vrai expérimentalement que nous ne puissions
mesurer l'impulsion et la position qu'approximativement. La question qui se pose est de savoir si les
idées de position exacte et d'impulsion exacte d'une particule sont valides ou non. La théorie
classique admet les idées : la théorie quantique ne les admet pas. Ceci ne veut pas dire, en soi, que
la théorie classique était fausse. Lorsque la nouvelle mécanique quantique fut découverte, les
physiciens classiques, ce qui incluait tout le monde sauf Heisenberg, Schrödinger et Born, dirent
"écoutez, votre théorie n'est bonne à rien puisque vous ne pouvez pas répondre à des questions
comme : quelle est la position exacte de la particule ? Par quel trou passe-t-elle ? Et quelques
autres." La réponse de Heisenberg fut : "je n'ai pas besoin de répondre à de telles questions parce
que vous ne pouvez pas les poser expérimentalement". Nous n'avons pas à nous les poser.
Considérons deux théories (a) et (b). (a) contient une idée qui ne peut pas être vérifiée directement
mais qui est utilisée dans l'analyse, et l'autre (b), ne contient pas cette idée. Si elles sont en
désaccord dans leurs prédictions on ne peut pas prétendre que (b) est fausse du fait qu'elle ne peut
pas expliquer l'idée de (a) puisque cette idée est l'une des choses qui ne peut pas être vérifiée
directement. Il est toujours bon de connaître les idées qui ne peuvent pas être vérifiées directement,
mais il n'est pas nécessaire de les supprimer. Il n'est pas vrai que nous puissions faire avancer la
science en n'utilisant que les concepts qui sont directement sujets à l'expérience.

Dans la mécanique quantique elle-même, il y a une amplitude de probabilité, et il y a beaucoup


d'autres concepts que nous ne pouvons pas mesurer directement. Le fondement de la science est sa
capacité à prédire. Prédire signifie dire ce qui se produira dans une expérience qui n'a encore
jamais été faite. Comment pouvons-nous faire cela ? En supposant que nous savons ce qui est là,
indépendamment de l'expérience. Nous devons extrapoler les expériences dans une région où elles
n'ont jamais été faites auparavant. Nous devons prendre nos concepts et les étendre à des domaines
où ils n'ont encore jamais été vérifiés. Si nous ne faisons pas cela, nous ne pouvons pas prédire. Il
était donc parfaitement raisonnable pour le physicien classique de continuer gaiement son chemin
et de supposer que la position, qui de toute évidence a une signification pour une balle, a aussi une
signification pour l'électron. Ce n'était pas de la stupidité. C'était une façon raisonnable de procéder.
Aujourd'hui nous disons que la relativité est vraie à toutes les énergies, mais, un de ces jours,
quelqu'un peut très bien arriver et nous montrer combien nous étions stupides. Ce n'est qu'en
prenant nos responsabilités que nous pouvons savoir où nous sommes "stupides", si bien que toute
l'idée est de prendre nos responsabilités. Et la seule façon de nous apercevoir que nous sommes
dans l'erreur est de découvrir d'abord quelles sont nos prédictions. Il est absolument nécessaire
d'échafauder des constructions de l'esprit.

Nous avons déjà fait quelques remarques sur l'indéterminisme de la mécanique quantique. Plus
précisément sur le fait que nous sommes incapables de prédire ce qui arrivera dans des conditions
physiques données, définies aussi soigneusement que possible. Si nous prenons un atome qui est
dans un état excité et qui est sur le point d'émettre un photon, nous ne pouvons pas dire quand il
émettra le photon. Il a une certaine amplitude pour émettre le photon à n'importe quel instant et
nous pouvons seulement prédire la probabilité d'émission. Nous ne pouvons pas prédire le futur
exactement. Ceci a donné lieu à toutes sortes de non-sens et de questions sur la signification du
libre arbitre et sur l'idée que le monde est incertain.

Il nous faut donc bien insister sur le fait que la physique classique est aussi non déterministe, en un
certain sens. On considère d'habitude que cet indéterminisme, le fait que nous ne pouvons pas
prédire le futur est un caractéristique importante de la mécanique quantique et on dit aussi que cela
explique le comportement de l'esprit humain, le sentiment de libre arbitre, etc. Mais si le monde
était classique, si les lois de la mécanique étaient classiques, il n'est pas évident que l'esprit humain
s'en trouverait changé. Il est vrai classiquement que si nous connaissons la position et la vitesse de
chaque particule dans le monde ou dans une boîte pleine de gaz, nous pourrions prédire exactement
ce qui arrivera. Et par conséquent le monde classique est déterministe. Supposons cependant, que
nous ne disposions que d'une précision limitée et que nous ne sachions pas exactement où est un
atome à mieux que, disons, un milliardième près. Alors, lorsque cet atome se déplace, il bouscule
d'autres atomes, et comme nous ne connaissons pas sa position à mieux qu'un milliardième, nous
trouvons une erreur sur la position encore plus grande après la collision. Et bien entendu, celle-ci
est amplifiée par la collision suivante si bien que si nous partons avec seulement une très petite
erreur, celle-ci est rapidement magnifiée et devient une très grande incertitude. Pour donner un
exemple : lorsque de l'eau tombe du haut d'une digue, elle éclabousse. Si nous nous tenons tout
près, une goutte atterrira sur notre nez de temps à autre. Ceci semble complètement aléatoire et
cependant un tel comportement serait prédit par des lois purement classiques. La position exacte de
toutes les gouttes dépend du mouvement précis de l'eau avant qu'elle n'atteigne la digue. Comment
? Les plus petites irrégularités sont amplifiées en tombant, si bien que nous obtenons une
distribution complètement au hasard. Manifestement, nous ne pouvons pas réellement prédire la
position des gouttes sauf si nous connaissons le mouvement de l'eau avec une exactitude absolue.

Pour être plus précis, étant donné une précision arbitraire et aussi grande soit-elle, on peut trouver
un intervalle de temps assez grand pour que nous ne puissions pas faire de prédictions valides après
un tel intervalle. C'est le fondement de la dynamique des systèmes non linéaires souvent appelée
"chaos déterministe". Cette incapacité à donner des prédictions à cause de l'amplification des
incertitudes est appelée "influence sensitive des conditions initiales".

Maintenant, le point important est que cet intervalle de temps n'est pas très grand. Ce n'est pas un
million d'années si la précision est d'un milliardième. Le temps ne croît en fait que
logarithmiquement avec la précision, et il se trouve que nous perdons toute information en un
temps très, très petit. Si la précision est choisie de l'ordre de un milliardième de milliardième de
milliardième, et quel que soit le nombre de milliards que nous prenions, tant que nous nous arrêtons
quelque part, nous trouvons un temps plus court que le temps qu'il nous a fallu pour énoncer la
précision, après quoi nous ne pouvons plus prédire ce qui se passera. Par conséquent, il n'est pas
juste de dire que nous aurions dû réaliser plus tôt que le déterminisme classique ne permettait
même pas d'espérer comprendre l'apparente liberté et l'indéterminisme de l'esprit humain, pas plus
qu'il n'est juste d'accueillir la mécanique quantique comme nous délivrant d'un univers
"complètement mécanique". Car d'un point de vue pratique, il y avait déjà indéterminisme en
mécanique classique.
II. Position du problème
Le moment est enfin venu de s'attaquer au problème de l'interprétation de la physique quantique et
de la nature de la fonction d'onde. Nous sommes suffisament outillé et nous avons vu les différents
aspects de la mécanique quantique.

Cette question n'est pas triviale car la fonction d'onde a été vue comme "une fonction qui donne la
probabilité de trouver la particule à un endroit donné". Mais quel sens physique donner à cet
"objet". Tel qu'il est formulé, on ne peut pas dire que la fonction d'onde est la particule. Mais d'un
autre coté, la mécanique quantique nous dit que la fonction d'onde résume tout ce qu'il y a à savoir
sur cette particule. En ce sens, la fonction d'onde est la meilleure description de la particule.

Bref, quelle est la nature exacte de ces objets quantiques ?

Nous allons donc passer en revue les différentes interprétations de la physique quantique afin de
cerner ce problème.
II.1. Interprétation probabiliste
Commençons par une interprétation purement opérationnelle.

D'un coté, nous avons le formalisme de la mécanique quantique que nous avons vu. De l'autre coté,
nous avons des expériences avec des mesures et ces mesures fournissent un certain nombre de
données.

L'interprétation opérationnelle se contente de fournir un ensemble de règles permettant de relier les


deux : les objets mathématiques du formalisme et les données. C'est donc une interprétation très
pragmatique, très utilitaire, celle du physicien de laboratoire.

Cette "interprétation opérationnelle" est également dite "interprétation probabiliste" ou


"interprétation instrumentale" pour des raisons évidentes. On pourrait aussi l'appeler "interprétation
minimale".

Formalisme
Rappelons donc en très bref le formalisme.

L'état d'un système est décrit par un vecteur ψ appartenant à un espace de Hilbert complexe. Il
obéit à certaines règles comme le principe de superposition et l'équation de Schrödinger.

La possibilité d'un état d'être dans un autre état donne une amplitude. Le résultat est donné par le
produit scalaire.

Un espace de Hilbert possède des bases d'états sur lesquelles on peut décomposer un état
quelconque, les coefficients de proportionnalité sont des amplitudes.

Les observables (variables physiques pouvant être mesurées) sont représentés par des opérateurs
hermitiques agissant sur les états.
Chaque opérateur a un spectre de vecteurs propres et de valeurs propres. Les vecteurs propres
correspondent aux seules quantités physiques qui peuvent être mesurées.

On peut décomposer un état quelconque sur la base du spectre d'un observable, ce qui donne
comme ci-dessus des amplitudes pour chaque vecteur propre.

Interprétation probabiliste
L'amplitude permet de calculer une probabilité. Soit la probabilité pour qu'un état donné soit
mesuré comme étant dans un autre (par exemple la probabilité que l'état ψ d'une particule
corresponde à une position x ) soit la probabilité de mesurer un vecteur propre donné pour un
observable.

La probabilité est donnée par le carré de l'amplitude. Par exemple, la probabilité d'être dans l'état
2
A est A ψ .

Comme autre exemple, x ψ n'est autre que la fonction d'onde ψ ( x ) et le coefficient (pour chaque
position) de la décomposition de ψ sur la base x . Et la base x est le spectre de l'opérateur
position. Ainsi la (densité de) probabilité de trouver la particule en x, c'est-à-dire dans l'état x , est
ψ (x )
2

La relation entre amplitude et probabilité est au cœur de cette interprétation. On ne cherche pas à
comprendre la raison de cet aspect aléatoire. On se contente d'une approche instrumentale. On
dispose d'un système macroscopique comportant un grand nombre de systèmes dans l'état ψ ou
on effectue successivement un grand nombre de mesures sur des systèmes tous préparés dans l'état
ψ .

Dans ce cas, la valeur mesurée est une moyenne donnée par des considérations statistiques utilisant
les règles probabilistes précédentes.
Cette interprétation instrumentale est la plus simple à expliquer et la plus pragmatique bien qu'elle
ne cherche pas à décortiquer le mécanisme de ces probabilités ainsi que d'autres aspects compliqués
comme la limite entre les comportements quantiques et classiques.

C'est habituellement cette interprétation qui est présentée dans les cours de mécanique quantique
(sans même la nommer, elle est présentée comme faisant partie du formalisme), pour plusieurs
raisons :
 Elle est simple.
 Lorsque l'on introduit la mécanique quantique à l'aide d'expériences (l'expérience de Young, par
exemple), c'est l'explication qui vient le plus naturellement car la description de ces expériences
est, au départ, basée sur des considérations de mesure à l'aide d'instruments classiques et
d'observations statistiques (la répartition statistique des impacts d'électrons dessinant la figure
d'interférence, par exemple).
 Les cours de mécanique quantique sont habituellement donnés dans un but pratique. C'est-à-
dire pour un usage en laboratoire ou dans l'industrie. Dans ce cas, une approche pragmatique
basée sur la mesure est la plus utile.
 Elle suffit à expliquer et interpréter toutes les expériences pratiques même si le caractère
probabiliste reste totalement mystérieux (qu'est-ce qui provoque l'issue de tel ou tel résultat ?).
 Elle évite d'introduire le moindre élément supplémentaire à caractère philosophique.

Cette interprétation est dite positiviste et non réaliste.

Positiviste dans le sens qu'elle se base sur la seule chose accessible à l'expérience : le résultat des
mesures avec des instruments. Elle se refuse à aller au-delà. Ce qui ne peut se mesurer n'existe pas
pour un positiviste pur et dur.

Non réaliste dans le sens qu'elle n'examine pas la réalité physique qui se cache derrière les
probabilités et la fonction d'onde. La fonction d'onde est-elle l'image de quelque chose de physique,
réellement "répartit dans tout l'espace" ou n'est-elle que la représentation mathématique (les
probabilités) d'un comportement plus complexe sous-jacent ? Cette interprétation ne se prononce
pas et s'y refuse. Elle se contente du formalisme mathématique et pas de la réalité que ce
formalisme décrit, quelle que soit sa forme.

Cette interprétation est très proche de l'interprétation de Copenhague présentée plus loin.

Le mot "interprétation" est ici un peu abusif dans la mesure où rien n'est réellement interprété (le
sens physique de la fonction d'onde, par exemple). On a juste un ensemble de règles techniques
pour relier le résultat des mesures aux résultats théoriques. Elle donne toutefois une traduction entre
le formalisme quantique et les mesures classiques et peut en ce sens être qualifiée d'interprétation,
au moins une interprétation minimaliste. Mais c'est la base dont nous devons partir car elle est
confirmée par l'expérience.

Réduction de la fonction d'onde


Que devient l'état d'un système après mesure ? Le système se réduit en le vecteur propre mesuré.

Par exemple, si ψ = x1 + x 2 et que l'on mesure la position, et si on trouve x1 , alors la particule


se retrouve après dans l'état x1 .

Cette réduction est confirmée si l'on effectue une seconde mesure de la position : on trouve alors
toujours x1 (sauf, évidemment, si la particule se déplace, ce qui se produira forcément car une
mesure précise implique une grande incertitude sur l'impulsion, la mesure doit donc se faire
immédiatement).

Cette règle (réduction avec une probabilité donnée par les amplitudes) est appelée règle de Born.

Cette situation soulève immédiatement un problème. Il suffit pour cela de regarder l'équation de Schrödinger. En
l'écrivant avec des états (plutôt qu'avec la fonction d'onde) on a :

(1) ih ψ = H ψ
∂t
(où H est l'opérateur hamiltonien, par exemple une combinaison de l'opérateur impulsion et du potentiel, comm
nous avons vu).
Cette relation est linéaire. C'est-à-dire que, par exemple, H ( x1 + x 2 ) = H x1 + H x 2 , par simple
multiplication. L'opérateur hamiltonien ne peut pas faire disparaître une des composantes, les deux évoluent
toujours de pair. Aucun opérateur d'évolution, respectant la physique quantique, ne peut correspondre à une
mesure ! En, fait, le mécanisme de réduction ci-dessus est totalement non linéaire. Aucune évolution linéaire ne
peut conduire à la réduction. Si toute la physique se doit d'être décrite par la physique quantique, comment cela
est-il possible ? Manifestement, il y a une incompatibilité entre le formalisme et la réduction ou, si l'on considère
celui-ci comme faisant partie du formalisme, la théorie est inconsistante !

Pour être précis on dit que l'équation de Schrödinger est "unitaire" car elle est linéaire et conserve les probabilité
(si la probabilité totale est 100% pour tous les cas au départ, comme il se doit, alors le total reste de 100%).

Signalons toutefois que ce problème peut être artificiel car :


 L'interprétation instrumentale donne un statut spécial et classique aux appareils de mesure. Une description
totalement quantique pourrait faire disparaître ce problème. Bien que la situation serait alors plus compliqué
car il resterait à faire le lien avec le monde classique qui est celui que nous percevons... et mesurons !

Ce statut particulier de la mesure est clairement visible dans la présentation que nous avons faite du
formalisme :
 Une description de l'évolution linéaire (équation de Schrödinger) de l'état du système lorsqu'il est "non
observé", c'est-à-dire lorsqu'il évolue librement sans interagir avec le reste de l'univers. La règle de
combinaison des amplitudes lorsque plusieurs possibilités existent est alors leur addition.
 Une description de l'évolution (réduction) de l'état du système lorsqu'il est "observé", c'est-à-dire mesuré
avec les règles probabilistes précédentes. La règle de combinaison des amplitudes lorsque plusieurs
possibilités existes et qu'elles sont discernables (mesurées, observées, au moins en principe) est l'addition
des probabilités.
Les deux étant incompatibles (on dit aussi complémentaires) et faisant référence à des situations différentes.
 Le système complet est constitué du système mesuré et de l'appareil de mesure (et même de
l'expérimentateur). Non seulement il y a interaction entre tous ces sous-systèmes, mais on sait par expérience
qu'il est impossible de mesurer un système aussi fragile que, par exemple, une particule atomique sans le
perturber. La réduction ne concerne que l'état d'un sous-système et l'évolution unitaire concerne le système
complet. Cela pourrait expliquer la différence.
 Nous n'avons pas, dans le cadre de cette interprétation, d'explication physique sur la nature de la fonction
d'onde ni sur les mécanismes probabilistes ni sur la réduction. Une interprétation correcte et complète pourra
expliquer cette incompatibilité apparente.

Nous aurons l'occasion de revenir largement sur ce problème qui est au cœur des interprétations de la mécanique
quantique.

Rappelons toutefois les difficultés soulevées dans le cadre de l'intrication quantique en relativité. La simultanéité
étant relative, la réduction de l'état des deux particules se fait différemment selon l'observateur, ce qui ne peut qu
lever un doute sur la réalité physique intrinsèque de la réduction bien que si on la rejette, on doive alors explique
la raison de cette réduction "apparente".
II.2. Le problème de la mesure
Comme nous venons le voir, la description de la mesure telle qu'elle est donnée par l'interprétation instrumentale
pose des difficultés car elle est incompatible avec l'évolution de l'état des systèmes quantiques tel que nous l'avo
décrit.

Nous allons maintenant approfondir ce problème et décrire les grands principes de l'attitude que nous devons
adopter face à celui-ci.
II.2.1. Le problème de la mesure
Le problème de la mesure peut se décrire brièvement, en une seule phrase, comme suit : la fonction
d'onde, en mécanique quantique, évolue selon l'équation linéaire de Schrödinger comme une
superposition (décomposition) d'états propres (d'un observable), mais les mesures réelles trouvent
toujours le système physique dans un état définit, un des états propres (de cet observable).

Donc, toute l'évolution, après la mesure, aura pour point de départ un système se trouvant dans le
nouvel état décrit par cet état propre. Le processus de mesure affecte donc le processus examiné
d'une manière importante et quelle que soit l'interaction réelle (que nous n'avons pas décrit)
conduisant à la mesure. Cette modification de l'état est, en apparence, indépendante du détail du
processus de mesure. Cette modification fondamentale n'est pas expliquée par le formalisme de
base de la mécanique quantique.

C'est le problème principal auquel doit répondre une interprétation de la mécanique quantique.
Nous aurons l'occasion de voir qu'il existe d'autres difficultés.

On va d'abord tenter de cerner la difficulté sans tenter, ici, de la résoudre.

Tentons une description purement quantique d'un processus de mesure. Pour cela, nous allons
employer un schéma simplifié du processus de mesure imaginé par von Neumann en 1932.

On considère un système S et appareil de mesure A. L'appareil de mesure interagit avec le système


effectuant une mesure décrite par un opérateur O . L'état du système S peut être décrit, en
mécanique quantique, par un vecteur d'état appartenant à un certain espace de Hilbert H S . Pour
l'opérateur O (l'observable mesuré par A), on a les états propres S1 , S 2 , … Par simplicité, nous
nous limiterons à deux états propres mais le résultat s'étend facilement à un nombre quelconque
d'états propres, éventuellement infini.
Si l'état du système est S1 , alors on a O S1 = s1 S1 et si le système est dans l'état S 2 on a
O S 2 = s 2 S 2 . L'appareil est conçu pour effectuer cette mesure et rend dans le premier cas la
valeur S1 et dans le second cas la valeur S 2 . Les deux cas seront, par exemple, identifié par la
position d'une aiguille sur un cadran. Les deux états correspondant de l'appareil de mesure sont
distincts et nous pouvons les désigner par deux états A1 et A2 appartenant à un certain espace
de Hilbert H A (nous tentons une description entièrement dans le cadre du formalisme de la
mécanique quantique). Bien sûr, l'état de l'appareil est beaucoup plus complexe que la simple
position de l'aiguille mais nous n'avons pas besoin de tous les détails et nous ne considérons que le
sous-espace engendré par ces deux états. Nous désignerons l'état initial de l'appareil, lorsque
l'aiguille de l'appareil est dans sa position initiale, par A0 .

Jusqu'ici, rien de bien compliqué, on n'a fait que nommer les différents états que peuvent prendre
l'appareil et le système.

Pour décrire l'état du système composite système mesuré / appareil de mesure, il suffit d'utiliser un
espace de Hilbert obtenu en combinant les deux espaces précédents H S ⊗ H A . L'évolution du
système composite peut alors être décrit comme suit, respectivement pour les deux cas considérés :
(1) S1 A0 → S1 A1
(2) S 2 A0 → S 2 A2

Où l'état complet est le produit de l'état du système et de l'état de l'appareil et la flèche indique
l'évolution due à la mesure.

En toute rigueur, l'état final du système mesuré pourrait être altéré par la mesure. Mais nous
considérons une mesure "parfaite", où la seule influence de l'appareil est décrite par l'opérateur O
qui ne modifie par l'état du système. On pourrait décrire une mesure "imparfaite" conduisant à un
état différent mais cela ne ferait que compliquer l'analyse sans apporter de véritable solution au
problème que nous allons constater (la perturbation peut être décrite par un opérateur modifiant
l'état du système et le résultat global consiste simplement à considérer un opérateur plus complexe
produit de l'opérateur correspondant à l'observable et l'opérateur représentant la perturbation).

La mécanique quantique nous dit qu'un système peut se trouver dans un état superposé. Si S1 et S 2 sont deu
états possibles pour le système, alors S1 + S 2 est également un état possible (à un coefficient de normalisatio
près).

Mais l'évolution du système, quel que soit l'hamiltonien décrivant l'évolution précédente, est donnée par l'équatio
linéaire de Schrödinger. Les deux équations précédentes permettent alors de trouver l'évolution du système
composite lorsque le système mesuré est dans un état superposé :

(S 1 + S2 )A
0 = S1 A0 + S 2 A0 → S1 A1 + S 2 A2

C'est à dire que le système composite, incluant l'appareil, se retrouve dans une superposition d'état incluant les
positions A1 et A2 des aiguilles de l'appareil.

Mais cela n'est jamais observé. Nous ne trouvons jamais un résultat où l'aiguille se trouverait dans deux position
en même temps ! Ce qui est mesuré est soit A1 (correspondant à la valeur S1 du système), soit A2 (correspondan
à la valeur S 2 ), jamais les deux à la fois. Et ces deux valeurs sont données par la règle de Born.
En fait, plus généralement, on ne retrouve jamais les objets macroscopiques dans de tels états superposés. C'est l
fameux paradoxe de Schrödinger où le chat se retrouve dans un état où il est à la fois mort et vivant et que nous
verrons plus loin. Sans aller aussi loin, si la position, disons, d'un livre sur une table peut être x1 ou x 2 , décrites
par les états x1 et x 2 , on ne retrouve jamais le livre dans un état x1 + x 2 .

Pourtant, dans l'analyse précédente, le caractère macroscopique n'intervient pas dans le processus. L'appareil de
mesure pourrait aussi bien être microscopique que macroscopique. Par exemple, l'état d'un électron pourrait être
mesuré par réaction avec une molécule chimique sur un film photographique, puis par des processus
d'amplifications successives aboutir à une image macroscopique de l'état mesuré. Chaque étape se décrit
parfaitement avec le schéma de von Neumann précédent. Où se produit la rupture entre ce que nous dit la
mécanique quantique et ce que l'on constate ?

Ce problème est appelé problème de la mesure ou problème des états définis. C'est-à-dire que l'on trouve toujour
l'appareil de mesure dans un état défini, correspondant à la mesure d'une valeur propre, et jamais dans un état
superposé correspondant à plusieurs résultats possibles. Comment expliquer cette discordance entre le
microscopique et le macroscopique ?

Evidemment, l'interprétation instrumentale résout le problème. Elle donne une prescription (la réduction, les état
définis) et une règle (les probabilités) pour décrire le résultat final. C'est la deuxième étape indiquée dans le
schéma de von Neumann ci-dessus. Mais cette approche est en conflit avec le formalisme de la mécanique
quantique et il reste à l'expliquer.

Notons que tout ce dont nous disposons pour décrire le monde quantique est justement des concepts classiques
comme ceux de position d'une aiguille sur un appareil de mesure. Nous ne disposons de rien d'autre car tout ce q
est accessible à nos sens sont ces concepts classiques. Nous ne sommes pas en mesure de percevoir directement
monde microscopique. Nous ne pouvons le faire qu'à travers des outils mathématiques et des concepts
macroscopiques. Si le monde macroscopique se comporte différemment du monde microscopique (quelle qu'en
soit la raison, la taille et la complexité par exemple), l'origine de la difficulté semble évidente.

La première idée, d'ailleurs développée part l'école dite de Copenhague, est d'accepter cette différence entre le
monde microscopique et macroscopique. La mécanique quantique ne serait pas directement applicable aux
systèmes macroscopiques, décrits par des lois classiques, et le lien entre les deux se fait à travers l'interprétation
instrumentale.

Mais pourquoi observe-t-on cette différence ? D'une part, tous les systèmes macroscopiques sont
composés de systèmes microscopiques (atomes, molécules) obéissant à la mécanique quantique,
d'autre part, la mécanique quantique n'a jamais été mise en défaut (à condition d'accepter
l'interprétation probabiliste pour résoudre le problème précédent). Le formalisme s'applique
toujours sans faille et des comportements quantiques ont même été mis en évidence sur des
systèmes macroscopiques (supraconducteurs, superfluidité, condensats de Bose - Einstein). Jamais
un phénomène physique, expliquant une différence dans les lois fondamentales entre un atome et
un assemblage de milliards d'atomes, n'a jamais été mis en évidence. Et les lois de la mécanique
quantique sont claires, si elles sont valables sur un système simple, alors, par linéarité (toujours
elle), elles restent vraies pour deux, trois, quatre,… systèmes et même pour des milliards d'atomes.
Une autre difficulté est liée à l'impossibilité de séparer l'objet mesuré de l'instrument de mesure.
Cela est dû, d'une part, au fait que tout système macroscopique est composé de systèmes
microscopiques, la mesure étant une chaîne continue d'interactions entre systèmes microscopiques
aboutissant au final à un état macroscopique (comme dans notre exemple de l'amplification d'une
réaction chimique entre un électron et une plaque photographique), d'autre part les systèmes
microscopiques sont tellement "sensibles" que la moindre mesure les perturbe et rend indissociable
le processus de mesure du système mesuré.

Si le processus de mesure est une chaîne continue d'interactions passant d'une particule à un
système macroscopique en parcourant tous les systèmes intermédiaires (un atome est affecté, puis
deux, etc. jusqu'aux milliards d'atomes composant l'aiguille de l'instrument), où placer la limite ?
Où se situe la frontière entre le microscopique et le macroscopique ? A quel moment cesser
d'appliquer l'évolution linéaire de Schrödinger et appliquer la règle discontinue et non déterministe
(probabiliste) de Born ?

Le problème semble difficile. Nous avons vu, d'ailleurs, que séparer le système complet en système
mesuré et appareil de mesure ne résout pas le problème. Quelle que soit la décomposition en
systèmes, sous-systèmes, sous-systèmes encore plus petits, on retrouve toujours le même problème
au final.

Et on ne peut pas effectuer la réduction "trop tôt". Imaginons que le système mesuré soit un
électron, dans un état superposé, et que la première interaction avec celui-ci consiste à envoyer un
autre électron le heurter, pour savoir en quel endroit il se trouve. Le système des deux électrons se
retrouve, conformément à notre schéma, dans un état superposé. On pourrait dire qu'il y a eut
mesure et que l'on doit choisir dans quel état il se trouve. C'est-à-dire effectuer la réduction. Mais le
problème c'est qu'il est possible d'effectuer sur ce système (les deux électrons) des expériences
(interférences, mesures sur ces électrons qui sont maintenant intriqués,…) montrant qu'il est bien
dans un état superposé. Il faut donc "repousser" la réduction vers des systèmes plus complexes.
Jusqu'à l'appareil tout entier puisque la frontière ne semble pas pouvoir être définie.

Certains vont même jusqu'à dire qu'en réalité l'appareil est réellement dans un état superposé mais
celui-ci doit encore être lu par un observateur qui lui ne se trouvera pas dans un état superposé.
Mais le même problème a juste été repoussé un peu plus loin. L'appareil de mesure final étant
l'observateur humain lui-même et son état pouvant être décrit par le même schéma de von
Neumann. A force de repousser le problème on en arrive à la conscience de l'observateur humain.
Certains ont jusqu'à été donner un rôle "spécial" (parfois même à caractère métaphysique) à la
conscience qui serait d'une "nature" différente du reste du monde et expliquerait qu'elle ne se trouve
jamais dans un état superposé.

C'est évidemment une hypothèse difficile à tester : comment faire des expériences d'interférences
avec des consciences ? Et puis, qu'est-ce que la conscience ? C'est de toute façon une hypothèse
difficile à justifier. A moins d'invoquer le caractère métaphysique, la conscience résulte du
fonctionnement du cerveau. Celui-ci, comme tout système macroscopique, est décrit par des objets
microscopiques (des cellules nerveuses composées elles-mêmes de molécules telles que des
protéines, des ions, des neurotransmetteurs,…) Et le métaphysique porte bien son nom, ce n'est plus
de la physique, ce n'est même plus de la science.

Et si l'on considère que l'appareil est en réalité constitué de tout : le dispositif de mesure,
l'observateur, l'environnement, c'est-à-dire tout l'univers, alors on repousse la réduction de plus en
plus loin jusqu'à ne plus avoir de réduction du tout ! Et nous avons vu que cela est un problème
puisque ce n'est pas ce qui est observé.

Un autre mécanisme peut être invoqué, c'est l'existence de perturbations ou d'imprécisions dans la
mesure. Nous avons eut l'occasion de discuter de l'importance des perturbations de l'environnement
dans le mécanisme de décohérence. Mais bien qu'important, ce mécanisme ne résout pas le
problème. Nous n'avons pas précisé les détails de l'appareil A, ni du processus de mesure. Nous
pouvons inclure ces perturbations et imprécisions dans l'appareil, plus exactement en utilisant
l'espace de Hilbert approprié incluant la description de tous les détails y compris les éléments
perturbateurs ou dans l'observable qui peut être légèrement différent de l'observable idéal que l'on
aurait souhaité, comme pour l'opérateur qui altérerait l'état du système. Dans tous les cas, le schéma
de von Neumann reste valable et nous retombons sur les mêmes difficultés. Ces difficultés sont
inhérentes à la linéarité de l'évolution des états quantiques et non à la forme des systèmes étudiés.
Notons que si les mécanismes d'interférences n'entrent pas en jeu, la réduction peut être effectuée
(mathématiquement) à n'importe quel stade. De la particule mesurée à l'observateur en passant par
l'appareil. Cela se vérifie aisément, il suffit de répéter le schéma de von Neumann avec des
systèmes de mesures emboîtés (A mesuré par S1, mesuré par S2, mesuré par S3, …) et de comparer
le résultat final selon le système où l'on choisit d'effectuer la réduction. Le résultat final est
évidemment toujours le même. Cela ne simplifie pas la tâche de savoir où la réduction devrait avoir
lieu. Mais cela jette aussi la suspicion sur la réalité physique de cette réduction, d'autant que, nous
l'avons dit, chaque fois que l'on a été en mesure de vérifier expérimentalement (à l'aide
d'interférences) la présence des superpositions, cela a été confirmé.

Nous avions déjà eut de sérieux doute avec l'intrication où la réduction s'opérait de manière
différente pour les deux particules selon les observateurs à cause de la relativité de la simultanéité
(les mesures ne sont pas faites dans le même ordre selon les deux observateurs).

Mais la difficulté ne s'arrête pas là ! Il existe un autre problème appelé problème de la base
privilégiée. Voyons cela d'un peu plus près.

Soit un état ψ . Celui-ci peut être décomposé sur une base d'états. Par exemple (nous nous
limitons à un espace de Hilbert à deux dimensions, c'est-à-dire avec une base composée de deux
états) :
ψ = a A +b B
Et la probabilité que le système représenté dans cet état soit, par exemple, dans l'état A est
2
donnée par a . C'est la probabilité que, lors d'une mesure, le système soit trouvé dans la valeur
associée à cet état de base. Ce pourrait, par exemple, être les deux états propres correspondant à
deux positions précises d'une particule.

Le problème est qu'il existe une infinité de bases sur laquelle décomposer l'état. Par exemple, on
peut prendre deux autres états comme suit :
A′ = A + B
B′ = A − B
(nous avons négligé l'existence d'un facteur, une amplitude correspondant à une probabilité 1, qui
permet de garantir que ces états forment une base. Inutile d'entrer dans les détails mathématiques
techniques).

L'état peut se décomposer dans cette nouvelle base :


ψ = a ′ A′ + b′ B ′
Et le système a la probabilité a ′ de se trouver dans l'état A′ .
2

Le problème est alors de savoir dans quel état on va retrouver le système ? Quelle base doit être
utilisée ? Existe-t-il une base privilégiée ?

On peut toujours affirmer que lorsqu'on effectue une mesure, cela correspond à la mesure d'un
observable donné auquel correspond une série d'états propres imposant la base. Bien entendu,
l'interaction complète entre le système microscopique et le système macroscopique peut être
extrêmement complexe et il peut être difficile de justifier que cela corresponde à tel observable
donné. Mais cela importe peu puisque, quel que soit cet observable, celui-ci doit exister (on
effectue une "opération" sur l'état en agissant dessus, modifiant l'état de l'appareil, ce qui
correspond à une observation donnée).

Mais cela ne résout rien ! En effet, si l'on regarde l'évolution linéaire donnée plus haut
( S1 + S 2 ) A0 → S1 A1 + S 2 A2
utiliser une autre base pour décomposer le système S conduit simplement à
( S1′ + S 2′ ) A0 → S1′ A1′ + S 2′ A2′
C'est-à-dire que l'on obtient juste une superposition décomposée sur une autre base (en toute
rigueur, on devrait vérifier que les états A′ constituent bien une base, mais cela ne change pas
grand chose au problème).

Nous avions déjà suggéré ce problème dans l'étude de la décohérence. Si l'on considère dans la
description quantique l'ensemble système + appareil de mesure, l'état superposé après mesure peut
être décomposé dans une infinité de bases possibles, par exemple les bases correspondantes aux
vecteurs propres de n'importe quel observable. L'appareil ne semble pas pouvoir remplir la fonction
pour lequel il a été conçut (mesurer les états propres d'un observable déterminé).

Comme toutes ces décompositions sont mathématiquement équivalentes, il n'y a pas de raison pour
privilégier une base plutôt qu'une autre. On pourrait choisir pour l'appareil des états de base
différents tel que :
A1′ = A1 + A2
A2′ = A1 − A2

Mais rappelons que les états A1 et A2 correspondent à des positions précises des aiguilles.
Choisir d'autres états de base pour l'appareil revient à choisir des états qui sont des "mélanges"
d'états avec une position précise de l'aiguille. C'est-à-dire des superpositions. Or nous avons dit que
l'appareil était toujours trouvé avec l'aiguille à une position précise. Il semble donc que le choix de
la base est clairement relié aux états définis des systèmes macroscopiques.

Le problème de la mesure inclut donc en réalité deux aspects liés : l'existence de valeurs définies
(le problème de la réduction non conforme au formalisme de base de la mécanique quantique) et
l'existence de bases privilégiées (le fait que les valeurs définies correspondent aux états d'une base
privilégiée).

Pour des systèmes macroscopiques, la base privilégiée est habituellement la base position. Mais
pour certains systèmes (généralement microscopiques ou mésoscopiques, c'est-à-dire d'une taille
intermédiaire entre le microscopique et le macroscopique, la taille des plus petits détails dans les
circuits intégrés les plus miniaturisés), on observe d'autres bases privilégiées comme la base énergie
(chaque état de base correspond à une énergie précise).

Nous reviendrons plus loin sur ce problème important de la base privilégiée. Vous savez d'ailleurs déjà que la
décohérence apporte une partie de la solution.

Il existe encore un autre problème lié à la mesure. C'est l'absence de mesure ! Comment décrire le système lorsq
l'on ne le mesure pas (par impossibilité ou par choix). Parfois on emploie le terme d'observation ou de "vision".
Comment est le système lorsqu'on ne le voit pas. "Voir" doit ici être compris au sens très large d'une interaction
avec le système pouvant fournir (éventuellement) une mesure via une chaîne d'interactions dans un appareil de
mesure.

Ce problème est plus délicat et plus important qu'il n'y paraît. En particulier pour des systèmes microscopiques.
Voyons pourquoi.
 Un système microscopique peut évoluer un certain temps sans être vu. C'est-à-dire sans interagir de quelque
manière que ce soit avec le reste de l'univers. Pour un objet macroscopique, c'est pratiquement impossible. L
objets macroscopiques, tel qu'un stylo posé sur une table, est en permanence heurté par des molécules d'air,
irradié par les rayonnements électromagnétiques environnant (ondes radio, lumière, infrarouge d'origine
thermique), etc. Par contre, une particule élémentaire tel qu'un électron, peut se déplacer sur une distance non
négligeable entre deux interactions avec d'autres particules, y compris les photons du champ
électromagnétique environnant.

De fait, même quand une particule n'interagit pas, son état évolue selon l'équation de Schrödinger.
 Toute mesure implique une perturbation, une interaction (comme dans le schéma de von Neumann). Et cette
perturbation ne peut pas être négligée. Il est possible de mesurer un objet macroscopique d'une manière
extrêmement délicate de manière à rendre la perturbation aussi faible que possible ou tout au moins
négligeable par rapport à la précision recherchée. C'est impossible pour des objets microscopiques. Les
particules élémentaires sont tellement légères et sensibles et les sondes servant à les mesurer tellement gross
(au mieux d'autres particules, semblables à celles mesurées) que des perturbations non négligeables doivent
nécessairement se produire.

Ces perturbations sont en outre imprévisibles. Même d'un point de vue déterministe, pour calculer la
perturbation il est nécessaire de connaître l'état complet d'un système. Dans ce cas, il n'est même plus
nécessaire de le mesurer ! Bien sûr, on pourrait objecter qu'une fois mesuré on connaît l'état et donc la
perturbation. Deux difficultés se posent toutefois. Le système de mesure doit aussi être connu, au départ,
parfaitement. Or, comment mesurer l'état de l'appareil de mesure ? Avec un autre appareil de mesure ? On
retombe sur le même problème. C'est un jeu de poupées russes. Ensuite, la mécanique quantique ne permet p
de connaître parfaitement l'état complet d'un système. Ceci est dû au principe d'indétermination, lui-même un
conséquence du fait que les observables ne commutent pas toujours.
 Les seules informations que nous pouvons obtenir sur un système sont données par les mesures. Aucune autr
information ne peut nous parvenir sur l'état du système.

Notons que l'on retrouve dans ce problème notre dualité : évolution quantique libre (sans
interaction, décrite par l'équation de Schrödinger) et mesure (avec interaction et, éventuellement,
réduction).

Etant donné ce qui précède, en particulier le caractère imprévisible des perturbations dues aux
mesures, il est nécessaire de décrire entièrement l'évolution du système même lorsqu'il n'est pas
observé afin de pouvoir prédire son comportement futur.

La description de l'état du système lorsqu'il est non observé ne peut être déduit que des moments où
il est observé. Les informations recueillies permettent de bâtir une description et des lois (la
mécanique quantique) permettant de le décrire.

Toutefois, même si nous pouvons le décrire par déduction à l'aide d'un formalisme mathématique
approprié, la nature physique du système non observé reste problématique puisque, par définition,
on ne peut l'observer. Et, en outre, comme nous l'avons vu, les résultats des mesures semblent a
priori en désaccord avec le formalisme de base de la mécanique quantique.

Nous avons donc deux problèmes :


 Quel statut physique attribuer à la description, c'est-à-dire à l'état ou à la fonction d'onde ?
 Quel statut physique attribuer à la réduction qui, nous l'avons vu, semble échapper à toute
réalité physique alors qu'on n'arrive pas à la contourner ?

Deux attitudes sont possibles pour la fonction d'onde. Ou on nie son caractère physique (ou on nie
l'importance même de se poser la question) ou on lui donne un statut physique réel.

C'est la différence entre le positivisme et le réalisme que nous aborderons bientôt.

En conclusion, résumons les insuffisances de l'approche instrumentale.


 Elle introduit une évolution indéterministe (règle de Born) dans une évolution déterministe
(l'évolution linéaire de Schrödinger).
 Elle introduit un processus irréversible dans une évolution réversible (la réduction élimine une
partie de l'information, elle est discontinue).
 Elle n'explique pas le mécanisme de réduction.
 Celle-ci est en désaccord avec le formalisme quantique.
 Son caractère physique n'est pas confirmé et même problématique (car on peut l'effectuer à
différents stades du processus de mesure sans que cela influe sur le résultat et la
simultanéité de la relativité rend impossible un processus de réduction identique pour tous
les observateurs).
 Elle n'explique pas l'existence de bases privilégiées.
 Elle ne permet pas de préciser le caractère physique des objets fondamentaux décrits par la
fonction d'onde.
II.2.2. Interprétation de Copenhague

Présentation
L'interprétation de Copenhague est probablement l'interprétation qui est la plus proche de
l'interprétation instrumentale. Comme nous l'avons vu, celle-ci est avant tout un ensemble de règles
opérationnelles permettant de relier le formalisme aux résultats expérimentaux. Mais elle se refuse
à donner toute explication sur la nature physique de la fonction d'onde et du processus de réduction.

L'interprétation de Copenhague reprend l'intégralité de l'interprétation instrumentale, sans la


modifier, et y ajoute simplement et directement une ontologie.

C'est pour cette raison que l'interprétation instrumentale est parfois présentée comme étant celle de
Copenhague. En vérité, ne sont données, dans la plus part des livres, que les règles opérationnelles
de l'interprétation instrumentale et les aspects ontologiques ou philosophiques sont ignorés ou très
superficiellement présentés.

C'est aussi pour cette raison, ainsi que pour son caractère historique, que l'interprétation de
Copenhague est souvent adoptée. Elle est la plus couramment admise. Même de nos jours, même si
le cœur de nombreux physiciens penche en faveur d'autres interprétations, lorsqu'ils sont amenés à
travailler concrètement avec la mécanique quantique, ils embrassent l'interprétation de Copenhague
ou tout au moins sa fondation instrumentale, consciemment ou inconsciemment, simplement pour
des raisons pratiques.

L'interprétation de Copenhague est la plus ancienne interprétation de la mécanique quantique. Elle


fut la première tentative de donner un sens au formalisme quantique, par les pères fondateurs de la
mécanique quantique. Signalons toutefois que d'autres approches existaient déjà à l'époque mais
elles n'ont pas abouti ou tout au moins pas immédiatement. Citons, par exemple, le point de vue de
Schrödinger qui voyait la fonction d'onde de l'électron comme un "fluide" ou un "champ" à l'instar
du champ électromagnétique pour le photon. Idée séduisante et intuitive mais qui s'est avérée
erronée. Citons aussi l'idée de Louis de Broglie d'associer une onde (la fonction d'onde) à une
particule (un corpuscule). Cette dernière idée qui n'a pas été approfondie par son auteur fut reprise
avec plus de succès bien plus tard par David Bohm.

L'interprétation de Copenhague trouve son origine dans une école de pensée située dans la capitale
du Danmark et dont le chef de file était le physicien danois Niels Bohr (l'auteur de la première
théorie de l'atome introduisant certains aspects de la mécanique quantique et destinée à expliquer le
fonctionnement du modèle de l'atome récemment découvert par Rutherford).

Immédiatement après que les bases de la mécanique quantique furent posées par les pères
fondateurs (Werner Heisenberg, Erwin Schrödinger, Albert Einstein, Paul Dirac,…), Bohr avec ses
collaborateurs et tout particulièrement Heisenberg, tentèrent vers 1927 de donner une interprétation
du formalisme fort abstrait de la mécanique quantique. Leur but était de compléter l'interprétation
probabiliste de Max Born avec un ensemble d'éléments physiques, ontologiques voire
philosophiques.

Même si certains aspects de l'interprétation furent formalisés plus tard par d'autres physiciens
comme John von Neumann et Dirac, il n'y a jamais eut d'accord complet entre les vues de Bohr et
d'Heisenberg. En fait, rares étaient les physiciens qui étaient d'accord sur l'ensemble des éléments
de l'interprétation. Les différences se trouvant souvent en marge de la physique suivant les courants
de pensée philosophique de leurs auteurs.

L'interprétation de Copenhague constitue donc essentiellement un ensemble de réflexions,


d'articles, de séminaires,… qui n'a jamais été entièrement et strictement formalisée. Le nom
"d'interprétation de Copenhague" n'a d'ailleurs jamais été utilisé par leurs auteurs et fut utilisé plus
tardivement pour souligner les traits principaux des vues de ses fondateurs.

La raison de ce flou entourant cette interprétation est aussi en partie liée au fait que la partie
réellement importante dans son usage pratique est simplement l'interprétation instrumentale qui,
elle, est parfaitement formalisée.
De fait, même actuellement, cette interprétation admet plusieurs variantes. Nous tenterons donc
d'en dégager les traits principaux et de donner les principales variantes sans chercher spécialement
à les attribuer à tel ou tel auteur ni de définir "une" interprétation de Copenhague.

Interprétation de Copenhague
On peut décomposer l'interprétation de Copenhague en plusieurs points. Nous approfondirons
certains aspects et certains concepts plus loin.
 Le formalisme de base de la mécanique quantique est inchangé. En particulier, tout système
microscopique est décrit par un état appartenant à un espace de Hilbert. Pour un système isolé,
l'évolution (linéaire) est décrite par un opérateur hamiltonien et l'équation de Schrödinger.
 La règle de Born donne les probabilités ou les statistiques pour l'observation d'un résultat lors
d'une mesure.
 On distingue le monde microscopique décrit par la mécanique quantique et le monde classique
décrit par les lois de la physique classique. Les appareils de mesure entrent clairement dans
cette deuxième catégorie. L'appareil de mesure correspond à un observable.
 L'application des règles précédentes implique qu'il est impossible de mesurer avec une
précision arbitraire deux observables qui ne commutent pas.
 Règle de complémentarité (voir plus loin).
 Nature physique de la fonction d'onde. Plusieurs variantes existent.
 La fonction d'onde représente un objet physique réel.
 La fonction d'onde a un caractère symbolique. Elle n'est qu'une représentation
mathématique des probabilités décrites par la règle de Born. Elle traduit les connaissances
que nous avons sur le système.
 La fonction d'onde d'un système donné est différente pour chaque observateur. Chacun en a
une connaissance différente.
 Réduction. Le mécanisme de réduction, induit par la règle de Born, prend un aspect différent
selon les variantes dans la signification physique de la fonction d'onde.
 Dans le cas d'une fonction d'onde représentant un objet physique réel, la réduction est un
processus physique réel modifiant le système.
 Dans le cas où la fonction d'onde ne représente que nos connaissances sur le système, la
réduction est une simple mise à jour de ces connaissances.
Fonction d'onde réelle
Examinons d'un peu plus prêt la variante où la fonction d'onde est considérée comme étant une
représentation d'un objet physique réel. C'est-à-dire un objet physique étendu, répandu dans tout
l'espace et le temps.

Cette interprétation est assez intuitive et naturelle dans la mesure où ce genre d'objet se rencontre
en physique. Par exemple le champ électromagnétique ou, plus généralement, tout phénomène
pouvant se décrire par des ondes.

Une première difficulté est liée à la nature de la fonction d'onde. Elle est décrite par des amplitudes
qui ne sont pas des nombres habituels (on dit que ce sont des nombres complexes). Or il semble
difficile de donner une interprétation physique directe à un nombre complexe. Toutes les propriétés
connues étant représentées par des nombres réels. Par exemple l'intensité, la masse, la
température,… Toutefois, si cet objet physique est assimilé à une onde, cette difficulté disparaît car
les ondes peuvent aussi être représentées par des nombres complexes encodant la grandeur de
l'onde et la phase. L'interprétation du nombre complexe est alors indirecte.

Mais d'autres difficultés surviennent. L'analyse précise de l'évolution des processus quantiques
montre la manifestation d'effets non locaux. C'est-à-dire de propagation ayant une vitesse
supérieure à la vitesse de la lumière dans le vide. Quelques calculs montrent que c'est le cas, par
exemple, dans l'effet tunnel ("vitesse" de la particule pendant la traversée de la barrière de
potentiel). Pire encore pour le processus de réduction : il est instantané. Par exemple, si nous
mesurons l'objet physique comme étant localisé à un endroit précis, alors la fonction d'onde
initialement répandue dans tout l'espace se retrouve instantanément réduite à l'endroit de la
localisation. Et on ne peut pas imaginer que cette "concentration" se produise à vitesse finie car
durant ce processus la probabilité de détecter la particule à un autre endroit (les deux mesures étant
séparées par un intervalle de type spatial) serait non nulle. Ce qui n'est jamais observé. Notons que
cette contradiction est au cœur du théorème de Malament : la probabilité de détecter la particule à
un endroit donné, la probabilité nulle de la détecter en deux endroits spatialement disjoints et le
respect de la relativité conduit à un problème.
Une autre difficulté est le moment auquel la réduction prend place au cours d'un processus
complexe de mesure passant d'un système microscopique mesuré à un dispositif de mesure
macroscopique. Jamais aucune réduction physique n'a été mise en évidence autrement que par
l'observation de résultats définis des mesures. Au contraire, avec l'amélioration des expériences, des
phénomènes d'interférences (états superposés) ont été mis en évidence sur des systèmes de plus en
plus complexes (grosses molécules). Cette interprétation ajoute donc, à la théorie, un processus
physique supplémentaire (en ce sens il ne s'agit plus d'une simple interprétation) qui n'a jamais été
observé.

Si l'on place la réduction trop tôt dans le processus de mesure, au niveau microscopique, alors on
entre en conflit avec l'observation des interférences. Si l'on place la réduction trop tard dans le
processus de mesure, au niveau macroscopique, alors on entre en conflit avec l'observation
commune de l'absence d'états superposés (avant que la réduction ne se produise) pour des objets
macroscopiques.

Les interprétations avec réduction physique de la fonction d'onde sont obligées de fixer
arbitrairement certains paramètres de manière à placer les phénomènes de réduction à cheval entre
le microscopique et le macroscopique. C'est-à-dire dans la zone qui échappe actuellement à
l'observation et aux expériences d'interférences.

Cette interprétation semble assez artificielle, voire problématique, et n'est pas la plus largement
acceptée.

Fonction d'onde symbolique


Voyons d'un peu plus près certains des aspects de l'interprétation de Copenhague où la fonction
d'onde est vue comme symbolique. C'est généralement sous ce point de vue que l'interprétation de
Copenhague est considérée.

Tout d'abord, cette interprétation est empruntée de la philosophie positiviste. La physique est vue
comme étant la science de la mesure. Elle est élaborée sur base de résultats expérimentaux et
d'observations et ce sont les seules données objectives sur lesquelles construire les théories. En
outre, toute prédiction théorique ne peut se vérifier que par le biais de l'expérimentation et de la
mesure. Toute autre considération est considérée comme de la spéculation, totalement invérifiable.
La philosophie positiviste va jusqu'à nier l'existence objective de ce qui ne peut être mesuré.

En mécanique quantique les seuls résultats disponibles sont les valeurs mesurées et les distributions
de probabilités. Ce caractère probabiliste est considéré comme intrinsèque. C'est-à-dire comme une
propriété fondamentale de la nature. Ces probabilités ne sont pas le reflet d'un manque de
connaissance sur l'état du système mais reflètent une caractéristique de ce système. Ce point de vue
est extrêmement différent de la physique classique où les probabilités sont le résultat d'une
connaissance imparfaite des détails d'un système physique dont le comportement moyen s'analyse
grâce aux statistiques (par exemple en physique statistique où le comportement d'un gaz résulte de
moyennes sur les positions inconnues d'un très grand nombre de molécules).

Du fait de cet indéterminisme intrinsèque et suivant la philosophie positiviste, cela implique que les
valeurs mesurées (charges, positions, moments,…) n'ont pas de réalité physique jusqu'à ce qu'on les
mesure.

Par conséquent, seules les probabilités devraient être discutées car elles seules décrivent
physiquement le système. La fonction d'onde n'est, dans ce point de vue, pas considérée comme
représentant un objet physique réel. Elle a un caractère symbolique. C'est un objet mathématique
qui encode les probabilités des résultats obtenus en effectuant des mesures sur le système. Toujours
en suivant la philosophie positiviste, cela implique que cette fonction d'onde contient tout ce qu'il y
a à savoir sur le système et que toute autre considération est sans intérêt. En dehors de ce qui est
décrit par la fonction d'onde, toute spéculation sur la nature physique de la fonction d'onde n'a
aucun sens.

La fonction d'onde est donc une représentation de l'état des connaissances sur un objet physique.
Notons toutefois que le mot "connaissance" peut être trompeur. Il ne s'agit pas nécessairement de la
connaissance attribuée à un observateur conscient. Ceci résulte de son caractère complet. Il n'est
pas besoin d'avoir conscience de cette connaissance pour qu'elle existe. Tout système
macroscopique, par exemple un appareil de mesure, constitue un "observateur" du système et est
concerné par la fonction d'onde.
Les expériences font appel à des appareils de mesures décrits par la physique classique. Plus
généralement, tout notre quotidien est façonné par les lois de la physique classique. L'évolution a
donc développé nos sens pour percevoir au mieux ce monde classique et tous les concepts dont
nous disposons ont un caractère classique (positions précises, durées précises, objets ayant une
forme bien identifiable,…) Par conséquent, tout ce dont nous disposons pour décrire une
expérience fait appel à ces concepts classiques. Le concept de valeurs définies enregistrées par les
appareils de mesure en est un exemple typique. Si nous inventons un nouveau concept, nous devons
en donner une description et celle-ci ne peut se faire qu'à l'aide de ce qui est déjà connu, c'est-à-dire
les concepts classiques. Par conséquent, ces derniers sont incontournables et c'est en leurs termes
que la physique doit être décrite. On ne peut comparer les résultats d'expériences classiques et
quantiques que s'ils sont exprimés dans les mêmes termes.

Dans ce but, les fondateurs de la mécanique quantique fondèrent le principe empirique de règle de
correspondance. La constante fondamentale qui régit la mécanique quantique est la constante de
Planck h . Que se passe-t-il lorsque celle-ci tend vers zéro ? Dans ce cas, on constate que les lois de
la mécanique quantique tendent vers celles de la physique classique. Cela se constate dans de
nombreux phénomènes.
 Tous les observables ne commutent pas. Ainsi, en mécanique quantique, on a
[x, p] = ih
Lorsque h → 0 , la relation tend vers [x, p ] = 0 . C'est-à-dire que la limite correspond à des
observables qui commutent, comme en physique classique.
 Le principe d'indétermination dit qu'il est impossible de mesurer avec une précision arbitraire
certaines paires d'observables. Par exemple la position et le moment. Le produit de l'incertitude
sur la mesure des deux observables (dit conjugués au sens de la dynamique, de la formulation
hamiltonienne) étant toujours supérieur à h / 2π . Lorsque la constante de Planck tend vers zéro,
une précision arbitraire devient possible. Ce résultat est directement relié au précédent.
 Dans le rayonnement du corps noir, si la constante de Planck tend vers zéro, la courbe théorique
tend vers la courbe donnée par la physique classique (d'ailleurs absurde avec sa catastrophe
ultraviolette).
 Dans un atome, lorsque l'on fait tendre la constante de Planck vers zéro, l'énergie des électrons
autour de l'atome tend vers les lois déduites de l'électromagnétisme classique avec un électron
qui tombe sur le noyau en émettant un rayonnement électromagnétique continu.
Cette correspondance entre la physique classique et la mécanique quantique avec une constante de
Planck tendant vers zéro fut érigée en règle. Cela donne un point d'accrochage entre les
phénomènes quantiques et classiques. A contrario, cette règle donne un moyen assez simple de
trouver les lois de la mécanique quantique lorsque l'on connaît les lois de la physique classique.
Pour un système physique donné, prenez la formulation classique. Remplacez ensuite les variables
conjuguées (au sens de la formulation hamiltonienne) par des variables non commutantes avec une
constante de Planck non nulle, et le tour est joué.

C'est ce principe de correspondance qui permet de dire que les valeurs mesurées d'un observables
sont les valeurs propres de l'opérateur correspondant.

Notons que ces règles empiriques ont leurs limites. En particulier lorsque l'on aborde un
phénomène pour lequel il n'existe aucune contrepartie classique. Par exemple, le spin.

D'autre part, cette règle concerne un comportement limite. Celui consistant à faire tendre la
constante de Planck vers zéro. Dans la nature, cette constante est non nulle et on sait que nombre de
comportements quantiques (par exemple la superposition des états) sont très différents des
comportements classiques. La description d'un système physique ne peut donc généralement se
faire qu'à l'aide d'un ensemble d'expériences fournissant chacune une description partielle. Ces
descriptions sont complémentaires même si les concepts classiques utilisés pour les décrire sont a
priori incompatibles en physique classique.

L'exemple le plus connu de complémentarité est la description en termes d'ondes et de corpuscules.


Selon les phénomènes physiques mesurés, un objet quantique peut se comporter tantôt comme une
onde, tantôt comme une particule. Ce n'est pas contradictoire (bien que ces deux concepts soient
classiquement incompatibles) car cela concerne des expériences différentes (ou des parties de
l'expérience, comme dans l'expérience de Young) et chaque expérience ne donne qu'une vue
partielle de l'objet physique, décrite avec des concepts physiques classiques, les seuls à notre
disposition, qui ne sont pas toujours ceux adaptés aux objets quantiques. La description complète
résultant de ces vues complémentaires.
Cette complémentarité se retrouve aussi dans l'interprétation instrumentale, l'évolution linéaire d'un
système isolé, "non mesuré", vue comme ondulatoire, étant complémentaire de la mesure, de
l'évolution non linéaire, discontinue, de la réduction, des résultats définis comme une position
précise, vue comme corpusculaire.

Notons que le principe de complémentarité reste aussi une règle empirique qui n'a jamais été
complètement formalisée même par ses pères fondateurs. Bohr parlait plus généralement de la
complémentarité cinématique - dynamique ou d'une description spatio-temporelle et d'une
description causale. Ce qu'on pourrait traduire par la dualité du système évoluant librement et du
système en interaction (de mesure).

Enfin, on arrive au phénomène de réduction de la fonction d'onde. Lorsque l'on effectue une mesure
sur un système, celui-ci se réduit instantanément dans l'état correspondant à la valeur propre
mesurée.

Cette réduction en elle-même n'est pas un processus physique, contrairement à l'acte de mesure, car
la fonction d'onde n'est pas considérée comme un objet réel. Cette réduction est un mécanisme de
mise à jour de l'état de nos connaissances sur l'objet physique obtenues via les informations
fournies par la mesure.

Difficultés
L'interprétation positiviste n'est pas non plus sans poser de problème.

Les concepts classiques ont leur limite. Nous l'avons vu. Certains phénomènes quantiques tel que la
superposition, l'intrication, le spin, sont sans contrepartie classique. Pourquoi ne pas aller au-delà
des concepts classiques ? Même si à la base on ne dispose que des concepts classiques, on peut
inventer de nouveaux concepts, initialement décrits en des termes classiques, mais différents d'eux.
L'indéterminisme intrinsèque en est d'ailleurs un exemple puisqu'il est décrit en termes
probabilistes (probabilités classiques) mais décrété intrinsèque (ce qui est non classique). Ces
nouveaux concepts peuvent s'avérer mieux adaptés voire indispensables pour décrire les propriétés
quantiques.
L'interprétation n'explique ni le mécanisme de réduction ni pourquoi elle est nécessaire. En
particulier, si la réduction ne constitue par un processus physique, en quoi est-elle nécessaire dans
la description d'un système physique ? Pourquoi la mise à jour de nos connaissances par la mesure
(ce qui se fait bien évidemment aussi en physique classique) devrait-elle se retrouver dans les lois
physiques décrivant le système étudié ? De plus, la réduction reste incompatible avec l'évolution
linéaire. Par conséquent le problème de savoir quand elle doit s'appliquer dans un processus
complexe de mesure reste problématique.

Affirmer que la réduction est instantanée est introduire un processus non local qui peut entrer en
conflit avec la relativité. En relativité, la simultanéité n'a pas un caractère absolu. Le concept de
réduction instantanée ne peut donc avoir de signification que dans certains repères. Même si la
réduction ne constitue par un processus physique, mais concerne seulement la connaissance, des
problèmes de consistance peuvent exister en relativité où ce qui est interdit n'est pas tant le transfert
ultraluminique de matière que celui d'information et donc aussi de la connaissance.

Le caractère relatif de la simultanéité indique qu'il doit y avoir une certaine liberté dans la
réduction. En un endroit donné, pour une expérience donnée, elle se produira à des instants
différents suivant les observateurs. Ce qui compte est que la réduction se produise à une vitesse
telle que deux endroits séparés subissent la réduction en des instants tels que les événements sont
séparés par un intervalle de type espace. C'est d'ailleurs cela qui peut poser des problèmes avec la
causalité en relativité.

Bien entendu, cela ne signifie pas que des problèmes doivent nécessairement se poser. L'étude
attentive des phénomènes non locaux de la mécanique quantique, tel que l'intrication et le paradoxe
EPR, ont montré que ces phénomènes ne pouvaient pas être utilisés pour envoyer des signaux à une
vitesse supérieure de la lumière.

Mais s'il existe une liberté quelque peu arbitraire dans le processus de réduction et que, bien que
toujours non local, aucun transfert non local d'information ne puisse être mis en évidence
expérimentalement, alors cela jette un doute sur l'existence même du processus de réduction.
Donner une propriété non mesurable à un processus est d'ailleurs en contradiction avec la
philosophie positiviste. Il se peut que cette réduction soit un simple artefact de l'interprétation. Que
le positivisme adopte la réduction, si peu positiviste, même en tant que simple mise à jour des
connaissances est pratiquement un aveu d'échec.

Un statut très particulier est donné au processus de mesure. Mais celui-ci n'est pas clairement
décrit. Qu'est-ce qu'une mesure ? Qu'est-ce qu'un appareil de mesure ? De toute évidence, une
simple interaction ne peut suffire à définir un processus de mesure puisque deux particules en
interaction se trouvent dans un état de superposition (comme dans le schéma de von Neumann)
expérimentalement vérifiable. C'est pour cette raison que l'interprétation fait référence à des
appareils de mesures macroscopiques obéissant aux lois de la physique classique.

Mais dans ce cas le problème a seulement été repoussé. Affirmer une différence fondamentale entre
les lois physiques classiques et quantiques est assez insatisfaisant et même contraire au principe de
correspondance. Et il reste le problème de définir la limite entre le microscopique et le
macroscopique, entre une simple interaction décrite par le formalisme quantique sans réduction et
une mesure avec réduction. L'évidence expérimentale montre que cette limite, si elle existe, est tout
sauf nette. Le passage des comportements quantiques aux comportements classiques est progressif
en fonction de la taille et de la complexité des systèmes.

A la base de ce problème il y a une question non résolue. Comment déduire les comportements
classiques des comportements quantiques ? Comment un ensemble d'éléments aux comportements
éminemment non classiques peuvent, une fois assemblés en grand nombre, manifester les
comportements classiques que nous observons ? Dans ce sens, l'interprétation de Copenhague suit
même le chemin inverse puisque au lieu d'essayer d'expliquer comment fonctionne notre monde à
partir des lois fondamentales (quantiques) elle tente de décrire le monde quantique à l'aide des
concepts classiques. Elle considère le monde classique comme préexistant au monde quantique et
dresse donc une barrière à la compréhension des lois classiques sur des bases plus fondamentales.
Compréhension qui risque, à la lumière de cette interprétation, de se transformer en simples
tautologies : les lois classiques découlent des lois quantiques car on les a postulés dès le départ.

Le problème du passage du quantique au classique est particulièrement épineux. Comment passe-t-


on des comportements indéterministes des systèmes microscopiques au déterminisme classique ?
Comment le processus quantique irréversible de réduction conduit-il à des lois physiques
réversibles (les phénomènes macroscopiques irréversibles en thermodynamique ont une toute autre
origine, basée sur les lois des grands nombres, les processus de bases étant décrits par des lois
réversibles) ?

Le principe de correspondance a, dans ce cadre, ses limites. En dehors de celles que nous avons
cité, faire tendre la constante de Planck vers zéro n'a pas beaucoup de sens puisque celle-ci est
justement constante et identique même pour des objets macroscopiques. Ce qu'il convient de
comprendre est ce qui se passe lorsqu'un système est composé d'un très grand nombre de particules,
ce qui est autrement plus difficile.

Dans l'interprétation de Copenhague, nous avons une double affirmation :


- La fonction d'onde a un caractère symbolique. Elle ne constitue pas une représentation de l'objet
physique étudié.
- La fonction d'onde contient tout ce qu'il y a à savoir sur l'objet physique.

Ces deux affirmations semblent contradictoires. Si cette fonction d'onde contient tout ce qu'il y a à
savoir sur l'objet physique, comment refuser de dire qu'elle en est une représentation et même une
représentation fidèle ? C'est seulement si cette fonction d'onde n'était qu'une approximation
statistique d'un phénomène plus complexe que l'on pourrait donner ce caractère purement
informatif à la fonction d'onde. Et même dans ce cas son caractère purement symbolique serait
discutable. D'ailleurs, comment expliquer que des lois physiques, expérimentalement vérifiables,
décrivent l'évolution d'un simple état de connaissance sans que celui-ci soit en fait une
représentation de l'état physique ? Ce caractère purement symbolique attribué à la fonction d'onde
semble assez artificiel. Il n'est pas un aveu d'échec à comprendre la nature de la fonction d'onde (la
deuxième affirmation sur la fonction d'onde ne le permet pas) mais plutôt une justification ad hoc
du caractère arbitraire de la réduction.

Notons ensuite que même si l'observateur a une signification très large (ce n'est pas obligatoirement
un observateur conscient), il a un rôle privilégié inexpliqué (et un tel rôle privilégié est en général
préjudiciable lorsque l'on essaie de donner un caractère universel aux lois physiques. Mais là aussi
cette affirmation que l'observateur a une signification très large est assez douteuse. Si la fonction
d'onde est un simple état de connaissance, sans qu'il soit une représentation de l'objet physique, il
faut bien que cette information soit encodée quelque part. Cela signifie l'existence d'une mémoire,
d'un support quelconque de cette information. Que se passe-t-il si cette information est ignorée ou
bruitée ? Que devient, dans ce cas, le statut ontologique de cette connaissance ? Et si elle est
encodée dans le système physique lui-même, la fonction d'onde acquiert un statut de description du
système physique que l'interprétation voulait lui refuser, avec l'émergence des problèmes liés à une
fonction d'onde représentant un objet physique réel que nous avons déjà soulevés. Et si seule la
connaissance que nous (expérimentateurs) en avons a une importance (dans ce cas, le fait que nous
ne disposons pas de toute l'information est tout simplement ignorée), alors le caractère général
donné à l'observateur est simplement une tentative maladroite pour essayer de contourner les
objections au caractère métaphysique des interprétations faisant intervenir la conscience.

Un autre aspect est le caractère complexe des amplitudes. Nous avons vu que la fonction d'onde
peut être un nombre complexe sans que cela pose de réel problème si elle est une représentation
d'un objet physique réel. Mais ici la situation est différente. Il est affirmé qu'elle ne représente qu'un
état de connaissance et que la seule chose dont nous devons discuter sont les probabilités. Mais
dans ce cas, pourquoi la fonction d'onde est-elle complexe ? Pourquoi ne pas manipuler uniquement
les probabilités qui sont des nombres réels ? Comment justifier la règle de Born ? Manifestement,
la nécessiter d'utiliser autre chose que des nombres réels (les probabilités) pour la fonction d'onde
est la manifestation qu'il y a autre chose qui ne peut être ignoré. Cet autre chose justifiant l'usage de
la règle de Born. Cette constatation a d'ailleurs été à l'origine de développements mathématiques
fructueux en logique et la naissance de la logique quantique (qui tente, pourrait-on dire, de ne
décrire le système que via les probabilités réelles mais en utilisant une logique différente de la
logique booléenne standard).

Ci-dessus il a été affirmé que les valeurs physiques qui étaient mesurées n'avaient pas de réalité
physique avant la mesure. Comment admettre ça ? Il est vrai que tout processus d'interaction affecte
un système microscopique d'une manière qui ne peut être négligée. Mais nous avons vu aussi que le
processus de mesure ne peut se réduire à de simples interactions. Le problème ne se situe pas là. Il
serait plus correct d'affirmer que les valeurs physiques n'ont pas de réalité avant la réduction. Mais
dans la mesure ou le caractère physique de la réduction est douteux et même nié par l'interprétation
positiviste (ce n'est qu'une mise à jour de nos connaissances), cette affirmation devient carrément
iconoclaste. Comment une simple mise à jours de nos connaissances pourrait "faire exister" une
valeur physique ? On glisse à nouveau dangereusement vers la métaphysique de la conscience !

Pire encore. Puisque les seules choses dont nous disposons sont les mesures de ces valeurs et
puisque l'interprétation positiviste affirme qu'il n'y a rien d'autre, affirmer que ces valeurs n'existent
pas avant la mesure ou la réduction est carrément affirmer que le système physique n'existe pas
avant d'être mesuré. Cela rappelle la remarque, en forme de boutade, que fit Einstein : "Croyez-
vous que la Lune n'est pas là lorsque vous ne la regardez pas ?". Face à de telles difficultés voire
d'absurdités, on comprend très bien le scepticisme d'Einstein envers cette interprétation de la
mécanique quantique.

Il est vrai, et c'est démontré, qu'on ne peut attribuer un ensemble de valeurs définies à chaque état.
C'est le cadre de théorèmes important tel que le théorème de von Neumann, le théorème de Kochen
et Specker, le théorème de Gleason ou le théorème de Mermin. Nous avons vu cela quand nous
avons dit que si l'état était décrit par des variables cachées, alors elles étaient forcément
contextuelles, c'est-à-dire que les valeurs mesurées dépendent de ces variables mais aussi et
toujours du contexte. Mais si on ne nie pas l'existence de l'objet physique avant la mesure, cela
signifie simplement qu'il y a autre chose que ces valeurs qui peut le décrire (par exemple la
fonction d'onde) et qui se traduit par ces valeurs à travers les processus complexes des mesures.
Cela reste à comprendre.

L'interprétation de Copenhague ne résout par le problème de la base privilégiée. Elle considère


comme acquit l'existence de processus de mesure correspondant à certains observables tel que la
position. Toutefois il serait plus correct de dire qu'elle ne l'aborde pas et n'empêche pas une telle
explication donnée par la décohérence. Nous y reviendrons.

Enfin, l'interprétation de Copenhague est totalement inapplicable en cosmologie quantique.


L'évolution de la physique en général et des théories fondamentales en particulier nous a conduit
très loin. Nous en sommes maintenant à essayer d'intégrer la mécanique quantique et la relativité
générale dans une seule théorie fondamentale, ce qui s'avère d'ailleurs un problème redoutable. La
cosmologie est le cadre idéal pour la relativité générale, c'est-à-dire pour étudier la structure et
l'évolution de l'univers dans son ensemble. Dans la mesure où la mécanique quantique attaque
maintenant le bastion de la relativité générale, il est tout naturel d'envisager également la
cosmologie dans un cadre totalement quantique. C'est d'autant plus nécessaire que la relativité
générale souffre des singularités (valeurs infinies des variables physiques) dans certaines
circonstances (à l'origine de l'univers dans la théorie du Big Bang ou au centre des trous noirs).
Circonstances où les effets quantiques ne peuvent être ignorés.

Mais si l'on considère l'univers comme un tout, nous n'avons plus d'observateur extérieur. Nous
n'avons plus, non plus, de processus de mesure (sur l'univers entier) et donc plus de réduction. La
distinction entre microscopique (quantique) et macroscopique (classique) devient caduque dans un
univers considéré globalement dans le cadre quantique. Dans ces circonstances, l'interprétation de
Copenhague devient totalement inappropriée et nous souffrons d'un manque manifeste de capacité
d'interprétation des résultats. L'exemple caractéristique est l'équation de Wheeler - DeWitt qui
décrit la fonction d'onde de l'univers et où la coordonnée temporelle est absente. Comment
interpréter cela ? Sans coordonnée du temps, elle ne peut décrire un changement, une évolution du
système !
II.2.3. Critique du principe anthropique
Le principe anthropique est un principe donnant une situation privilégiée à l'être humain.

Habituellement on distingue deux formes du principe anthropique :


 Le principe anthropique fort. Il affirme que tout dans l'univers existe pour nous. C'est pour que nous puission
exister que l'univers est tel qu'il est. L'univers n'a de raison d'être que parce qu'il nous habite.

Cette forme presque religieuse du principe anthropique est presque unanimement rejetée par la majorité des
scientifiques. Si la relation causale entre l'existence de l'être humain et celle de l'univers ne peut être
expérimentalement mise en évidence, alors ce n'est qu'un principe philosophique à caractère religieux qui n'a
pas d'influence sur la physique. Si cette relation causale peut être mise en évidence (ou pourrait l'être) alors l
lois physiques qui régissent l'univers sont liées directement au fait que nous existions ou pas. Elles auraient u
caractère totalement arbitraire dont le seul intérêt serait d'être à notre service. Il n'y aurait plus guère de raiso
d'étudier les phénomènes physiques pour eux-mêmes. Une des clés de la méthode scientifique est qu'elle doi
se détacher de l'arbitraire lié aux sentiments et à nos désirs.

En outre, il faut bien avouer que ce principe traduit un ego surdimensionné ! Il faut un orgueil démesuré pou
affirmer que l'univers incommensurablement plus grand que nous n'existe que pour nous satisfaire.
 Le principe anthropique faible. Il donne seulement un rôle privilégié à l'être humain sans établir une relation
de cause à effet entre nous et le reste de l'univers. L'univers est simplement vu de notre point de vue.

Ce principe affirme que l'univers est comme il est, non pas parce que nous sommes là mais parce que sinon
nous n'aurions pas été là pour l'observer.

Ce principe est en réalité fort proche du précédent. La différence est subtile. Toutefois, sous cette forme il es
acceptable. Ce qu'il affirme est d'ailleurs évident. Si la loi décrivant la gravité avait été un tant soit peu
différente, il n'y aurait pas d'orbite stable, donc pas de planète et pas de vie. Et en l'absence de vie, pas d'être
humain pour constater que la vie y est impossible ! Le seul fait que nous puissions dire "nous sommes là et
nous observons l'univers" implique que celui-ci est construit, peut-être par hasard ou pour quelle que raison
que ce soit, de telle manière que la vie puisse y exister.
Toutefois, même sous sa forme faible, le principe anthropique donne un rôle central à l'être humain que nous
allons critiquer. Mais avant tout, passons en revue quelques raisons qui sont à l'origine de ce rôle privilégié
attribué à l'être humain.

Les premières raisons sont aussi bien biologiques qu'historiques. L'être humain n'a qu'une vue très restreinte de
l'univers qui l'entoure, même géographiquement, notre vue ne s'étend pas au-delà de l'horizon, nous ne pouvons
voir qu'un faible nombre d'étoiles avec nos yeux et les objets microscopiques nous échappent. Lorsque l'on ignor
comment fonctionne la mécanique céleste nos sens nous donnent l'impression que tout tourne autour de nous : la
Lune, le Soleil, les étoiles… La Terre fut longtemps considérée comme le centre de l'univers. Tout le monde sait
que la révolution de Copernic et de Galilée, donnant au Soleil la place centrale, s'est faite dans la douleur. L'être
humain a dû aussi lutter pour acquérir sa place au Soleil. Une lutte incessante et qui n'est pas close contre les
prédateurs, les forces de la nature et même contre lui-même. Face à cette adversité et à l'inconnu il s'est construit
une mythologie et des religions pour le rassurer, le guider et lui donner des explications à ce qu'il ne comprenait
pas. Et toute cette cosmogonie était bien évidemment centrée sur lui.

Depuis, l'homme a appris que le monde s'étendait bien au-delà de son horizon. Il a appris à construire des
instruments de mesures (télescopes, microscopes,…) lui permettant de voir ce que ses sens limités lui interdisaie
jusqu'alors. Il a découvert que la Terre, et donc lui-même, n'était pas le centre de l'univers ni même le Soleil ni
même la voie lactée, notre galaxie. Ce rejet du centralisme est même devenu pratiquement un dogme. Bien que c
dogme ne doit évidemment pas être absolu puisqu'il serait absurde de nier le rôle central de l'être humain en
médecine, en sociologie ou en ethnologie ! Et il se peut que ce désir de retirer le rôle central à l'être humain ait
même fait du tort à certaines disciplines. Sans réellement trop nous avancer sur un terrain que nous maîtrisons
mal, l'économie et son Homo Economicus, être rationnel parfait agissant toujours au mieux de ses connaissances
bien éloigné de nous, en est peut être un exemple. Actuellement les théories économiques font d'énormes efforts
de rapprochement avec des disciplines comme la sociologie et la psychologie pour mieux intégrer les
comportements irrationnels des individus.

Par contre, en physique, ce rejet du centralisme est tout à fait justifié. Le but de la physique est d'étudier les lois
qui régissent les phénomènes physiques en toute généralité : depuis l'atome jusqu'à l'univers entier en passant pa
la mécanique du tas de sable, le laser ou les propriétés des semi-conducteurs. Dans la majorité de ces phénomène
l'être humain ne tient qu'une place négligeable voire nulle. Tout au plus est-il un observateur ou le constructeur e
l'utilisateur de certains de ces phénomènes ou dispositifs qu'il désire exploiter.
Mais le fait est que cette situation centrale de l'être humain est difficile à éviter. Que ce soit par nos sens (nous
voyons et entendons autour de nous) ou par notre conscience (nous avons conscience de nos pensées mais pas de
celles des autres). L'expérimentateur qui effectue des expériences est la pièce centrale de l'ensemble qui collecte
les informations et les interprète. Même en sachant que nous ne jouons qu'un rôle d'observateur nous risquons à
tout moment, inconsciemment, de donner à nos théories un rôle privilégié à l'homme. Cela est particulièrement
vrai lorsque le processus d'observation occupe un rôle important comme en mécanique quantique.

Nous illustrerons l'effet pervers du principe anthropique sur les raisonnements à l'aide d'un exemple très différen
de la mécanique quantique : l'existence de la vie dans l'univers. C'est un des cas où nous sommes inconsciemmen
tentés d'avoir une vue anthropique des choses tout simplement parce que, tout comme pour l'acte d'observation,
nous sommes particulièrement impliqués : nous sommes vivants !

On affirme souvent que l'existence de la vie dans l'univers résulte d'un hasard incroyable. Nous ne parlons pas ic
de la possibilité que la vie existe ailleurs dans l'univers mais du simple fait que la vie existe tout court. C'est-à-di
que nous même soyons là. Cette réflexion résulte d'une série de remarques a priori très pertinentes.

Nous avons parlé de la gravité. Aurait-elle été un tant soit peu différente, la vie n'aurait pas pu apparaître. Cela e
vrai de bien d'autres choses. Les lois de la physique atomique sont régies par une constante appelée constante de
structure fine. Si elle avait été un tout petit peu différente les atomes n'auraient pas pu exister. Et sans atome, pas
de molécule, pas de chimie, pas de biologie et pas de vie. Si la force nucléaire avait été un rien différente (une
fraction de pour cent) le carbone n'aurait pas pu être fabriqué dans les fournaises des étoiles et sans carbone, pas
de vie organique. Si la Lune avait été plus petite, l'inclinaison de la Terre sur son orbite aurait été instable
empêchant des saisons stables et rendant difficile l'apparition d'une vie élaborée. Ce genre de "coïncidence"
pourrait être poussé presque à l'infini. De là l'affirmation du "hasard incroyable". Le hasard apparemment
invraisemblable que tout ait été réglé si finement que la vie soit apparue.

Comme nous l'avons dit, le principe anthropique faible est acceptable et il est effectivement accepté par
pratiquement tous les scientifiques. Mais le principe anthropique fort, lui, est fortement rejeté. Au vu de ce hasar
incroyable il se forme immanquablement un certain malaise. En effet, le principe anthropique faible nous dit qu'
ne peut pas en être autrement car sinon nous n'aurions pas été là pour l'observer. Mais par quel hasard incroyable
en est-il ainsi ? Pour éviter de glisser irrésistiblement vers le principe anthropique fort plusieurs attitudes ont été
développées. Une, assez à la mode, est celle des univers multiples de Andreï Linde (qui n'a rien à voir avec les
univers multiples de Everett et de DeWitt que l'on rencontre en mécanique quantique et que nous verrons). Selon
sa théorie, à l'origine, une infinité d'univers seraient apparus (en fait des univers apparaîtraient en permanence
dans un vide quantique primordial). Tous avec des caractéristiques différentes, des lois physiques différentes, de
constantes différentes. Et le principe anthropique faible nous dit que nous sommes forcément dans celui qui
permet la vie et donc nous permet de constater que c'est l'univers qui nous permet d'y exister et de l'observer.

Cette idée est assez séduisante, surtout si on rejette totalement le principe anthropique fort, mais
est-elle une fatalité ? Nous allons voir que pas nécessairement.

Existe-t-il d'autres phénomènes que la vie qui résultent de ce hasard extraordinaire ? La réponse est
oui et même : tous les phénomènes ! La Lune non plus n'aurait pas existé si la gravitation ou la
constante de structure fine avaient été un peu différentes. De même pour les magnifiques anneaux
de Saturne qui en outre ne se seraient probablement pas formés si Saturne avait été moins grosse ou
si son voisin Jupiter n'avait été un tel monstre perturbateur.

Des anneaux aussi magnifiques que ceux de Saturne doivent même être relativement peu fréquents
dans l'univers (des anneaux plus fins et difficiles à percevoir sont, eux, assez fréquent et présent
autour de presque toutes les planètes).

Mais viendrait-il à l'idée de quelqu'un d'invoquer des univers multiples pour justifier l'existence de
ces anneaux ou de la Lune "incroyablement improbables" ? Non. En tout cas, nous n'avons jamais
rien lu à ce sujet. La raison est double :
- Nous, être humains, ne sommes pas des anneaux mais nous sommes des êtres vivants.
- Si l'univers avait été un peu différent, il n'y aurait pas eut la Lune ni les anneaux de Saturne
mais il y aurait eut d'autres choses que nous pouvons à peine imaginer et probablement des
choses parfois extraordinaires et exceptionnelles.

La première raison nous donne l'influence du principe anthropique. Nous considérons que le hasard
lié à l'apparition de la vie est important car nous sommes des êtres vivants. La deuxième raison
nous donne la solution. Si l'univers avait été différent il n'y aurait pas eut de vie mais il y aurait
simplement eut d'autres choses.
La vie est-elle plus importante que les anneaux de Saturne ? Certainement de notre point de vue !
Mais pas du point de vue de la physique ou de l'univers. La vie, les être humains, ce ne sont que des
phénomènes physiques parmi tant d'autres. La vie n'est qu'un simple épiphénomène des lois
gouvernant l'univers. Comme la Lune ou les anneaux de Saturne.

C'est notre situation d'observateur conscient… et vivant… et peut être (sûrement) notre orgueil qui
nous donne l'impression que le hasard lié à l'apparition de la vie est anormal. Le rejet total du
principe anthropique fort et un peu d'humilité nous force à admettre que cela n'a rien de si
incroyable. La vie nous paraît quelque chose d'exceptionnel, de merveilleux, et c'est bien normal.
Mais d'un point de vue physique, totalement détaché de notre point de vue humain, de notre point
de vue d'être vivant, est-elle plus exceptionnelle que les réactions nucléaires, l'existence des trous
noirs ? Selon quels critères (et en particulier selon quels critères non tautologiques c'est-à-dire des
critères qui ne font pas eux-mêmes référence à une éventuelle importance ou position centrale de la
vie) ?

Si l'univers, ses conditions initiales, ses lois, ses constantes, avaient été un tant soit peut différent,
l'univers aurait tout simplement été différent. Avec peut-être de la vie, peut-être pas. C'est tout, rien
d'extraordinaire à ça ! Rien de plus extraordinaire que de constater que le chiffre 42512539 vient de
sortir à la loterie alors que ce nombre avait une chance infirme de sortir : il faut bien qu'il y en ait
un qui sorte ! L'un de ces chiffres s'appelle "vie", un autre "pas de vie", un autre encore "vie
différente"…. Qu'importe, l'un de ces chiffres doit bien sortir et ils sont tous aussi étonnant ou
banal l'un que l'autre.

Certains rejettent cet argument en invoquant des effets que nous avons indiqués. Avec des
différences infimes dans les constantes ou les lois, il n'y a pas d'orbite, pas de chimie du carbone,
etc. La moindre variation conduirait au chaos ou à un univers d'une banalité effrayante (presque
vide ou désespérément homogène). Mais en réalité, on n'en sait rien ! Il est déjà bien difficile de
reconstruire (théoriquement) l'immense richesse de l'univers à partir des lois fondamentales. Que
dire alors de prédictions basées sur l'infinie possibilité des lois physiques possibles ? Si l'on change
radicalement les lois physiques, personne n'est en mesure de dire si cela aboutit à un univers "sans
intérêt" ou à un univers riche et complexe mais simplement différent du nôtre. La complexité
émerge très facilement de lois simples. Cela a particulièrement été mis en évidence avec l'étude des
automates tel que le jeu de la vie. En passant en revue les différentes règles possibles pour de tels
automates on aboutit à des "mondes" mornes, chaotiques ou complexes. Ces derniers n'étant pas en
quantité négligeable. Il est très difficile de faire des prédictions sur "les univers possibles". Mais la
possibilité d'une infinité de variantes riches et complexes n'est pas exclue et semble même assez
logique. Ce déplacement du questionnement (qui passe de la vie à tout ce qui manifeste une
certaine complexité) est trop hâtif. L'argument du "seul univers intéressant" n'est pas tenable.

L'univers tel qu'il est pourrait être unique. Son contenu, ses lois pourraient résulter de lois
extrêmement simples déduites de la logique et de la consistance (en fait nous l'ignorons). Et il est
devenu comme ça, sans plus. Cela a donné un univers avec de la vie. Incroyable ? Guère plus que le
fait que cet univers contienne une planète Saturne avec des anneaux ou un nuage interstellaire ayant
la forme d'une tête de cheval ou encore une étoile, Sanduleak, qui a explosé récemment.

Selon ce point de vue, tout hasard disparaît. Il n'y a pas de raison de qualifier de hasard l'existence
d'un univers sommes toutes (peut-être) banal. Pas plus qu'il n'y a de raison de qualifier de hasard
extraordinaire la sortie du dernier numéro du loto. Il faut bien qu'il y en ait un qui sorte et le fait que
celui là ait (comme tous les autres) une chance sur des millions de sortir ne lui donne pas un
caractère extraordinaire.

Si la vie est juste un phénomène comme un autre, alors qu'elle soit présente dans un univers qui est
en un seul exemplaire n'a plus rien d'extraordinaire. Quel que soit cet univers, il faut bien qu'il
contienne quelque chose. Il est difficile de parler de hasard ou de probabilité lorsque l'on a affaire à
un exemplaire unique : l'univers.

Tout ce qu'on peut donc dire c'est que l'univers aurait été différent. Point. En sommes pour éviter le
principe anthropique il suffit de le rejeter !

Le seul avantage du principe anthropique faible c'est que sachant que la vie existe, ainsi que la
Lune, les anneaux de Saturne, cela nous donne des indications et nous permet d'en déduire certaines
choses sur l'univers. Après tout le fait que l'univers devait bien avoir une forme donnée parmi une
infinité de possibles n'empêche pas de l'étudier et d'essayer de comprendre pourquoi il est ainsi. Le
rejet du principe anthropique n'est pas un aveu de fatalité.

De même, l'observation des lois de la physique classique nous donne des informations sur la
manière dont la mécanique quantique doit fonctionner. Mais pas plus que de voir la lumière
allumée ne nous permet d'en déduire que quelqu'un a dû appuyer machinalement sur l'interrupteur !
C'est de la déduction, pas de l'anthropisme.

Après cette longue digression hors du domaine de la mécanique quantique, résumons :


 Il ne faut pas donner, en physique, un rôle privilégié à la vie, l'intelligence, l'homme ou à la
conscience ni à aucun observateur d'aucune sorte ou type d'observateur, même au sens large.
 L'univers et les lois régissant son fonctionnement et en particulier les lois de la mécanique
quantique existaient bien avant que l'homme n'apparaisse sur Terre et même avant que la Terre
n'apparaisse.
 La vie et l'être humain ne sont que des "phénomènes" physiques parmi tant d'autres remplissant
l'univers.
 Les lois physiques sont sensées s'appliquer à l'univers entier et à tous les objets qu'il contient.
L'être humain n'a aucun rôle privilégié, ni en tant que composant de cet univers ni même en tant
que simple observateur.
 On tombe aisément dans le piège du principe anthropique fort, même lorsque l'on pense avoir
pris des mesures pour l'éviter (comme les univers multiples de Linde).
 Pour comparer les théories à des données expérimentales, il faut forcément prendre un
observateur particulier, éventuellement un expérimentateur humain.

Ce dernier point semble plus délicat. On affirme qu'il faut rejeter les observateurs mais que ceux-ci sont
indispensables pour l'expérimentation. Bien entendu, puisque les lois physiques doivent avoir un caractère
universel tandis que des données expérimentales sont toujours particulières. On trouve cela dans toutes les
théories physiques. En relativité restreinte ou générale, par exemple, on peut décrire l'espace-temps de manière
très générale par ses propriétés géométriques, indépendamment de tout observateur. Par exemple en utilisant les
espaces vectoriels et des objets géométriques sans choisir un système de coordonnées particulier (l'espace-temps
de Minkowski ou les variétés riemanniennes). Mais pour appliquer la théorie, il faut choisir un repère de référen
afin d'avoir des valeurs numériques pour les coordonnées, positionner les appareils de mesure et comparer les
résultats aux prédictions ou à d'autres mesures. C'est inévitable puisque, comme la relativité restreinte l'affirme,
toute valeur (par exemple la vitesse d'un corps) n'a de sens que relativement à un autre observateur.

Ce rejet total du rôle privilégié de l'observateur dans la théorie doit primer même en mécanique quantique.

Si l'on regarde le formalisme de base de la mécanique quantique, on voit que celui-ci respecte bien cette règle.
Aucun rôle particulier n'est attribué aux observateurs. Un système est décrit par un état appartenant à un espace d
Hilbert et évolue indépendamment du point de vue de tel ou tel observateur.

L'interprétation de la théorie se doit aussi de rejeter le principe anthropique puisqu'elle est le complément de cett
théorie qui permet de lui donner un sens.

Force est de constater que l'interprétation de Copenhague est fortement anthropique. Elle donne un rôle privilégi
à l'observateur et même à l'être humain. Ceci est assez inévitable puisque cette interprétation met l'accent princip
sur la mesure qui, comme nous venons de le dire, s'insère toujours dans un contexte particulier. Et le positivisme
nous dit que seules ces mesures ont une réalité physique. Pourtant, l'exemple de la relativité restreinte nous mon
que cela n'empêche pas d'exprimer des lois générales indépendantes de l'observateur. D'ailleurs, même
l'interprétation de Copenhague n'y échappe pas puisqu'elle utilise la fonction d'onde qui n'est en soit pas un
observable, même si elle escamote la difficulté en lui donnant un statut ontologique particulier (état des
connaissances).

Même le simple constat des valeurs définies, également présent dans l'interprétation instrumentale, pourrait être
un artefact à caractère anthropique puisque de telles valeurs définies se réfèrent toujours à des mesures faites par
des appareils de mesures et des expérimentateurs et non pas, par exemple, à des interactions plus simples se
passant au niveau microscopique.

Au mieux, ces interprétations donnent un rôle privilégié aux systèmes macroscopiques (et à la physique classiqu
sans vraiment dire pourquoi ni comment ils acquièrent ce statut spécial.

Les valeurs définies et les mesures peuvent être vues, comme dans l'exemple de la relativité, le choix d'un
observateur particulier effectuant des expériences. Mais dans ce cas l'interprétation doit aussi expliquer les liens
entre les différents observateurs (comme les transformations de Lorentz en relativité restreinte) et avoir à la base
une interprétation plus basique et rejetant totalement le principe anthropique. L'interprétation de Copenhague
échoue totalement dans ce rôle mais, il est vrai, elle n'a pas été conçue dans cette optique, au contraire.
II.2.4. Réalisme et positivisme

Le positivisme ou le réalisme
Nous avons déjà parlé du positivisme. Pour le physicien positiviste, les seules choses dont il vaut la
peine de parler sont les résultats des mesures, c'est-à-dire les résultats des expériences et des
observations. Tout le reste n'est que spéculation.

Cette vue semble inattaquable. Ce qui ne peut faire l'objet d'une vérification expérimentale est par
essence invérifiable et les résultats des expériences constituent des faits objectifs. En ce sens, les
positivistes ont souvent beau jeu d'opposer des arguments inébranlables face aux objections ou face
à d'autres approches. Même si ces arguments sont de simples rejets, cadrant avec leur philosophie,
voire des tautologies.

Toutefois, rien n'est simple. Une vue positiviste n'empêche pas la nécessité de rassembler
l'ensemble des observations en un tout cohérent, en une théorie précise et prédictive. Cette théorie
est offerte par la mécanique quantique. Mais celle-ci entraîne en retour de devoir expliquer ce que
signifient les objets mathématiques utilisés par la théorie. Une théorie, aussi bien conçue soit elle,
n'est pas une simple liste de données mais un ensemble de structures mathématiques. Et ces
structures mathématiques, en soit, ne sont pas des données expérimentales. On ne peut donc rester
dans un cadre strictement positiviste. Nous avons vu que la tentative d'emballer la théorie dans un
cadre strictement positiviste, l'interprétation de Copenhague, n'est pas sans soulever un certain
nombre de problèmes, d'objections et même d'incohérences et de violations de la vue positiviste.
Après presque un siècle d'analyse par les philosophes des sciences, aucune formalisation complète,
libre de difficulté et d'objection, n'a pu être dressée.

Le réalisme, a contrario, trouve normal et même nécessaire de parler d'une réalité physique
indépendante de l'observateur. C'est-à-dire d'une réalité physique, à laquelle appartiennent les
systèmes physiques étudiés, mais qui a son existence propre qui ne nécessite pas la mesure ou
l'observation. Le but du réaliste est de tenter une description de cette réalité sans devoir faire appel
à la mesure même si celle-ci, bien sûr, offre une porte ouverte sur cette réalité.
Nous allons voir que cette approche n'est pas non plus sans difficulté. Deux difficultés principales
sont à soulever. La seule forme de réalité, au moins apparente, qui est accessible à nos sens fait
appel à des concepts classiques. Il est très difficile de se débarrasser des préjugés issus du quotidien
ou plus largement de la physique classique bien que ce soit une nécessité pour décrire une réalité
peut-être très différente de celle que nous connaissons. La deuxième difficulté a été soulignée dans
l'approche positiviste : si l'on parle de choses qui ne sont pas mesurées, comment vérifier leur
validité ?

Le réalisme peut prendre plusieurs formes. En particulier, il peut se présenter sous des formes plus
restrictives dont il convient de souligner les principales afin d'en connaître les limites.

Le réalisme local consiste en deux parties :


- Supposons que le système est décrit par un état ( ψ ,θ ) . ψ est le vecteur d'état de la
mécanique quantique et θ est un ensemble de paramètres inconnus (variables cachées). A
chaque observable correspond une fonction F ( ψ ,θ ) qui attribue à l'état une valeur définie qui
est la valeur obtenue lors de la mesure de cet observable.
- Les signaux et toute information ne peuvent se propager instantanément d'un point à l'autre. Il
existe une vitesse limite (normalement la vitesse de la lumière dans le vide). Lorsque l'on
effectue une mesure en un point A, l'état du système en un point B séparé par un intervalle de
type espace ne peut donc en être affecté.

Ce réalisme local, prôné par Einstein, a été invalidé par le théorème de Bell et les expériences. Il
existe des phénomènes physiques prédits par la mécanique quantique, en particulier ceux lié à des
mesures spatialement séparées sur des états intriqués, qui ne peuvent être reproduit par aucune
théorie respectant le réalisme local. Ces effets ont été vérifiés expérimentalement prouvant que
toute théorie à variables cachées doit être non locale.

Le réalisme naïf consiste à penser que la mesure, associée à un observable O, d'un système
physique consiste en la mesure d'une propriété physique préexistante du système appelée O. Ce
réalisme naïf est d'autant plus tentant que la physique classique y obéit et comme nous traduisons
toutes nos expériences à l'aide des concepts classiques le piège est tendu. Le langage humain,
évidemment calqué sur notre expérience du quotidien, se fait le relais de cette tendance. Ainsi, on
lira dans de nombreux livres et articles des phrases tel que "la mesure de la position de la particule",
c'est-à-dire la mesure associée à l'observable x , sous-entendu (volontairement ou non) que la
particule possède une position définie. Il va pourtant de soit que cette mesure implique un dispositif
complexe qui interagit fortement avec le système physique et que le lien n'est peut-être pas si
évident.

Le réalisme naïf peut se traduire par la première condition du réalisme local. On associe à chaque
état et chaque observable une valeur définie. Là aussi des théorèmes, tel que celui de Kochen et
Specker, montrent qu'une telle vision des choses ne peut pas reproduire tous les effets de la
mécanique quantique.

La conséquence est, du point de vue du réalisme, que le résultat des mesures ne dépend pas
seulement de l'état du système mais également de la mesure qui est effectuée. On dit que les
variables cachées doivent être contextuelles.

Les résultats de la mécanique quantique nous montrent donc que si l'on adopte le point de vue des
variables cachées, on doit nécessairement avoir des variables cachées non locales et contextuelles
(c'est, par exemple, le cas dans la théorie à variables cachées de David Bohm).

Mais le réalisme n'impose pas nécessairement l'utilisation de variables cachées ni, d'ailleurs, le
déterminisme (ces deux caractères se retrouvent presque toujours dans les approches dites réalistes
et la simple évocation du réalisme fait implicitement croire aux variables cachées et au
déterminisme, mais ce n'est en rien une obligation). La seule chose qui importe est d'accepter
l'existence d'une réalité indépendante de l'observation et de tenter de la décrire. Des tentatives telles
que ci-dessus, faisant intervenir des variables cachées, suivent plutôt un réalisme classique. C'est-à-
dire une volonté de décrire la réalité quantique dans des termes les plus proches possibles de ceux
rencontrés en physique classique.

Une autre critique qui pourrait être soulevée contre le réalisme est qu'il est peut-être extrêmement
présomptueux de vouloir décrire la réalité. La mécanique quantique pourrait ne pas être complète
ou ne pas être la théorie "ultime". Comment savoir que la réalité que nous décrivons est la "bonne"
? Peu importe. Au moins essayons de décrire la réalité qui nous est accessible ou que la mécanique
quantique nous permet de décrire. C'est déjà ça ! La réalité décrite pourrait avoir une forme
différente d'une réalité plus fondamentale mais cela est encore plus vrai de la physique classique et
on ne peut nier l'existence réelle de cet objet tout ce qui a de plus classique que la chaise sur
laquelle nous sommes assis ! La physique se construit petit à petit, certaines lois ou paradigmes
s'écroulant au fur et à mesure des découvertes. Savoir que les lois physiques ont une validité
éphémère ne doit pas nous empêcher d'avancer. Nous reviendrons plus loin sur cette variabilité
dans la manière de décrire la réalité.

Attitude philosophique
Tout d'abord un premier avertissement. Il faut faire attention à ne pas "faire trop de philosophie" ! Il
ne faut pas oublier qu'il y a, derrière tout ce dont nous discutons, la physique et des expériences. La
philosophie est l'héritière d'une longue tradition qui a forgé ses propres concepts, ses propres
représentations du monde, ses catégories, en partie par des raisonnements, en partie par
l'observation du monde, et qui peut contenir involontairement des préjugés de quelque nature que
ce soit.

De plus, l'étude de la philosophie montre qu'elle s'éloigne parfois très loin de ce que l'on pourrait
appeler le sens commun. Pour un physicien, par exemple, le résultat d'une expérience est quelque
chose de réel. Ce que traduit ce résultat, ce qu'il nous dit sur le système qui est le sujet de
l'expérience est une autre question. Mais le résultat en soit est tout ce qu'il y a de plus réel. La
philosophie, même sur ce genre de point, peut suivre des méandres tortueux qui peuvent aboutir à
des résultats bien étranges. Bref, en physique, il faut rester pragmatique même lorsque l'on fait de la
philosophie !

Comme le dit John Blanton, il ne faut pas devenir esclave de la philosophie. Les meilleurs atouts,
en dehors du support expérimental, que l'on peut étaler sur la table sont :
- La logique. Les raisonnements doivent être consistants, rigoureux.
- La prudence. Méfions-nous de l'évidence immédiate et vérifions que toutes les possibilités ont
bien été envisagées.
- L'ouverture d'esprit. Si quelque chose semble heurter notre intuition, que ce soit la non-localité,
l'indéterminisme ou bien d'autres choses, ne le rejetons pas a priori sans non plus, bien sûr,
vouloir les adopter à tout prix !

Dans la littérature, mais c'est aussi ce que nous avons fait ci-dessus, on oppose souvent le réalisme
et le positivisme comme étant des attitudes philosophiques contradictoires et irréconciliables. Par
exemple le refus de parler d'une réalité indépendante de l'observation par les positivistes alors que
cette réalité est le credo des réalistes. Un autre exemple est la nécessité pour les positivistes de se
baser uniquement sur des concepts classiques puisque ce sont les seuls concepts directement
accessibles à nos sens (résultats définis des mesures expérimentales) alors que les réalistes peuvent
être amenés à les rejeter complètement.

Notons toutefois que le réalisme peut difficilement être rejeté. Qui oserait nier qu'il y a une réalité
qui nous entoure (à part peut-être ceux qui font trop de philosophie) ? Que l'univers est peut-être
très différent de ce que nos sens limités nous montrent mais qu'il existe bel et bien, qu'il n'est pas
une pure illusion ? La grande majorité des physiciens adoptant une attitude positiviste ne rejettent
pas l'existence du réel mais refusent simplement d'utiliser en physique autre chose que ce qu'ils
peuvent manipuler de manière objective : les résultats des mesures. Pour eux, cette réalité
indépendante de l'observation n'est pas inexistante mais seulement indigne de l'intérêt du physicien.
C'est surtout sur ce point que le positivisme s'oppose au réalisme. Comme nous l'avons dit, les
arguments des positivistes sont, sur ce point, totalement inattaquables. Sauf peut-être sur le
caractère "indigne" du sujet ! Tout sujet peut être digne de réflexion. Il faut d'abord l'avoir exploré
avant d'affirmer que rien ne peut en être retiré. En outre, les bénéfices d'une telle analyse peuvent
être multiples et ne se résument pas nécessairement à faire des prédictions expérimentalement
vérifiables. En parlant des difficultés du positivisme, nous avons relevé des constructions
théoriques qui utilisent des concepts (la fonction d'onde, par exemple) qui nécessite une
interprétation. De toute évidence, ces magnifiques constructions de l'esprit basées sur l'expérience
ne sont pas, comme signalé plus haut, qu'une simple collection de résultats de mesures !
Comprendre la signification profonde d'une théorie a un intérêt… théorique ! En bref, l'intérêt
pourrait être purement pédagogique en aidant à comprendre et donc à progresser dans la
construction des théories. Et rien que cela est parfaitement digne d'intérêt pour le physicien. En tout
cas, pour le théoricien.
Définition du réel
Le plus grand problème dans l'approche réaliste est qu'elle parle d'une réalité en dehors de toute
observation. Peut-on connaître cette réalité ? C'est toute la question. Toutefois, même si nous
parlons d'une réalité indépendante de l'observation, ces observations existent et peuvent nous
fournir des indications sur sa nature et sa forme.

Evidemment, il se peut que le raisonnement nous amène à plusieurs possibilités. Plusieurs


descriptions consistantes avec les observations. Comment trancher ?

Même si nous rencontrons cette difficulté, le simple fait de pouvoir décrire une réalité possible est
déjà un pas important. L'important est d'en avoir une description, même abstraite, du moment
qu'elle est consistante et satisfait à certains critères.

Nous sommes donc confrontés à deux choses :


- Comment définir le réel ? Comment le décrire ?
- Quels critères, en plus des observations, permettent, si nécessaire, de faire les choix nécessaires
?

Une approche pour définir le réel est l'utilisation, comme l'a fait Einstein, des "éléments de réalité".
C'est-à-dire de résultats tirés de l'expérience que l'on peut affirmer, après raisonnement, comme
étant des éléments objectifs appartenant à la description de cette réalité.

Selon Einstein, Podolsky et Rosen, si la valeur d'une quantité peut être prédite avec certitude avant
la mesure, en utilisant d'autres mesures qui ne perturbent pas cette quantité, alors elle correspond à
un élément de réalité.

L'étape suivante consiste à faire correspondre chaque élément du formalisme mathématique aux
éléments de réalité.

Mais il faut avoir beaucoup de méfiance. Cette approche semble séduisante et même irréfutable. Et
pourtant ! Elle a conduit Einstein et ses collègues au réalisme local qui a été, plus tard, montré être
faux par Bell et les expériences.
D'une manière générale, il faut tenir compte des théorèmes dit "d'impossibilité" tel que ceux de
Bell, Kochen et Specker, Mermin, Gleason ou Malament qui fixent des barrières à ce qu'il est
possible d'imaginer pour cette réalité. Du moins si l'on accepte la mécanique quantique en tant que
théorie du Monde.

Un autre point important dont nous avons déjà parlé est aussi le rejet de toute approche
anthropique. Cela est d'autant plus important que l'on parle d'une réalité indépendante de
l'observation. Cela implique que les concepts classiques ne doivent être utilisés que s'ils s'avèrent
réellement indispensables et pas par obligation.

Une des questions posée dans l'interprétation de Copenhague était le caractère de réalité de la
fonction d'onde. Représente-t-elle un objet physique réel ou traduit-elle seulement nos
connaissances (probabilistes) sur ce système physique ? Mais à y regarder de plus prêt, cette
question a-t-elle vraiment un sens ? Toute modélisation mathématique est une représentation
abstraite de certains aspects des systèmes physiques. Si l'on recherche la réalité physique qui se
cache derrière le phénomène, cette description mathématique est aussi une représentation de la
réalité physique. L'objet mathématique lui-même n'étant bien entendu qu'un ensemble de symboles.
Nous ne savons pas quelle forme peut prendre la réalité physique et nous savons que nous devons
la définir indépendamment de toute observation et sans faire nécessairement référence à des
concepts classiques. Cette fonction d'onde, en particulier si l'on admet qu'elle contient tout ce qu'il
y a à savoir sur l'état physique, est donc une représentation tout à fait fidèle de cette réalité,
exprimée dans le langage approprié et faisant appel à des concepts non classiques. Plus
précisément, cette fonction d'onde et les lois de la mécanique quantique constituent une définition
de ce nouveau concept. En outre, toute description, qu'elle soit obtenue par des expériences ou par
des raisonnements, constitue une information, une connaissance de l'objet physique. Lorsque nous
disons qu'un ballon est rond, c'est via des informations transmises par des signaux lumineux et par
des interactions physiques entre la surface du ballon et les molécules de nos doigts. "Rond" est la
description de l'objet physique réel "ballon", mais c'est aussi une information que nous avons sur
cet objet. La distinction entre fonction d'onde représentant un objet physique ou un état de
connaissance sur cet objet physique est donc assez artificielle.
Un autre exemple est donné par la température d'un objet. La température résulte de propriétés
statistiques. Elle est liée aux mouvements moléculaires. Plus les molécules bougent rapidement et
plus l'objet a une température élevée. La température n'est donc qu'une information indirecte du
comportement microscopique de l'objet. La température est pourtant bien une des propriétés
objectives décrivant un objet macroscopique classique. Objective dans le sens qu'on peut la mesurer
et que sa valeur a des conséquences concrètes (par exemple on peut se brûler en touchant l'objet).
Que l'on décrive l'objet par sa température ou par les mouvements de ses molécules, on a une
définition plus ou moins détaillées de l'objet réel, mais dans tous les cas on a bien une description
de l'objet réel ou d'une partie de celui-ci.

La fonction d'onde peut donc constituer une description plus ou moins complète (et l'évidence
expérimentale ainsi que la théorie quantique nous disent qu'elle est complète) et elle constitue bien,
à sa manière, une description de la réalité physique.

Cette manière de raisonner illustre bien aussi ce que nous entendions par "pas trop de philosophie".
Lorsque l'on se pose des questions sur la réalité de la fonction d'onde ou du moins de ce qu'elle
représente, il faut surtout bien réfléchir à ce qu'on entend par là et par voie de conséquence si cela a
même intérêt de philosopher indéfiniment sur la réalité de la fonction d'onde.

Le fait qu'elle soit complète est un problème difficile connu comme le problème de la complétude.
Comme nous l'avons dit, tout indique qu'elle soit complète. Mais en réalité, selon la manière
d'appréhender la réalité, selon la manière de la définir et d'y faire correspondre la fonction d'onde,
le problème peut se poser différemment. Par défaut, pour ne pas introduire d'éléments
supplémentaires inutiles (nous reviendrons sur ce point) il sera préférable d'admettre qu'elle est
complète. Nous aurons l'occasion d'en rediscuter.

On peut objecter que la fonction d'onde étant un nombre complexe (une amplitude), elle ne peut
représenter un objet physique réel. Mais la correspondance entre mathématique et physique n'est
pas toujours numérique, elle peut être plus complexe (nombres complexes pour les ondes, par
exemple, espaces de configurations, tenseurs de contraintes, spineurs et autres torseurs,…). Il faut
se débarrasser de cette idée qu'autre chose que les nombres réels ne sont pas "réels" au sens
physique. Les deux ne sont que des symboles, un langage, utilisé pour représenter une réalité
physique.

Résumons ce que nous avons appris :


 Il faut se méfier des approches trop simples, trop proches de la physique classique, comme le
réalisme naïf ou le réalisme local.
 Les théorèmes d'impossibilité sont des critères de rejet important dont il faut tenir compte.
 Le principe anthropique doit être rejeté.
 La fonction d'onde peut constituer une description de la réalité physique. Sans nécessairement
devoir essayer d'interpréter cette description. La fonction d'onde et les lois de la mécanique
quantique constituant l'interprétation ou la définition de ce nouveau concept de fonction d'onde
servant à décrire l'objet.
 Selon cette vue, l'espace de Hilbert est alors un espace de configuration, l'espace
(mathématique) rassemblant toutes les possibilités (tous les états possibles). Il est très différent
des espaces de configurations de la physique classique. Mais les concepts classiques n'étant pas
nécessairement appropriés, il ne faut pas chercher à traduire cet espace de Hilbert en termes
plus familiers. A nouveau, la description mathématique est la description recherchée.
 Le formalisme mathématique n'est pas un obstacle car il constitue un langage approprié pour
définir de nouveaux concepts, pour en parler. Il nécessite seulement une bonne connaissance de
la théorie.
 Si possible, on considérera la fonction d'onde comme une description complète.

Une telle approche réaliste rejetant les concepts classiques nécessite, c'est certain, un effort de
réflexion et d'abstraction. Une connaissance approfondie de la mécanique quantique et de ses
mathématiques semble incontournable. Cela pourrait être critiqué mais il n'est pas anormal d'utiliser
un langage rigoureux et approprié à une description donnée. Et comme le monde quantique est très
éloigné de notre quotidien il n'est pas étonnant de devoir faire appel au langage mathématique,
surtout que nous voulons éviter les concepts classiques tant que faire ce peu et que nous voulons
utiliser la logique et la rigueur (qui sont inclus en mathématique). Reprocherait-on à un chirurgien
d'utiliser ses connaissances en médecine pour comprendre ses actes chirurgicaux ? Alors pourquoi
reprocher à un physicien d'utiliser ses connaissances en mathématiques pour comprendre les
phénomènes physiques ?
Réalisme et positivisme
Donc, le réalisme est séduisant, oui. Mais quelle réalité adopter ? Adopter le réalisme n'est pas
imposer une réalité donnée, dictée par des préjugés philosophiques ou des concepts classiques. Par
exemple, comme nous l'avons vu ci-dessus, le réalisme peut prendre une forme extrêmement
souple. Dans un cas extrême, la fonction d'onde peut constituer un état de connaissance (des
informations) sur le système physique tout en étant une description fidèle de la réalité physique. Le
réalisme peut donc rejoindre le positivisme !

L'opposition entre réalisme et positivisme est donc essentiellement une attitude plutôt qu'un fait.
Nous avons vu que le positivisme ne peut pas se passer d'interpréter des choses comme la fonction
d'onde. Et le réalisme ne peut se passer des gardes fous donnés par le positivisme. Et si les deux
attitudes peuvent sembler antinomiques, comme sur la nature de la fonction d'onde, les deux
peuvent en réalité se rejoindre.

Comme indiqué ci-dessus il faut rester pragmatique et éviter de se laisser enfermer dans une
attitude sous prétexte que la philosophie oppose certaines catégories comme le positivisme et le
réalisme. Votre narrateur se qualifie d'ailleurs lui-même, un peu par boutade et surtout pour illustrer
ce point, de réaliste positiviste ! L'expression plus couramment employée est le "réalisme
pragmatique" auquel se rattachent d'ailleurs beaucoup de physiciens.

Attention, toutefois, en voulant être trop souple dans ce que l'on accepte ! Nous devons au moins
faire attention à deux choses.
 Si l'on donne une grande importance à la description mathématique, il faut se méfier des
artefacts mathématiques. C'est à dire des parties de la description qui n'existent que pour des
raisons purement mathématiques et pas physiques. C'est artefacts peuvent être plus ou moins
difficile à détecter. Quelques exemples éclaireront ce problème.
 Il est parfaitement possible de modifier la théorie de la relativité restreinte de manière à ce
que la vitesse de la lumière dans le vide soit anisotrope (différente selon la direction
considérée). Cette possibilité découle du fait que l'on ne peut mesurer la vitesse de la
lumière que sur un aller-retour ou à l'aide de plusieurs horloges synchronisées et que cette
synchronisation ne peut se faire soit qu'avec des signaux à vitesse connue (dans ce cas la
mesure de la vitesse se mord la queue) ou par déplacement des horloges (ce qui pourrait les
affecter d'une manière inconnue). Les prédictions expérimentales d'une telle théorie sont
totalement identiques à la théorie originale (étant bien entendu que l'anisotropie se reflète
aussi dans toutes les autres grandeurs physiques de telle manière à ce que l'anisotropie passe
inaperçue, une espèce de compensation perverse). L'utilisation de la jauge dite de Selleri en
est un exemple.

Il va de soit qu'une telle modification de la théorie est simplement une modification


mathématique et, qui plus est, assez alambiquée. Rien dans la physique ne permet de
supposer une telle anisotropie. Une telle hypothèse est donc totalement arbitraire. Par
conséquent, si en construisant la théorie on tombe sur cette anisotropie, il faut vérifier si elle
n'est pas un simple artefact mathématique.

Dans le cas d'espèce on évite l'artefact en adoptant le principe de relativité qui dit que tout
les systèmes de références sont équivalents ou, en d'autres mots, que notre manière,
arbitraire, de choisir des systèmes de coordonnées ne doit pas affecter la formulation des
lois physiques.
 Un autre exemple tiré de la relativité est le signe de l'énergie. Si l'on se réfère à la relation
universelle reliant l'énergie, la masse et l'impulsion, il se fait que cette relation implique que
l'énergie peut aussi bien être négative que positive. Mais en réalité, les valeurs négatives
sont un simple artefact mathématique dû à l'usage du carré (du moins en physique classique
!) car élever un nombre au carré donne toujours un nombre positif (par exemple -2 fois -2
est égal à quatre). La valeur de l'énergie étant bornée par le bas par la valeur positive ou
nulle mc 2 .
 En électromagnétisme, les potentiels ou le champ électromagnétisme sont affectés d'un
arbitraire dit de jauge que l'on fixe à l'aide d'une équation mathématique supplémentaire de
contrainte (appelée jauge de Coulomb, jauge de Lorentz,…) Le développement
d'expressions "physiques", "invariantes de jauge" est une priorité dans beaucoup de théories
et constitue souvent un pan de recherche puissant et fructueux.
 Lorsque l'on regarde les coordonnées sur une sphère, par exemple les longitudes et les
latitudes, on constate que les pôles sont des endroits particuliers, des singularités dans le
système de coordonnées. En fait, c'est le choix des coordonnées qui rend ces points
particuliers. Sur une sphère, tous les points sont équivalents. En réalité, cet artefact
mathématique est inévitable et est lié au fait que la sphère n'est pas homéomorphe au plan.
On a parfois du mal à s'en rendre compte car, pour la Terre, on a fait coïncider ces points
particuliers avec l'axe de rotation qui, lui, n'est bien entendu pas un artefact mathématique !
 Etre très souple, très imaginatif, très libre d'esprit, c'est très bien. Et dans le domaine échappant
à la mesure, il y a beaucoup de liberté. Mais il faut toutefois veiller à ce que nous construisons
ne conduise pas à des contradictions ou des paradoxes. L'interprétation doit être consistante.

Quantique ou classique
Nous devons aussi parler du lien qui doit exister entre le monde quantique et le monde classique.
Le monde classique, celui des objets macroscopiques et de la vie de tous les jours, est construit à
partir d'éléments plus simples tels que les atomes et les molécules obéissant aux lois de la
mécanique quantique. Par conséquent, on devrait pouvoir déduire les lois de la physique classique
de celles de la mécanique quantique. Il en est de même des concepts de la physique classique
comme ceux de position précise, de valeurs définies lors des mesures, etc.

Si l'on insiste pour interpréter la mécanique quantique en utilisant des concepts classiques, comme
le fait l'interprétation de Copenhague, nous avons vu les difficultés que cela soulève. En particulier,
ici, comment espérer déduire les lois et concepts de la physique classique à partir d'une théorie et de
son interprétation où les concepts classiques sont présupposés ? Ce type de déduction se mordrait la
queue et ne pourrait qu'être une tautologie n'expliquant rien.

Arrêtons d'interpréter à tout prix, directement, la mécanique quantique en termes de concepts


classiques.

Prenons l'exemple bien connu de la position et de l'impulsion ainsi que du principe


d'indétermination qui leur est associé. La position est en fait un concept classique, macroscopique.
L'état du système, par exemple une particule, ne contient aucune référence à une position ou un
moment. Ce n'est que par les projections sur une base privilégiée, la base positions reliées aux
concepts classiques, que cette notion d'observable position se dégage. Par conséquent, le problème
n'est pas tant de savoir comment décrire le système en termes de positions et d'impulsions, ni de
savoir pourquoi il y a une indétermination quantique, mais de savoir pourquoi telle base privilégiée
correspond aux concepts classiques de position ou d'impulsion puis de voir pourquoi à notre échelle
l'indétermination disparaît (ce dernier point est alors évident vu la petitesse de la constante de
Planck) ainsi que la raison des valeurs définies observées au niveau classique.

Eviter de décrire le système avec ces concepts classiques n'est pas toujours chose aisée. Ainsi,
parler d'électron "dispersé", comme on le lit parfois dans certains ouvrages de vulgarisation, c'est
faire appel, par contraste, au concept de position précise (la dispersion est aussi un domaine, un
ensemble de positions clairement définies) !

Acceptons la mécanique quantique pour ce qu'elle est et si l'état (le "vecteur" dans l'espace de
Hilbert, la fonction d'onde) n'est pas nécessairement l'objet physique ou sa représentation directe il
doit être considéré comme une représentation qui en contient tout (pour autant que nous le
sachions) ce qu'il y en a à savoir. Pas de concept de position dans un vecteur de Hilbert, c'est juste
un élément d'un ensemble d'états ! Et il ne faut pas y ajouter des concepts simplement parce que
nous en avons l'habitude.

Bien sûr, comme nous l'avons dit, les concepts des deux mondes sont liés, le macroscopique
découle du microscopique et le concept de position découle, d'une manière ou d'une autre, de la
mécanique quantique. Mais avant de comprendre comment B découle de A, comment A et B sont
liés, comment B peut être décrit par A dont il est l'essence, il faut d'abord savoir ce que sont A et B
et certainement pas décrire A à l'aide de B.

Acceptons la mécanique quantique pour ce qu'elle est, même d'un point de vue ontologique, et puis
cherchons à décrire le lien. Et donc excluons les concepts classiques de la description s'ils ne sont
pas indispensables.

Bien entendu, la position de Bohr se comprend. Il a raison. Tout ce dont on dispose pour expliquer
la physique ce sont des mots, des concepts classiques, tirés de notre expérience au quotidien et de la
mesure,… Mais on peut et on doit se rattacher à des notions pouvant s'appliquer aux deux mondes
comme l'information, les interactions. La description peut aussi être très abstraite, mathématique,
nous l'avons vu. Et on peut construire des concepts nouveaux en les décrivant à l'aide de processus
physiques et de concepts déjà connus. Nous en avons vu l'exemple avec l'indéterminisme.
C'est seulement après que l'on peut remonter aux concepts classiques comme les valeurs définies, la
position, l'impulsion,…

Un corollaire de tout cela est qu'il est exclut de privilégier telle ou telle base d'états au départ, en
particulier la base position

Le choix de l'interprétation
Revenons un peu sur les critères permettant de choisir entre plusieurs interprétations. Nous en
avons déjà vu et nous en verrons encore.

Que faire lorsqu'il y a correspondance entre deux interprétations par simples substitutions
sémantiques ou ontologiques ? Dans ce cas, la distinction entre les deux a-t-elle seulement un sens
? Ce qu'il faut remettre en cause, dans ce cas, c'est peut-être la signification des concepts utilisés
pour l'ontologie. Il faut tenter de les rapprocher quand c'est possible ou de trouver le tronc commun.
Cela peut nécessiter une révision profonde de ce que nous appelons réel et de notre manière
d'attribuer des propriétés ontologiques aux éléments théoriques.

Enfin, il est probablement important de connaître la théorie de la décohérence pour les


interprétations. Nous avons dit qu'aucune base privilégiée ne devait être choisie au départ et qu'il ne
fallait pas faire intervenir certains concepts classiques comme ceux de position. En réalité, si nous
pouvons affirmer cela c'est rétrospectivement. Pendant longtemps, ces problèmes de bases
privilégiées furent mal compris. On n'avait guère d'autre choix que de les inclure dans
l'interprétation. Maintenant, nous savons ce que la théorie de la décohérence peut apporter et nous
sommes à même d'épurer les interprétations.

Pas conséquent, il est important d'utiliser la décohérence pour comprendre les comportements
classiques et macroscopiques. La décohérence est liée à la structure dynamique des systèmes, à
l'environnement et la complexité des systèmes. Mais cela doit venir après. Elle ne devrait pas
intervenir dans la définition fondamentale de l'interprétation contrairement à ce qui est parfois
constaté. Les objections à une telle intervention de la décohérence dès le départ, dans
l'interprétation de base, sont plus ou moins les mêmes que celles que nous opposons à la physique
classique. La décohérence peut s'expliquer à partir du formalisme de base de la mécanique
quantique alors évitons de mettre la charrue avant les bœufs.

Mais il existe des éléments plus basiques qui interviennent à la fois dans le formalisme et dans la
décohérence. Par exemple, la décohérence montre que la base privilégiée est liée à la structure des
interactions (décrites par l'hamiltonien). En particulier la base position pour les systèmes
macroscopiques est due au fait que la plus part des interactions dépendent de la distance. Cela
montre que l'hamiltonien, surtout dans un contexte relativiste où l'intervalle joue un rôle important,
est un élément qui doit intervenir dans l'interprétation. Au moins pour en tirer les conséquences une
fois que l'on est en mesure de préciser l'hamiltonien pour un système donné.
II.2.5. Le rasoir d'Ockham
Nous allons maintenant discuter d'un principe utile et souvent invoqué dans les interprétations.

Le principe du rasoir d'Ockham peut s'énoncer comme suit : "parmi toutes les explications, la plus
simple est souvent la meilleure."

Ce principe découlant du bon sens n'est évidemment qu'un guide utile. En effet, souvent ne veut pas
dire toujours et simple ne veut pas dire simpliste. Dans l'étude des phénomènes physiques, les
explications simples ne se sont pas toujours avérées, à l'usage, être les meilleures.

En physique, ce principe pourrait s'énoncer comme suit : "dans toute explication, éliminez le
superflu. Supprimez tout ce qui n'est pas strictement nécessaire à l'explication des phénomènes
étudiés. N'utilisez que le strict minimum".

Ce principe aussi découle du bon sens et, cette fois, semble totalement incontournable. Pourquoi
ajouter des éléments supplémentaires si on peut s'en passer ? Pour des raisons expérimentales ?
Dans ce cas on ne peut affirmer qu'on peut s'en passer ! C'est vraiment si on peut s'en passer qu'il
n'y a vraiment aucune justification à leur présence.

Mais comment savoir ce qui est superflu ? Ce n'est pas toujours trivial, surtout si on parle de
phénomènes aussi exotiques que ceux rencontrés en mécanique quantique ou si l'on compare deux
interprétations totalement différentes de la même théorie.

Si l'on désire comparer les interprétations, dans la mesure où une telle comparaison à un sens, cela
revient à estimer le nombre d'éléments supplémentaires introduits par l'interprétation. Mais
comment faire ? L'expérience montre que c'est loin d'être une tâche aisée et l'estimation est parfois
très subjective car elle dépend de ce que l'on considère être "un élément" et de son caractère
inévitable ou arbitraire.

Un bon exemple de cette situation est donné par l'interprétation des mondes multiples de DeWitt et
Everett que nous verrons plus tard et où chaque mesure, conduisant à un état superposé
macroscopique, est supposée donner un monde différent (des espèces de "mondes parallèles") pour
chaque composante de cette superposition.

Certains estiment que cette interprétation, introduisant une infinité de mondes, constitue une
violation maximale du principe du rasoir d'Ockham. D'autres au contraire, considère cela comme
normal voire inévitable et estiment que l'élimination du postulat de réduction constitue au contraire
un respect de ce même principe !

Comment estimer objectivement le nombre d'éléments supplémentaires ? Il est certain que le


nombre de valeurs que peut prendre une variable et même le nombre de variables, lorsqu'elles sont
toutes de même nature (par exemple un ensemble de variables position), ne doit pas intervenir.
Imaginons une variable température, par exemple, ajoutée à l'interprétation (c'est évidemment un
exemple hypothétique, aucune interprétation de ce type n'existe). Le fait que cette température
puisse prendre différentes valeurs n'implique pas qu'elle constitue un élément supplémentaire plus
gênant qu'une variable qui ne pourrait prendre que deux valeurs. De même, si on spécifie la
température en chaque point, cela n'est pas plus gênant. La multitude des variables température
(une pour chaque point de l'espace) ne constitue pas une multitude d'éléments supplémentaires.
Cela dépend juste de la façon dont la température est introduite dans l'interprétation.

Donc, seul le fait d'avoir ces variables constitue un élément supplémentaire. Le fait de devoir fixer
le domaine de ces variables est aussi un élément supplémentaire. Par exemple, si l'on ajoute une
variable température T ou une variable dépendant de la position T ( x ) cela constitue un élément
supplémentaire. Et si on dit que cette variable ne peut dépasser une valeur arbitrairement fixée
Tmax , cela constitue également un élément supplémentaire. En fait chaque ajout d'un paramètre
arbitraire et indépendant constitue un tel élément supplémentaire.

Tout élément de structure (spécifiant que les différentes parties constituant l'interprétation sont
reliées de telle ou telle manière), tout concept nouveau, toute règle nouvelle, peut également être un
élément.
Puisque l'on désire comparer des interprétations de la mécanique quantique, il faut bien entendu
comparer à ce que l'on sait déjà : le formalisme de base de la mécanique quantique et,
éventuellement, les données expérimentales.

Mais ne jouons pas aux comptables ou aux boutiquiers, restons simples

Idéalement, ce dont nous avons besoin pour respecter le principe du rasoir d'Ockham est seulement
:
- Le formalisme de base de la mécanique quantique.
- Des règles ontologiques simples et immédiates attribuant des propriétés physiques aux objets
mathématiques du formalisme.
- Eviter de rejeter tout ou partie des lois de la mécanique quantique sans raison absolue.
- Eviter l'ajout de variables supplémentaires, par exemple des variables cachées, si cela est
possible.

Un exemple d'interprétation aussi minimaliste est l'interprétation des états relatifs de Hugh Everett
III. Elle rejette le postulat de réduction et prend la superposition, constatée dans le modèle de
mesure de von Neumann, au pied de la lettre. Rien de plus, rien de moins. Nous y reviendrons.

Mais il faut avouer que cette interprétation est assez incomplète (Everett en est resté pratiquement à
ce point dans sa thèse de doctorat et cela peut expliquer son caractère minimal). Nombre de
questions restent ouvertes sur la manière de relier cette interprétation à ce que nous observons en
pratique. Cette interprétation s'arrête à mi-chemin pourrait-on dire.

Plusieurs possibilités existent pour la compléter. Par exemple, après le choix d'une base privilégiée,
les mondes multiples. Ce faisant, on ajoute certains éléments comme cette base privilégiée et ce
concept de monde multiple. Mais elle ne constitue certainement pas une violation majeure du
principe du rasoir d'Ockham.

Cette interprétation est-elle la meilleure ? Que signifie d'ailleurs "la meilleure" ? Peut-on faire
mieux du point de vue du principe du rasoir d'Ockham ? Quelle place lui accorder face à d'autres
critères de jugement ? Nous ne tenterons pas de répondre ici à ces questions (ce cours n'a pas pour
vocation d'étudier toutes les interprétations existantes afin de les juger, la littérature est suffisament
abondante sur ce point, et nous n'aborderons que les principales). Ce principe doit simplement être
considéré dans la suite comme un guide utile.

Toutefois gardons à l'esprit l'interprétation des états relatifs, nous en reparlerons plus en détail, car
du fait qu'elle constitue une interprétation extrêmement basique et minimaliste et du fait qu'elle
rejette la réduction au caractère physique si douteux, elle peut s'avérer un outil utile dans la
construction d'une interprétation.
II.2.6. Les bases privilégiées

Présentation
Le problème des bases privilégiées a déjà été présenté dans la section sur le problème de la mesure. Nous allons
maintenant approfondir un peu le sujet.

Soit un espace de Hilbert donné H et une base de cet espace {ψ i } . Cet ensemble d'états de base pouvant être f
ou infini. Il y a une infinité de bases possibles.

Toutes ces bases sont strictement équivalentes. Tout vecteur de l'espace de Hilbert peut se décomposer de maniè
unique sur une base, quelle qu'elle soit. De plus, quel que soit l'hamiltonien décrivant l'évolution du système,
l'équation de Schrödinger étant linéaire, toutes les bases sont également strictement équivalentes du point de vue
de l'évolution dans le temps (puisque l'évolution linéaire préserve la superposition et une décomposition d'un éta
sur une base n'est qu'une telle superposition d'états).

Par contre, pour des systèmes réels plus ou moins complexes, il existe des bases privilégiées.
 Au niveau macroscopique, la base privilégiée est la base position. Les objets macroscopiques, ceux de la vie
de tous les jours, ont toujours des positions définies. Il en est ainsi des tables, des appareils de mesure ou des
aiguilles de ces mêmes appareils.
 Pour des objets microscopiques, de la taille d'un atome, la base privilégiée est souvent la base énergie (la bas
d'états propres de l'opérateur énergie). Il en est ainsi de l'état des électrons autour d'un atome.
 Pour des objets mésoscopiques, tel que des molécules, la situation est plus complexe et peut même manifeste
des bases privilégiées mixtes mélangeant position et impulsion.

Ainsi la plus part des grosses molécules se manifestent sous plusieurs isomères (des molécules qui diffèrent
leur image dans un miroir). On trouvera par exemple des molécules de glucose gauche ou droit. Généraleme
les isomères sont stables, ce qui est une manifestation du fait que la base isomérique est privilégiée. C'est en
fait une variante de la base position puisque les molécules ont alors une structure dans l'espace bien définie.

Certaines petites molécules ont plutôt une base privilégiée énergie. Ainsi, on ne trouve pas deux sortes de
molécules (isomères) du diméthyl-1,2-benzène. Et ce malgré la présence des doubles liaisons alternées qui
devraient donner deux conformations différentes de la molécule
 On dit que les électrons des doubles liaisons sont délocalisés autour du cycle benzène. En fait, cela revient à
dire que la molécule se trouve dans un état superposé des deux conformations. Il existe plusieurs
superpositions possibles (deux pouvant former une base isomérique) et la molécule se trouve dans la
superposition d'énergie la plus basse.
 La charge électrique est toujours mesurée définie. La base des états propres de l'opérateur charge est une bas
privilégiée.

Plus généralement, considérons un appareil de mesure conçu pour mesurer un observable O d'un système
microscopique S donné. Les différentes positions de l'aiguille seront associées aux différentes valeurs propres de
cet observable.

L'appareil de mesure enregistrera toujours des valeurs définies pour cet observable. Les états propres
correspondants aux valeurs propres de cet observable constituent donc une base privilégiée.

On voit aussi que c'est la mesure qui est à l'origine de ce concept de base privilégiée. Nous retombons sur le
problème de la mesure. Le fait que, pour des systèmes macroscopiques (en particulier les appareils de mesure) o
observe toujours des valeurs définies et pas des états superposés. Comme nous l'avons vu. Et dans toute mesure,
y a forcément interaction avec un système macroscopique, ne fut ce que l'expérimentateur lui-même.

Prenons par exemple la base position. Soit une particule élémentaire pouvant se situer en deux endroits x1 et x 2
Les états correspondant seront notés x1 et x 2 . On a un appareil de mesure pouvant mesurer la position de la
particule, par exemple, par interaction avec un rayon lumineux. L'observable correspondant est l'opérateur
position x . On observe toujours des valeurs définies et jamais un état superposé tel que x1 + x 2 .

On peut aussi avoir une autre base formée des deux états x1 + x 2 et x1 − x 2 , par exemple. A cette base peu
correspondre un opérateur X dont ces états sont états propres. Mais on n'observe pas la particule dans des états
propres de cet opérateur. Notons que des exceptions existent, dans les condensats de Bose-Einstein, les différent
atomes sont tous dans le même état quantique sans position précise et cela peut se traduire dans certains cas par
des effets visibles (comme l'opalescence critique due aux corrélations longues portées). Cela montre bien que si
base position est la plus commune à l'échelle macroscopique, elle ne doit pas être considérée comme absolue.
Ne devrait-on pas parler d'observables privilégiés ? Pourquoi les appareils de mesure macroscopiques ne
permettent-ils pas de mesurer certains observables comme X ? Pourquoi les observables ne peuvent-ils pas être
arbitraires (comme le suppose implicitement l'interprétation de Copenhague) ?

En fait, il y a un lien entre la base d'états propres de l'observable et la base position de l'appareil. Le lien se fait v
les interactions complexes de la mesure passant du système microscopique au système macroscopique. L'appare
étant toujours observé dans une position définie, l'observable prend forcément des valeurs définies également. O
peut parfaitement concevoir un appareil capable de mesurer X et les valeurs mesurées, bien définies, seront
toujours des valeurs propres de cet observable. Ce qui est dit ci-dessus n'est donc pas tout à fait vrai. Il est possib
de mesurer, a priori, tous les observables désirés. Mais le résultat n'est pas "stable". Il est même tellement instab
que parfois on n'arrive pas à effectuer la mesure. Illustrons la signification de ce point sur un exemple.

Soit des grosses molécules de sucres pouvant se trouver dans deux configurations G gauche et D droite. Les
molécules de ce type ont la propriété, lorsqu'elles sont en solution, de faire tourner le plan de polarisation de la
lumière (à gauche ou à droite, d'où leurs noms). Nous avons donc un moyen simple de mesurer l'observable
"configuration gauche ou droite", en utilisant de la lumière polarisée.
Supposons que nous ayons un moyen de séparer les différentes configurations. Après la mesure d'un grand
nombre de molécule dans les configurations G et D, on les sépare, et on obtient deux flacons. Un contenant
uniquement des molécules G et l'autre contenant uniquement des molécules D.

Si après quelques heures ont effectue à nouveau la mesure sur le flacon G, on constate qu'il contient toujours des
molécules dans la configuration G. Tout va bien.

Maintenant, on aimerait utiliser un moyen de mesurer les configurations dans une autre base. Par exemple
X = G + D et Y = G − D . L'observable sera appelé "configuration X ou Y". La polarisation de la
lumière peut aussi se mettre dans de tels états, c'est la polarisation dite circulaire. On peut donc imaginer
concevoir un appareil utilisant non plus de la lumière polarisée linéairement mais circulairement pour mesurer ce
deux états.

Ici aussi, après un grand nombre de mesures, on va se retrouver avec des molécules dans des états bien définis X
et Y. On peut séparer nos molécules et préparer un flacon de molécules X et un flacon de molécules Y.
Après quelques heures (en fait, quelques millièmes de secondes seraient suffisantes) on reprend le flacon de X e
on refait la mesure. Surprise ! On trouve à peu près la moitié de X et la moitié de Y ! L'état X n'est donc pas
stable, contrairement à l'état G.

Il existe donc bien des bases privilégiées. Leur caractère principal n'est pas d'avoir des valeurs définies. Cela n'es
pas dû qu'à la mesure, au fait que l'on mesure toujours des valeurs définies et au fait que la base privilégiée
macroscopique est la base position. Non, leur caractère principal est la stabilité. Par exemple, si vous observez u
stylo sur une table, après avoir fermé les yeux un instant, il est toujours au même endroit (si un farceur n'est pas
venu le subtiliser). C'est cet aspect de stabilité qui permet de suivre une balle des yeux pendant qu'elle roule. Cet
stabilité donne un sens au concept classique de "trajectoire".

Le fait d'avoir des appareils de mesure qui mesurent uniquement des valeurs dans les bases privilégiées n'est pas
non plus dû aux appareils de mesure eux-mêmes mais au caractère stable des propriétés. On peut construire des
appareils pour mesurer (presque) tout ce que l'on veut. Mais seuls certains appareils de mesure ont un intérêt. Un
physicien n'a aucun intérêt à mesurer une propriété totalement évanescente !

Il existe donc bien des bases privilégiées, intimement liées au caractère "classique" du quotidien, reste à savoir
pourquoi.

Théorème de décomposition biorthogonale


Soit un espace de Hilbert H pouvant se décrire comme le produit de deux sous-espaces de Hilbert H = H 1 ⊗ H
C'est-à-dire que le système décrit par cet espace de Hilbert peut être décomposé en deux sous-systèmes. Cela peu
être deux particules, comme on l'a vu avec les états intriqués ou un système microscopique et un appareil de
mesure, etc.

Soit un état quelconque ψ appartenant à H . Alors il existe deux bases {φ i } et {ϕ j } pour, respectivement, H 1
H 2 tel que ψ peut être écrit comme de termes de la forme :
φi , ϕ j

C'est-à-dire qu'il peut être décomposé sur ces états, c'est une base.
En général, on peut montrer que cette base φ i , ϕ j est unique.

Ce théorème permet donc de sélectionner, pour un système S1 donné, en présence d'un autre système S2, une ba
et donc un observable donné.

Ce théorème de décomposition biorthogonal est parfois utilisé dans les interprétations modales pour choisir des
observables privilégiés. Mais cela n'est pas sans poser des problèmes parfois épineux.
 Les dimensions (le nombre d'états dans une base) des sous-espaces H 1 et H 2 doivent être identiques. Cela
peut poser des difficultés.
 Soit un système S donné, par exemple un système microscopique et son appareil de mesure. Nous avons déjà
parlé, dans la problématique de la réduction de la fonction d'onde, qu'il était difficile de fixer une frontière
entre le microscopique et le macroscopique. Entre le système étudié, par exemple un atome, et l'appareil, il y
toute une chaîne de systèmes en interaction et il est difficile voire impossible de dire où s'arrête un système e
où commence l'autre. Bref, la décomposition en deux sous-systèmes est souvent arbitraire et il y a une
multitude de possibilités pour le faire. Et le résultat de la décomposition en dépend.
 Le théorème de décomposition biorthogonal n'est valable que pour deux sous-systèmes. Par exemple, si l'on
veut étudier deux particules et un appareil de mesure, cela fait trois sous-systèmes. Et la décomposition
n'existe pas la plus part du temps.

Soit les sous-systèmes décrits par les espaces H 1 , H 2 et H 3 . On peut appliquer le théorème à H 1 ⊗ H 2 , ain
qu'à H 2 ⊗ H 3 ou à (H 1 ⊗ H 2 ) ⊗ H 3 . Il existe de nombreuses possibilités. D'autant plus qu'il y a des sous-
systèmes. Et en toute généralité, les bases ainsi sélectionnées n'auront rien en commun.
 En effectuant les calculs explicites sur des systèmes réels, on se rend compte que le théorème de
décomposition biorthogonal ne donne pas toujours des observables correspondant aux observables privilégié

Cette approche ne semble donc pas correcte.

Interprétations
Comment tenir compte de ces problématiques des bases privilégiées dans les interprétations ?
Il est un fait que ces bases privilégiées sont en partie liée au problème de la mesure, à l'aspect macroscopique de
appareils de mesures mais aussi à la dynamique (stabilité des états). C'est-à-dire, plus généralement, à ce qu'on
appelle la classicalité. C'est ce qui caractérise les systèmes décrits par des concepts classiques et obéissant aux lo
de la physique classique.

De plus, le formalisme quantique de base ne fait intervenir nul part de concept de base privilégiée. Même le
théorème de décomposition biorthogonale ne remplit pas la tâche que l'on souhaiterait de sélectionner les bases
privilégiées.

Comme nous l'avons dit, nous ne pouvons pas faire intervenir les concepts classiques à la base de l'interprétation
Ou du moins, nous ne souhaitons pas le faire. Nous ne pouvons pas, non plus, faire intervenir des aspects
complexes ou dynamiques. La dynamique est une conséquence des lois fondamentales. La dynamique, tout
comme la classicalité, doivent être déduites des lois fondamentales décrivant les systèmes, pas l'inverse. Il n'est
donc pas possible de faire intervenir les conséquences de la dynamique dans l'interprétation des lois qui
l'expliquent sous peine d'avoir une interprétation qui se mord la queue ou qui n'explique pas vraiment les
phénomènes qu'elle aborde.

Il ne faut donc pas privilégier telle ou telle base dans l'interprétation.

Ce n'est qu'après coup, quand les lois de la dynamique seront comprises, que des aspects tel que la classicalité et
les bases privilégiées pourront entrer dans le cadre général des lois quantiques et de leur interprétation.

Rappelons, comme nous l'avons déjà dit, que cette dynamique expliquant les bases privilégiées est connue et est
appelée décohérence. Nous y reviendrons.
III. Interprétations
Nous allons donc maintenant étudier les principales interprétations de la mécanique quantique, en
dehors de l'interprétation de Copenhague déjà présentée.

Nous présenterons d'abord l'interprétation, ses principes, ses idées, comment elle marche.

Normalement, ces interprétations sont physiquement équivalentes. Tous les résultats vérifiables
expérimentalement peuvent être obtenus directement à partir de l'interprétation instrumentale. Par
conséquent, ces interprétations ne fournissent pas de résultats supplémentaires qui pourraient faire
l'objet d'expériences. Mais cette équivalence n'est pas toujours parfaite :
 Premièrement, certaines interprétations de la mécanique quantique portent assez mal leur nom
dans la mesure où elles modifient le formalisme de base de la mécanique quantique. Il s'agit
bien, dans ce cas, de théories réellement différentes qui pourraient faire l'objet d'expériences.
 Ensuite, les concepts utilisés dans différentes interprétations sont parfois strictement
incompatibles. Le passage d'une interprétation à l'autre n'est pas forcément trivial.
 Enfin, ces interprétations peuvent avoir un domaine d'application limité, variable d'une
interprétation à l'autre. Nous l'avons déjà vu avec l'interprétation de Copenhague qui nécessite
un observateur qui effectue des mesures et qui ne peut donc s'appliquer à l'univers entier pris
comme un tout.

Nous essayerons de donner un jugement basé sur ce que nous avons déjà vu. Effectuons cet
exercice en prenant l'interprétation de Copenhague.
 Respect du formalisme de la mécanique quantique.
L'interprétation de Copenhague respecte le formalisme de base de la mécanique quantique en
l'absence de mesure pour les phénomènes microscopiques. Le processus de réduction, lors d'une
mesure, est toutefois incompatible avec ce formalisme. Ce point n'est pas gênant car les objets
macroscopiques (instruments de mesure) ne sont pas décrit par le formalisme de la mécanique
quantique mais par les lois de la physique classique.
 Limite.
Le respect du formalisme montre immédiatement les limites :
 Incapacité à expliquer pourquoi les objets macroscopiques obéissent aux lois de la physique
classique puisque celles-ci sont présupposées et on ne leur applique pas les lois de la
mécanique quantique.
 Obligation de disposer d'un observateur ou d'instruments de mesure. Et donc l'interprétation
ne peut s'appliquer à l'univers tout entier considéré comme un objet décrit par les lois de la
mécanique quantique.
 Principe anthropique.
Le principe anthropique est suivi puisque l'on donne un rôle privilégié à l'observateur ou plus
généralement aux objets macroscopiques.
 Réalisme ou positivisme.
Cette interprétation est strictement positiviste se refusant à discuter d'une réalité pourtant
incontournable.
 Rasoir d'Ockham.
En ajoutant un seul processus, la réduction, au formalisme de base, l'interprétation de
Copenhague se limite au strict minimum.
 Bases privilégiées.
L'interprétation ne peut expliquer les bases privilégiées. Mais nous avons vu que cela était
normal puisque leur existence dépendait de mécanismes dynamiques complexes que nous
aborderons bientôt. Mais, plus ennuyant, l'interprétation présuppose l'existence de bases
privilégiées puisqu'elle donne aux objets macroscopiques (possédant une base privilégiée, la
base position) un statut spécial.
 Caractère explicatif des probabilités et de la réduction.
L'interprétation ne donne aucune explication de l'existence du mécanisme de réduction et des
règles probabilistes. Elle se contente de les constater.
 Coté pédagogique.
De par sa proche ressemblance avec le formalisme de base, elle a un coté assez pratique,
comme l'interprétation instrumentale. Ce coté pratique la rend aussi aisée à comprendre, en
particulier si on adopte le point de vue d'un expérimentateur dans un laboratoire. Mais elle
laisse un profond goût d'insatisfait car elle laisse trop d'inconnues donnant l'impression que la
mécanique quantique reste un peu un ensemble de recettes magiques.
 Défauts.
En dehors des points soulignés en rouge, ci-dessus, nous avons vu qu'elle n'était pas exempte de
difficultés comme le fait que la réduction ne peut échapper à une interprétation physique alors
qu'une réduction physique est douteuse, par exemple dans le cas de l'intrication. La difficulté de
dire à quel stade du processus de mesure se produit la réduction peut aussi entraîner de sérieux
problèmes. Ces difficultés se sont traduites par une versatilité de l'interprétation qui a empêché
une formalisation définitive de l'interprétation.

Notons que ces jugements sont assez subjectifs. Un positiviste jugerait par exemple que le fait
d'être positiviste n'est évidemment pas un défaut. Le lecteur doit donc se forger sa propre opinion.
Mais, pour trancher et essayer de quantifier les choses, donnons un score négatif basé sur le nombre
de points en rouge (en mettant sur un pied d'égalité chaque défaut, ce qui n'est certainement pas
parfait mais cela donne une indication). Plus ce nombre sera faible et plus l'interprétation satisfera
les critères que nous recherchons :

Interprétation de Copenhague : -10.

Nous insistons sur le fait que ce score ne fait que traduire le sentiment de l'auteur, la liste des
critères étant subjective et qualitative. Mais il nous permettra de faire des choix respectants les
principes que nous nous sommes fixés.

Une fois les interprétations passées en revue, nous ferons nos choix. Prendre une de ces
interprétations ? L'aménager ? En prendre plusieurs ou ce qui a d'intéressants dans chacune ? Nous
verrons.
III.1. Les histoires consistantes

III.1.1. Interprétation
En mécanique quantique, l'approche des histoires consistantes projette de donner une interprétation
moderne de la mécanique quantique, généralisant l'interprétation conventionnelle de Copenhague et
fournissant une interprétation naturelle de la cosmologie quantique. Certains pensent que cette
interprétation dérive du travail de Hugh Everett et est une version moderne de l'interprétation des
mondes multiples. D'autres sont totalement en désaccord. La théorie est basée sur un critère de
consistance qui permet alors à l'histoire d'un système d'être décrite tel que les probabilités de
chaque histoire obéissent aux règles de la probabilité classique bien qu'elles soient consistantes
avec l'équation de Schrödinger.

Selon cette interprétation de la mécanique quantique, le but d'une théorie physique quantique est de
prédire les probabilités de différentes histoires alternatives. Une histoire est définie comme une
séquence (produit) de projecteurs à différents moments du temps :

(1) H i = T ∏ Pi , j (t i , j )
ni

j =1

Le symbole T indique que les facteurs dans le produit sont ordonnés dans l'ordre chronologique
selon la valeur de t i , j : les opérateurs du "passé" avec la plus petite valeur de t apparaissent sur le
coté droit et les opérateurs "futurs" avec la plus grande valeur de t apparaissent sur le coté gauche.

Ces projecteurs peuvent correspondre à tout ensemble de questions qui incluent toutes les
possibilités. Des exemples ils peuvent être les trois projections signifiant "l'électron est passé par la
fente de gauche", "l'électron est passé par la fente de droite" et "l'électron n'est pas passé par les
fentes". Un des objectifs de la théorie est de montrer que les questions classiques tel que "où est ma
voiture" sont consistantes. Dans ce cas, on peut utiliser un très grand ensemble de projections,
chacune spécifiant la position de la voiture dans une certaine petite région de l'espace.
Une histoire est une séquence de telles questions ou, mathématiquement, le produit des projecteurs
correspondants. Le rôle de la mécanique quantique est de prédire les probabilités des histoires
individuelles étant donné les conditions initiales connues.

Finalement, les histoires doivent être consistantes, c'est-à-dire :


( )
(2) Tr H i ρH +j = 0
pour des i, j différents. Ici ρ représente la matrice de densité initiale et les opérateurs sont
exprimés dans le point de vue de Heisenberg. L'exigence de consistance nous permet de postuler
que la probabilité d'une histoire H i est simplement
(
(3) Pr (H i ) = Tr H i ρH i+ )
qui garantit que la probabilité de "A ou B" est égale à la probabilité de "A" plus la probabilité de
"B" moins la probabilité de "A et B" et ainsi de suite. L'interprétation basée sur les histoires
consistantes est utilisée en combinaison avec les avancées de la décohérence quantique. La
décohérence quantique implique que seuls des choix particuliers d'histoires sont consistants et elle
permet un calcul quantitatif des limites entre le domaine classique et le domaine quantique.

D'une certaine façon, l'interprétation basée sur les histoires consistantes ne change rien par rapport
au paradigme de l'interprétation de Copenhague qui dit que seules les probabilités calculées en
mécanique quantique et la fonction d'onde ont une signification physique. Afin d'obtenir une
théorie complète, les règles formelles ci-dessus doivent être complétées avec un espace de Hilbert
particulier et des règles gouvernant la dynamique, par exemple un hamiltonien.

Selon l'opinion d'autres cela n'en fait pas encore une théorie complète car aucune prédiction n'est
possible sur le choix de l'ensemble d'histoires consistantes qui se produiront réellement. C'est-à-dire
que les règles de consistance, l'espace de Hilbert et l'hamiltonien doivent être complétés par un
ensemble de règles de sélections. Sinon le nombre d'histoires possibles est trop grand et il n'est
même plus possible de leur affecter des probabilités.

Les défenseurs de cette interprétation moderne, tel que Murray Gell-Mann, James Hartle, Roland
Omnes, Robert B. Griffiths et Wojciech Zurek affirment que leur interprétation clarifie les
désavantages fondamentaux de la vieille interprétation de Copenhague et peut être utilisée comme
un cadre d'interprétation complet pour la mécanique quantique.
III.1.2. Evaluation
Faisons maintenant quelques remarques sur cette interprétation et donnons son évaluation.

Notons que sans l'emploi de la décohérence et même par l'emploi d'une base privilégiée et le critère
de consistance, l'ensemble des histoires consistantes ne constitue par un ensemble unique. Un
nombre considérable de possibilités existe (on parle de "familles d'histoires consistantes") et des
critères de sélection arbitraires sont nécessaires. Le choix d'utiliser la décohérence est un tel critère
arbitraire, celui de choisir de mettre l'accent sur les résultats définis obtenus par des mesures avec
des appareils macroscopiques classiques. Avec ce choix, la théorie ne pose aucun problème.
D'autres critères de sélection, nécessaires lorsque l'on ne dispose pas d'un tel guide comme en
cosmologie quantique, peuvent conduire à des contradictions et tous les problèmes n'ont pas encore
été entièrement résolus à ce jour. Des travaux sont encore en cours.

D'une certaine façon, l'interprétation basée sur les histoires consistantes ne change rien par rapport
au paradigme de l'interprétation de Copenhague qui dit que seules les probabilités calculées en
mécanique quantique et la fonction d'onde ont une signification physique. Elle ne fait que
moderniser l'interprétation en changeant la réduction arbitraire et instantanée d'un état par le choix
d'une histoire consistante.

 Respect du formalisme de la mécanique quantique.


L'interprétation des histoires consistantes respecte entièrement le formalisme de la mécanique
quantique. De plus, en conservant l'ensemble des possibilités (histoires), elle évite de devoir
introduire un mécanisme de réduction incompatible avec le formalisme. Les probabilités et
donc le choix de l'histoire compatible, par exemple, avec une mesure, sont appliquées sur la
totalité du processus jusqu'à son aboutissement pour, par exemple, comparaison avec les
données expérimentales. On évite ainsi les difficultés de la réduction.
 Limite.
L'interprétation des histoires consistantes n'est pas contrainte par les limites de l'interprétation
de Copenhague car le choix d'une base privilégiée classique et d'une situation correspondant à
une mesure classique n'est pas une obligation.
 Principe anthropique.
La possibilité de choisir toute famille d'histoires compatible avec une situation donnée et
l'absence d'obligation de choisir un observateur classique permet de ne pas se laisser enfermer
dans une vision anthropique.
 Réalisme ou positivisme.
L'interprétation est totalement positiviste car elle considère toujours que seuls les résultats ont
une signification et elle adopte vis à vis de la fonction d'onde la même philosophie que
l'interprétation de Copenhague.
 Rasoir d'Ockham.
L'interprétation ajoute peu de conditions au formalisme de base. Toutefois, la règle probabiliste
de Born ne suffit pas et il faut ajouter des règles de sélection pour les familles d'histoires.
 Bases privilégiées.
Actuellement, on choisit habituellement les bases privilégiées données par la décohérence mais
ce n'est pas une obligation même si de nombreux travaux sont encore en cours pour régler
toutes les difficultés qui peuvent se poser dans le choix des bases et des familles.
 Caractère explicatif des probabilités et de la réduction.
Aucune explication n'est donnée sur le caractère non déterministe de la théorie. La philosophie
positiviste ne le permet pas.
 Coté pédagogique.
Cette interprétation n'est pas très pédagogique car même si le concept d'histoires est assez
intuitif, son implémentation est hautement technique et nécessite une bonne connaissance de la
mécanique quantique. Elle ne peut donc pas servir facilement d'outil d'enseignement pour faire
comprendre la mécanique quantique.
 Défauts.
Des difficultés et des incohérences ont parfois été rencontrées mais elles ne semblent pas
rédhibitoires dans la mesure ou des solutions ont chaque fois pu être trouvées. Les travaux
actuellement en cours ne permettent pas encore de dire si cette interprétation va rencontrer un
obstacle insurmontable. Cela ne semble pas être le cas et, au pire, on peut se limiter aux bases
classiques données par la décohérence. On retomberait alors dans la situation de l'interprétation
de Copenhague où il faut donner un rôle privilégié à la physique classique mais rien ne permet
pour le moment de l'affirmer et cette interprétation a déjà montré son utilité pour étudier des
systèmes quantiques complexes et très éloignés de la physique classique tels que ceux
rencontrés en gravité quantique.

Interprétation des histoires consistantes : -4.


III.2. Réduction physique
La mécanique quantique, avec ses implications révolutionnaires, a posé d'innombrables problèmes
aux philosophes des sciences. En particulier, elle a suggéré de reconsidérer les concepts de base tel
que l'existence du monde qui est, au moins jusqu'à un certain point, indépendant de l'observateur, la
possibilité d'en avoir une connaissance fiable et objective et la possibilité de rendre (sous des
circonstances appropriées) objectives certaines propriétés possédées par les systèmes physiques.
Elle a aussi soulevé plusieurs autres questions qui sont bien connues comme celles impliquées dans
le débat sur l'interprétation de ces piliers de la science moderne. On peut affirmer que la plus part
des problèmes sont non seulement dû à la nature intrinsèquement révolutionnaire des phénomènes
qui ont conduit au développement de la théorie mais qu'ils sont aussi reliés au fait que, dans sa
formulation et interprétation standard, la mécanique quantique est une théorie qui est excellente (en
fait elle a rencontré des succès sans précédents dans l'histoire des sciences) en nous disant tout sur
ce que nous observons. Mais elle rencontre de sérieuses difficultés en nous disant ce que c'est. Nous
faisons ici spécifiquement référence au problème central de la théorie, habituellement appelé le
problème de la mesure ou, dans des termes plus appropriés, le problème d'objectivation
macroscopique. C'est juste une des nombreuses tentatives de surmonter les difficultés posées par ce
problème qui ont conduit au développement des théories avec réduction physique, c'est-à-dire au
programme de réduction dynamique. Comme nous le verrons, cette approche consiste à accepter
que l'équation dynamique de la théorie standard doive être modifiée par l'addition de termes
stochastiques et non linéaires. Le fait agréable est que la théorie résultante est capable, sur la base
d'une dynamique unique qui est supposée gouverner tous les processus naturels, d'expliquer en
même temps tous les faits bien établis sur les systèmes microscopiques comme décrit par la théorie
standard ainsi que le postulat dit de réduction du paquet d'onde. Comme c'est bien connu, un tel
postulat est supposé dans le schéma standard juste afin de garantir que les mesures ont des résultats
mais, comme nous en discuterons ci-dessous, elle rencontre des difficultés insurmontables si on
prend la mesure elle-même comme un processus gouverné par les lois linéaires de la théorie.
Finalement, les théories avec réduction expliquent d'une manière complètement satisfaisante le
comportement classique des systèmes macroscopiques.

Deux spécifications sont nécessaires afin de rendre clair dès le début quelles sont les limites et les
mérites du programme. Les seuls modèles explicites satisfaisant de ce type (qui sont
essentiellement des variations et des raffinements de la théorie initiale habituellement appelée
GRW, Ghirardi, Rimini et Weber, 1985, 1986) sont les tentatives phénoménologiques de résoudre
un problème de fondation. Actuellement, elles impliquent des paramètres phénoménologiques qui,
si la théorie est prise sérieusement, acquièrent le statut de nouvelles constantes de la nature. De
plus, jusqu'à maintenant, toutes les tentatives de construire des généralisations relativistes
satisfaisantes de ces modèles ont rencontré des difficultés mathématiques sérieuses dues à
l'apparition de divergences insolubles, même si elles élucident certains points cruciaux et suggèrent
qu'il n'y a pas de raison de principe d'empêcher d'atteindre ce but.

En dépit des remarques précédentes, leurs auteurs pensent que les théories avec réduction ont une
remarquable pertinence puisqu'elles représentent une nouvelle manière de surmonter les difficultés
du formalisme, pour fermer le cercle dans le sens précis définis par Abner Shimony (1989), une
manière qui jusqu'il y a quelques années était considérée comme impraticable et qui, au contraire, a
été montrée parfaitement viable. De plus, elles ont permis une identification claire de propriétés
formelles qui caractériseraient et unifieraient la théorie des processus micro et macro.
III.2.1. Considérations générales
Comme déjà dit, une question très naturelle à laquelle tous les scientifiques qui sont concernés par
la signification et la valeur de la science ont à faire face, est de savoir si on peut développer une vue
du monde cohérente qui peut accommoder notre connaissance concernant les phénomènes naturels
tels qu'ils sont inclus dans nos meilleures théories. Un tel programme rencontre de sérieuses
difficultés avec la mécanique quantique, essentiellement à cause de deux aspects formels de la
théorie qui sont communs à toutes ses versions, depuis les formulations originales non relativistes
des années 20 jusqu'aux théories quantiques des champs des dernières années : la nature linéaire de
l'espace d'état et l'équation d'évolution, c'est-à-dire la validité du principe de superposition et le
phénomène relié d'intrication qui, dans les mots de Schrödinger :
Est le trait caractéristique de la mécanique quantique, le seul qui force de s'écarter entièrement des
lignes de pensée classique
[Schrödinger, 1935, p.807].

Ces deux propriétés formelles ont des conséquences embarrassantes, puisqu'elles impliquent :
- La chance objective dans les processus naturels, c'est-à-dire la nature non épistémique des
probabilités quantiques.
- Le caractère non défini objectif des propriétés physiques à la fois au niveau micro et macro.
- L'intrication objective entre des constituants spatialement séparés et sans interaction d'un
système composite, impliquant une sorte de holisme et un type précis de non-localité.

Dans le but de la généralité, nous présenterons d'abord un schéma très concis des "règles du jeu".
III.2.2. Le formalisme : un schéma concis
Rappelons la structure axiomatique de la théorie quantique :
1. Les états des systèmes physiques sont associés à des vecteurs normalisés dans un espace de
Hilbert, un espace vectoriel linéaire, complexe, de dimension infinie équipé d'un produit
scalaire. La linéarité implique que le principe de superposition est valable : si f et g sont
des états, alors (pour a et b des nombres complexes arbitraire)
(1) K = a f + b g
est aussi un état. De plus, l'évolution de l'état est linéaire, c'est-à-dire qu'elle préserve les
superpositions : si f , t et g , t sont les états obtenus en faisant évoluer les états f ,0 et
g ,0 , respectivement, depuis le temps initial t = 0 jusqu'au temps t, alors a f , t + b g , t est
l'état obtenu par l'évolution de a f ,0 + b g ,0 . Finalement, l'hypothèse de complétude est faite,
c'est-à-dire que la connaissance de son vecteur d'état représente, en principe, l'information la
plus précise qu'on peut avoir sur l'état d'un système physique individuel.
2. Les quantités observables sont représentées par des opérateurs hermitiques B sur l'espace de
Hilbert. Les équations aux valeurs propres associées B bk = bk bk et les espaces propres
correspondant (les sous-espaces linéaires générés par les vecteurs propres associés à une valeur
propre donnée) jouent un rôle de base pour le contenu prédictif de la théorie. En fait :
i. Les valeurs propres bk de l'opérateur B représentent les seuls résultats possibles dans une
mesure de l'observable correspondant.
ii. La norme (c'est-à-dire la longueur) de la projection du vecteur normalisé (c'est-à-dire de
longueur 1) décrivant l'état du système sur l'espace propre associé à une valeur propre donnée
donne la probabilité d'obtenir la valeur propre correspondante comme résultat de la mesure. En
particulier, il est utile de rappeler que quand on est intéressé par la probabilité de trouver une
particule à un endroit donné, on doit recourir à la représentation dite en espace de configuration
du vecteur d'état. Dans ce cas, le vecteur d'état devient une fonction de carré intégrable des
variables position des particules du système dont le carré du module donne la densité de
probabilité pour les résultats des mesures de position.
Nous insistons sur le fait que, selon le schéma ci-dessus, la mécanique quantique fait seulement des
prédictions probabilistes conditionnelles (conditionnelles sur la mesure réellement effectuée) pour
les résultats de processus de mesures éventuelles (et en général incompatibles). C'est seulement si
un état appartient déjà avant l'acte de mesure à un espace propre de l'observable qui est mesuré
qu'on peut prédire le résultat avec certitude. Dans tous les autres cas, si l'hypothèse de complétude
est faite, on a des probabilités objectives non épistémiques pour différents résultats.

La position orthodoxe donne une très simple raison à la question : qu'est-ce qui détermine le
résultat quand différents résultats sont possibles ? Rien. La théorie est complète et, par
conséquence, il est illégitime de poser toute question sur des propriétés possédées se référant à des
observables pour lesquels différents résultats ont des probabilités non nulles d'être obtenues. De
manière correspondante, les repères de la théorie sont les résultats des procédures de mesure. Elles
doivent être décrites en termes classiques et impliquent en général des conditions physiques
mutuellement exclusives.

Par rapport à la légitimité d'attribuer des propriétés aux systèmes physiques, on pourrait dire que la
mécanique nous prévient contre le besoin de trop de propriétés possédées réellement par les
systèmes physiques. Cependant, avec Einstein, on peut adopter une condition suffisante avec
laquelle on est capable (sans aucunement perturber le système) de prédire avec certitude le résultat
d'une mesure. Dans ce cas alors que le vecteur d'état complet se factorise en produit d'un état de
l'espace de Hilbert du système physique S et du reste du monde, S possède certaines propriétés
(réellement un ensemble complet de propriétés, c'est-à-dire celles associées à un ensemble maximal
d'observables commutant).

Avant de conclure cette section nous devons ajouter quelques commentaires sur le processus de
mesure. La théorie quantique fut créée pour traiter des phénomènes microscopiques. Afin d'obtenir
de l'information sur eux, on doit être capable d'établir des corrélations strictes entre les états des
systèmes microscopiques et les états des objets que nous pouvons percevoir. Dans le formalisme,
cela est décrit en considérant les interactions micro-macro appropriées. Le fait que quand la mesure
est complétée on puisse faire des affirmations sur le résultat est pris en compte par le postulat de
réduction déjà mentionné [Dirac, 1948] : une mesure provoque toujours un saut du système dans un
état propre de la quantité observée. De manière correspondante, le vecteur d'état de l'appareil
"saute" aussi dans l'espace propre associé au résultat enregistré.
III.2.3. Le problème de l'objectivation macroscopique
Dans cette section, nous allons clarifier pourquoi le formalisme que nous venons de présenter
conduit au problème de la mesure ou de l'objectivation macroscopique. Dans ce but, nous
discuterons en tout premier lieu de l'argument standard simplifié basé sur le schéma de mesure
idéal dit de von Neumann. Ensuite, nous discuterons des résultats plus récents [Bassi et Ghirardi,
2000] qui renoncent aux hypothèses de von Neumann.

Commençons par rappeler les points de base de l'argument standard :

Supposons qu'un microsystème S, juste avant la mesure d'un observable B, soit dans l'état propre
b j de l'opérateur correspondant. L'appareil (un macrosystème) utilisé pour obtenir l'information
sur B est initialement supposé être dans un état macroscopique précis, son état prêt, correspondant à
une propriété macroscopique définie, par exemple, son aiguille pointe sur le 0 d'une échelle.
Puisque l'appareil A est fait de particules élémentaires, atomes, etc., il doit être décrit par la
mécanique quantique, qui lui associera le vecteur d'état A0 . On suppose alors qu'il y a une
interaction système - appareil appropriée durant un temps fini telle que quant l'état initial de
l'appareil est déclenché par l'état b j , il termine dans une configuration finale A j qui est
macroscopiquement discernable de l'état initial et de l'autre configuration Ak dans laquelle il
terminerait s'il était déclenché par un état propre différent bk . De plus, on suppose que le système
est laissé dans son état initial. En bref, on suppose qu'on peut disposer les choses de manière à ce
que l'interaction système - appareil puisse être décrite comme :
(état initial ) bk A0
(1)
(état final) bk Ak
L'équation (1) et l'hypothèse que le principe de superposition gouverne tous les processus naturels
nous disent que si l'état du microsystème est une superposition linéaire de différentes états propres
(pour la simplicité, nous en considérerons seulement deux), on a :
(état initial ) (a bk + b b j ) A0
(état final) (a bk Ak + b b j A j )
(2)

Quelques remarques sont dans l'ordre :


- Le schéma est hautement idéalisé, à la fois parce qu'il prend pour garanti qu'on peut préparer
l'appareil dans un état précis, ce qui est impossible. Puisque nous ne pouvons pas avoir le
contrôle sur tous ses degrés de liberté et parce qu'il suppose que l'appareil enregistre le résultat
sans altérer l'état du système mesuré. Cependant, comme nous en discuterons ci-dessous, ces
hypothèses ne sont pas vraiment essentielles pour dériver la conclusion embarrassante à
laquelle nous devons faire face, c'est-à-dire le fait que l'état final est une superposition linéaire
de deux états correspondant à deux états macroscopiquement différents de l'appareil. Puisque
nous savons que le + représentant la superposition linéaire ne peut pas être remplacée par
l'alternative logique ou bien ... ou, le problème de mesure apparaît : quelle signification peut-on
attacher à un état des choses dans lequel deux états macroscopiquement et perceptivement
différents se produisent simultanément ?
- Comme déjà mentionné, la solution standard à ce problème est donnée par le postulat de
réduction : dans un processus de mesure, la réduction se produit : l'état final n'est pas celui
apparaissant du coté droit de l'équation (2) mais, puis qu'une objectivation macroscopique se
produit, il est
2 2
(3) ou bien bk Ak ou bien b j A j avec respectivement des probabilités a et b .

Jusqu'à ce jour, il y a un consensus général que la solution est absolument inacceptable pour deux
raisons de base :
1. Cela correspond à supposer que la nature linéaire de la théorie est brisée à un certain niveau.
Donc, que la théorie quantique est incapable d'expliquer comment il peut arriver que l'appareil
se comporte comme requit par le postulat de réduction (qui est un des axiomes de la théorie).
2. Même si on accepte que la mécanique quantique a un domaine limité d'application, tel qu'elle
ne prend pas en compte tous les processus naturels et, en particulier, échoue au niveau
macroscopique, il est clair que la théorie ne contient aucun critère précis pour identifier la limite
entre micro et macro, linéaire et non linéaire, déterministe et stochastique, réversible et
irréversible. Avec les mots de J.S. Bell, il n'y a rien dans la théorie qui fixe une telle limite et la
séparation entre les deux types précédents de processus est fondamentalement mouvant. De fait,
si on regarde le débat historique sur ce problème, on peut facilement voir que c'est précisément
en recourant continuellement à cette ambiguïté sur la séparation que les adhérents de
l'orthodoxie de Copenhague ou les résolveurs faciles [Bell, 1990] du problème de la mesure ont
rejeté les critiques des hérétiques [Gottfreid, 2000]. Par exemple, Bohr réussit à rejeter les
critiques d'Einstein à la conférence de Solvay en insistant sur le fait que certaines parties
macroscopiques de l'appareil doivent être traitées entièrement par la mécanique quantique. Von
Neumann et Wigner déplacèrent la séparation en la localisant entre le physique et la conscience
(mas qu'est-ce que la conscience ?), etc. D'autres proposèrent aussi des solutions au problème,
en particulier certaines des interprétations des mondes multiples, souffrant d'ambiguïtés
analogues.

Ce n'est pas notre tâche de passer ici en revue les différentes tentatives de résoudre les difficultés
ci-dessus. Au contraire, nous aimerions discuter comment le problème d'objectivation
macroscopique est en effet une conséquence très générale, en fait inévitable, des hypothèses sur la
nature des mesures et non spécifiquement des hypothèses du modèle de von Neumann. Cela fut
établit dans une série de théorèmes de généralité croissante, en particulier ceux de Fine [1970],
Shimony [1974], Brown [1986] et Bush et Shimony [1996]. Peut-être que la preuve la plus directe
et générale est donnée par Bassi et Ghirardi [2000] dont nous résumons brièvement les résultats.
Les hypothèses du théorème sont :
(i) Un microsystème peut être préparé dans deux états propres différents d'un observable (tel
que, par exemple, la composante du spin le long de l'axe z) et dans une superposition de
deux états de ce type.
(ii) On a une manière suffisament fiable de "mesurer" un tel observable, signifiant que quand la
mesure est déclenchée par chacun des deux états propres ci-dessus, le processus conduit
dans la grande majorité des cas à des situations macroscopiquement et perceptivement
différentes de l'univers. Cette exigence permet les cas dans lesquels l'expérimentateur n'a
pas un contrôle parfait de l'appareil, l'appareil est intriqué avec le reste de l'univers,
l'appareil fait une erreur ou le système mesuré est altéré ou même détruit dans le processus
de mesure.
(iii) Tout processus naturel obéit aux lois linéaires de la théorie.
A partir de ces hypothèses très générales on peut montrer que, en répétant le processus de mesure
sur des systèmes préparés dans la superposition des deux états propres donnés, dans la grande
majorité des cas on termine dans une superposition de situations macroscopiquement et
perceptivement différentes de l'univers entier. Si on veut avoir une situation finale acceptable, on
minore le fait que nous avons des perceptions définies, on est alors forcé de briser la linéarité de la
théorie à une étape appropriée.
III.2.4. La naissance des théories avec réduction physique
Le débat sur le problème de l'objectivation macroscopique a continué plusieurs années après les
débuts de la mécanique quantique. Au début des années 50, une étape importante fut franchie par
D. Bohm qui présenta [Bohm, 1952] un achèvement déterministe mathématiquement précis de la
mécanique quantique (la mécanique bohmienne). Dans le domaine des théories avec réduction, on
devrait mentionner la contribution de Bohm et Bub [1966] qui était basée sur les interactions du
vecteur d'état avec des variables cachées de Wiener - Siegel. Mais passons aux théories avec
réduction (physique) dans le sens couramment attaché à cette expression.

Différentes investigations durant les années 70 peuvent être considérées comme des étapes
préliminaires pour les développements subséquents. Dans les années 1970-1972, L. Fonda, A.
Rimini, T. Weber et Ghirardi furent sérieusement concernés par le processus de désintégration
quantique et en particulier par la possibilité de dériver, dans un contexte quantique, la loi de
désintégration exponentielle [Fonda, Ghirardi, Rimini et Weber, 1973, Fonda et al., 1978].
Certaines propriétés de cette approche sont extrêmement pertinentes pour le programme de
réduction dynamique. Listons les :
- On traite de systèmes physiques individuels.
- Le vecteur d'état est supposé subir un processus aléatoire à des moments aléatoires induisant
des changements soudain le conduisant ou bien dans l'espace linéaire de l'état instable ou dans
celui des produits de désintégration.
- Pour rendre ce traitement assez général (l'appareil ne sait pas quelle sorte de système installé il
teste), on est conduit à identifier le processus aléatoire avec un processus de localisation des
coordonnées relatives des fragments de désintégration. Une telle hypothèse combinée avec la
dynamique résonnante particulière caractérisant un système instable conduit de manière
complètement générale au résultat désiré. La "base de position relative" est la base privilégiée
de cette théorie.
- Des idées analogues ont été appliquées aux processus de mesure [Fonda, Ghirardi, Rimini,
1973].
- L'équation finale pour l'évolution au niveau de l'ensemble est du type de semi-groupe
dynamique quantique et a une structure extrêmement similaire à celui final de la théorie GRW.
Evidemment, dans ces articles le processus de réduction qui était impliqué n'était pas supposé être
un processus naturel "spontané et fondamental", mais dû aux interactions système - environnement.

A peu près la même année, P. Pearle [Pearle, 1976, 1979] et subséquemment N. Gisin [Gisin, 1984]
et d'autres ont pris en considération l'idée d'expliquer le processus de réduction en termes d'une
équation différentielle stochastique. Cependant, ils n'avaient pas donné de suggestion générale sur
comment identifier les états auxquels l'équation dynamique conduirait. En effet, ces états étaient
supposés dépendre du processus particulier de mesure que l'on considérait. Sans une identification
claire de ce point, il n'y avait aucune manière d'identifier le mécanisme dont l'effet pourrait être
négligeable pour les microsystèmes mais extrêmement pertinent pour les macroscopiques. N. Gisin
donna subséquemment une démonstration extrêmement intéressante [Gisin, 1989] que les
modifications linéaires de l'équation standard sans stochasticité sont inacceptables puisqu'elles
impliquent la possibilité d'envoyer des signaux supraluminiques. Un peu après, R. Grassi et
Ghirardi [Ghirardi et Grassi, 1991] ont montré que les modifications stochastiques sans non-
linéarité peuvent au plus induire un ensemble et non des réductions individuelles, c'est-à-dire
qu'elles ne garantissent pas que le vecteur d'état de chaque système physique individuel soit conduit
dans un sous espace correspondant à des propriétés définies.
III.2.5. Le modèle de réduction original
Comme déjà mentionné, la théorie avec réduction [Ghirardi, Rimini et Weber, 1986] que nous
allons décrire consiste à accepter des modifications de la loi d'évolution standard de la théorie tel
que les microprocessus et les macroprocessus soient gouvernés par une dynamique unique. Une
telle dynamique doit impliquer que l'interaction micro-macro dans un processus de mesure
conduise à la réduction. En gardant cela à l'esprit, rappelons que la propriété caractéristique
distinguant l'évolution quantique de la réduction est que, bien que l'équation de Schrödinger soit
linéaire et déterministe (au niveau de la fonction d'onde), la réduction est non linéaire et
stochastique. Il est alors naturel de considérer, comme cela fut suggéré, la possibilité de
modifications non linéaires et stochastiques de la dynamique standard de Schrödinger. Cependant,
la tentative initiale d'implémenter cette idée ne fut pas satisfaisante pour différentes raisons. La
première, dont nous avons déjà discuté, concerne le choix de la base privilégiée : si on désire avoir
un mécanisme universel conduisant aux réductions, dans quel sous espace linéaire devrait conduire
le mécanisme de réduction le vecteur d'état ? Ou, de manière équivalente, quelles "potentialités"
(généralement) incompatibles de la théorie standard devrait-on choisir de rendre réelles ? La
seconde, appelée le problème du déclenchement par Pearle [Pearle, 1989] est le problème de
comment le mécanisme de réduction peut devenir de plus en plus effectif du domaine micro au
macro. La solution de ce problème constitue la propriété centrale des théories avec réductions du
type GRW. Pour discuter ces points, résumons brièvement le premier modèle consistant avec
réduction [Ghirardi, Rimini et Weber 1985] apparu dans la littérature.

Dans un tel modèle, appelé initialement modèle avec localisation spontanée, le problème du choix
de la base privilégiée est résolu en remarquant que la plus part des superpositions embarrassantes,
au niveau macroscopique, sont celles impliquant différentes localisations spatiales des objets
macroscopiques. En réalité, comme signalé par Einstein [Born, 1971, p.223], c'est un point crucial
auquel doivent faire face tous ceux qui tentent de prendre une position macro-objective sur les
phénomènes naturels : "un corps macroscopique doit toujours avoir une position quasi nette dans la
description objective de la réalité". Par conséquent, le modèle avec localisation spontanée considère
la possibilité de processus spontanés qui sont supposés se produire instantanément et au niveau
microscopique qui tendent à supprimer les superpositions linéaires de différents états localisés. Le
mécanisme de déclenchement requis doit alors s'en suivre de manière consistante.
L'hypothèse clé du modèle avec localisation spontanée est la suivante : chaque constituant
élémentaire de tout système physique est sujet, à des moments aléatoires, à des processus de
localisation aléatoires et spontanés (que nous appelons coups) autour de positions appropriées. Pour
avoir un modèle mathématique précis, on doit être très spécifique sur les hypothèses précédentes.
En particulier on doit rendre explicite comment le processus fonctionne, c'est-à-dire quelles
modifications de la fonction d'onde sont induites par les localisations, où ils se produisent, c'est-à-
dire ce qui détermine l'occurrence d'une localisation à une certaine position plutôt qu'à une autre et,
finalement, quand, c'est-à-dire à quels moments ils se produisent. Les réponses à ces questions sont
les suivantes.

Considérons un système de N particules discernables et notons par F (q1 , q 2 , K , q N ) la


représentation coordonnées (fonction d'onde) du vecteur d'état (nous écartons les variables de spin
puisque les coups sont supposés ne pas agir dessus).

(a) La réponse à la question comment est alors : si un coup se produit pour la particule i au point x,
la fonction d'onde est instantanément multipliée par une fonction gaussienne (normalisée de
manière appropriée)
[( ) ]
(1) G (q i , x ) = K exp − 1 / 2 d 2 (q i − x )
2

où d est la précision de localisation. Notons


(2) Li (q1 , q 2 , K , q N ; x ) = F (q1 , q 2 , K , q N )G (q i , x )
la fonction d'onde immédiatement après la localisation, bien que non normalisée.
(b) Concernant les spécifications de où la localisation se produit, il est supposé que la densité de
probabilité P(x ) du point x où elle se produit est donnée par la norme de l'état Li (la longueur,
ou pour être plus précis, l'intégrale du carré du module de la fonction Li sur l'espace à 3N
dimensions). Cela implique que les coups se produisent avec une plus grande probabilité aux
endroits où, dans la description quantique standard, il y a une plus grande probabilité de trouver
la particule. Notons que la prescription ci-dessus introduit des éléments non linéaires et
stochastiques dans la dynamique. La constante K apparaissant dans l'expression de G (q i , x ) est
choisie de telle manière que l'intégrale de P(x ) sur l'espace entier soit égale à 1.
(c) Finalement, la question quand est répondue en supposant que les coups se produisent à des
moments distribués aléatoirement, selon une distribution de Poisson, avec une fréquence
moyenne f.

Il est immédiat de se convaincre que le processus des coups conduit, quand il se produit, à la
suppression des superpositions linéaires des états dans lesquels la même particule est bien localisée
en différentes positions séparées par une distance plus grande que d. Comme un simple exemple,
nous pouvons considérer une seule particule dont la fonction d'onde est différente de zéro
seulement en deux petites régions éloignées h et t. Supposons qu'un processus de localisation se
produit autour de h. L'état après le coup est alors différent de zéro de manière appréciable
seulement dans une région autour de h elle-même. Un argument tout à fait analogue est valable
pour le cas où le coup se produit autour de t. En ce qui concerne les points qui sont loin de h et t, on
peut facilement voir que la densité de probabilité pour de tels coups, selon la règle de multiplication
déterminant Li , s'avère être pratiquement zéro et, de plus, que si un tel coup s'était produit, après
que la fonction d'onde soit normalisée, la fonction d'onde du système resterait quasiment inchangée.

Nous pouvons maintenant discuter de la plus importante propriété de la théorie, c'est-à-dire le


mécanisme de déclenchement. Pour comprendre la manière avec laquelle le mécanisme de
localisation spontanée est amplifié par l'augmentation du nombre de particules qui sont dans des
régions éloignées (comparé à d), on peut considérer, par simplicité, la superposition S , avec des
poids égaux, de deux états pointeurs macroscopiques H et T correspondant à deux positions
différentes des pointeurs H et T, respectivement. En prenant en compte le fait que le pointeur est
"presque rigide" et contient un nombre macroscopique N de constituants microscopiques, l'état peut
être écrit, dans une notation évidente, comme :
(3) S = 1 près de h1 L N près de hN + 1 près de t1 L N près de t N
où hi est près de H et t i est près de T. Les états apparaissant dans le premier terme du coté droit de
l'équation (3) ont des représentations coordonnées qui sont différentes de zéro seulement quand
leurs arguments (1, ..., N) sont tous près de H tandis que ceux du second terme sont différents de
zéro seulement quand ils sont tous près de T. Il est maintenant évident que si une des particules
(disons la particule i) subit un processus de coup, par exemple près du point hi , la prescription de
multiplication conduit pratiquement à la suppression du deuxième terme dans (3). Donc, toute
localisation spontanée d'un des constituants consiste en la localisation du pointeur. La fréquence de
coups est donc effectivement amplifiée proportionnellement au nombre de constituants. Notons
que, pour la simplicité, l'argument fait référence à un corps pratiquement rigide, c'est-à-dire à un
corps pour lequel toutes les particules sont autour de H dans un des états de la superposition et
autour de T dans l'autre. Il devrait cependant être évident que ce qui amplifie réellement la
réduction est le nombre de particules qui sont à des positions différentes dans les deux états
apparaissant dans la superposition elle-même.

Avec ces prémisses, nous pouvons maintenant choisir les paramètres d et f de la théorie, c'est-à-dire
la précision de localisation et la fréquence moyenne de localisation. L'argument que nous venons de
donner nous permet de comprendre comment on peut choisir les paramètres de manière à ce que les
prédictions quantiques pour des systèmes microscopiques restent totalement valides tandis que les
superpositions macroscopiques embarrassantes dans des situations de mesure soient supprimées en
un temps très court. Par conséquent, comme conséquence de la dynamique unifiée gouvernant tous
les processus physiques, des objets macroscopiques individuels acquièrent des propriétés
macroscopiques définies. Le choix suggéré dans le modèle GRW est :
f = 10 −16 s −1
(4)
d = 10 −5 cm

Il s'ensuit qu'un système microscopique subit une localisation, en moyenne, tous les cent millions
d'années tandis qu'un corps macroscopique subit une localisation tous les 10 −7 seconde. Par
référence à la version défi du problème d'objectivation macroscopique présenté par Schrödinger
dans l'exemple fameux de son chat, J.S. Bell commente [Bell, 1987, p.44] : [dans le modèle avec
localisation spontanée] le chat n'est pas à la fois mort et vivant pendant plus d'une fraction de
seconde. A coté de la fréquence extrêmement faible des coups pour les systèmes microscopiques,
également le fait que la largeur de localisation est grande par rapport aux dimensions des atomes
(ainsi, même quand une localisation se produit, il fait très peu violence à l'économie interne d'un
atome) joue un rôle important qui garantit qu'aucune violation des prédictions bien testées de la
mécanique quantique n'est impliquée par la dynamique modifiée.
Quelques remarques sont appropriées. Tout d'abord, le modèle avec localisation spontanée étant
formulé de manière précise, permet de localiser précisément la "division" entre micro et macro,
réversible et irréversible, quantique et classique. La transition entre les deux types de "régimes" est
gouvernée par le nombre de particules qui sont à des positions bien localisées éloignées de plus de
10 −5 cm dans les deux états dont la cohérence doit être en fait, une partie essentielle du programme
consistant à prouver que ses prédictions ne contredisent pas de fait établit sur les microsystèmes et
les macrosystèmes.
III.2.6. Le modèle de localisation spontanée continu
Le modèle que nous venons de présenter (le modèle avec localisation spontanée) a un sérieux
problème : il ne permet pas de travailler avec des systèmes contenant des constituants identiques
car il ne respecte pas la nécessité de symétrie ou d'antisymétrie de telles particules. Une idée assez
naturelle pour surmonter cette difficulté serait de relier le processus de coup non pas aux particules
individuelles mais à la densité du nombre de particule moyennée sur un volume approprié.
Cependant, incorporer cette idée dans le schéma du modèle avec localisation spontanée
nécessiterait l'introduction d'une nouvelle constante à coté des deux qui apparaissent déjà dans le
modèle.

Une solution plus satisfaisante à ce problème peut être obtenue en injectant les principes physiques
appropriés du modèle GRW dans l'approche de P. Pearle. Celle ligne de pensée a conduit à une
formulation assez élégante d'un modèle de réduction dynamique, habituellement appelé le modèle
de localisation spontanée continu [Pearle, 1989, Ghirardi, Pearle et Rimini, 1990] dans lequel les
sauts discontinus qui caractérisent le modèle avec localisation spontanée sont remplacés par une
évolution stochastique continue dans l'espace de Hilbert (une sorte de mouvement brownien du
vecteur d'état).

Nous n'entrerons pas dans les détails plutôt techniques de ce développement intéressant de la
proposition originale de GRW puisque les idées de base et les implications physiques sont
exactement les mêmes que ceux de la formulation originale. Actuellement, on peut affirmer que
l'idée ci-dessus de saisir le problème des particules identiques en considérant le nombre moyen de
particules dans un volume approprié est correct. En fait, il a été prouvé [Ghirardi, Pearle et Rimini,
1990] que pour toute dynamique du modèle de localisation spontanée continu il y a une dynamique
des coups qui, d'un point de vue physique, est "aussi proche que l'on veut". Au lieu d'entrer dans les
détails du formalisme du modèle de localisation spontanée continu, il est utile, pour la discussion
ci-dessous, d'analyser une version simplifiée.
III.2.7. Une version simplifiée du modèle de localisation spontanée
continu
Dans le but de comprendre les implications physiques du modèle de localisation spontanée continu
tel que le taux de suppression de la cohérence, nous faisons maintenant quelques hypothèses
simplificatrices. Tout d'abord, nous supposons que nous traitons seulement d'un seul type de
particule (par exemple les nucléons), deuxièmement nous écartons le terme de Schrödinger
standard dans l'évolution et, finalement, nous divisons l'espace complet en cellules de volume d 3 .
Nous notons n1 , n2 ,K un état dans lequel il y a ni particules dans la cellule i et nous considérons
une superposition de deux états n1 , n2 ,K et m1 , m2 ,K qui diffèrent dans les nombres
d'occupation des différentes cellules de l'univers. Avec ces hypothèses, il est assez facile de prouver
que le taux de suppression de la cohérence entre les deux états (afin que l'état final soit un des deux
et pas leur superposition) est gouverné par la quantité :
{ [ ]}
(1) exp − f (n1 − m1 ) + (n 2 − m2 ) + L t
2 2

la somme étant étendue à toutes les cellules de l'univers. En dehors des différences reliées à
l'identité des constituants, la physique complète est assez similaire à celle impliquée par le modèle
avec localisation spontanée. Evidemment, il y a des implications physiques intéressantes qui
méritent d'être discutées. Une analyse détaillée a été présentée par Ghirardi et Rimini [1990].
Comme ils l'ont montré et comme cela suit d'estimations sur les effets possibles pour les dispositifs
supraconducteurs [Rae, 1990, Gallis et Fleming, 1990, Rimini, 1995] et pour l'excitation des
atomes [Squires, 1991], il ne s'avère pas possible, avec la technologie actuelle, d'effectuer des
expériences claires permettant de discriminer le modèle de la mécanique quantique standard
[Benatti et al., 1995].

Il y a cependant un aspect intéressant qui peut être pertinent pour l'idée de relier la suppression de
la cohérence aux effets gravitationnels. Etant donné l'équation (1), notons que le scénario de pire
cas (du point de vue du temps nécessaire à supprimer la cohérence) est la superposition de deux
états pour lesquels les nombres d'occupation des cellules individuelles diffère seulement d'une
unité. En effet, dans ce cas l'effet d'amplification en prenant le carré des différences disparaît.
Soulevons alors la question : combien de nucléons (au pire) doivent occuper des cellules différentes
afin pour la superposition donnée d'être dynamiquement supprimée dans le temps qui caractérise
les processus de perception humaine ? Puisqu'un tel temps est de l'ordre de 10 −2 seconde et
f = 10 −16 seconde, le nombre de nucléons déplacés doit être de l'ordre de 1018 , ce qui correspond,
avec une précision remarquable, à la masse de Planck. Cette image semble pointer dans la même
direction que les tentatives telle que celle de Penrose de relier le mécanisme de réduction aux effets
gravitationnels quantiques [Penrose, 1989].
III.2.8. Succès des théories avec réduction
A. Pais rappelle dans sa biographie d'Einstein :
Nous avons souvent discuté de ces notions de réalité objective. Je me rappelle que durant une
promenade, Einstein s'arrêta soudainement, se tourna vers moi et me demanda si je croyais
vraiment que la Lune existe seulement quand je la regarde.
[Pais, 1982, p.5]

Dans le contexte de la remarque d'Einstein dans Albert Einstein, scientifique philosophe [Schilpp,
1949], nous pouvons voir cette référence à la Lune comme un exemple extrême de "un fait qui
appartient entièrement à la sphère des concepts macroscopiques", tout comme une marque sur une
bande de papier qui est utilisée pour enregistrer le résultat d'une expérience de désintégration,
tel que
Par conséquent, il y a peu de chance que quelqu'un qui serait incliné à considérer sérieusement
[...] que l'existence d'une position est essentiellement dépendante de la réalisation d'une
observation faites sur la bande d'enregistrement. Dans la sphère macroscopique il est considéré
comme certain qu'on doive adhérer au programme d'une description réaliste dans l'espace et du
temps, tandis que dans la sphère des situations microscopiques on est plus facilement incliné à
donner ou au moins à modifier ce programme
[p.671].
Cependant,
Le "macroscopique" et le "microscopique" sont si mélangés qu'il semble impossible de conduire ce
programme dans le "microscopique" seul.
[p.674]

On peut spéculer qu'Einstein n'aurait pas pris le programme de réduction dynamique sérieusement,
étant donné que c'est un programme fondamentalement indéterministe. D'un autre coté, le
programme de réduction dynamique permet précisément cette base moyenne entre donner une
"description réaliste dans l'espace et le temps" tout inclus (la Lune n'est pas là quand personne de la
regarde) et nécessitant qu'elle soit applicable aussi au niveau microscopique (une certaine sorte de
théorie à "variables cachées"). Il semblerait que la poursuite du "réalisme" d'Einstein était plus un
programme ayant des tentatives bienvenues de donner ou d'affaiblir les nécessités microréalistes
pourvu qu'elles permettent d'adopter une position macroréaliste.

Dans le programme de réduction dynamique, nous pouvons dire d'un électron dans une situation
EPR de Bohm que "lorsque personne ne le regarde", il n'a pas de direction ou de spin définit et en
particulier que quand il est dans une superposition de deux états localisés éloignés l'un de l'autre, il
ne peut pas être vu comme ayant une place définie. Dans la réalité macroscopique, cependant, les
objets ont des places définies et sont généralement descriptibles en termes classiques. C'est-à-dire
que le programme de réduction dynamique n'ajoute pas de "variables cachées" à la théorie mais la
Lune est définitivement là même quand aucun être conscient ne l'avait jamais vue ou, avec les mots
de J.S. Bell, le programme de réduction dynamique
permet à des électrons (dans des microsystèmes généraux) de jouir du brouillard des ondes tout en
permettant aux tables, aux chaises et à nous-mêmes et aux traces sur les photographies d'être
plutôt bien définies à une place plutôt qu'une autre et d'être décrit en des termes classiques.
[Bel, 1986, p.364]

Un tel programme, comme nous l'avons vu, est réalisé en supposant seulement l'existence de
fonctions d'onde et en proposant une dynamique unifiée qui gouverne à la fois les processus
microscopiques et les "mesures". Par rapport à ces dernières, aucune définition vague n'est
nécessaire afin d'appliquer la théorie. Les équations sont suivies exactement et les ambiguïtés
macroscopiques qui se produiraient avec l'évolution linéaire sont théoriquement possibles mais
seulement pendant une durée momentanée et donc on peut dire sans importance pratique et sans
source d'embarras.

Nous n'avons pas encore analysé l'implication sur la localité, mais puisque dans le programme de
réduction dynamique aucune variable cachée n'est introduite, la situation ne peut pas être pire que
dans la mécanique quantique ordinaire : "en ajoutant de la précision mathématique aux sauts de la
fonction d'onde, elle rend simplement précise l'action à distance de la mécanique quantique
ordinaire" [Bell, 1987, p.46]. En effet, une investigation détaillée des propriétés de localité de la
théorie devient possible et on peut analyser si la théorie représente une approximation d'une théorie
invariante relativiste. L'analyse effectuée jusqu'ici, cependant, prouve qu'au moins dans la version
non relativiste, un programme de réduction dynamique peut être développé de manière consistante.
De plus, comme cela deviendra clair quand nous discuterons de l'interprétation de la théorie en
terme de densité de masse, les théories du modèle avec localisation spontanée et du modèle de
localisation spontanée continu conduisent d'une manière naturelle à attacher des propriétés définies
dans l'espace et le temps aux objets macroscopiques, le principal objectif des exigences d'Einstein.

Les résultats du programme de réduction dynamique qui sont pertinents pour le débat sur les
fondations de la mécanique quantique peuvent aussi être résumés de manière concise avec les mots
de H.P. Stapp :
Le mécanisme de réduction proposé pourrait être vu, d'un coté, comme des mutilations ad hoc
conçues pour forcer l'ontologie à s'agenouiller devant les préjugés. D'un autre coté, ces
propositions montrent qu'on peut certaine ériger une ontologie quantique cohérente qui se
conforme généralement aux idées ordinaires au niveau macroscopique.
[Stapp, 1989, p.157]
III.2.9. Modèles de réduction dynamique relativistes
Quand on est confronté avec un nouveau schéma théorique, particulièrement avec un qui, comme
nous l'avons vu [Bell, 1987], "rend précis l'action à distance de la mécanique quantique ordinaire",
on est naturellement conduit à soulever la question de si elle représente une approximation d'une
théorie invariante relativiste. Dans cette relation, il est utile de mentionner, en tout premier lieu,
certaines investigations récentes intéressantes des aspects non locaux du modèle de localisation
spontanée continu.

Comme c'est bien connu, [Suppes et Zanotti, 1976, van Fraassen, 1982, Jarrett, 1984, Shimony,
1983], l'hypothèse de localité de Bell est équivalente à la conjonction de deux autres hypothèses,
dans la terminologie de Shimony, l'indépendance aux paramètres et l'indépendance aux résultats.
Vu la violation expérimentale des inégalités de Bell, on doit abandonner une de ces deux
hypothèses. La division ci-dessus de la requête de localité en deux conditions logiquement
indépendantes est particulièrement utile en discutant les différents statuts du modèle de localisation
spontanée continu et des théories à variables cachées déterministes par rapport aux exigences
relativistes. En fait, comme prouvé par Jarrett lui-même, quand l'indépendance aux paramètres est
violée, si on a accès aux variables qui spécifient complètement l'état de systèmes physiques
individuels, on pourrait envoyer des signaux plus rapides que la lumière d'une partie de l'appareil à
l'autre. De plus, [Ghirardi et Grassi, 1994, 1996] il a été montré qu'il est impossible de construire
une véritable théorie invariante relativiste qui, dans sa limite non relativiste, exhibe une dépendance
aux paramètres et n'implique pas de retours dans le temps. D'autre part, si la localité est violée
seulement par l'occurrence d'une dépendance aux résultats alors les signaux plus rapides que la
lumière ne peuvent pas être obtenus.

Maintenant, il est bien connu que toute théorie déterministe (c'est-à-dire une dans laquelle le
domaine de toutes les distributions de probabilité pour les résultats est l'ensemble {0,1}) qui
reproduit les prédictions quantiques doit exhiber une dépendance aux paramètres. Ce fait en lui-
même suggère que de telles théories rencontreront certainement de plus sérieuses difficultés avec la
relativité que des théories comme la mécanique quantique standard qui viole seulement
l'indépendance aux résultats et qui ne permet pas de signaux plus rapides que la lumière [Eberhard,
1978, Ghirardi, Rimini et Weber, 1980, Gihrardi, Grassi, Rimini et Weber, 1988]. Qu'en est-il du
modèle de localisation spontanée continu ? Il a été possible de prouver [Ghirardi, Grassi,
Butterfield et Fleming, 1993, Butterfield et al., 1993] qu'elle aussi viole la localité de Bell
seulement en violant l'indépendance aux résultats. C'est à un certain point encourageant, même si,
comme nous serons conduit à conclure, il semble très difficile de construire un modèle relativiste
incluant les réductions, ce résultat montre qu'il n'y a pas de raisons de principe à rendre un tel projet
non viable.

Soyons plus spécifique. La première tentative d'obtenir une généralisation relativiste des modèles
de réduction dynamique fut présentée par Pearle [1990]. On doit insister sur le fait qu'avoir des
réductions individuelles empêche la théorie d'être invariante au niveau individuel (notez que le
modèle avec localisation spontanée et le modèle de localisation spontanée continu ne sont même
pas invariant de Galilée au niveau individuel). On est donc conduit à introduire une généralisation
de l'exigence d'invariance : la théorie doit être stochastiquement invariante. Cela signifie que,
même si le processus individuel peut sembler différent à différents observateurs, ils seront d'accord
sur la composition de l'ensemble final pour (subjectivement) les mêmes conditions initiales. Nous
remarquerons que c'est précisément dans ce sens qu'à la fois le modèle avec localisation spontanée
et le modèle de localisation spontanée continu s'avèrent être invariant de Galilée.

Pearle [1990] considéra un champ de fermions couplé à un champ de mésons et a mis en avant
l'idée de localisation induite pour les fermions à travers leur couplage aux mésons et un mécanisme
de réduction dynamique stochastique agissant sur les variables mésons. Il considéra des équations
d'évolution de Heisenberg pour les champs couplés et une équation d'évolution de type modèle de
localisation spontanée continu Tomonaga - Schwinger avec un couplage biaisé hermitique d'un
potentiel complexe stochastique pour le vecteur d'état. Cette approche a été systématiquement
analysée par Ghirardi, Grassi et Pearle [1990a, 1990b]. Ici nous nous limiterons à souligner que
sous certaines approximations on obtient à la limite non relativiste une équation de type modèle de
localisation spontanée continu induisant une localisation spatiale. Cependant, à cause de la nature
de bruit blanc du potentiel stochastique, de nouveaux problèmes de renormalisation se posent :
l'accroissement par unité de temps et par unité de volume de l'énergie du champ de méson est infini
à cause du fait qu'une infinité de mésons sont créés. Pour les raisons dont nous venons de discuter,
on ne peut pas dire que la possibilité de généraliser le modèle de localisation spontanée continu au
cas relativiste a été bien établi. Même les tentatives plus récentes n'ont pas réussi à surmonter ces
difficultés.

Néanmoins, les efforts qui ont été dépensés sur un tel programme ont conduit à une meilleure
compréhension de certains points et ont mis en lumière des questions conceptuelles importantes.
Premièrement, elles ont conduit à une formulation complètement générale et rigoureuse du concept
d'invariance stochastique [Ghirardi, Grassi et Pearle, 1990]. Deuxièmement, elles ont incité une
reconsidération critique, basée sur la discussion des observables dispersés avec un support compact,
du problème de localité au niveau individuel. Cette analyse a montré la nécessité de reconsidérer le
critère pour l'attribution de propriétés locales objectives aux systèmes physiques. Dans des
situations spécifiques, on ne peut pas attribuer de propriété locale à un microsystème : toute
tentative de faire cela conduit à des ambiguïtés. Cependant, dans le cas de systèmes
macroscopiques, l'impossibilité de leurs attribuer des propriétés locales (ou, de manière
équivalente, l'ambiguïté entourant de telles propriétés) dure seulement un intervalle de temps de
l'ordre de celui nécessaire pour que la réduction dynamique prenne place. De plus, aucune propriété
objective correspondant à un observable local, même pour les microsystèmes, ne peut émerger
comme une conséquence d'un événement de type mesure se produisant dans une région séparée de
type espace : de telles propriétés émergent seulement dans le futur du cône de lumière de
l'événement macroscopique considéré. Finalement, des analyses récentes [Ghirardi et Grassi, 1994,
1996, Ghirardi, 1996, 2000] ont montré que la structure formelle de la théorie est telle qu'elle ne
permet pas, même conceptuellement, d'établir des relations de cause à effet entre des événements
spatialement séparés.

Après avoir listé certains résultats intéressant parmi ces lignes, en conclusion de cette section, il est
nécessaire d'insister une fois de plus sur les immenses difficultés que le programme d'une
généralisation relativiste a rencontré jusqu'à maintenant. La question de savoir si un tel programme
trouvera une formulation satisfaisante reste encore le "grand problème" de ce type de recherche.
III.2.10. Théories avec réduction et perceptions définies
Certains auteurs [Albert et Vaidman, 1989, Albert, 1990, 1992] ont soulevé une objection
intéressante concernant l'émergence de perceptions définies dans les théories avec réduction.
L'objection est basée sur le fait qu'on peut facilement imaginer des situations conduisant à des
perceptions définies qui néanmoins n'impliquent pas le déplacement d'un grand nombre de
particules jusqu'à l'étape de perception elle-même. Ces cas constitueraient alors des situations
réelles de mesure qui ne peuvent pas être décrites par le modèle avec localisation spontanée,
contrairement à ce qui se passe pour les situations idéalisées (selon les auteurs) considérées dans le
modèle avec localisation spontanée, c'est-à-dire celles impliquant le déplacement d'une certaine
sorte de pointeur. Pour être plus spécifique, les raisonnements ci-dessus considèrent un processus
de "mesure" dont la sortie est l'émission d'un jaillissement de photons. Cela peut facilement être
conçu en considérant, par exemple, un dispositif de Stern-Gerlach dans lequel les deux chemins
suivis par le microsystème selon la valeur de la composante de son spin heurtent un écran
fluorescent et excitent un petit nombre d'atomes qui se désintègrent subséquemment en émettant un
petit nombre de photons. L'argument est le suivant : puisque seuls quelques atomes sont excités,
puisque les excitations impliquent des déplacements qui sont plus petit que la distance de
localisation caractéristique du modèle avec localisation spontanée, puisque le modèle avec
localisation spontanée n'induit pas de réductions des états des photons et finalement puisque les
états des photons se recouvrent immédiatement, il n'y a aucune manière pour que le mécanisme de
localisation spontané devienne effectif. La superposition des états "photons émergeant du point A
de l'écran" et de "photons émergeant du point B de l'écran" continuera un long moment. D'un autre
coté, puisque la perception visuelle est déclenchée assez facilement (environ 6 à 7 photons), il n'y a
aucun doute que l'œil nu d'un observateur humain est suffisant pour détecter si le spot lumineux sur
l'écran est en A ou B. La conclusion est la suivante : dans le cas considéré, aucune réduction
dynamique ne peut prendre place et par conséquence aucune mesure n'est faite, aucun résultat
défini, jusqu'au moment où la conscience de l'observateur perçoit le spot.

Nous avons présenté une réponse détaillée à cette critique [Aicardi et al., 1991]. Les points
cruciaux de notre argumentation sont les suivants : nous sommes parfaitement d'accord que dans le
cas considéré la superposition persiste un long moment (réellement, la superposition doit persister
puisque le système considéré étant microscopique on pourrait effectuer des expériences
d'interférences que tout le monde attendrait confirmer la mécanique quantique). Cependant, pour
traiter de la manière appropriée et correcte une telle critique, on doit considérer tous les systèmes
qui entrent en jeu (électron, écran, photons et cerveau) et la dynamique universelle gouvernant tous
les processus physiques pertinents. Une simple estimation du nombre d'ions qui sont impliqués
dans le mécanisme de perception visuelle rend parfaitement plausible que, dans le processus, un
nombre suffisant de particules sont déplacées d'une quantité spatiale suffisante pour satisfaire les
conditions sous lesquelles, selon le modèle avec localisation spontanée, la suppression de la
superposition des deux signaux nerveux prend place dans la même échelle de perception.

Pour éviter les mauvaises compréhensions, cette analyse ne signifie pas qu'on tente d'attribuer un
rôle spécial à l'observateur conscient ou à la perception. Le cerveau de l'observateur est le seul
système présent dans le dispositif dans lequel une superposition des deux états impliquant
différentes localisations d'un grand nombre de particules se produit. Comme tel, c'est le seul endroit
où la réduction peut et doit réellement prendre place selon la théorie. Il est extrêmement important
d'insister sur le fait que si à la place des yeux d'un être humain on place en face du flux de photons
une chambre à étincelles ou un dispositif conduisant au déplacement d'un pointeur macroscopique
ou produisant des points d'encre sur une sortie informatique, la réduction prend également place.
Dans l'exemple donné, le système nerveux humain est simplement un système physique, un
assemblage spécifique de particules qui effectue la même fonction qu'un de ces dispositifs, si aucun
autre dispositif n'interagit avec les photons avant que l'observateur humain ne le fasse. Il s'ensuit
qu'il est incorrect et sérieusement trompeur d'affirmer que le modèle avec localisation spontanée
nécessite un observateur conscient pour rendre définie les propriétés macroscopiques des systèmes
physiques.

Une remarque supplémentaire peut être appropriée. L'analyse ci-dessus pourrait être prise par le
lecteur comme indiquant une attitude très naïve et sursimplifiée envers le problème profond de la
correspondance esprit - cerveau. Il n'y a aucune affirmation et aucune présomption que le modèle
avec localisation spontanée permet une explication physique de la perception consciente. Il est
seulement signalé que, pour ce que nous savons des aspects purement physiques du processus, on
peut dire qu'avant que les impulsions nerveuses atteignent le cortex visuel supérieur, les conditions
garantissent la suppression d'un des deux signaux. En bref, une utilisation consistante du
mécanisme de réduction dynamique dans la situation ci-dessus explique l'aspect défini de la
perception consciente même dans la situation extrêmement particulière imaginée par Albert et
Vaidmann.
III.2.11. L'interprétation de la théorie
Comme signalé au début, le problème le plus sérieux de la mécanique quantique standard tient au
fait qu'elle est extrêmement réussie en nous disant ce que nous observons mais est basiquement
silencieuse sur ce qu'elle est. La propriété spécifique est très reliée à l'interprétation probabiliste du
vecteur d'état combiné avec la supposition de complétude de la théorie. Notons que ce qui est
discuté est l'interprétation probabiliste et pas le caractère probabiliste de la théorie. Les théories
avec réduction ont aussi un caractère fondamentalement stochastique mais à cause de leur propriété
la plus spécifique, c'est-à-dire celle de guider le vecteur d'état de tout système physique individuel
dans un espace propre approprié et physiquement significatif, elle permet une interprétation
différente. En fait, on pourrait dire (si on désire éviter qu'elles aussi, comme la théorie standard,
parlent uniquement de ce que nous trouvons) qu'elles imposent une interprétation différente, une
qui explique nos perceptions au niveau approprié, c'est-à-dire macroscopique.

La question de l'interprétation correcte de la théorie a été le sujet de débats, certaines des approches
principales ayant commencé avec J.S. Bell. Etant donné que la fonction d'onde elle-même est un
objet dans l'espace de configuration (de grande dimension), Bell fut particulièrement enthousiasmé
d'identifier ce qu'on pourrait prendre comme une sorte de "pouvoir local" à partir duquel on
pourrait obtenir une représentation de la réalité perçue dans l'espace ordinaire à trois dimensions.
Dans le contexte spécifique du modèle avec localisation spontanée, Bell [1987, p.45] a suggéré que
les "sauts GRW", que nous avons appelé "coups" ci-dessus, pourraient jouer ce rôle. Plus tard, il a
suggéré que l'interprétation la plus naturelle pour la fonction d'onde dans le contexte d'une théorie
avec réduction pourrait être comme décrivant la "densité [...] tissu" dans l'espace de configuration
[Bell, 1990, p.30]. L'interprétation qui, selon l'opinion de Ghirardi, est la plus appropriée pour les
théories avec réduction [Ghirardi, Grassi et Benatti, 1995, Ghirardi, 1997, 1997] fut ultimement
développée à partir de cette suggestion ainsi qu'avec la ferme conviction qu'une interprétation
acceptable devrait établir un lien précis entre notre description formelle des processus physiques et
les événements qui prennent place dans l'espace à trois dimensions que nous "voyons" autour de
nous.

En tout premier lieu, différentes analyses [Pearle et Squires, 1994] ont rendu clair que le modèle
avec localisation spontanée et le modèle de localisation spontanée continu nécessitent une
modification c'est-à-dire que la fréquence caractéristique de localisation des constituants
élémentaires de la matière doit être rendue proportionnelle à la masse caractérisant la particule
considérée. En particulier, la fréquence originale du processus des coups f = 10 −16 seconde est
celle caractérisant les nucléons, tandis que, par exemple, les électrons souffriraient de coups avec
une fréquence réduite d'environ 2000 fois. Malheureusement, nous n'avons pas la place pour
discuter ici des raisons physiques qui font que ce choix est approprié. Nous renvoyons le lecteur à
l'analyse récente détaillée de Peruzzi et Rimini [Peruzzi et Rimini, 2000]. Avec cette modification,
ce que la dynamique linéaire s'efforce de rendre "objectivement défini" est la distribution moyenne
de masse dans l'univers entier (moyennée sur des volumes appropriés associés avec la précision de
localisation caractéristique de la théorie). Deuxièmement, une reconsidération critique profonde
[Ghirardi, Grassi et Benatti, 1995] a rendu évident combien le concept de "distance" qui caractérise
l'espace de Hilbert est inapproprié dans l'explication de la similarité ou les différences entre les
situations macroscopiques. Juste pour donner un exemple convainquant, considérons trois états h ,
h ∗ et t d'un macrosystème (disons un bloc macroscopique massif de matière), le premier
correspondant à une localisation ici, le second ayant la même localisation mais un de ses atomes
(ou molécules) étant dans un état orthogonal à l'état correspondant à h et le troisième ayant
exactement le même état interne que le premier mais étant localisé différemment (là). Alors, en
dépit du fait que les deux premiers états sont pratiquement indiscernables l'un de l'autre au niveau
macroscopique, tandis que le premier et le troisième correspondent des situations complètement
différentes et directement perceptibles, la distance dans l'espace de Hilbert entre h et h ∗ est
égale à celle entre h et t .

Quand la fréquence de localisation est reliée à la masse des constituants, alors, comme ci-dessus de
manière totalement générale (c'est-à-dire même quand on travaille avec un corps qui n'est pas
totalement rigide tel qu'un gaz ou un nuage), le mécanisme conduisant à la suppression des
superpositions des différents états macroscopiques est fondamentalement gouverné par la somme
(ou l'intégrale) des différences des carrés des densités de masse associées à deux états superposés,
moyenné sur le volume caractéristique de la théorie, c'est-à-dire 10 −15 cm 3 . Cela suggère de prendre
l'attitude suivante : ce que la théorie est, ce qui est réel "au-delà" en un point de l'espace donné x est
juste la densité moyenne de masse dans le volume caractéristique autour de x :
(1) M (x, t ) = F , t M (x ) F , t
où M (x ) est l'opérateur densité de masse correspondant au volume donné autour de x et F , t est
le vecteur d'état caractérisant le système à un instant donné. Il est évident que dans la mécanique
quantique standard, une telle fonction ne peut pas être douée de toute signification physique
objective à cause de l'existence de superpositions linéaires de différentes distributions
macroscopiques de masse conduisant à des valeurs qui ne correspondent pas à ce que nous trouvons
dans des processus de mesure ou ce que nous percevons (typiquement, la superposition de poids
égaux des états h et t conduira à une distribution de densité de masse qui est la moitié de la
réelle à la fois "ici" et "là"). Mais dans un modèle de localisation spontanée continu reliant les
réductions à la densité de masse, la dynamique, comme nous l'avons vu, supprime en des temps
extrêmement courts ces superpositions embarrassantes. Dans ce cas, si on considère seulement l'état
autorisé par la dynamique on peut donner une description du monde en terme de M (x, t ) , c'est-à-
dire qu'on retrouve une explication physiquement significative de la réalité physique dans l'espace
habituel à trois dimensions et le temps. En recourant à la quantité (1), on peut aussi définir une
"distance" appropriée entre deux états comme l'intégrale sur l'espace à trois dimensions du carré de
la différence de M (x, t ) pour deux états donnés, une quantité qui s'avère être parfaitement
appropriée pour baser le concept d'états de l'espace de Hilbert macroscopiquement similaires ou
discernables. En retour, cette distance peut être utilisée comme une base pour définir une
correspondance psychophysique sensible dans la théorie.
III.2.12. Le problème des queues de la fonction d'onde
Dans les années récentes, il y a eu un vif débat autour du problème qui a son origine, selon certains
des auteurs qui l'ont soulevé, dans le fait que même si le processus de localisation, qui correspond à
multiplier la fonction d'onde par une gaussienne et donc conduit à une fonction d'onde fortement
concentrée autour de la position du coup, elle conduit à des fonctions d'ondes qui sont différentes
de zéro dans l'espace entier. La première critique de cette sorte fut soulevée par A. Shimony
[Shimony, 1990] et peut être résumée par sa phrase,
On ne devrait pas tolérer de queues dans la fonction d'onde qui sont si larges que leurs différentes
parties peuvent être discriminées par les sens, même si des amplitudes de probabilités très faibles
leur sont assignées.

Après une localisation d'un système macroscopique, typiquement le pointeur de l'appareil, son
centre de masse, sera associé à une fonction d'onde qui est différente de zéro sur l'espace entier. Si
on adopte l'interprétation probabiliste de la théorie standard, cela signifie que même quand le
processus de mesure est terminé, il y a une probabilité non nulle (même si elle est extrêmement
petite) de trouver son pointeur dans une position arbitraire, au lieu d'une correspondant au résultat
enregistré. Cela est considérer comme inacceptable car indiquant que le programme de réduction
dynamique ne surmonte pas réellement le problème de l'objectivation macroscopique.

Disons immédiatement que le problème (prétendu) se pose entièrement en gardant l'interprétation


standard de la fonction d'onde inchangée, en particulier en supposant que le carré de son module
donne la densité de probabilité de la variable position. Cependant, comme nous en avons discuté
dans la section précédente, il y a en principe des raisons beaucoup plus sérieuses qui nécessitent
d'abandonner l'interprétation probabiliste et de la remplacer avec une de celles proposées par Bell
ou, de manière plus appropriée, par l'interprétation de la densité de masse que nous avons soulignée
ci-dessus.

Avant d'entrer dans une discussion détaillée de ce point subtil, nous avons besoin de mieux nous
concentrer sur le problème. Nous ne pouvons pas éviter de faire deux remarques. Supposons qu'on
adopte, pour le moment, la position quantique conventionnelle. Nous sommes d'accord que, dans
un tel cadre, le fait que la fonction d'onde n'a jamais un support spatial strictement compact peut
être considéré comme énigmatique. Cependant, c'est un problème se posant directement à partir des
phénomènes mathématiques (dispersion de la fonction d'onde) et de l'interprétation probabiliste de
la théorie et pas du tout un problème particulier des modèles de réduction dynamique. En effet, le
fait que, par exemple, la fonction d'onde du centre de masse d'un pointeur ou d'une table n'a pas un
support compact n'a jamais été considéré comme un problème pour la mécanique quantique
standard. Quand la fonction d'onde est extrêmement bien concentrée autour d'un point donné de
l'espace, il a toujours été accepté qu'elle décrive une table localisée à une certaine position et que
cela correspond d'une certaine manière à notre perception de la table. Il est évidemment vrai que,
pour la fonction d'onde donnée, les règles quantiques impliquent que si une mesure était effectuée
la table pourrait être trouvée (avec une probabilité extrêmement petite) à des kilomètres de là, mais
ce n'est pas la mesure ou le problème de l'objectivation macroscopique de la théorie standard. Ce
dernier concerne une situation complètement différente, c'est-à-dire celle dans laquelle on est
confronté avec une superposition de deux fonctions d'ondes de même poids macroscopiquement
séparées, dont les deux possèdent des queues (c'est-à-dire n'ont pas un support compact) mais sont
différentes de zéro de manière appréciable seulement dans des intervalles très étroits. C'est la
situation réellement embarrassante que la mécanique quantique conventionnelle est incapable de
rendre compréhensible. A quelle perception de la position de la table correspond cette fonction
d'onde ?

Les implications pour ce problème de l'adoption de la théorie du modèle avec localisation


spontanée devraient être évidentes. Dans le modèle avec localisation spontanée, la superposition de
deux états qui, quand ils sont considérés individuellement, sont supposés conduire à des
perceptions définies et différentes des locations macroscopiques, sont dynamiquement interdites. Si
certains processus tendent à produire de telles superpositions, alors la dynamique de réduction
induit la localisation du centre de masse (la fonction d'onde associée étant différente de zéro de
manière appréciable seulement dans un intervalle étroit et précis). De manière correspondante, la
possibilité est donnée d'attribuer au système la propriété d'être dans une place définie et donc
d'expliquer notre perception définie. Pour résumer, nous insistons une fois de plus sur le fait que la
critique sur les queues ainsi que l'exigence que l'apparition de queues macroscopiquement étendues
(même si elles sont extrêmement petites) est strictement interdite est exclusivement motivé par
l'absence de critique confiant à l'interprétation probabiliste de la théorie même en ce qui concerne la
correspondance psychophysique : les états assignant des probabilités non exactement nulles à
différents résultats de mesures de positions doivent correspondre à des perceptions ambiguës de ces
positions. Puisque ni dans le formalisme standard ni dans le cadre des modèles de réduction
dynamique une fonction d'onde ne peut avoir de support compact, prendre une telle position
conduit à conclure que c'est juste la description de l'espace de Hilbert des systèmes physiques qui
doit être abandonnée.

On doit insister sur le fait qu'il n'y a rien dans la théorie GRW qui rendrait le choix des fonctions
avec support compact problématique dans le but de la localisation mais il doit aussi être noté que
suivre cette ligne serait totalement sans utilité : puisque l'équation d'évolution contient le terme
d'énergie cinétique, toute fonction, même si elle a un support compact à un moment donné, sera
instantanément dispersée en acquérant une queue qui s'étend dans l'espace entier. Si on garde
l'interprétation probabiliste et qu'on accepte la complétude de la description des états des systèmes
physiques en termes de fonction d'onde, le problème des queues ne peut pas être évité.

La solution du problème des queues peut seulement dériver d'un complet abandon de
l'interprétation probabiliste et en adoptant une interprétation plus physique et réaliste reliant "qu'est-
ce qui est là" à, par exemple, la distribution de densité de masse dans l'univers entier. Dans cette
relation, l'exemple suivant sera instructif [Ghirardi, Grassi et Benatti, 1995]. Prenons une sphère
massive de densité normale et d'une masse d'environ 1 kg. Classiquement, la masse de ce corps sera
totalement concentrée dans le rayon de la sphère, appelons le r. Dans le modèle avec localisation
spontanée, après l'intervalle de temps extrêmement court dans lequel la dynamique de réduction
conduit à une situation de "régime" et si on considère une sphère d'un rayon r + 10 −5 cm , l'intégrale
de la densité de masse sur le reste de l'espace s'avère être une fraction incroyablement petite (de
l'ordre de 1 sur 10 exposant 1015 ) de la masse d'un seul proton. Dans de telles conditions, il semble
assez légitime d'affirmer que le corps macroscopique est localisé dans la sphère.

Cependant, même cette position assez raisonnable a été remise en question et il a été affirmé
[Lewis, 1997] que l'existence des queues implique que le principe d'énumération (c'est-à-dire le fait
que l'affirmation "la particule 1 est dans cette boite et la particule 2 est dans cette boite et... et la
particule n est dans cette boite et aucune autre particule est dans cette boite" implique l'affirmation
"il y a n particules dans cette boite") n'est plus valable, si on prend sérieusement l'interprétation de
la densité de masse des théories avec réduction. Cet article a conduit à un long débat qu'il serait
inapproprié de reproduire ici. Nous renvoyons le lecteur aux articles des auteurs [Ghirardi et Bassi,
1999, Clifton et Monton, 1999a, 1999b, Bassi et Ghirardi, 1999, 2001]. Différents arguments ont
été présentés en faveur et contre la critique de Lewis.

Nous aimerions conclure cette brève analyse en insistant sur le fait une fois de plus que tous les
désaccords et les mauvaises compréhensions concernant ce problème ont leur origine dans le fait
que l'idée qu'une interprétation probabiliste de la fonction d'onde doit être abandonnée n'a pas
encore été totalement acceptée par les auteurs qui trouvent certaines difficultés dans l'interprétation
proposée de la densité de masse des théories avec réduction.
III.2.13. Evaluation
Passons maintenant à l'évaluation de cette interprétation suivant nos critères.

Plusieurs problèmes se posent :


 La vitesse à laquelle la réduction se produit doit être finement réglée. Si elle est trop rapide, la
suppression des superpositions quantiques empêche l'existence de phénomènes d'interférence.
Et si elle est trop lente, les superpositions subsisteraient alors que les mesures ont déjà été
effectuées. Hors, comme signalé, aucun phénomène physique de réduction n'a encore pu être
mis expérimentalement en évidence et on observe toujours des résultats définis pour les
mesures. Il reste donc une frange étroite dans laquelle placer le processus conjecturé. En fait, et
c'est assez gênant, on doit régler la théorie pour qu'elle échappe aux mesures actuelles qui ne
détectent pas le processus conjecturé ! Plusieurs auteurs ont signalé de sérieuses difficultés pour
arriver à régler finement les paramètres pour que la théorie reste valable dans l'ensemble des
conditions expérimentales connues. Considérons ne fut ce que les condensats de Bose - Einstein
qui sont suffisament stables et denses pour qu'une réduction spontanée se produise pendant le
temps, long, d'observation, réduction qui n'est pas observée.

D'une manière générale les processus invoqués semblent fort arbitraires bien que les liens
conjecturés avec la densité de masse et avec la gravitation quantique soient assez séduisants.
 Il y a des difficultés avec l'intrication.

Considérons un état intriqué tel que + 1


+ 2
+ − 1
− 2.

Dès qu'un coup affecte la distribution de, la particule 1, la particule 2 subit automatiquement la
même modification. Ainsi, par exemple, si la particule 1 voit sa composante + amplifiée par le
coup, l'état se modifie en + 1 + 2 plus une toute petite fraction pour les composantes -.

Deux difficultés se posent alors.

D'une part, la modification de l'état des deux particules est modifié simultanément. C'est-à-dire
en violation de la relativité. Ce problème est à relier aux difficultés soulignées pour obtenir une
formulation relativiste de la théorie.

Si on attend suffisament longtemps (et les expériences d'intrication on été effectuées sur des
distances considérables grâce à des fibres optiques) les particules sont toutes les deux réduites
dans le même état. Et les mesures terminales reviennent à mesurer des particules ayant des états
définis, comme dans le cas des variables cachées. Ce qui est écarté par le théorème de Bell.

Les auteurs parlent toujours de position et excluent le spin, pourtant, d'une part, le problème de
la mesure se pose tout autant avec des propriétés comme le spin, d'autre part les positions aussi
peuvent être intriquées. Le même problème se pose.
 Le fait qu'un processus physique, responsable de la réduction, implique l'existence d'une base
privilégiée est ennuyant (la position). En effet, la décohérence est un autre processus physique
expliquant l'existence de cette base privilégiée. Par quel hasard les bases privilégiées en
question sont-elles identiques ?

Divers travaux sont encore à l'étude afin de voir comment relier les processus de réduction
physique à la décohérence. Mais à notre connaissance, ces travaux sont peu avancés ou très
spéculatifs.

Une des difficultés vient du fait que la réduction physique entraîne une décohérence. Elle entre
donc directement en conflit avec la théorie de la décohérence induite par l'environnement.
Comme la décohérence a été largement expérimentée (expériences dites du chat de Schrödinger
microscopique) à cause de son importance dans les programmes de cryptographie et de calcul
quantique et confirmée, les modèles de réduction physique doivent s'adapter pour "coller" à ces
résultats. La zone d'ombre étroite dans laquelle on a placé le processus de réduction physique se
réduit d'autant et son caractère arbitraire s'amplifie. Il n'est guère étonnant dès lors de voir se
rapprocher le mécanisme de réduction physique des effets de l'environnement dans les modèles.

Faisons donc le point.


 Respect du formalisme de la physique quantique.
Ces interprétations ne respectent pas le formalisme de la physique quantique qu'elles modifient
explicitement l'équation d'évolution (pour la rendre non linéaire).
 Limite.
Etant donné que le formalisme modifié se suffit à lui-même, ces interprétations ne sont pas
limitées à certaines situations.
 Principe anthropique.
Ces interprétations ne donnent pas un rôle privilégié à tel ou tel observateur ou type
d'observateurs.
 Réalisme ou positivisme.
Ces interprétations sont réalistes, tout au moins en les complétant en disant que la fonction
d'onde est un objet réel. Mais dans le cadre de ces interprétations, ce n'est pas une difficulté.
Comme les auteurs l'expliquent, on doit abandonner l'interprétation probabiliste usuelle pour la
remplacer par la réduction physique.
 Rasoir d'Ockham.
La théorie doit ajouter des équations et divers termes finement ajustés. C'est une violation
importante de ce principe d'économie.
 Bases privilégiées.
L'interprétation choisit arbitrairement la base privilégiée et la réconcilier avec la décohérence
reste encore actuellement très spéculatif. Ce point est particulièrement aigu quand on considère
le spin et les vérifications expérimentales, voir ci-dessus.
 Caractère explicatif des probabilités et de la réduction.
Ces interprétations fournissent un mécanisme à la réduction. Certaines variantes suppriment
également le caractère indéterministe, l'aspect aléatoire résultant de détails de l'environnement.
 Coté pédagogique.
Cette approche est simple (dans son principe) et intuitive. Mais elle ne peut servir de guide
pédagogique pour comprendre la physique quantique puisqu'elle la modifie explicitement. Les
versions les plus élaborées nécessitent un maîtrise poussée de la mécanique quantique voire au-
delà avec la gravitation quantique.
 Défauts.
En dehors des points soulignés en rouge, ci-dessus, nous avons vu qu'elle n'était pas exempte de
difficultés :
 Paramètres finement réglés voir impossibles à ajuster.
 Incapacité à rendre compte de l'intrication sans violation de la relativité restreinte.

Interprétation avec réduction physique: -6.

Malgré ce score honorable, signalons que ces interprétations sont en dehors du cadre de cette étude
qui a pour but de comprendre la mécanique quantique et non une théorie alternative. Du point de
vue adopté ici, la modification de la théorie doit être considérée comme un défaut majeur. La
difficulté à rendre compte correctement de l'intrication est également un défaut majeur puisque
l'intrication et la violation des inégalités de Bell a maintenant un fondement expérimental. Rien que
ces deux points mériteraient, selon nous, 5 points chacun. Donnant un score de -16.
III.3. Les interprétations modales
L'interprétation modale originale de la mécanique quantique est née au début des années 70 et à ce
moment la phrase se référait à une seule interprétation due à van Fraassen. La phrase embrasse
maintenant une large classe d'interprétations et le plus souvent prise comme se référant à une
approche générale de l'analyse de la structure, à la fois conceptuelle et mathématique, de la
mécanique quantique. Nous décrirons l'histoire des interprétations modales, comment la phrase est
devenue (mieux) utilisée de cette manière et le programme général de ceux (au moins certains
d'entre-eux) qui défendent cette approche.
III.3.1. La variante de Copenhague
Au début des années 70, les chercheurs en philosophie physique sont devenus très attentifs à la
non-localité inhérente à la mécanique quantique standard. Elle apparaissait le plus dramatiquement,
peut-être, dans le contexte du postulat de réduction qui affirme que sous une mesure d'un système
physique, son état se "réduit" (ou est "projeté") dans une des valeurs possibles de la quantité
mesurée. Ce postulat est difficile à accepter dans tous les cas (est-ce que l'effet est un changement
discontinu dans l'état physique d'un système ? Qu'est-ce qu'exactement une "mesure" ?) mais il est
spécialement inquiétant quand on l'applique à des systèmes composites intriqués dont les
composantes sont bien séparées dans l'espace. L'exemple classique est l'expérience du type
Einstein-Podolsky-Rosen dans laquelle deux particules interagissant initialement sont séparées.
Leur état quantique est "intriqué" ce qui signifie dans notre cas que la réduction résultant d'une
mesure sur une d'entre elles affecte simultanément et instantanément l'autre.

Une manière possible de régler ce problème fut notée par van Fraassen (1972, 1974) qui proposa
d'éliminer le postulat de réduction de la théorie. Bien sûr, d'autres ont fait cette proposition avant.
La théorie de Bohm (1952) (elle-même précédée par la proposition de de Broglie dans les années
20) éliminait le postulat de réduction ainsi que les différentes interprétations des univers multiples
(et des états relatifs). La proposition de van Fraassen était, cependant, assez différente de ces autres
approches. Elle se rattachait, en particulier, à une distinction entre la "valeur d'état" d'un système et
"l'état dynamique" d'un système. La valeur d'état décrit les propriétés du système tandis que l'état
dynamique détermine quelles propriétés le système peut avoir à un moment ultérieur (plus
spécifiquement, l'état dynamique détermine comment le système "réagit aux perturbations", comme
van Fraassen le dit quelque fois, une telle information étant ce que nous avons besoin pour faire des
prédictions sur sa future valeur d'état).

L'état dynamique est juste l'état quantique et il ne se réduit jamais. La valeur d'état est
(typiquement) quelque chose d'autre que l'état quantique. En effet, c'est quelque chose d'autre que
l'état dynamique quand l'état dynamique n'est pas un état pur (c'est-à-dire quand l'état dynamique,
ou quantique, d'un système est mixte), l'état dynamique contraint les valeurs d'état possibles (et
l'adéquation empirique nécessite qu'elle génère aussi les fréquences correctes pour ces valeurs d'état
qui sont observables).
La proposition de van Fraassen viole donc le lien dit "état propre - valeur propre" qui affirme qu'un
système a une valeur d'état correspondant à une valeur propre donnée (d'un observable donné) si et
seulement si son état quantique est un état propre de l'observable correspondant à cette valeur
propre. Van Fraassen accepte la partie "si" mais rejette la partie "seulement si".

Quelles sont les "valeurs d'état" possibles pour un système donné à un moment donné ? Pour van
Fraassen, la forme de la valeur d'état est restreinte d'une manière importante et assez conservative :
les propositions sur un système physique ne peuvent pas être vraies ensembles sauf si elles peuvent
être certaines ensembles. En d'autres mots, le principe d'indétermination impose une limite non
seulement à notre connaissance des propriétés d'un système mais aussi sur les propriétés elles-
mêmes. Il doit être possible pour un état dynamique d'attribuer une probabilité de valeur d'état 1.
Cette restriction motiva van Fraassen à appeler son interprétation la "variante de Copenhague" de
l'interprétation modale. D'autres variantes (par exemple, van Fraassen identifie une variante "anti
Copenhague" qu'il attribue à Arthur Fine) imposerait des conditions moins restrictives sur la forme
des valeurs d'état.

Finalement, les "valeurs d'état" sont maximales par rapport à la restriction indiquée. Il s'ensuit
immédiatement que les valeurs d'état sont représentables comme des états purs. Mais quels états
purs sont les valeurs d'état possibles à un moment donné ? Van Fraassen formule un critère très
permissif que d'autres auteurs ont trouvé trop permissif, la raison venant de sa philosophie
"constructive empirique" de la science. Il est plus concerné par la possibilité de donner une
interprétation de la théorie dans laquelle la théorie est empiriquement adéquate, c'est-à-dire
compatible avec tous les phénomènes observables (dans le sens utilisé par van Fraassen), en
particulier les phénomènes observables que (ce que nous appelons normalement) les mesures font
pour avoir des résultats. En effet, si nous appliquons le lien état propre - valeur propre de la théorie
(qui, rappelons-le, est la mécanique quantique sans le postulat de réduction) il s'avère que les
mesures n'ont pas de résultats. Mais une "interprétation" qui prédit que les mesures auront des
résultats, particulièrement si elle prédit aussi quelles seront les probabilités de ces résultats (règle
de Born), et comment l'évolution future du système sera affectée par ces résultats (postulat de
réduction) n'est probablement pas une simple interprétation de la théorie donnée mais une nouvelle
théorie (une théorie à variables cachées). La description donnée par van Fraassen est beaucoup plus
modeste, prescrivant comme une règle d'interprétation seulement que les valeurs d'état potentielles
sont les états qui apparaissent dans les différentes décompositions de l'état dynamique
(généralement mixte).

Bien sûr, l'adéquation empirique nécessite que, dans le cas des mesures, la valeur d'état réelle de
l'appareil soit un état décrivant un résultat de mesure défini et donc les valeurs d'état observées,
dans ces cas, sont seulement un sous-ensemble très restreint des valeurs d'état possible selon van
Fraassen. L'observation nous dit aussi que, dans ces cas, l'état dynamique génère une probabilité de
mesure sur ces ensembles plus restreints nous permettant donc de faire des prédictions sur le
résultat. A cette fin, van Fraassen est forcé de prendre en compte les mesures et sa description est
considérée par beaucoup être problématique.

La description de van Fraassen est "modale" car elle conduit, d'une manière assez directe, à une
logique modale des propositions quantiques. Pour van Fraassen, le point peut-être le plus important
est qu'on ne devrait pas présumer que cette logique modale vient de l'ignorance sur l'état réel de
choses dont la découverte est le but de la science. En d'autres mots, nous ne disons pas qu'un
système avec un état dynamique W a éventuellement certaines valeurs d'état V1 , V2 ,... et nous
avons besoin de trouver laquelle ou laquelle avec quelle probabilité. Ce qui est important est qu'il a
des valeurs d'état possibles pour tous les systèmes physiques (c'est-à-dire des histoires possibles du
monde) qui sont compatibles avec toutes les données observables. D'autre part, il est assez facile de
voir comment la description de van Fraassen conduit à un programme qui est largement concerné
par fournir une interprétation "réaliste" de la mécanique quantique, un programme vers lequel nous
allons maintenant nous tourner.
III.3.2. Les interprétations de Kochen-Dieks-Healey
Les lignes de base de ce programme sont déjà apparentes dans le travail de van Fraassen (ou dans
ce qui peut être considéré comme ses limites). L'idée principale est de définir un ensemble de
propriétés possibles pour un système physique puis d'affirmer que l'état "dynamique" (c'est-à-dire
quantique) génère une mesure de probabilité interprétable comme une ignorance sur cet ensemble.
Plus précisément, on définit une mesure de probabilité interprétable comme une ignorance sur les
valeurs d'états qui elles-mêmes attribuent "possédé" ou "non possédé" à chaque propriété dans
l'ensemble. Le fait qu'on utilise la mesure de probabilité quantique garantit une sorte d'adéquation
empirique minimale par rapport aux propriétés de l'ensemble des propriétés possibles. Si, en plus,
on trouve un monde décrit en terme de ces propriétés (et seulement elles) pour être notre monde de
manière plausible, alors on peut être satisfait avec cette interprétation (l'exception peut être un désir
d'une image dynamique explicite de propriétés possédées. Voir plus bas).

A la fin des années 80, différents autres philosophes, typiquement, comme noté ci-dessus, avec un
penchant plus réaliste que van Fraassen, ont réalisé que les propriétés centrales de cette approche
peuvent être utilisées dans le service des interprétations de la mécanique quantique avec d'autres
intérêts philosophiques. Ici nous allons considérer trois cas, bien que brièvement et largement sans
référence à leurs motivations philosophiques "sous-jacentes" (qui sont toutes réalistes bien que
d'une manière très différente) : Kochen, Dieks et Healey.

L'interprétation modale de Kochen (1985) donne une série de propositions étalées durant la fin des
années 80 et les années 90. Sa proposition est basée sur le théorème de décomposition polaire (voir
Reed et Simon (1979, pp.197-198) pour un exposé de la démonstration) mais est assez facile à
comprendre en termes du théorème dit de "décomposition biorthogonale" dont nous avions déjà
parlé :

Théorème de décomposition biorthogonale


Etant donné un vecteur v dans un espace de Hilbert produit tensoriel, H 1 ⊗ H 2 , il existe des
bases { ei } et { f } pour H
j 1 et H 2 respectivement tel que v peut être écrit comme une
combinaison linéaire de termes de la forme ei ⊗ f i . Si la valeur absolue (module) des
coefficients dans cette combinaison sont tous différents alors la base est unique.

En d'autres mots, l'état d'un système à deux particules sélectionne (dans la plus part des cas) une
base (et donc un observable) pour chaque composante du système (voir par exemple Schrödinger
(1935) pour une démonstration de ce théorème).

Rappelons de la section précédente que van Fraassen n'était pas (pour des raisons philosophiques)
forcé de fournir une prescription très restrictive pour décider quelles peuvent être les valeurs d'état
possibles pour un système donné. Nous voyons dans le théorème de décomposition biorthogonale
une manière de choisir les valeurs d'état possibles à partir d'une seule décomposition de l'état
dynamique (mixte) d'un système : prenons les (pour chaque composante du système) comme les
éléments de la base sélectionnée par le théorème. Il est manifeste que l'état dynamique génère une
mesure de probabilité sur cet ensemble de valeurs d'état possibles, c'est-à-dire la mesure quantique
standard.

En prenant cette vue, notre interprétation est essentiellement reliée à l'existence d'un système
composite à deux composantes. Dans un sens, cette propriété n'est pas vraiment une différence
notable de la vue de van Fraassen car rappelons que pour van Fraassen seuls les systèmes qui sont
dans un état dynamique mixte (en effet, improprement mixte) ont des valeurs d'état qui diffèrent de
leur état dynamique. Cette situation se produit typiquement pour des systèmes qui sont
composantes d'un système composite (il y a cette différence : le théorème de décomposition
biorthogonale est valable seulement pour des systèmes à deux composantes tandis que des sous-
systèmes de systèmes composites arbitraires auront typiquement pour leur état dynamique une
mixture impropre). Cette similarité formelle entre Kochen et van Fraassen masque cependant une
différence philosophique assez importante. La description de Kochen est vue de manière
perspective ou relationnelle signifiant qu'un système a une propriété seulement en relation avec un
autre système (voir ci-dessous).

En effet, dans une situation de mesure typique, la prescription de Kochen est la même que celle de
van Fraassen. Par exemple si on considère une mesure typique dans laquelle un "pointeur" devient
corrélé avec la valeur qu'un certain système "mesuré" a pour un observable donné. Soit ei
représentant "l'indicateur d'état" possible du pointeur et f j la valeur possible que le système peut
avoir pour l'observable mesuré, l'état final du système composite prendrait en effet la forme d'une
combinaison linéaire de termes de la forme ei ⊗ f i , comme la prescription de Kochen (et de van
Fraassen), le pointeur a en effet son indicateur d'état comme valeur d'état possible (plus
précisément, pour van Fraassen, les indicateurs d'état du pointeur sont parmi les valeurs d'état
potentielles; comme discuté ci-dessus, van Fraassen est seulement intéressé par établir ce fait et pas
le fait que ce sont les valeurs d'état même quand elles sont inobservables).

Pour Kochen, le fait que l'application de l'interprétation est restreinte aux sous-systèmes d'un
système composite à deux composantes n'est pas un problème. En effet, il semble adopter une
métaphysique des propriétés dans laquelle les systèmes n'ont pas de propriétés intrinsèques : toutes
les propriétés sont relationnelles. Kochen appelle la relation "témoignage". Considérons à nouveau
la mesure décrite ci-dessus. Dans ce cas, le pointeur (à la fin de la mesure) peut être dit "indiquer"
(ou, comme Kochen le préfère, "témoigner") le résultat, c'est-à-dire la valeur que le système mesuré
a pour l'observable mesuré. Maintenant, comme Kochen veut que son interprétation s'applique à
toutes les circonstances (pas seulement à la mesure), nous devons abstraire l'idée "d'indication" ou
de "témoignage" du contexte de la mesure et quelle que soit la notion avec laquelle nous finissons,
elle est supposée s'appliquer à tous les cas de possession de propriétés. L'interprétation de Kochen
est donc hautement "perspective" : les systèmes ne possèdent pas de propriété intrinsèque mais
relativement à la "perspective" d'un autre système qui "témoigne" qu'il possède la propriété en
question.

D'autres auteurs, en particulier Dieks, préfèrent (ou au moins préféraient originellement) une
métaphysique de propriétés intrinsèques possédées. Ils sont donc face à deux questions.

1. Que peut-on dire (si c'est possible) sur les propriétés de sous-systèmes qui ne sont pas
composants d'un système à deux composantes dans un état pur ?

Pour poser la deuxième question, notons qu'un système composite à trois composantes peut être
divisé en paires de sous-systèmes de plusieurs manières. Considérons par exemple le système
composite A&B&C. Nous pourrions arriver aux propriétés de A en appliquant le théorème de
décomposition biorthogonale au système à deux composantes A&(B&C). Nous pourrions aussi
appliquer le théorème à (par exemple) B&(C&A) ou C&(A&B).
2. Comment les propriétés de A et B sont-elles reliées à celles de A&B ?

Supposons, par exemple, que A a la propriété P et B la propriété Q. Doit-on attribuer la


propriété P&Q à A&B ou A&B a-t-il une certaine propriété obtenue en appliquant la
décomposition biorthogonale à C&(A&B) ou les deux ?

Bien que dans sa proposition originale Dieks (1988, 1989) n'a pas répondu à ces questions, son
travail ultérieur, en collaboration (Vermaas et Dieks, 1995) les a abordés (la description complète
est dans Vermaas (1999), voir aussi Bacciagaluppi). La réponse de Dieks à la première question
tient au fait que l'opérateur densité (état réduit) d'une seule composante d'un système à deux
composantes a pour sa résolution spectrale exactement les projecteurs générés par les éléments de
base sélectionnés par le théorème de décomposition biorthogonale, dans le cas où la décomposition
est unique. On peut alors généraliser la proposition originale en supposant que les valeurs d'état
possibles pour tout système sont juste les éléments dans la décomposition spectrale de son
opérateur densité (typiquement impropre et réduit) dont l'existence et l'unicité est garantie par le
théorème spectral (donné et démontré dans tout livre d'analyse fonctionnelle). Cette nouvelle
proposition correspond à l'ancienne quand l'ancienne s'applique, c'est-à-dire dans le cas où la
décomposition biorthogonale s'applique et garantit une décomposition biorthogonale unique.

La réponse à la seconde question est un peu plus embrouillée. En fait, nous pouvons rendre la
question encore plus compliquée en notant qu'un espace de Hilbert produit tensoriel donné peut être
factorisé de plusieurs manières. En essence, la factorisation d'un espace de Hilbert donné, H, en
deux facteurs H 1 et H 2 peut subir une "rotation" pour fournir des factorisations supplémentaires
H 1′ et H ′ 2 . Il y a une infinité continue de telles possibilités. Devons nous appliquer la proposition
à chacune des factorisations ? Comment ces résultats sont-ils reliés, si possible ?

Un théorème dû à Bacciagaluppi (1995) montre, en essence, que si on applique la proposition de


Dieks au "système" obtenu dans toute factorisation et en insistant pour que les résultats soient
comparables (c'est-à-dire que les sous-systèmes ainsi obtenus n'aient pas leurs propriétés "relatives
à une factorisation" mais plutôt de manière absolue) alors on est conduit à une contradiction du type
Kochen-Specker. Bien qu'on ne puisse pas adopter la vue que les sous-systèmes ont leurs propriétés
"relatives à une factorisation", la plus part des avocats de l'interprétation modale ont adopté à la
place une vue qu'il y a une "factorisation privilégiée" de l'espace de Hilbert universel en sous-
systèmes. Cette hypothèse conduit à l'adoption de l'existence de degrés de liberté "atomiques" de
l'univers.

On doit encore faire face, cependant, avec la question de comment les degrés de liberté d'un
système composite sont reliés à ceux de ses composantes. La réponse à cette question dépend,
finalement, d'une autre question. Est-ce que la proposition de Dieks s'applique aux "atomes" seuls
ou à tout sous-système quel qu'il soit ? Par exemple, doit-on appliquer la proposition (pour notre
exemple schématique ci-dessus) à A&B&C aussi bien qu'à A&B ? Vermaas (1997) a montré que
faire ainsi rendait la question 2 sans réponse en général : on ne peut pas définir généralement des
corrélations valides entre un système composite et ses composants dans ce cas (si on veut adopter le
relativisme - comme Kochen, par exemple - alors on peut peut-être justifier le manque de telles
corrélations). A moins que l'on désire adopter une certaine forme de relativisme, alors on est
apparemment conduit à une interprétation modale atomique (voir, par exemple, Bacciagaluppi et
Dickson, 1999) selon laquelle la proposition de base s'applique seulement aux sous-systèmes
"atomiques" de l'univers. Les propriétés de tout autre système (composite) sont héritées de leurs
sous-systèmes (Clifton (1995) offre aussi un théorème important concernant cette question).

Richard Healey (1989) fut aussi parmi les premiers à utiliser le théorème de décomposition
biorthogonale, prenant l'idée de Kochen dans une direction assez différente. La principale
préoccupation de Healey était en effet l'apparente non-localité de la mécanique quantique.
L'intuition de Healey sur la manière dont une interprétation "modale" basée sur le théorème de
décomposition biorthogonale devrait être appliqué, disons, à une expérience EPR était comme suit.
Le théorème est appliqué d'abord à la composition de l'appareil d'un coté et la paire EPR (bien que
la paire EPR n'a pas encore interagit avec l'appareil de l'autre coté). Donc la paire EPR acquiert une
propriété "holistique" qui peut alors expliquer pourquoi l'appareil de l'autre coté acquiert une
propriété qui est corrélée au résultat de l'autre coté.
En dehors du fait de savoir si cette description est suffisament générale pour son but, elle montre
que Healey ne souscrit pas à une interprétation modale "atomique" puisqu'il est crucial pour lui
qu'une propriété (non produite) soit affectée à la paire EPR comme un tout. La proposition de
Healey commence avec l'interprétation atomique, utilisant le théorème de décomposition
biorthogonale, mais l'ensemble des propriétés possibles est alors étendu (et subséquemment
restreint) par un certain nombre de conditions. Le but d'Healey est apparemment de marcher sur
une ligne étroite parmi une variété de desiderata. Le premier est la consistance. Comme montré par
(par exemple) les théorèmes de Bacciagaluppi et Vermaas mentionnés ci-dessus, sans compter le
théorème de Kochen-Specker lui-même, étant donné certaines conditions sur l'ensemble des
propriétés possédées possibles, on ne peut pas ajouter des propriétés à cet ensemble à volonté. Une
seconde est de maintenir une théorie plausible de la relation entre les systèmes composites et leurs
sous-systèmes. Une troisième est de maintenir une description plausible des relations parmi les
propriétés possédées à un moment donné. Une quatrième est de maintenir une description plausible
des relations parmi les propriétés possédées à des moments différents.

La structure des propriétés possédées possibles qu'émerge des conditions de Healey (du moins pour
cet auteur) est extrêmement difficile à comprendre. Certains progrès ont été fait depuis que le livre
de Healey a été publié (voir par exemple Reeder et Clifton, 1995) mais en général il reste difficile
de voir quel est l'ensemble des propriétés possédées possibles pour Healey.
III.3.3. Motivations des premières interprétations modales
D'un autre coté, l'avantage clair qu'a l'approche de Healey sur les autres d'approximativement la
même période est la motivation. La nécessité (ou en effet la plausibilité) des conditions de Healey
peut être débattue, mais il est clair qu'elles l'affirment et pourquoi on peut désirer faire une telle
affirmation, Healey lui-même donne les raisons. Cependant, il reste la question fondamentale :
pourquoi commencer avec la décomposition biorthogonale (ou plus généralement la décomposition
spectrale) en premier lieu ? Pour ces interprétations qui en disent peu au-delà de l'application de ces
décompositions pour déterminer l'ensemble des propriétés possédées possibles, la question est assez
pressante et les interprétations manquent singulièrement de motivation physique directe.

Une série de théorèmes du milieu des années 90 proposent de répondre (ou de commencer à
répondre) à cette question. Le premier de ces théorèmes est dû à Clifton (1995a), le titre de l'article
indiquant le projet : "motivation indépendante de l'interprétation modale de Kochen-Dieks de la
mécanique quantique". Une série de résultats reliés suivirent incluant ceux de Clifton (1995),
Dickson (1995) et Bub et Clifton (1996). Ici nous discuterons de l'article original de Clifton et du
théorème de Bub et Clifton, le premier indiquant le but général de ces premiers arguments et le
dernier comme une manière d'introduire la propre interprétation modale de Bub.

Le théorème discuté est ici n'est pas tout à fait celui de Clifton qui est légèrement plus fort (car ses
hypothèses sont légèrement plus faibles) mais le lecteur sera capable de comprendre l'idée générale
de ces théorèmes à partir de la discussion qui suit. Ils prennent la forme générale, pour certaines
conditions établies mathématiquement (mais on l'espère physiquement motivées) A, B, C, etc. : si
on désire qu'un ensemble de propriétés possédées possibles obéissent aux conditions A, B, C,...
alors l'ensemble doit prendre la forme affirmée par la décomposition spectrale de l'interprétation
modale. Cette forme, plus précisément, est ce qui suit. Considérons un système dans l'état mixte (en
général réduit et impropre) W. Soit {Pi } l'ensemble des projecteurs spectraux de W et soit B Pi
l'algèbre booléenne générée par les Pi qui est dans ce cas juste l'ensemble de toutes les sommes
d'éléments de {Pi }. Finalement, soit Q l'espace nul de W, c'est-à-dire orthogonal à chaque Pi . Alors
l'ensemble de toutes les valeurs de projections possibles, P, pour notre système est l'ensemble
{P | P = Pj + Q′, Pi ∈ B Pi , Q′ ⊂ Q}
Ainsi les théorèmes du type prouvé par Clifton et les autres prennent la forme : les ensembles de la
forme donnée ci-dessus sont les seuls ensembles satisfaisant les conditions A, B, C,...

Dans un tel théorème, approximativement celui prouvé originalement par Clifton, les conditions
sont :
1. Fermeture : l'ensemble de toutes les propriétés possédées possibles est fermé sous la
conjonction, la disjonction et la négation (comprise de manière appropriée en termes de logique
quantique).
2. Classicalité : la mesure de probabilité quantique (générée par l'état réduit W) sur l'ensemble de
toutes les propriétés possédées possibles obéit à la loi classique de probabilité et, crucial, elle
est "interprétable par ignorance".
3. Certitude : pour toute propriété R, si l'état réduit W attribue la probabilité 1 ou la probabilité 0 à
R, alors R est dans l'ensemble de toutes les propriétés possédées possibles.
4. Ignorance : chaque membre de la résolution spectrale de W est dans l'ensemble de toutes les
propriétés possédées possibles.

La condition finale est probablement la plus difficile à justifier, bien qu'on notera que le théorème
de Clifton utilise une condition considérablement plus faible (bien sûr, en conjonction avec les
autres conditions, elle implique la condition donnée ici).

Le théorème de Bub et Clifton (1996) (sous une forme légèrement améliorée de Bub, Clifton et
Goldstein (2000)) concerne un ensemble de propriétés possédées possibles qui est caractérisé assez
différemment. Spécifiquement, il est caractérisé en termes de (dans le cas le plus simple) d'états
purs, v et d'un observable, R. L'état pur est l'état quantique du système tandis que l'observable est
supposé avoir une "valeur bien définie"; c'est-à-dire, quelles que soient les autres valeurs, les
projecteurs spectraux de R doivent avoir une valeur définie.

Les conditions du théorème de Bub et Clifton sont les suivantes :


1. Fermeture : comme ci-dessus.
2. Vérité et probabilité : essentiellement la même condition que "classicalité" ci-dessus.
3. R-privilégié : les espaces propres de R sont parmi l'ensemble des propriétés possédées
possibles.
4. v ,R définissabilité : l'ensemble des propriétés possédées possibles est définissable seulement
en termes de l'état pur v et de l'observable R.
5. Maximalité : l'ensemble des propriétés possédées possibles est maximal par rapport aux
conditions précédentes.

L'idée, alors, est de trouver un ensemble (maximal) de propriétés possédées possibles qui admet
une mesure de probabilité empiriquement adéquate mais interprétable en termes d'ignorance, qui
rend R avec une valeur définie et est fixé par l'état du système v et R. Le plus controversé est
sûrement "R-privilégié" car il n'est pas clair pourquoi il devrait y avoir un certain observable
"privilégié" dans ce sens, et particulièrement comment il peut être sélectionné. On ne devrait pas
avoir un observable sélectionné de fait, par exemple. Si nous voulons choisir un observable et
stipuler d'une manière plus ou moins ad hoc qu'il doit avoir une valeur, alors il n'est pas clair
pourquoi nous devrions être concernés par l'interprétation de la mécanique quantique en premier
lieu.

Bub et Clifton prouvent le résultat assez remarquable que les conditions ci-dessus conduisent à un
ensemble unique de propriétés possédées possibles, définis comme suit. Soit {Pi } l'ensemble des
projecteurs sur les vecteurs vi qui sont les projections de v sur les espaces propres de R. Alors
l'ensemble est comme défini ci-dessus pour le théorème de Clifton concernant la décomposition
spectrale des interprétations modales.

Bub n'est pas silencieux sur la question soulevée ci-dessus de pourquoi il y aurait un observable
privilégié et comment il peut être choisi. Tout d'abord, il note qu'un certain nombre d'interprétations
traditionnelles de la mécanique quantique peuvent être caractérisées de cette manière. En particulier
parmi elles il y a l'interprétation de Dirac - von Neumann, (ce que Bub prend comme)
l'interprétation de Bohr et peut-être la théorie de Bohm. Dans ce dernier cas, Bub (suivant Vink,
1993) affirme que la théorie de Bohm peut dans un sens être retrouvée comme une sorte de limite
d'une interprétation modale dans laquelle les R sont choisis comme les observables discrets de
position. Deuxièmement, Bub affirme (particulièrement dans son travail de 1997) que R pourrait
être sélectionné par le processus physique de décohérence. Nous laisserons cette suggestion comme
une possibilité tentante.
III.3.4. Ensembles de réalité : le problème de la mesure imparfaite
Plus tôt, nous avons suggéré que la décomposition spectrale (et la décomposition biorthogonale)
des interprétations modales résout le problème de la mesure d'une manière particulièrement directe
: à la fin d'une mesure typique, le système composite (appareil plus système mesuré) est dans un
état tel que les propriétés possibles sont sélectionnées par ces interprétations modales incluant
exactement les états "pointeurs" de l'appareil. Donc ces interprétations attribuent le "bon" état à
l'appareil.

Il y a deux problèmes avec cette affirmation qui est en elle-même vraie. Premièrement, tout ce à
quoi on peut désirer attribuer une propriété définie n'est pas (ou n'est pas nécessairement) un
appareil à la fin d'une mesure. Deuxièmement, les mesures dans le monde réel ne satisfont pas le
modèle idéal que nous avons décrit plus tôt. En particulier, elles n'effectuent pas une corrélation
parfaite entre l'appareil et le système mesure. L'appareil de mesure est imparfait. Mais alors il est
loin d'être clair que la décomposition biorthogonale (ou spectrale) sélectionne les bonnes propriétés
pour l'appareil (un problème analogue fait face à Bub : est-ce que la décohérence sélectionne
toujours les observables appropriés avec une valeur définie ?)

Ce problème fut soulevé en premier par Albert et Loewer (1190, 1991), développé plus tard par
Elby (1993), et il enflamma considérablement la discussion. Avant de nous tourner vers les
réponses, nous notons qu'en fait le problème est inévitable dans le contexte de la mécanique
quantique. Il n'est pas dû simplement au fait que les appareils de mesure sont imprécis. Plutôt, le
formalisme quantique lui-même ne nous permet pas des corrélations parfaites. Considérons, par
exemple, une mesure standard de Stern-Gerlach du spin d'une particule. Immédiatement après
l'interaction entre la particule et les aimants, et même si cette interaction produit, initialement, une
séparation parfaite entre les particules de spin haut et les particules de spin bas, la fonction d'onde
de la particule émergeant des aimants se disperse instantanément pour couvrir tout l'espace. La
particule aura nécessairement une probabilité non nulle d'être trouvée dans la "mauvaise" région
(voir Dickson (1194) pour une discussion plus longue de ce point). Ainsi le problème auquel nous
faisons face ici n'est pas seulement un problème d'engineering, il est intrinsèque à la mécanique
quantique (pour cette raison, nous pouvons nous attendre à apprendre quelque chose en
l'examinant, que l'interprétation modale survive au problème ou pas).
La réponse des interprétations modales à ce problème "d'incertitude" intrinsèque aux mesures vient
en trois étapes. Premièrement, nous pouvons noter que les "termes d'erreur" dans l'état du système
composite (appareil plus mesuré) seraient typiquement très petits, tel que le vrai état final sera
extrêmement proche de l'état idéal (dans le sens que leur produit scalaire serait très proche de un).
Dans ce cas, on peut s'attendre à ce que la décomposition spectrale (des états réduits pour l'appareil
et le système mesuré) sélectionnerait des états pour les deux systèmes qui sont extrêmement
proches des états "idéaux". Spécifiquement, les propriétés possédées possibles "réelles" de
l'appareil seraient très proches (dans l'espace de Hilbert) des propriétés possédées possibles
"idéales". Une question intéressante qui vient ici est si "proche" est suffisament bon. Quelle que
soit la réponse, il est crucial de réaliser que les interprétations modales ne proposent pas ici une
solution FAPP ("pour tout usage pratique") au problème de la mesure. Non, elles affirment que
l'état réel de l'appareil est "proche" de l'état idéal attendu et qu'il n'y a pas de problème empirique
en faisant cette affirmation.

Cependant, avant qu'on puisse conclure en débattant cette question, nous devons faire face à deux
étapes supplémentaires dans la réponse des interprétations modales au problème des mesures
imparfaites. La première vient de la réalisation que quand l'état final du système composite est
pratiquement dégénéré (quand il est écrit dans la base donnée par l'observable mesuré et les
observables "pointeurs" appareil, c'est-à-dire quand les probabilités pour les différents résultats sont
pratiquement égales) la décomposition spectrale ne choisit en fait pas de base qui est même proche
du résultat attendu idéal. Ce point fut discuté en grand détail par Bacciagaluppi et Hemmo (1996).
Se rattachant à la (quasi) ubiquité de la décohérence dans la réalité macroscopique, ils affirment
que quand l'appareil est considéré comme un système de dimension finie (plus précisément, quand
l'appareil est modélisé par un espace de Hilbert de dimension finie) la décohérence garantit plus ou
moins que la décomposition spectrale de l'état (réduit) de tout objet macroscopique sera très proche
du résultat idéal attendu. Par exemple, les pointeurs seront dans des positions bien localisées.

L'étape finale de la réponse des interprétations modales au problème implique la considération du


cas (probablement plus réaliste) d'une infinité d'états distincts pour l'appareil. Baccagialuppi (2000)
a analysé cette situation en utilisant un modèle continu de l'interaction de l'appareil avec
l'environnement. Il en a conclu que dans ce cas, la décomposition spectrale de l'état réduit de
l'appareil ne sélectionne pas d'états qui sont fortement localisés. Ce résultat s'applique plus
généralement à d'autres cas où un système macroscopique (non idéalisé avec un nombre fini de
dimensions) subit la décohérence due à l'interaction avec son environnement (voir aussi Donald
(1998)).

Deux suspicions viennent immédiatement de ces résultats. La première est que l'interprétation
modale, comme établie jusqu'ici, n'a jamais été en position de traiter le cas d'espaces de Hilbert de
dimensions infinies en mécanique quantique. La seconde (reliée à la première) est que la
décomposition spectrale n'est en aucun cas le bon outil à utiliser pour sélectionner les propriétés
possédées possibles. Ces problèmes sont sérieux. Même la mécanique quantique non relativiste
standard se déroule dans l'arène d'espaces de Hilbert de dimensions infinies, sans parler de la
théorie quantique des champs. En effet, dans ce dernier cas, la plus part de ce que nous avons dit
sur ce point devrait être significativement révisé ou simplement rejeté.
III.3.5. L'approche algébrique
L'approche algébrique des interprétations modales attaque ces questions, d'abord en visant un
formalisme qui est significativement plus général que celui développé jusqu'ici, un qui peut
s'appliquer à la mécanique quantique dans des espaces de Hilbert de dimensions infinies et à la
théorie quantique des champs, et deuxièmement, en s'abstrayant d'un choix particulier pour les
propriétés possédées possibles (notez que deux variantes alternatives des interprétations modales
qui visent aussi à résoudre certaines des questions ci-dessus ont récemment été proposées par
Spekkens et Sipe (2001) et par Bene et Dieks (2002)).

Les rudiments d'une approche algébrique sont déjà présents dans le travail de ceux qui, dans le
milieu des années 90, visaient à fournit une motivation pour les interprétations modales. Nous y
avons vu que les interprétations modales étaient décrites en termes plus ou moins algébriques, c'est-
à-dire comme un certain ensemble fermé sous les opérations algébriques (les opérations de
conjonction, disjonction et orthocomplément sur le réseau des projecteurs d'un espace de Hilbert,
par exemple). En effet, Bub définit son interprétation en ces termes : son ensemble des propriétés
possédées possibles est défini algébriquement, en termes d'un observable choisi arbitrairement (ci-
dessus, R).

Bien qu'il fut reconnu par les premiers chercheurs (Bub, Clifton, Dickson et d'autres) que
l'ensemble des propriétés possédées possibles peut être caractérisé d'une manière algébrique
intéressante, le premier travail algébrique sérieux sur les interprétations modales fut fait par Bell et
Clifton (1995) qui définirent la notion d'une "algèbre quasi booléenne". Ces algèbres sont "presque"
distributives dans un sens bien défini. C'est leur "quasi" distributivité qui permet la définition de
mesures de probabilité classiques sur elles qui dans les yeux de plusieurs interpréteurs est la
précondition pour adopter une interprétation d'ignorance des probabilités.

Suivant ce travail, Zimba et Clifton (1998) virèrent un peu de bord et considérèrent non pas les
algèbres (ou les réseaux) d'opérateurs de projecteurs mais les algèbres d'observables. Les avantages
de cette approche sont multiples. Premièrement, il y a des théories bien développées d'algèbres
d'opérateurs sur lesquelles on peut travailler. Deuxièmement, elle permet, en principe, de travailler
avec des observables incluant généralement ceux qui n'ont pas d'espaces propres. Troisièmement,
elle permet une justification possible plus attirante pour le type de condition de "fermeture" qui a
été mentionné ci-dessus.

Zimba et Clifton se sont largement concentré sur cette dernière question, considérant un certain
nombre de conditions de fermeture sur l'ensemble des observables à valeurs définies. Par exemple,
l'ensemble doit-il être fermé sous les combinaisons linéaires réelles ? Dans ce cas on peut supposer
qu'une combinaison réelle d'observables qui sont à valeurs définies est elle-même à valeur définie.
Des combinaisons algébriques arbitraires ? Des fonctions ("hermitiques") arbitraires ? Zimba et
Clifton ont prouvé un certain nombre de résultats intéressants concernant l'algèbre des observables
sélectionnés par les interprétations modales (leurs résultats ne sont cependant pas tous applicables
au cas de dimension infinie). De manière un peu plus précise, on commence avec une algèbre quasi
booléenne de projecteurs, pas nécessairement sélectionnés par une des prescriptions que nous avons
discutées mais seulement des algèbres quasi booléennes, et on considère alors les observables qui
sont à valeur définie en vertu de cette algèbre quasi booléenne constituant une algèbre de propriétés
possédées possibles. Suivant Zimba et Clifton, appelons une telle algèbre d'observables D. Zimba et
Clifton considèrent alors s'il existe des évaluations sur D (c'est-à-dire des attributions de valeurs à
tous les observables dans D) qui respectent des relations fonctionnelles (hermitiques) arbitraires
parmi les observables dans D. C'est-à-dire, soit v[ A] représentant la valeur de A (pour A dans D) et
soit f une fonction (hermitique), nous exigeons que f (v[ A]) = v[ f ( A)] . La réponse est "oui". De
manière plus importante, ils montrent qu'il y a suffisament de telles évaluations pour que les
probabilités quantiques sur D puissent être retrouvées à partir d'une mesure de probabilité classique
sur de telles évaluations. En d'autres mots, on peut comprendre les probabilités quantiques comme
une ignorance sur quelles valeurs les observables dans D ont réellement.

Le dernier chapitre de cette ligne de raisonnement est dû à Halvorson et Clifton (1999). Ils ont
étendu le résultat de Zimba et Clifton au cas des observables non bornés. Cependant, il reste des
questions ouvertes sur ce cas.
III.3.6. Dynamique
Comme nous l'avons vu, les interprétations modales proposent de fournir, à tout instant du temps,
un ensemble de propriétés possédées possibles (ou d'observables de valeur définie) et des
probabilités pour la possession de ces propriétés (ou pour les valeurs de ces observables). Certains
avocats des interprétations modales peuvent vouloir en rester plus ou moins là. D'autres pensent
qu'il est crucial pour toute interprétation modale de répondre aussi à des questions de la forme :
étant donné qu'un système possède la propriété P au temps s, quelle est la probabilité qu'il possède
la propriété P' au temps t (t > s) ? En d'autres mots, ils désirent une dynamique des propriétés
possédées (il est clair, par exemple, que la description de Healey nécessite une certaine
dynamique).

Il y a des arguments des deux cotés. Ceux qui considèrent une dynamique des propriétés possédées
comme superflue peuvent demander si la mécanique quantique ne pourrait pas être éliminée avec
juste des probabilités à temps unique. Pourquoi ne pouvons nous pas établir une interprétation qui
complète la mécanique quantique seulement en fournissant d'une manière systématique un
ensemble (l'ensemble des propriétés possédées possibles) sur lequel les probabilités à temps unique
sont définies ? Si nous exigeons de cet ensemble qu'il inclue les propriétés de tous les jours des
objets macroscopiques, alors qu'avons nous besoin de plus ? Indiscutablement, van Fraassen a une
position similaire considérant une dynamique des valeurs d'état comme étant plus qu'une
interprétation de la mécanique quantique devrait fournir.

Ceux qui affirment la nécessité d'une dynamique répliquent que nous avons besoin de l'assurance
que les trajectoires des propriétés possédées sont, au moins pour des objets macroscopiques, plus
ou moins ce que nous voyons en être. Par exemple, nous exigerions non seulement que le livre au
repos sur le bureau ait une position définie mais aussi que s'il n'est pas perturbé sa position relative
au bureau ne change pas dans le temps. Nous avons aussi besoin de montrer que ces spécifications
sont au moins compatibles avec une dynamique raisonnable. Même mieux, nous aimerions voir la
dynamique explicitement.

La question vient de ce que l'on considère être "le phénomène qui a besoin d'être sauvé" par une
interprétation. Ceux qui croient que le phénomène en question inclut les phénomènes dynamiques
seront inclinés à chercher une dynamique des propriétés possédées (ou des valeurs définies). Les
autres non.

Bien sûr, les interprétations modales admettent, trivialement, une dynamique non raisonnable, c'est-
à-dire une dans laquelle il n'y a aucune corrélation d'un instant à l'autre (dans ce cas, la probabilité
de transition de la propriété P en s à P' en t est juste la probabilité à temps unique de P' en t). Dans
un tel cas, le livre sur la table ne peut pas rester au repos relativement à la table même s'il est non
perturbé. De telles dynamiques sont peu intéressantes pour ceux qui cherchent une dynamique.
Comme nous l'avons vu, leur motivation est (probablement) de fournir une assurance que
l'interprétation modale peut décrire le monde plus ou moins comme nous pensons qu'il est.

Plusieurs chercheurs ont contribués au projet de construire une dynamique pour les interprétations
modales. La description la plus complète est de Baccagialuppi et Dickson (1999). Ce travail répond
à la plus part des défis auquel fait face la construction d'une dynamique, bien qu'ils aient laissés
quelques questions importantes ouvertes.

Le premier défi est posé par le fait que l'ensemble des propriétés possédées possibles - appelons le
'S' - peut changer au cours du temps. En d'autres mots, "l'espace d'état" (S) sur lequel nous voulons
définir les probabilités de transition est lui-même dépendant du temps. La solution est de définir
une famille d'applications, chacune étant une bijection de S à un moment sur S (différent !) à un
autre moment. Avec de telles familles d'applications, on peut effectivement définir des probabilités
conditionnelles dans un seul espace d'états puis le traduire en probabilités de "transition" par
l'utilisation de cette famille d'applications. Bien sûr, pour que cette technique fonctionne, S doit
avoir la même cardinalité à chaque instant. En général (par exemple, dans les interprétations reliées
à la décomposition spectrale) ce n'est pas le cas. On doit alors augmenter S à chaque instant pour
que la cardinalité corresponde à la plus haute cardinalité que S puisse atteindre.

Bien sûr, on espère faire cela d'une manière qui n'est pas complètement ad hoc. Par exemple, dans
le contexte de la version décomposition spectrale de l'interprétation modale, Bacciagaluppi, Donald
et Vermass (1995) montrent que la "trajectoire" (à travers l'espace de Hilbert) des composantes
spectrales de l'état réduit d'un système physique sera, sous des conditions raisonnables, continue ou
aura seulement des discontinuités isolées (telle que la trajectoire peut naturellement être prolongée
à une trajectoire continue). Ce résultat suggère une famille naturelle d'applications comme discutée
ci-dessus : appliquer chaque composante spectrale à un moment à son unique évolution (continue) à
un moment plus tard.

Le second défi à la construction d'une dynamique vient du fait qu'on désire définir des probabilités
de transition sur des unités infinitésimales de temps puis en dériver les probabilités de transition à
temps fini. Ce problème est central dans la théorie des processus stochastiques. En adaptant les
résultats de la théorie des processus stochastiques, on peut montrer que la procédure peut, plus ou
moins, être exécutée pour les interprétations modales sur au moins quelques variables.

Finalement, on doit réellement définir les probabilités de transition infinitésimales qui conduiront
aux probabilités quantiques propres à un moment. En suivant le travail de Bell (1984) et Vink
(1993) et d'autres, Baccagialuppi et Dickson définissent qu'il faut une classe infinie de telles
probabilités de transition infinitésimales. Certaines d'entre elles peuvent être considérées plus
"quantiques" que d'autres mais toutes génèrent les probabilités à temps uniques correctes qui sont,
peut-on dire, tout ce que nous pouvons tester à strictement parler. D'autre part, Sudberry (2000) a
affirmé que la forme des probabilités de transition serait pertinente pour préciser la forme des
désintégrations spontanées ou le "saut quantique de Dehmelt" (autrement connu comme le
"télégraphe quantique" ou la "fluorescence intermittente"). En effet, il a développé
indépendamment la dynamique de Baccagialuppi et Dickson et l'applique d'une telle manière
qu'avec le choix "standard" des probabilités de transition elle conduit aux prédictions correctes pour
ces expériences. Des expériences quelque peu inhabituelles peuvent s'avérer être des tests de base
cruciaux pour des "interprétations" alternatives de la mécanique quantique, comme signalé par
Shimony (1990).
III.3.7. Projets ouverts
Un certain nombre de projets et problèmes ouverts font face aux interprétations modales. Ci-dessus
nous avons vu que la décomposition spectrale est probablement inadéquate. Le travail algébrique
plus récent s'abstrait de choix spécifiques mais à la fin on se sent tenté de retourner à cette question.
En effet, on aimerait tout au moins savoir quel choix peut au moins capturer ce que nous croyons
être vrai sur le monde. Nous avons noté un certain nombre de théorèmes de la forme "le plus grand
ensemble d'observables qui peuvent être rendu simultanément définis (sous certaines conditions)
dans S" pour un certain S. Devons nous supposer que la nature a été faite pour rendre toutes les
affirmations simultanément vraies descriptibles en termes d'un de ces ensembles ? Sans une
démonstration que la réponse est (au moins plausible) "oui", on peut s'interroger.

D'autres questions fondamentales se posent, dont nous n'avons pas discuté du tout ici. Par exemple,
est-ce que l'idée derrière les interprétations modales est raisonnable ? Certains ont affirmé que la
théorie quantique ne devrait pas être vue en termes "d'opérateurs" et "d'états quantiques". Ils
questionnent même les fondements du formalisme de l'espace de Hilbert, que les interprétations
modales prennent assez sérieusement. Par exemple, Daumer et al. (1996) affirment qu'on ne devrait
pas prendre naïvement les opérateurs pour représenter des quantités physiques (quoi qu'il soit
controversé que les interprétations modales fassent ainsi ou le fassent en tout cas dans le sens naïf
qu'ils écartent). D'autre part, Brown, Suarez et Baccagialuppi (1998) affirment qu'il y a plus que la
réalité quantique qui est habituellement décrite par les opérateurs et les états quantiques : jauges et
systèmes de coordonnées sont cruciaux pour notre description de la réalité physique tandis que les
interprétations modales n'ont de manière standard pas prises ces choses en considération.

Le récent travail algébrique est lui-même une source de plusieurs questions ouvertes. Halvorson et
Clifton (1999) en mentionnent eux-mêmes plusieurs. On peut aussi poser des questions plus
fondamentales sur l'approche algébrique elle-même. Par exemple, quelle est la motivation des
conditions de fermeture algébrique ? Les opérations fonctionnelles correspondent-elles à des
opérations empiriques bien définies ? Si la signification physique de l'observable A est bien
comprise, comprenons-nous donc ce que f(A) signifie ? Si non, alors pourquoi insister sur la
fermeture fonctionnelle ? Si oui, que signifie-t-elle ?
Dans la réalité de la dynamique, Baccagialuppi et Dickson (1999) soulèvent un certain nombre de
questions marquantes. En plus, la question de savoir si une dynamique est réellement nécessaire est
encore un sujet de discussion parmi les chercheurs. Relié à ces questions il y a la question de
l'invariance de Lorentz. Dickson et Clifton (1998) ont montré qu'une large classe d'interprétations
modales ne peuvent pas être invariantes de Lorentz. Est-ce que les interprétations modales sont
toutes sujettes à cela ou à des résultats similaires ? Si oui, que devons nous faire de cette situation ?

Plusieurs questions et problèmes ouverts supplémentaires font face aux interprétations modales.
Quels que soient leurs mérites au final, on peut au moins dire qu'elles ont conduit à des séries
sérieuses et fertiles d'investigations dans la nature de la théorie quantique.
III.3.8. Evaluation
Les interprétations modales ont des liens étroits avec la logique quantique et des travaux importants
ont été accomplis. Mais notre but n'est pas ici de voir si des résultats importants ont été obtenus
mais ce que ces interprétations valent en tant que telles.

Il faut tout d'abord noter que ces approches sont fort semblables aux théories à variables cachées,
elles en partagent en tout cas une partie des motivations, trouver des valeurs définies à associer aux
états, sans toutefois souffrir des mêmes problèmes (mis en évidence par le théorème de Bell ou le
théorème de Kochen et Specker, par exemple).

D'un point de vue interprétatif, il faut bien avouer que ces interprétations ne sont pas très claires.
Que sont réellement sensées représenter ces valeurs définies ? Quelles sont ces valeurs ? La
question se pose d'autant plus qu'il y a plusieurs variantes et plusieurs approches pour définir ces
valeurs et qu'elles n'ont ni les mêmes objectifs ni les mêmes résultats. Mais il est vrai que beaucoup
de travail reste à faire. Trop d'ailleurs, à notre point de vue, si on veut considérer ces interprétations
comme un outil interprétatif concret.

 Respect du formalisme de la physique quantique.


Ces interprétations respectent le formalisme et veillent même à être en adéquation avec les
résultats de la mécanique quantique.
 Limite.
Sauf dans certaines variantes anciennes (comme celles basée sur la décomposition
biorthogonale) ces interprétations ne souffrent a priori pas de limites.
 Principe anthropique.
Ces interprétations ne donnent pas un rôle privilégié à tel ou tel observateur ou type
d'observateurs. Sauf exception (choix de l'observable privilégié R).
 Réalisme ou positivisme.
Ces interprétations sont réalistes, tout au moins c'est leur motivation et cherchent à se passer de
la réduction. Il semble que dans, au moins certains cas, l'ensemble des valeurs définies permette
d'obtenir tous les résultats expérimentalement vérifiables.
 Rasoir d'Ockham.
La construction des ensembles de valeurs nécessite le choix de plusieurs axiomes dont la
motivation n'est d'ailleurs pas toujours claire.
 Bases privilégiées.
Il n'est pas nécessaire, dans la plus part des versions, de choisir des bases privilégiées (sauf dans
le cas du choix d'un observable privilégié).
 Caractère explicatif des probabilités et de la réduction.
Le lien avec la réduction n'est pas évident à cerner mais les résultats définis sont au moins
clairement une conséquence des valeurs définies.
 Coté pédagogique.
Cette approche est hautement complexe et nécessite tant une maîtrise de la mécanique
quantique que de la logique quantique.
Elle ne peut servir de cadre pédagogique pour enseigner la mécanique quantique.
En outre, trop de travail reste à accomplir pour la considérer comme une interprétation
utilisable en pratique.
 Défauts.
Les ensembles de valeurs définies ne sont pas toujours clairs et leur variété selon les variantes
de ces interprétations rend difficile un choix clair.
D'autres difficultés pourraient exister notamment en mécanique quantique relativiste, mais ces
interprétations ne sont pas assez abouties pour émettre un avis ferme sur ce point.

Interprétations modales : -4.

C'est un excellent score mais… le caractère totalement non abouti de ces interprétations ne le
rendent pas utilisables en pratique.
III.4. La théorie de Bohm
La théorie de Bohm a été présentée en détail dans le tome VI ainsi que des défauts. Nous donnons
donc ici seulement l'évaluation.

 Respect du formalisme de la mécanique quantique.


L'interprétation de Bohm respecte totalement le formalisme de base de la mécanique quantique
en l'absence de mesure pour les phénomènes microscopiques. Elle ajoute une "couche"
supplémentaire avec les corpuscules mais sans modifier le formalisme initial.
 Limite.
La théorie est obligatoirement non relativiste car non locale.
 Principe anthropique.
Aucun rôle privilégié n'est donné à tel ou tel observateur ou type d'observateur.
 Réalisme ou positivisme.
La théorie est strictement réaliste et prouve, de surcroît, qu'une théorie à variables cachées (non
locales et contextuelles) est possible.
 Rasoir d'Ockham.
La théorie de Bohm est l'extension minimale à apporter à la mécanique quantique afin d'obtenir
une théorie complète (à tout observable correspond une quantité prédéterminée par la trajectoire
du corpuscule). Mais ce n'est minimal que pour cet objectif ! La théorie ajoute en fait un très
grand nombre de variables cachées (une infinité). On peut toutefois considérer qu'elle n'ajoute
qu'une variable (par particule) : sa position.
 Bases privilégiées.
L'interprétation donne un rôle privilégié à la base position.
 Caractère explicatif des probabilités et de la réduction.
La théorie explique parfaitement les probabilités mais :
 N'explique pas vraiment la nature de la fonction d'onde. Même si on affirme que c'est une
onde. D'autant plus que celle-ci est totalement inobservable, elle n'est qu'un guide et ce qui
est mesuré ce sont les objets fondamentaux que sont les corpuscules. Son évolution n'est
même pas influencée par les corpuscules. Ces derniers sont considérés comme les objets
fondamentaux alors que ce n'est pas ce qui ressort de la formulation théorique !
 N'explique pas l'origine de la distribution statistique initiale des corpuscules. L'hypothèse
"thermique" de l'équivariance étant spéculative.
 Coté pédagogique.
La théorie est assez intuitive et donc pédagogique. Mais la nécessité de prendre en compte le
caractère non contextuel, les trajectoires hautement non classiques et la plus grande complexité
des équations la rend très difficile d'usage et en tout cas peu adaptée pour expliquer la
mécanique quantique.
 Défauts.
Ajoutons :
 Des trajectoires "réelles" non observables.
 Les trajectoires des corpuscules hautement non classiques sans rapport avec les trajectoires
des particules classiques correspondantes (les adeptes de la théorie de Bohm ne voient pas
cela comme un défaut).
 Le caractère ad hoc de la théorie (qui donne l'impression d'une structure mathématique
artificielle conçue juste pour donner le nom de "corpuscules" au flux de probabilités).

Interprétation de Bohm : -9.


III.5. Transactionnel

III.5.1. Introduction
L'interprétation transactionnelle est une interprétation originale entièrement imaginée et élaborée
par le physicien John G. Cramer. Nous allons la présenter.

Il fut un temps où les articles disaient que seulement douze hommes comprenaient la théorie de la
relativité. Je ne crois pas qu'il y ait jamais eut une telle époque.... D'un autre coté, je pense qu'on
peut affirmer sans risque que personne ne comprend la mécanique quantique. Evitez de vous
demander, si vous pouvez l'éviter, "Mais comment peut-elle être comme ça ?", car vous "tomberiez
du train" dans une ruelle sombre dont personne n'a encore pu s'échapper. Personne ne sait
comment elle peut être comme ça.
R.P. Feynman (1967a)

Il s'est passé plus d'un demi siècle depuis la remarquable période de 1927 où la mécanique
quantique moderne a soudainement émergé du travail de Heisenberg (1925, 1927), de Broglie
(1926, 1927), Schrödinger (1926, 1927) et Born (1926, 1927) et a rapidement remplacé la
mécanique newtonienne et la "vieille théorie quantique" de Planck, Einstein et Bohr en tant que
théorie standard dans le domaine de tous les phénomènes microscopiques. Le formalisme
mathématique de la mécanique quantique, bien que refondue et généralisée dans les décades
suivantes, n'a jamais été sérieusement mis en défaut ni théoriquement ni expérimentalement et reste
comme fermement éprouvé comme il l'était au début des années 1930.

Et sur cette période entière depuis le développement original de la mécanique quantique, il y a eut
des controverses sur son interprétation. Les questions sur la signification des mathématiques et de
la réalité sous-jacente derrière les lois et procédures de la mécanique quantique ont été un champ de
bataille pendant cinq décennies et la trêve n'a pas encore été signée. La controverse s'est, en fait,
récemment intensifiée. Les "actions à distance" qu'Einstein (1947) avait perçu dans la mécanique
quantique semblent avoir été démontrée par le travail théorique de J.S. Bell (1964, 1966) et le
travail expérimental qui en a suivi (Freedman, 1972, Clauser, 1978, Aspect, 1982). Cet ensemble de
travaux (Clauser, 1978, Stapp, 1971, 1982) montra de manière remarquable que la mécanique
quantique (et la nature) ne peut pas simultanément avoir les propriétés de "localité" et de
"définition contrafactuelle", mais doit à la place abandonner l'une ou l'autre (ou les deux).
III.5.1.1. Définition contrafactuelle
Le terme définition contrafactuelle utilisé ici fut introduit par Stapp (1971, voir aussi Herbet, 1978)
comme une supposition minimale. Elle signifie que pour les différentes mesures alternatives
possibles (éventuellement de variables non commutantes) qui peuvent avoir été effectuées sur un
système quantique, chacune pourrait avoir produit un résultat observable définit (mais inconnu et
éventuellement aléatoire) et de plus que cet ensemble de résultats est une matière appropriée pour
la discussion. La définition contrafactuelle est réellement une supposition assez faible et est souvent
employée par les physiciens expérimentaux dans l'investigation et la discussion sur les systèmes
quantiques. Elle est complètement compatible avec les mathématiques de la mécanique quantique
mais est un peu en conflit avec l'élément positiviste de l'interprétation de Copenhague.

Le terme localité signifie que des parties séparées du système décrit sont supposées restées
corrélées aussi longtemps qu'elles ont la possibilité d'un contact à la vitesse de la lumière et que
lorsqu'elles sont isolées d'un tel contact les parties séparées peuvent rester en corrélation seulement
à travers la "mémoire" du contact précédent. Le terme de non-localité implique l'inverse, par
exemple la corrélation établie plus vite que la lumière sur des intervalles spatiaux ou temporels
négatifs. On pourrait faire la distinction entre contrainte non locale des corrélations, dont il est
question ici, et communication non locale, qui (bien que quelque fois confondue avec la
précédente) est une condition de loin plus forte. Cette distinction sera clarifiée plus loin.
III.5.1.2. Non-localité et formalisme
Les mathématiques de la mécanique quantique n'utilisent pas explicitement de telles corrélations
non locales. Elles requièrent cependant que toutes mesures séparées des propriétés d'un système
étendu soient traitées comme les parties du même "état" quantique, sans s'occuper du degré de leur
séparation des mesures dans le temps et/ou l'espace. Cette nécessité d'état commun peut être
interprétée comme une sorte de non-localité de facto, mais cette association n'est pas faite
conventionnellement en appliquant l'interprétation de Copenhague aux mathématiques.

Mermin (1985) a suggéré que la question de savoir s'il y a quelques problème fondamental avec la
mécanique quantique signalé par les tests des inégalités de Bell, les physiciens peuvent être divisés
en une majorité qui sont "indifférents" et une minorité qui sont "ennuyés". S'il y avait une vue
prédominante parmi cette minorité concernée comme la résolution de la dichotomie précédente, la
définition contrafactuelle contre localité, ce serait probablement que la définition contrafactuelle,
bien que pragmatiquement utile dans les applications pratiques et les discussions de la mécanique
quantique, doit être philosophiquement abandonnée pour le positivisme car l'alternative de non-
localité est inacceptable. Cela est perçu par certain que la non-localité doit être en conflit direct
avec la relativité restreinte car elle est considérée utilisée, au moins au niveau des expériences de
pensées, comme de "vraies" déterminations de la simultanéité relativiste et doit être en conflit avec
la causalité car elle offre la possibilité de signaux remontant le temps. Mais cette vue est au mieux
discutable. Bien qu'il soit clair que la communication non locale entre observateurs puisse conduire
à de tels conflits, les corrélations non locales minimales nécessaires pour invalider le postulat de
localité de Bell sont compatibles avec à la fois la relativité et la causalité.

L'approche alternative à la dichotomie, et qui est défendue ici, est de retenir la définition
contrafactuelle et d'abandonner la localité. Contrairement à ce qu'on peut croire, cela ne nécessite
pas la révision du formalisme mathématique de la mécanique quantique mais seulement une
révision de l'interprétation du formalisme. L'interprétation transactionnelle de la mécanique
quantique qui est la nouvelle interprétation présentée ci-dessous est explicitement non locale mais
aussi invariante relativiste et totalement causale. Elle est consistante avec toutes les prédictions
théoriques familières et les démonstrations expérimentales de la mécanique quantique
conventionnelle et fournit en effet une nouvelle vision de certains des aspects les plus contre
intuitifs du formalisme de la mécanique quantique.
III.5.2. Règles de base
Lorsque nous examinerons un formalisme de la mécanique quantique dans le contexte d'une
interprétation, nous restreindrons nos considérations au formalisme de Schrödinger - Dirac (Dirac,
1930) de la mécanique ondulatoire. Bien que ce formalisme soit peut-être moins élégant que
certaines de ses alternatives, nous le trouvons le plus transparent pour l'interprétation. A cause de
l'équivalence complète (Schrödinger, 1926) entre le formalisme de la mécanique ondulatoire et de
ses principales alternatives, aucune perte de généralité n'est introduite par cette restriction. Pour des
raisons dont nous discuterons plus tard, nous supposerons que les équations d'onde décrivant le
système considéré sont invariantes relativistes.

Les interprétations d'une théorie physique ne peuvent normalement pas être sujettes à des
vérifications expérimentales. Pour cette raison, il sera nécessaire d'utiliser des critères autres que
l'appel à l'expérience pour faite toute sorte de comparaison critique. Nous aimerions lister ces
critères explicitement ici :
1. Economie (rasoir d'Ockham) : il est préférable de construire l'interprétation pour utiliser un
nombre minimum de postulats indépendants.
2. Compatibilité : il est préférable que les constructions non observables de l'interprétation soient
compatibles avec les lois physiques, même si de telles lois ne sont pas directement reliées à la
théorie interprétée, par exemple la mécanique quantique. Dans le cas présent, nous emploierons
les lois de l'invariance relativiste, la causalité macroscopique et l'invariance par renversement
du temps dans ce contexte. [La violation de ces critères, par exemple la violation d'une loi
physique par une construction d'interprétation, est quelque fois appelées un "paradoxe
d'interprétation". Ils doivent être évités.]
3. Plausibilité : il est préférable que les mécanismes, s'il y en a, employés par l'interprétation
soient physiquement plausibles. Le sens commun n'est pas toujours un guide fiable en physique,
mais il peut souvent aider faire un choix alternatif entre deux alternatives autrement égales.
4. Profondeur : Il est préférable qu'une interprétation fournisse une vue approfondie des
mécanismes de la nature cachés derrière le formalisme mathématique. Fournir des explications
des processus fondamentaux de la nature est une fonction importante d'une interprétation. Par
exemple, le concept d'interprétation des lignes de champ introduit par Faraday, bien que non
nécessaire au formalisme de l'électrodynamique, fournit un support riche et puissant pour
obtenir une vue approfondie des phénomènes électromagnétiques.
III.5.3. L'interprétation transactionnelle de la mécanique quantique
L'interprétation de Copenhague n'est pas libre de critiques. Plusieurs problèmes d'interprétations
sont traités seulement de manière superficielle par l'interprétation de Copenhague. Le domaine
problématique est centré autour de l'association du vecteur d'état avec une connaissance subjective
du système par un observateur. Nous allons présenter l'interprétation transactionnelle de la
mécanique quantique, une alternative à l'interprétation de Copenhague qui retient les liens
d'interprétation de l'interprétation de Copenhague entre le formalisme et l'expérience mais qui
remplace la subjectivité et les aspects non locaux implicites par une description objective et
explicitement non locale des processus quantiques.

L'analyse des défauts de l'interprétation de Copenhague permet de définir comme but un ensemble
de caractéristiques désirables dans une interprétation plus "idéale" :
(1) Elle devrait permettre l'opération du microcosme d'être isolé du macrocosme et particulièrement
des concepts macroscopiques intrinsèquement compliqués, par exemple les observateurs
intelligents, la conscience, l'irréversibilité et la mesure.
(2) Elle devrait prendre en compte les corrélations non locales des tests des inégalités de Bell d'une
manière consistante avec la relativité et la causalité.
(3) Elle devrait prendre en compte la réduction du vecteur d'état sans "déclenchement de réduction"
subjectif (par exemple la conscience).
(4) Elle devrait ajouter une signification du vecteur d'état et fournir une explication aux problèmes
de complexité, complétude et prédictivité.

Avec ces buts à l'esprit, nous présentons maintenant l'interprétation transactionnelle de la


mécanique quantique. Nous trouverons que l'interprétation transactionnelle, qui est objective et
explicitement non locale, satisfait chacun de ces buts. Elle fournit une description du vecteur d'état
comme une onde réelle physiquement présente dans l'espace réel. Elle fournit un mécanisme pour
l'application d'effets de corrélation non locaux à travers l'utilisation d'ondes avancées. La réduction
du vecteur d'état dans l'interprétation transactionnelle est la formation d'une transaction qui se
produit par l'échange d'ondes retardées et avancées. Le modèle transactionnel fournit selon son
auteur une manière de visualiser clairement, de développer l'intuition sur les phénomènes
quantiques qui sont restés mystérieux et contre intuitifs pendant un demi siècle.
III.5.3.1. Ondes avancées et théorie des absorbeurs de Wheeler -
Feynman
L'élément de base de l'interprétation transactionnelle est une transaction émetteur - absorbeur à
travers l'échange d'ondes avancées et retardées comme d'abord décrit par Wheeler et Feynman
(1945, 1949) [voir aussi (Feynman, 1967)]. Les ondes avancées sont solutions de l'équation d'ondes
électromagnétiques et d'autres équations d'onde similaires qui contiennent seulement la dérivée
seconde par rapport au temps. Les ondes avancées ont des valeurs propres caractéristiques d'énergie
et de fréquence négative et elles se propagent dans la direction négative du temps. La figure ci-
dessous illustre la propagation d'ondes avancées et retardées dans un diagramme de Minkowski où
l'émission a lieu point (x, t) = (0, 0).
Les solutions d'onde avancées de l'équation d'onde de l'électromagnétisme sont habituellement
ignorées comme non physiques car elles ne semblent pas avoir de contrepartie dans la nature.

L'électrodynamique classique décrite par Wheeler et Feynman fut conçue pour traiter le problème
de l'auto énergie de l'électron d'une manière innovante. En supposant le formalisme symétrique
dans le temps de Dirac (1938) combiné avec la supposition ad hoc qu'un électron n'interagit pas
avec son propre champ, Wheeler et Feynman furent capable d'éliminer formellement le terme
d'auto énergie de leur électrodynamique. Mais en même temps que l'auto énergie, ces suppositions
enlevèrent aussi les processus bien observés de perte d'énergie et de recul (par exemple
l'amortissement radiatif) venant de l'interaction de l'électron irradiant avec son propre champ de
radiation.

Cependant, Wheeler et Feynman prirent en compte des effets d'amortissement bien connus en
permettant à l'électron émetteur d'interagir avec l'onde avancée envoyée par d'autres électrons qui
devraient, ultimement, dans un certain temps futur, absorber la radiation retardée. Donc la perte
d'énergie et le recul de l'émetteur étaient pris en compte sans avoir à interagir avec son propre
champ. De plus, le calcul réussit à décrire les interactions électrodynamiques d'une manière
complètement symétrique dans le temps. Pour prendre en compte la dominance asymétrique de
l'observateur de la radiation retardée, Wheeler et Feynman invoquèrent l'action de conditions aux
limites externes venant de la thermodynamique. Ils évitaient donc le recours à la condition de
"causalité" ad hoc habituelle normalement nécessaire pour éliminer les solutions de radiation
avancée.

Malheureusement, l'article de Wheeler et Feynman, bien que mathématiquement correct, fut prouvé
être une manière invalide de traiter l'auto énergie. Comme Feynman (1949) l'a pointé plus tard,
l'auto interaction est une partie nécessaire de l'électrodynamique, nécessaire, par exemple, pour
prendre en compte l'effet Lamb. Et il est pertinent que la supposition ad hoc de non-interaction de
Wheeler et Feynman n'est pas nécessaire dans le calcul du recul car, comme les auteurs l'ont signalé
plus tard (Pegg, 1975, Cramer, 1980), l'électron ne peut pas subir une perte d'énergie ou un recul,
qui sont des processus intrinsèquement non symétriques dans le temps, comme résultat de
l'interaction avec son propre (ou tout autre) champ symétrique dans le temps.

Quand la supposition choquante de non-interaction est enlevée du formalisme de Wheeler et


Feynman, ce qui reste est une électrodynamique classique consistante et symétrique dans le temps
qui ne peut pas être utilisée pour aborder le problème de l'auto énergie. De plus, ce formalisme de
Wheeler et Feynman n'est pas particulièrement utile comme méthode alternative pour
l'électrodynamique des processus radiatif car la description mathématique de la radiation implique
explicitement l'interaction de l'émetteur avec l'univers futur en entier. Donc, une simple intégration
sur les coordonnées locales dans le formalisme conventionnel est remplacée par une intégration sur
tout l'espace-temps futur dans le cône de lumière de l'émetteur dans le formalisme de Wheeler et
Feynman.

Cependant, cette difficulté peut être vue comme un avantage. Les mathématiques de Wheeler et
Feynman peuvent être utilisées pour analyser les propriétés des modèles cosmologiques décrivant
l'état futur de l'univers en les reliant à de tels modèles de processus radiatifs. En essence, cette
approche fournit une manière de relier la flèche cosmologique du temps (la direction temporelle
dans laquelle l'univers est en expansion) à la flèche électrodynamique du temps (la dominance
complète des radiations retardées sur les avancées dans tous les processus radiatifs). Il y a une
littérature considérable dans ce domaine que l'auteur a résumé dans une publication précédente
(Cramer, 1983).

Bien que le travail original de Wheeler et Feynman traitait exclusivement d'électrodynamique


classique, des auteurs (Hoyle et Marlikar, 1969, 1971, Davies 1970, 1971, 1972) ont développé
ultérieurement une électrodynamique quantique symétrique dans le temps équivalente avec la
même approche. Les prédictions de ces théories d'électrodynamique quantique ont été montrées
complètement consistantes avec les prédictions de l'électrodynamique quantique conventionnelle
qui peut être comparée avec l'observation expérimentale. Il a été aussi montré (Davies, 1972) qu'en
dépit de cette similarité des prédictions, l'électrodynamique quantique symétrique dans le temps
fournit une description qualitativement différente des processus électrodynamiques. Elle est
essentiellement une théorie de l'action à distance sans degrés de liberté supplémentaires pour le
champ de radiation et sans seconde quantification. Le champ en effet devient une manière
mathématique pratique pour décrire les processus d'action à distance.

Il peut aussi y avoir un autre avantage à l'approche électrodynamique de Wheeler et Feynman. Le


travail de Dirac (1938) sur l'électrodynamique symétrique dans le temps, sur lequel la théorie de
Wheeler et Feynman est basé, fut introduit comme une manière de traiter les singularités dans le
champ de radiation dans la théorie conventionnelle près de l'électron irradiant. Konopinski (1980)
dans son traitement covariant de Lorentz de l'électron irradiant a signalé que cette approche
"Lorentz - Dirac" symétrique dans le temps élimine de telles singularités et conduit donc à une
théorie directement renormalisée. Cette formulation peut avoir des applications en éliminant les
singularités correspondantes dans la théorie quantique des champs dans un espace-temps courbe.
III.5.3.2. Le modèle transactionnel des émetteurs - absorbeurs
Il y a une seconde application de l'approche de Wheeler - Feynman qui fut introduite par l'auteur
dans une publication précédente (Cramer, 1980). La description de Wheeler et Feynman du
processus radiatif peut être appliquée à l'échange microscopique d'un seul quantum d'énergie,
impulsion, etc., entre un émetteur actuel et un seul absorbeur futur à travers le médium d'une
transaction, un échange de Wheeler - Feynman d'ondes avancées et retardées. La figure ci-dessous
illustre une forme simplifiée (un espace à une dimension et une dimension du temps) du processus
de transaction.
Les ondes émises par l'émetteur sont en rouges, celles émises par l'absorbeur en bleu. Les ondes
retardées sont en traits pleins et les ondes avancées en traits interrompus.

L'émetteur, par exemple un électron vibrant ou un atome dans un état excité, tente d'irradier en
produisant un champ. Ce champ, selon la description de Wheeler - Feynman, est une combinaison
symétrique dans le temps d'un champ retardé qui se propage dans le futur et d'un champ avancé qui
se propage dans le passé. Par simplicité, considérons d'abord le champ net qui consiste en une onde
plane retardée de la forme F1 ~ exp[i (kr − ω t )] pour t > T1 ( T1 est l'instant d'émission) et d'une
onde avancée de la forme G1 ~ exp[− i (kr − ω t )] pour t < T1 . Puisque l'onde retardée a des valeurs
propres caractéristiques d'énergie positive hω et d'impulsion hk , tandis que l'onde avancée G1 a
des valeurs propres d'énergie et impulsion négative − hω et − hk , la perte nette d'énergie et
d'impulsion par l'émetteur en produisant la paire d'ondes (F1 + G1 ) est zéro comme on peut s'y
attendre de la symétrie dans le temps de l'onde composite.

Laissons de coté pour le moment la considération de l'onde avancée G1 et suivons l'onde retardée
F1 . Cette onde se propagera dans la direction des temps positifs ( t > T1 ) jusqu'à ce qu'elle rencontre
un absorbeur. Le processus d'absorption, comme c'est bien connu, peut être décrit comme un
mouvement de l'électron (ou atome) absorbant en réponse au champ incident retardé F1 d'une telle
manière qu'il gagne de l'énergie, recule et produit un nouveau champ retardé F2 = − F1 qui annule
exactement le champ incident F1 . Donc, l'onde retardée de l'absorbeur annule exactement l'onde
retardée de l'émetteur et il n'y a pas de champ net présent après l'instant d'absorption T2 , c'est à dire
:
(1) Fnet = F1 + F2 = 0 pour t > T2

Mais la supposition de Dirac - Wheeler - Feynman de processus radiatifs symétriques dans le temps
nécessite que l'absorbeur puisse seulement produire le champ retardé annulant F1 pour t > T2 s'il
produit aussi un champ avancé G2 pour t < T2 . Ce champ G2 va se propager dans la direction des
temps négatifs (c'est à dire dans le passé) de l'instant d'absorption T2 , refaisant en arrière le chemin
de l'onde incidence F1 jusqu'à l'instant d'émission T1 . Il y a interaction avec l'électron (ou atome)
irradiant à l'instant d'émission, causant le recul et la perte d'énergie. De plus, l'onde avancée
continue dans le temps tel que t < T1 , où elle se surimpose à l'onde avancée de l'émetteur G1 pour
produire un champ avancé net :
(2) Gnet = G1 + G2

Mais la condition que F2 = − F1 à l'absorbeur pour t > T2 conduit à une condition similaire pour les
champs avancés, tel que G2 = −G1 à l'émetteur pour t < T1 tel que Gnet = 0 pour t < T1 . Le résultat
de l'annulation des ondes de pré-émission et de post-absorption est quel le champ est non nul
seulement dans l'intervalle T1 < t < T2 :
(3) Fnet = F1 + G2

Donc nous voyons que même sous la supposition de Dirac de la radiation symétrique dans le temps
d'ondes retardées et avancées, le champ avancé G1 ne peut pas produire "d'effets avancés" tel que
des signaux remontant le temps et l'émission de radiation d'énergie négative car elle a été annulée
par le processus d'absorption.

C'est, sous une forme simplifiée à une dimension qui sera développée ci-dessous, la transaction
émetteur - absorbeur. L'émetteur peut être considéré comme produisant une onde "offre" F1 qui
voyage vers l'absorbeur. L'émetteur retourne alors une onde "confirmation" vers l'émetteur et la
transaction est complétée par une "poignée de main" à travers l'espace-temps. Pour un observateur
qui n'a pas vu le processus dans la séquence pseudo-temporelle employée dans la discussion
précédente, il n'y a pas de radiation avant T1 ou après T2 mais une onde voyageant de l'émetteur
vers l'absorbeur. Cette onde peut être réinterprétée comme une onde purement retardée car sa
composante avancée G2 , une onde d'énergie négative voyageant en arrière dans le temps de
l'absorbeur vers l'émetteur, est une correspondance bijective avec la description habituelle.

Donc, la description de Wheeler et Feynman symétrique dans le temps des processus


électrodynamiques est complètement équivalente à tous les observables de la description
électrodynamique conventionnelle. L'électrodynamique symétrique dans le temps, à la fois sous
forme classique et quantique, conduit à des prédictions identiques de celles de l'électrodynamique
conventionnelle. Pour cette raison, il n'est pas possible de concevoir des tests expérimentaux qui
distingueraient l'électrodynamique symétrique dans le temps et conventionnelle. L'impossibilité
intrinsèque de test de l'électrodynamique symétrique dans le temps montre qu'elle devrait être
considérée comme une interprétation alternative du formalisme électrodynamique plutôt que
comme une formulation alternative.

C'est cette interprétation alternative du formalisme électrodynamique qui a été généralisée (Cramer,
1980) pour inclure tous les processus quantiques et qui a conduit à l'interprétation alternative de la
mécanique quantique qui est présentée ici. L'élément fondamental de cette interprétation est la
transaction émetteur - absorbeur, une simple version en ondes planes de ce qui fut décrit ci-dessus.
La transaction est une "poignée de main" entre les participants émetteur et absorbeur d'un
événement quantique se produisant à travers le médium d'un échange d'ondes avancées et retardées.
La description que nous venons de présenter est basiquement à une dimension (dans l'espace) et
n'est pas totalement applicable au cas à trois dimensions avec des conditions aux limites
quantifiées. Avant de discuter les applications de l'interprétation, nous allons généraliser le modèle
de transaction à trois dimensions spatiales.

Il y a deux problèmes avec la description en ondes planes à une dimension employée ci-dessus :
(1) Elle ne traite pas explicitement de l'atténuation et la modification de l'amplitude de l'onde due à
la propagation à travers l'espace ou le passage à travers un médium atténuateur.
(2) Elle n'inclut pas explicitement les conditions quantiques sur le transfert d'énergie, moment
angulaire, charge, etc. qui sont un aspect important de tout processus quantique.

Dans le cas de l'électrodynamique quantique, la condition de quantification de l'énergie du photon


E = hω place une contrainte supplémentaire sur l'équation d'onde électromagnétique, requérant
qu'un nombre entier de quanta soient échangé entre émetteur et absorbeur en dépit de l'action de
l'espace, filtres, miroirs, fentes, plans d'ondes, etc. réduisant ou modifiant l'amplitude des ondes
avancées ou retardées entre émetteur et absorbeur.

Pour ces raisons, la séquence pseudo-temporelle en deux étapes et la description associée en ondes
planes doit être remplacée par une séquence en plusieurs étapes permettant des ondes sphériques ou
plus compliquées qui se poursuivent jusqu'à ce que toutes les conditions quantiques appropriées
soient remplies. En particulier, nous devons voir la transaction comme se produisant sous forme
pseudo-séquentielle qui inclus une "offre", une "confirmation" et une transaction complète.

La figure ci-dessous illustre cette forme plus générale de transaction.


Dans la première étape pseudo-séquentielle (1) l'émetteur localisé en, (R1 , T1 ) envoie une onde
F1 (r , t > T1 ) et G1 (r , t < T1 ) (qui peut être sphérique ou plus compliquée) dans toutes les directions
spatiales possibles. Dans l'étape (2) l'absorbeur localisé en (R2 , T2 ) reçoit un front d'onde retardé
atténué F1 (R2 , T2 ) et produit simultanément une onde réponse G2 (r , t ) qui a une amplitude initiale
proportionnelle à l'amplitude locale de l'onde incidente qui l'a stimulé :
(4) G2 (r , t ) ~ F1 (R2 , T2 )g 2 (r , t )

Ici, g 2 (r , t ) est une onde avancée unité, c'est à dire l'équivalent avancé de l'onde retardée F1 (r , t )
où g 2 (r , t − T2 ) = [F1 (r , t − T1 )]

Dans l'étape (2) l'onde avancée G2 se propage vers le lieu d'émission où elle a une amplitude
proportionnelle à son amplitude initiale F1 (R2 , T2 ) multipliée par l'atténuation qu'elle a reçue en se
propageant du lieu d'absorption au lieu d'émission. Mais l'onde avancée G2 voyage à travers le
même intervalle spatial et à travers le même média atténuant rencontré par F1 , mais dans l'autre
sens. Pour cette raison, l'onde d'amplitude unité g 2 (R1 , T1 ) revenant à l'émetteur a une amplitude
qui est proportionnelle à F1∗ (R2 , T2 ) , le temps renversé de l'onde retardée qui a atteint l'absorbeur.
Donc, au lieu d'émission, l'amplitude de l'onde avancée G2 est :
(5) G2 (R1 , T1 ) ~ F1 (R2 , T2 )F1∗ (R2 , T2 ) = [F1 (R2 , T2 )]
2

Cela signifie que l'onde avancée de "confirmation" ou "écho" que l'émetteur reçoit de l'absorbeur
comme première étape d'échange de la transaction naissante est juste le carré absolu de l'onde
"d'offre" initiale, tel qu'évaluée au lieu d'absorption. La signification de cet écho ψψ ∗ et sa relation
à la loi de probabilité de Born sera discutée plus loin.

Dans l'étape (4) l'émetteur répond à "l'écho" et le cycle se répète jusqu'à ce que la réponse de
l'émetteur et de l'absorbeur soit suffisante pour satisfaire toutes les conditions aux limites [ E = hν
et les différentes lois de conservation], à cet instant la transaction est complète. Même si plusieurs
échos retournent à l'émetteur venant d'absorbeurs potentiels, les conditions aux limites ne peuvent
habituellement permettre qu'une seule transaction. La formation de la transaction peut être
considérée comme analogue à l'établissement d'une onde stationnaire quadrivectorielle à travers
l'intervalle borné par (R1 , T1 ) et (R2 , T2 ) , les deux locations formant les "murs" extérieurs où
l'amplitude n'a pas de contribution au processus. Notez qu'à l'étape de complétude (4), les champs
locaux dans le voisinage à la fois de l'émetteur et de l'absorbeur sont réelles (versus complexes) car
elles sont une superposition d'une onde avancée et retardée d'amplitude égale et de même phase. La
signification de cela pour le problème de la complexité est discutée plus loin.

Pour résumer le modèle transactionnel, l'émetteur produit une onde offre (OW) retardée qui voyage
vers l'absorbeur causant la production par l'absorbeur d'une confirmation avancée (CW) qui voyage
2
à rebours sur le chemin de l'onde offre de l'émetteur. Son amplitude là est CW1 ~ OW , où CW1
est évaluée à l'émetteur et OW2 est évaluée à l'absorbeur. L'échange se répète alors de manière
cyclique jusqu'à ce que l'échange net de l'énergie et des autres quantités conservées satisfasse les
conditions aux limites quantiques du système, à ce moment la transaction est complète. Bien sûr, la
séquence pseudo-temporelle de la discussion précédente est seulement une manière sémantique
pratique de décrire l'ensemble de la transaction. Un observateur, comme dans le cas simple de
l'onde plane, percevra seulement la transaction complète qu'il interprétera comme le passage d'un
seul photon retardé (c'est à dire d'énergie positive) à la vitesse de la lumière de l'émetteur vers
l'absorbeur.

Mais une interprétation également valide du processus est qu'une onde stationnaire
quadrivectorielle a été établie entre l'émetteur et l'absorbeur. Tout comme une onde stationnaire
habituelle à trois dimensions est une superposition d'ondes voyageant vers la droite et vers la
gauche, cette onde stationnaire quadrivectorielle est la superposition des composantes avancées et
retardées. Elle a été établie entre les limites de l'émetteur qui bloque le passage de l'onde avancée
plus en arrière dans le flux du temps et l'absorbeur qui bloque le passage de l'onde retardée plus en
avant dans le flux du temps. Cette onde stationnaire spatio-temporelle est la transaction et nous
l'utiliserons comme base de la discussion qui suit.

Insistons sur le fait que l'interprétation transactionnelle est une interprétation du formalisme
existant de la mécanique quantique plutôt qu'une nouvelle théorie ou une révision du formalisme de
la mécanique quantique. Comme telle, elle ne fait pas de prédictions qui diffèrent de celles de la
mécanique quantique conventionnelle. Elle n'est pas testable excepté sur la base de sa valeur pour
traiter les problèmes d'interprétation. L'auteur lui a trouvé plus d'utilité comme guide pour décider
quels calculs quantiques effectuer plutôt que pour la performance de tels calculs. La principale
utilité de l'interprétation transactionnelle est comme un modèle conceptuel qui fournit à l'utilisateur
une manière de clairement visualiser des processus quantiques compliqués et de rapidement
analyser des situations apparemment "paradoxales" qui nécessiteraient autrement une analyse
mathématique élaborée. C'est une manière de penser plutôt qu'une manière de calculer. Elle peut
avoir une valeur comme outil pédagogique pour l'apprentissage de la mécanique quantique aux
étudiants. Elle semble aussi avoir une valeur considérable dans le développement des intuitions et
des explications pour les phénomènes quantiques qui restait jusqu'à maintenant assez mystérieuse.
III.5.3.3. Le modèle transactionnel et la mécanique quantique relativiste
Le modèle transactionnel discuté dans la section précédente traite de l'émission et de l'absorption
des photons venant des interactions électromagnétiques. Le modèle utilise des fonctions d'ondes
avancées et retardées qui sont solutions de l'équation d'onde électromagnétique :
2 ∂ ψ
2
(1) (hc ) ∇ ψ = h
2 2

∂t 2

Notez que cette équation différentielle est du second ordre en la variable temporelle. Comme cela a
été montré dans une précédente publication de l'auteur (Cramer, 1980), le même modèle
transactionnel peut être appliqué à l'absorption et l'émission de particules massives, neutres ou
chargées électriquement, par exemple des électrons. La seule nécessité pour cette application est
que les équations d'onde décrivant les particules concernées doivent, comme l'équation d'onde
électromagnétique, avoir à la fois des solutions avancées et retardées.

Cette nécessité semble présenter un problème. L'équation d'onde qui a été au centre de la plus part
des discussions entourant l'interprétation de la mécanique quantique est l'équation de Schrödinger :
h2 2 ∂ψ
(2) − ∇ ψ = ih
2m ∂t

où m est la masse de la particule décrite par l'équation. Cette équation est du premier ordre en la
variable temps et pour cette raison n'a pas de solutions avancées. Donc, si ψ = F (r , t ) est une
solution de l'équation de Schrödinger, alors ψ ∗ = G (r , t ) n'est pas une solution ni une combinaison
linéaire de F et G comme utilisé dans le modèle transactionnel.

Nous devons garder à l'esprit, cependant, que l'équation de Schrödinger n'est pas physiquement
correcte car elle n'est pas invariante relativiste. Elle doit plutôt être considérée comme un cas
limite, dans un domaine non relativiste restreint, d'une équation d'onde invariante relativiste plus
raisonnable physiquement, par exemple l'équation de Dirac ou l'équation de Klein-Gordon. Ces
équations relativistes, comme l'équation d'onde électromagnétique, ont des solutions à la fois
avancées et retardées.
En considérant l'équation de Schrödinger comme un cas limite, le problème apparent créé par son
manque de solution avancée peut être résolu. Quand une équation d'onde relativiste appropriée est
réduite à l'équation de Schrödinger en prenant une limite non relativiste (Bjorken, 1964), la
procédure de réduction conduit à deux équations distinctes, l'équation de Schrödinger et une autre
équation de la forme :
h2 2 ∂ψ
(3) − ∇ ψ = −ih
2m ∂t
qui est la complexe conjuguée ou renversée dans le temps de l'équation de Schrödinger. Cette
équation a seulement des solutions avancées. Les équations (2) et (3) sont des réductions non
relativistes également valides de la dynamique relativiste, mais l'équation (3) est habituellement
éliminée car elle a des valeurs propres de l'énergie négatives. Suite à cela, il est clair que F (r , t ) et
G (r , t ) (ou ψ et ψ ∗ ) sont des solutions également valides de la dynamique sous-jacente à
l'équation de Schrödinger. Il est donc valide d'utiliser les solutions avancées dans le modèle
transactionnel dans la limite non relativiste si elles sont solutions de l'équation de Schrödinger.

Nous pouvons aussi regarder la nécessité de l'invariance relativiste d'une autre manière. Le
problème d'interprétation de la localité que les tests récents des inégalités de Bell ont placé sur le
devant de la scène est essentiellement un problème relativiste. Si la vitesse de la lumière était
infinie, le problème de localité n'existerait pas : il n'y aurait pas de différence entre descriptions
locales et non locales. L'équation de Schrödinger peut être considérée comme le cas limite d'une
équation invariante relativiste lorsque la vitesse de la lumière tend vers l'infini. Donc, il n'est pas
particulièrement surprenant qu'une description explicitement non locale telle que le modèle
transactionnel puisse nécessiter certaines propriétés des équations d'onde invariantes relativistes.
C'est un lien subtil entre la relativité et la mécanique quantique qui n'a pas, peut-être, été
précédemment apprécié.

Il y a une autre implication de la mécanique quantique relativiste qui devrait aussi être discutée ici.
Dans le domaine relativiste, le principe d'indétermination de Heisenberg doit être reconsidéré à
cause des restrictions ajoutées par la relativité restreinte (Landau, 1931, Beresteskii, 1971). En
particulier, l'introduction de la vitesse limite c impose une nouvelle relation d'indétermination sur la
précision avec laquelle l'impulsion p peut être mesurée : ∆p = h / (c∆t ) . Cette relation peut être
considérée venir du fait que la localisation de la position ∆q (supposée être initialement petite) ne
peut pas se disperser avec un taux plus grand que c. La distance c∆t est donc la quantité maximale
possible dont la localisation de la position peut être élargie dans un intervalle de temps ∆t pour
permettre une meilleure précision de l'impulsion. Cela place une limite sur la précision ∆p avec
laquelle l'impulsion p peut être mesurée dans un intervalle de temps ∆t .

Il y a une limite analogue sur la détermination de la position q qui vient d'une autre caractéristique
des théories quantiques des champs. Comme mentionné ci-dessus, les solutions des équations
d'onde invariantes relativistes pour des particules massives incluent des solutions avancées ou de
fréquence négative. Quand une particule est localisée dans une région suffisament petite de
l'espace, ces fonctions de fréquence négative apparaissent explicitement dans le développement de
leur paquet d'ondes position. Landau et Peierls (1931) ont suggéré qu'afin d'éviter l'inclusion de
solutions de fréquence négative "sans signification physique", il est raisonnable de confiner la
détermination de la position dans un domaine qui n'inclut pas de tels processus. Cela correspond à
une incertitude de position limite de ∆q = hc / W , où W est la masse-énergie totale de la particule.
Cette limite sur l'incertitude de la position pour une particule de masse m avec une impulsion
initialement petit est juste ∆q = h / mc , la longueur d'onde de de Broglie.

Beresteskii et al (1971) justifient cette limite sur la localisation de la position d'une manière
semblable mais légèrement différente. Ils interprètent les composantes de fréquence ou d'énergie
négative de la fonction d'onde comme indiquant l'ensemble de la production particule -
antiparticule quand l'impulsion devient suffisament grand pour correspondre à une énergie libre
plus grande que 2mc 2 . Ils affirment que quand cette limite est atteinte dans une mesure, par
exemple en déterminant la position d'un électron, "la formation de nouvelles particules d'une
manière qui ne peut pas être détectée par le processus lui-même rend clairement sans signification
la mesure des coordonnées de l'électron". Donc, l'élargissement en l'impulsion est coupée à cette
limite, conduisant à la limite hc / W sur la localisation de la position.

Landau et Peierls (1931) avaient affirmé que ces limites relativistes sur les déterminations de la
position et de l'impulsion compromettaient irrémédiablement l'utilité de ces variables dynamiques
pour la mesure dans le sens de la mécanique quantique non relativiste. Ni la position ni l'impulsion
d'une particule ne peuvent, même en principe, être déterminés avec une précision arbitraire en un
intervalle de temps fini ni ne peuvent être considérés avoir une valeur particulière à un moment
donné. Cela semblait en effet invalider l'interprétation statistique de Born de la mécanique
quantique en ce que la description du vecteur d'état comme représentation de la probabilité de
trouver une valeur définie d'un observable particulier comme résultat d'une mesure faite à un
instant donné devenait intenable. Cependant, Bohr et Rosenfeld (1933, voir aussi Rosenfeld, 1955)
désamorcèrent ce problème en démontrant que dans le formalisme relativiste de l'électrodynamique
quantique, dans lequel les quantités champ ne sont pas représentées par des fonctions ponctuelles
mais par des fonctions de régions de l'espace-temps, il n'y a pas désaccord entre les limites
imposées par le principe d'indétermination relativiste et les possibilités physiques de la mesure.

Posé un peu différemment, c'est un non-problème. Les limites relativistes sur la précision avec
laquelle les variables peuvent être mesurées rendent en effet ces variables moins directement
pertinentes pour les coordonnées des particules relativistes. Cependant, cela n'invalide ni leur
utilisation ni leur utilité. Dans un cas semblable non relativiste, l'angle de rotation θ reste une
variable dynamique valide et quelque fois utile même si sa valeur mesurable est rendue
complètement incertaine par la quantification de la variable conjuguée moment angulaire. La
spécification d'une variable dynamique "à un moment donné" comme considéré par Landau et
Peierls (1931) n'est ni nécessaire ni désirable. Dans le formalisme relativiste ce sont les intégrales
sur les régions de l'espace-temps plutôt que les valeurs ponctuelles qui conduisent à des prédictions
observables. Dans ce contexte, le caractère atemporel et non local de l'interprétation
transactionnelle comme discuté ci-dessous fournit une manière naturelle de décrire la réduction
atemporelle du vecteur d'état en une certaine valeur localisée d'une variable dynamique. En fait, la
notion que le vecteur d'état se réduit en une valeur particulière d'une variable "à un instant donné"
est inconsistante avec la description transactionnelle.

Un autre problème qui concerne l'interprétation statistique de la mécanique quantique dans le


domaine relativiste est l'observation que les solutions des équations des champs ne peuvent pas
toujours être utilisées pour construire une densité de probabilité invariante relativiste ou définie
positive (Bjorken, 1964). Donc, tandis que les équations différentielles et leurs solutions restent un
dispositif indispensable de la théorie quantique relativiste des champs (Bjorken, 1965), le problème
de l'identité de ces solutions est rendu plus sévère car l'interprétation statistique, au moins sous sa
forme la plus simple, est prouvée inadéquate. Le vecteur d'état ne peut pas être identifié comme un
simple porteur de probabilité dans le domaine relativiste.

La formulation naïve de l'interprétation statistique est clairement insuffisante dans le domaine


relativiste, particulièrement quand elle est appliquée à des régions spatio-temporelles où aucune
mesure n'est réellement faite. De plus, certaines procédures formelles de la mécanique quantique
non relativiste, par exemple l'intégration de produits de fonctions d'onde sur de grands volumes
d'espace à temps fixé, sont manifestement inconsistantes avec la relativité restreinte. Cependant, le
développement de théories quantiques relativistes a conduit à un formalisme avec des procédures
calculatoires qui sont appropriées au domaine relativiste. Une forme généralisée de l'interprétation
statistique est implicite dans ces procédures pour le calcul des observables et des éléments de
matrice. C'est donc notre vision de l'interprétation statistique qui doit être (et a été) généralisée dans
le domaine relativiste plutôt qu'écartée.

La portée de notre présentation est limitée à l'interprétation de la mécanique quantique dans la


limite non relativiste des faibles vitesses, l'arène où la plus part des discussions précédentes sur
l'interprétation de la mécanique quantique s'est concentrée. Pour cette raison nous ne discuterons
pas plus l'interprétation de la mécanique quantique relativiste. Cependant, nous sommes attentifs à
tout nouveau problème d'interprétation qui serait ajouté par une théorie quantique des champs
entièrement relativiste au-delà de celles associées avec la création de particules et la délocalisation
de l'espace-temps déjà discutées. L'interprétation transactionnelle de la mécanique quantique
présentée dans la prochaine section basée sur les solutions des équations différentielles des champs
invariantes relativistes est totalement consistante avec la relativité restreinte et semble
s'accommoder de ces phénomènes additionnels d'une théorie quantique relativiste de manière très
naturelle. Nous sommes donc confiants que l'interprétation présentée ici, peut-être avec des
améliorations mineures, soit appropriée pour l'interprétation d'une théorie complètement relativiste
de la mécanique quantique.
III.5.3.4. L'interprétation transactionnelle
Maintenant nous sommes préparés pour spécifier les prémisses de l'interprétation transactionnelle.
En faisant cela, nous utiliserons un cadre qui est aussi familier que possible avec la description de
l'interprétation de Copenhague.

 (TI1) Le principe d'indétermination a sa forme habituelle. C'est une conséquence du fait qu'une
transaction en voie d'achèvement peut projeter et localiser seulement une des variables d'une
paire de variables conjuguées de l'onde offre.
 (TI2) L'interprétation statistique est inchangée. C'est une conséquence du fait que "l'écho" reçu
par l'émetteur en initiant la transaction suit la loi de probabilité de Born P = ψψ ∗ . Nous en
discuterons plus loin et le caractère aléatoire de la mécanique quantique sera examiné.
 (TI3) Tous les processus physiques ont un statut égal. L'observateur, intelligent ou autre, n'a pas
de statut spécial. La mesure et les appareils de mesure n'ont pas de statut spécial, excepté qu'ils
sont des processus qui relient aux observateurs. "L'universalité" existe mais n'est pas reliée à un
caractère spécial de la mesure mais plutôt à la connexion entre émetteur et absorbeur dans la
transaction. Le concept de "complémentarité" existe aussi mais comme le principe
d'indétermination, c'est seulement une manifestation de la nécessité qu'une transaction donnée
en cours d'achèvement peut projeter seulement une des variables d'une paire de variables
conjuguées.
 (TI4) L'interaction quantique fondamentale est prise comme étant la transaction, comme définit
dans la section précédente. Le vecteur d'état du formalisme quantique est une onde physique
réelle avec une extension spatiale et est identique avec "l'onde offre" initiale de la transaction.
La particule (photon, électron, etc.) et le vecteur d'état réduit sont identiques avec la transaction
complète. La transaction peut impliquer un seul émetteur et absorbeur ou des multiples
émetteurs et absorbeurs, mais est seulement complète quand les conditions aux limites
quantiques appropriées sont satisfaites en tous les lieux d'émission et d'absorption. Les
particules transférées n'ont pas d'identité séparée qui est indépendante de la satisfaction de ces
conditions aux limites. La correspondance du vecteur d'état avec la "connaissance du système"
est fortuite mais une conséquence trompeuse de la transaction de ce qu'une telle connaissance
doit suivre et décrire la transaction.
 (TI5) Une distinction est faite entre observables et quantités inférées. Les premières sont des
prédictions fermes de la théorie complète et peuvent être sujettes à des vérifications
expérimentales. Les secondes, particulièrement celles qui sont des quantités complexes, ne sont
pas vérifiables et sont utiles seulement dans un but d'interprétation ou pédagogique. Il est
supposé que les deux sortes de quantité doivent obéir aux lois de conservation, aux conditions
de causalité macroscopique, à l'invariance relativiste, etc. Le recourt au positivisme n'est pas
nécessaire et est indésirable.

En résumé, l'interprétation transactionnelle adopte les deux premiers éléments de l'interprétation de


Copenhague et est aussi capable de s'accommoder des aspects du principe de complémentarité. Elle
enlève l'affirmation que les solutions d'une simple équation différentielle du second ordre reliant la
masse, l'énergie et le moment sont quelque peu relié à la "connaissance" et emploie à la place une
solution habituellement négligée de cette équation pour construire la transaction émetteur -
absorbeur de TI4. L'interprétation transactionnelle enlève le positivisme car le paravent positiviste
n'est plus nécessaire pour cacher la machinerie non locale derrière.

On doit aussi signaler que la substitution de l'identification de la fonction d'onde avec la


connaissance de l'état par TI4, dans une réalité objective donnée du vecteur d'état, affecte tous les
autres éléments de l'interprétation. Bien que le principe d'indétermination (TI1) et l'interprétation
statistique (TI2) soient formellement les mêmes que dans l'interprétation de Copenhague, leurs
implications philosophiques, sur lequel beaucoup a été écrit du point de vue de l'interprétation de
Copenhague, peuvent être assez différentes.
III.5.3.5. L'interprétation transactionnelle et la notation formelle de la
mécanique quantique
La comparaison de la notation formelle utilisée dans la mécanique quantique ondulatoire avec la
description du modèle transactionnel discutée précédemment montre une excellente
correspondance entre les deux. Une fois que l'interprétation transactionnelle est bien
conceptualisée, la description de l'interprétation transactionnelle des processus quantiques peut être
perçue dans les procédures et notations mathématiques utilisées dans le calcul des observables. En
particulier, le formalisme de la mécanique quantique fait une utilisation intensive de la conjugaison
complexe. Pour des systèmes simples, cette opération est équivalente à l'opération de renversement
du temps (Wigner, 1950) qui transforme les ondes retardées en ondes avancées. Donc ψ ∗ est l'onde
de confirmation avancée équivalente à ψ , l'onde offre retardée. Comme mentionné ci-dessus, ψψ ∗
est l'onde écho offre - confirmation que l'émetteur reçoit d'une direction particulière. De même,
(1) ∫ ψψ ∗ dv
V
est la somme de tous les échos onde offre - onde de confirmation de tous les endroits possibles de
l'espace.

Considérons d'autres exemples. Une intégrale en mécanique quantique de "chevauchement" de la


forme
(2) ∫ ψ 1ψ 2• dv
V
peut être interprétée dans l'interprétation transactionnelle comme représentant une moyenne sur
tous l'espace des "échos" qu'un émetteur envoyant des ondes offre ψ 1 reçoit de tous les absorbeurs
possibles renvoyant les ondes de confirmation qui confirment les transactions impliquant un état
final décrit par ψ 2 . De plus, le calcul d'une valeur moyenne d'une variable x qui est déduite d'une
fonction d'onde donnée ψ par l'opérateur X, tel que Xψ = xψ , a la forme :
(3) x = ∫ ψ 2∗ Xψ 1 dv
V

Cela peut être vu comme une moyenne sur l'espace des valeurs possibles de x que l'opérateur X
projette à partir des composantes de l'onde offre qui apparaît dans la transaction complète. Cette
approche de l'interprétation peut aussi être appliquée à d'autres aspects du formalisme de la
mécanique quantique.

D'un certain point de vue, l'interprétation transactionnelle est si apparente sous la forme
Schrödinger - Dirac du formalisme de la mécanique quantique, avec ses combinaisons d'ondes
normales et renversées dans le temps, qu'on peut se demander honnêtement pourquoi cette
interprétation évidente du formalisme de la mécanique quantique n'a pas été faite précédemment.
On ne peut pas, bien sûr, expliquer pourquoi quelque chose ne se produit pas dans l'histoire du
développement de la mécanique quantique, mais plusieurs observations pertinentes peuvent être
faites :
1. L'équation de Schrödinger, qui a été au centre des investigations sur l'interprétation des années
1920 à maintenant n'a pas de solution avancée car elle implique seulement la première dérivée
par rapport au temps (comme discuté ci-dessus) et ainsi l'association de ψ ∗ avec les solutions
avancées de l'équation d'onde n'est donc pas frappant.
2. Après qu'Heisenberg eut inventé le lien entre fonction d'onde et connaissance, ce qui concerne
la non-localité de la mécanique quantique fut effectivement écarté pour une longue période et
les considérations des problèmes d'interprétation furent dirigées ailleurs et ainsi c'est seulement
récemment que le sujet de la non-localité du formalisme a réémergé à cause des tests des
inégalités de Bell.
3. Les équations d'onde relativiste qui ont des solutions aussi bien avancées que retardés ont été
traitées avec suspicion car elles ne décrivent pas de manière unique l'état d'un système donné.

De plus, la "raison" des solutions avancées était pensée avoir été trouvée avec la découverte avec la
contrepartie antimatière des fermions "normaux" (par exemple, les positrons, les antiprotons, etc.)
Donc d'autres "raisons" pour les solutions d'ondes avancées ne furent pas vues et elles ne furent pas
associées avec le ψ ∗ du formalisme.
III.5.3.6. Identité et complexité dans l'interprétation transactionnelle
Pour aborder le problème de l'identité, TI2 donne au vecteur d'état la même signification que dans
l'interprétation de Copenhague comme le moyen pour décrire les probabilités des différents
événements quantiques possibles. TI4 aborde plus directement le problème de l'identité d'une
manière assez différente de l'interprétation de Copenhague. Il affirme que le vecteur d'état est une
onde physique réelle qui est générée par l'émetteur et qui voyage dans l'espace jusqu'à l'absorbeur
final et également en plusieurs autres lieux de l'espace et plusieurs autres potentiels absorbeurs. Le
vecteur d'état est l'onde offre qui initie la transaction. A cause des conditions aux limites de la
mécanique quantique, la transaction est seulement complétée entre un seul émetteur et un seul
absorbeur dans un événement quantique. La particule elle-même (photon, électron, etc.) n'est pas
identique au vecteur d'état mais à la transaction complète, dont le vecteur d'état n'est que la phase
initiale.

La tentative originelle de Schrödinger d'interpréter le vecteur d'état d'une manière similaire a


échoué à cause de deux problèmes :
1. On a trouvé que les ondes de la mécanique quantique exhibaient des comportements non locaux
ou d'action à distance quand elles sont interprétées comme des ondes réelles physiquement
présentes dans l'espace.
2. On a découvert qu'il n'était pas possible de décrire une particule comme un "paquet d'ondes" qui
reste dans une enveloppe étroite pendant sa propagation.

L'interprétation transactionnelle travaille directement avec (1) car elle est explicitement non locale
et, de plus, les composantes du vecteur d'état voyageant dans d'autres directions que l'absorbeur
éventuel ne doivent pas disparaître car elles sont seulement virtuelles dans le sens qu'elles ne
transfèrent ni énergie ni impulsion et ne participent pas à la transaction. Et (2) n'est pas un
problème pour l'interprétation transactionnelle car c'est la formation de la transaction qui localise le
transfert d'énergie et d'impulsion. Le vecteur d'état lui-même n'a donc pas besoin de rester sous
forme d'un petit paquet d'ondes pour expliquer le comportement corpusculaire de l'événement
quantique.
Puisque l'interprétation transactionnelle considère que le vecteur d'état est physiquement présent
dans l'espace, elle doit aborder le problème de son caractère complexe. Cependant, le modèle de
transaction est capable de le faire car c'est en chaque point de la transaction complète qu'il y a une
interaction physique, par exemple au lieux d'émission et d'absorption, il y a aussi superposition des
ondes avancées et retardées d'amplitudes égales. Puisque ψ + ψ ∗ = 2 Re(ψ ) , le vecteur d'état réduit
devient réel et il n'y a pas de partie imaginaire résiduelle du vecteur d'état à expliquer. Donc,
l'interprétation transactionnelle a restauré la réalité algébrique du microcosme.
III.5.3.7. Réduction et non-localité dans l'interprétation transactionnelle
Dans l'interprétation transactionnelle la réduction du vecteur d'état est interprété comme la fin de la
transaction commencée par l'onde offre et l'onde de confirmation échangée entre émetteur et
absorbeur. L'émergence de la transaction à partir du vecteur d'état ne se produit pas en un endroit
particulier de l'espace ou à un instant particulier du temps mais plutôt se forme le long du
quadrivecteur entier qui relie le point d'émission et le point d'absorption (ou les points dans le cas
de particules multiplement corrélées). La transaction emploie à la fois des ondes retardées et
avancées qui se propagent, respectivement, le long des quadrivecteurs de type lumière (ou de type
temps) positifs et négatifs. Puisque la somme de ces quadrivecteurs peut générer des intervalles
spatiaux et temporels ou lumières négatifs, "l'influence" de la transaction contraignant les
corrélations de l'événement quantique est explicitement à la fois non locale et atemporelle.

La figure ci-dessous montre un exemple de telles combinaisons de quadrivecteurs d'une transaction


à deux photons correspondant à un événement dans l'expérience de Freedman-Clauser (que nous
présenterons plus loin).
Le schéma (a) montre les deux transactions établies entre l'émetteur et les deux absorbeurs avec les
ondes offres et de confirmation. Les schémas (b) et (c) montrent que la somme des ondes retardées
et avancées correspond à une onde d'échange entre les deux absorbeurs, l'intervalle entre les deux
événements d'absorption pouvant être de type spatial.
Notons que bien que toutes les ondes dans la transaction appartiennent à des lignes d'univers de
type lumière, "l'influence" contrainte par les corrélations entre les deux mesures de polarisation
génère un intervalle spatial et est donc non locale. Cette non-localité est un phénomène explicite de
l'interprétation transactionnelle venant de l'utilisation d'ondes avancées.

Schrödinger (1935), en analysant le paradoxe EPR, en a conclu qu'au moins une partie du problème
tenait dans la manière dont le temps est utilisé en mécanique quantique (dans le contexte de
l'interprétation de Copenhague). L'interprétation de Copenhague traite le temps d'une manière
essentiellement classique non relativiste et cela conduit à des inconsistances avec la relativité ou
avec la causalité dans doute description de l'interprétation de Copenhague non subjective, par
exemple, dans l'expérience de Freedman-Clauser. Les racines des inconsistances viennent de la
supposition implicite de l'interprétation de Copenhague que le vecteur d'état se réduit à un instant
particulier où une mesure particulière est faite et la "connaissance" est obtenue et qu'avant cet
instant le vecteur d'état est dans son état totalement non réduit et qu'il y a un "avant" et un "après"
bien défini dans la description de la réduction. Dans l'interprétation transactionnelle, la réduction,
c'est à dire le développement de la transaction, est atemporelle et donc évite les contradictions et
inconsistances implicite dans toute réduction localisée dans le temps du vecteur d'état.

De plus, la description de l'interprétation transactionnelle n'a pas besoin d'invoquer un


déclenchement arbitraire de la réduction tel que la conscience, etc. car c'est l'absorbeur plutôt que
l'observateur qui précipite la réduction du vecteur d'état et cela peut se produire de manière
atemporelle et non locale à travers toutes sortes d'intervalles entre les éléments de l'appareil de
mesure.
III.5.3.8. Complétude et prédictivité dans l'interprétation transactionnelle
La solution du problème de complétude posé dans l'article EPR est implicite dans le formalisme de
la mécanique quantique, pourvu que le vecteur d'état soit interprété comme une quantité physique
réelle. Puisque l'interprétation transactionnelle traite le vecteur d'état comme une quantité physique
réelle, la mécanique quantique interprétée par l'interprétation transactionnelle est une théorie
complète. En particulier, le vecteur d'état porte à chaque absorbeur potentiel la totalité des résultats
possibles et tous ont une "réalité simultanée" dans le sens EPR. L'absorbeur interagit de telle
manière qu'il permet à un des résultats d'émerger de la transaction, ainsi le vecteur d'état réduit se
manifeste seulement pour un de ces résultats. Et le formalisme quantique assure que si une des
quantités canoniquement conjuguées d'une paire est localisée dans une telle transaction, l'autre
quantité est de manière correspondante délocalisée comme requit par le principe d'incertitude.

L'interprétation transactionnelle clarifie aussi, mais ne résout pas, le problème de la prédictivité.


Comme cela a été discuté plus haut, le début d'une transaction peut être vu lorsque l'émetteur
envoie une onde "offre" retardée dans différentes directions et reçoit un "écho" de l'absorbeur sous
la forme d'une onde confirmation avancée qui a une amplitude proportionnelle à ψ ∗ (où ψ est
l'onde offre complexe évaluée au niveau de l'absorbeur). Dans les circonstances habituelles, il y a
un grand nombre d'absorbeurs futurs potentiels et si tous fournissent de tels échos, l'émetteur, à
l'instant d'émission, a un grand menu de possibilités de transactions possibles parmi lesquelles
choisir. Dans un événement quantique simple, les conditions aux limites permettront seulement à
un événement de se produire.

La loi de probabilité de Born est donc une affirmation que la probabilité d'occurrence d'une
transaction donnée est proportionnelle à l'amplitude de l'écho correspondant à la transaction que
l'émetteur reçoit. Cela semble être une supposition très plausible. L'événement quantique, de ce
point de vue, est une solution d'une équation différentielle (l'équation d'onde appropriée) pour
laquelle un ensemble défini de conditions aux limites restreignent les solutions mais ne spécifient
pas de manière unique la solution. Dans cette situation la probabilité d'une solution donnée est
proportionnelle à "l'intensité du lien" des participants comme indiqué par la taille de l'écho que
l'absorbeur renvoie à l'émetteur. L'émetteur disposes des échos d'absorbeurs potentiels qui forment
une liste pondérée des transactions possibles parmi laquelle une seule peut être choisie. Les
absorbeurs possibles peuvent influencer l'émission passée seulement à travers la force de leur écho
dans la liste mais ne peuvent pas influencer quelle entrée sera réellement choisie pour la
transaction.

Notons qu'il y a une situation classique analogue dans laquelle un système est spécifié par un
ensemble d'équations différentielles avec des conditions aux limites incomplètes, par exemple, dans
la dynamique des fluides turbulents. Et de manière intéressante, il y a eu des progrès récents
significatifs dans ce domaine à travers l'application de nouvelles techniques mathématiques tel que
la théorie des catastrophes, la théorie des attracteurs étranges, etc. Il semble possible que des
techniques similaires puissent un jour être appliquées aux processus statistiques de la mécanique
quantique.

Ainsi, tandis que l'interprétation transactionnelle n'altère pas le caractère essentiellement statistique
de la mécanique quantique, elle a fournit un aperçu des "dés" qui sont au travail dans le processus
statistique. Les dés fonctionnent pour assurer un résultat consistant avec les conditions aux limites
quantiques d'une transaction et sont "pipés" en proportion de la grandeur de l'écho que l'émetteur
reçoit des absorbeurs potentiels.
III.5.3.9. Relativité et causalité dans l'interprétation transactionnelle
Plusieurs fois nous avons mentionné les contraintes reliées de non-localité, d'invariance relativiste
et de causalité. Comme nous l'avons précédemment mentionné, il semblerait que la non-localité de
la transaction telle qu'elle a été définie donne plusieurs problèmes à la fois avec la dernière
contrainte en autorisant à la fois des tests de simultanéités sur des intervalles spatiaux et la
communication vers le passé. Cependant, cela n'est pas le cas comme nous allons le montrer ici.

La transaction émetteur - absorbeur, bien qu'elle ait l'effet de renforcer les corrélations non locales
entre les parties séparées d'un système, ne peut pas être utilisée pour de la communication non
locale entre observateurs. Il n'y a pas d'effets avancés résiduels quand la transaction est complète et
la réinterprétation des ondes avancées assure que le résultat est d'un point de vue observation le
même que si seules des ondes retardées étaient présentes. De plus, comme cela a été montré
mathématiquement (Eberhard, 1976, 1978, Ghirardi, 1979, 1980, Mittelstaedt, 1983), la nature des
corrélations renforcées entre les parties séparées d'une expérience de Freedman-Clauser est telle
qu'elle empêche la possibilité d'une communication non locale entre observateurs.

Puisque la transaction est atemporelle, se formant le long de l'intervalle entier séparant les lieux
d'émission et d'absorption "en une fois", il n'y a pas de différence dans la survenue des résultats ou
dans la description de l'interprétation transactionnelle si les expériences séparées se produisent
"simultanément" ou selon toute séquence temporelle. Il n'y a pratiquement pas d'issue pour que les
mesurées séparées se produisent d'abord et précipitent la réduction du vecteur d'état puisque dans
l'interprétation transactionnelle les deux mesures participent de manière égale et symétrique dans la
formation de la transaction. De plus, les chemins le long desquels l'échange renforçant la
corrélation prend place sont des quadrivecteurs de type lumière et sont ainsi invariants sous toute
transformation de Lorentz. Donc, le résultat et la description de l'interprétation transactionnelle de
toute expérience de corrélation est la même indépendamment du repère de référence inertiel qui est
utilisé, comme cela doit être si la mécanique quantique et la relativité sont des théories compatibles.

Le caractère évident de "retour dans le temps" du modèle transactionnel à besoin de considérations


précises pour savoir si la causalité est préservée. Dans un sens l'interprétation transactionnelle nous
dit que l'absorbeur "cause" la transaction qui précède dans la séquence temporelle, en violation de
la cause avant l'effet. Pour aborder cet aspect de l'interprétation transactionnelle il est nécessaire de
considérer attentivement la nature de la causalité et l'évidence physique qui la supporte. Dans un
article précédent (Cramer, 1980), l'auteur a fait la distinction entre le principe de causalité fort, qui
affirme qu'une cause doit toujours précéder l'effet dans tout repère de référence, et le principe de
causalité faible, qui affirme la même chose, mais seulement s'il s'applique aux observations
macroscopiques et à la communication entre observateurs. Il n'y a pas d'évidence expérimentale
actuelle pour supporter un principe causal qui est plus fort que le principe faible.

L'interprétation transactionnelle est parfaitement consistante avec le principe de causalité faible.


Comme discuté précédemment, la complétude de la transaction évite tout champ avancé en
interaction excepté la connexion de l'émetteur avec l'absorbeur et le reste de la superposition
avancée/retardée peut être interprétée comme purement retardée. Donc, il n'y a pas "d'effets
avancés", pas de comportement acausal évident même au niveau microscopique. Les relations de
dispersions, etc., sont complètement consistantes avec la microcausalité telle qu'elle est
habituellement interprétée.

La nature, d'une manière très subtile, peut s'engager dans une confirmation remontant le temps.
Mais l'utilisation de ce mécanisme n'est pas disponible pour des investigations expérimentales
même au niveau microscopique. La transaction complète efface tout effet avancé tel qu'aucun
signal d'onde avancée n'est possible. Le futur peut affecter le passé seulement de manière très
indirecte, en offrant des possibilités pour les transactions.
III.5.3.10. La flèche du temps dans l'interprétation transactionnelle
Le formalisme de la mécanique quantique, au moins dans sa formulation relativiste invariante, est
complètement symétrique du point de vue de la "flèche" du temps, la distinction entre les directions
du temps futures et passées. Même l'action apparemment asymétrique d'une mesure macroscopique
idéale en "préparant" un système dans un état quantique définit peut formellement être décrit dans
le contexte de l'interprétation probabiliste d'une manière totalement symétrique dans le temps
(Aharonov, 1964).

La description de la réduction dans l'interprétation de Copenhague est essentiellement non


symétrique dans le temps. Le modèle transactionnel donne l'apparence d'être plus symétrique car il
traite l'émetteur passé et l'absorbeur futur comme des terminateurs égaux de la transaction qui se
développe entre eux. Cependant, le lecteur attentif aura perçu qu'il y a une asymétrie temporelle
plus subtile implicite dans la description de l'interprétation transactionnelle de l'événement
quantique qui est implicite dans TI2. La probabilité d'un événement quantique avec émission de
(R1 , T1 ) vers un absorbeur en (R2 , T2 ) est supposée être :
(1) P12 = [ψ 12 (R2 , T2 )]
2

plutôt que :
(2) P12 = [ψ 12 (R1 , T1 )]
2

c'est-à-dire, dans l'interprétation transactionnelle l'émetteur reçoit un rôle privilégié car s'est l'écho
reçu par l'émetteur qui précipite la transaction plutôt que celui reçu par l'absorbeur. Donc, le passé
détermine le futur (d'une manière statistique) plutôt que le futur ne détermine le passé.

La supposition (1) est consistante avec la formulation usuelle de la mécanique quantique, la "post"
formulation, qui emploie cette règle dans l'évaluation des probabilités des événements. L'alternative
"pré" formulation, qui emploie (2) pour évaluer les probabilités, est rarement utilisée mais, en
l'absence de violation du renversement du temps, elle doit donner les mêmes résultats pour un
calcul donné (DeVries, 1974).

Cette symétrie entre les post et pré formulations et la symétrie équivalente entre les post et pré
versions de l'interprétation transactionnelle basées sur (1) et (2) peuvent être considérées comme
une symétrie suffisante dans l'analyse de la micro réversibilité, excepté pour un problème. La
nature a exhibé une violation flagrante de l'invariance par renversement du temps au niveau
microscopique dans la désintégration du méson K 0 . A partir de l'étude expérimentale des modes de
désintégration violant la symétrie CP du système K 0 , on en tire que la direction temporelle de la
réaction K 0 + e + → π + + ν sera apparente dans sa section efficace, c'est à dire que la réaction
inverse aura une section efficace quantitativement réduite par rapport à celle dans le sens direct. Il
n'est pas possible de fournir une cible fixe des particules participant à ces réactions et donc il n'est
pas expérimentalement réalisable d'observer directement l'un de ces modes de réaction. Donc, cela
sera considéré comme une expérience de pensée. Mais même comme ça, cela implique que les pré
et post formalismes et les interprétations sont en principe discernables et donc non équivalentes.

Le travail de Aharonov et al (1964) mentionné ci-dessus a montré que pour des systèmes idéaux et
des mesures idéales, une interprétation probabiliste plausible symétrique dans le temps pourrait être
formulée pour remplacer celle habituelle de Born. Cependant, ils trouva qu'afin d'utiliser cette règle
d'une manière qui donne les mêmes prédictions de la mécanique quantique que celles de la loi de
probabilité conventionnelle, elle était forcée d'employer un effet de bord non symétrique dans le
temps. Belifante (1975) a examiné cette analyse pour inclure des mesures non idéales et des
systèmes et a trouvé que l'importance des asymétries temporelles était même encore plus apparente
dans le cas général. Ce travail mène à des conclusions similaires à celles dont nous avons parlé ci-
dessus concernant l'existence inévitable d'une flèche du temps quantique.

Cette flèche du temps microscopique doit être prise en compte. Heureusement, une justification
d'une telle asymétrie temporelle a déjà été effectuée dans le cas de l'électrodynamique de Wheeler -
Feynman par l'auteur dans une publication précédente (Cramer, 1983). Un modèle de condition aux
limites du Big Bang T = 0 a été utilisé pour relier la flèche du temps électromagnétique (la
dominance macroscopique du rayonnement électromagnétique retardé) à la flèche du temps
cosmologique (la direction de l'expansion de l'univers). Les arguments présentés dans cet article
s'appliquent également au modèle transactionnel présenté ici et justifient l'utilisation de la loi de
probabilité (1) plutôt que (2).
III.5.4. Evaluation
Passons maintenant à l'évaluation de cette interprétation.

 Respect du formalisme de la physique quantique.


L'interprétation transactionnelle respecte entièrement le formalisme de la physique quantique
(et admet même des solutions habituellement écartées).
 Limite.
La théorie s'applique a priori à toute situation. Mais elle donne un rôle particulier aux émetteurs
et absorbeurs. C'est assez gênant. Comment décrire le comportement des électrons autour d'un
atome ? Manifestement pas en considérant chaque électron comme des émetteurs / absorbeurs
échangeant des transactions avec le noyau. Les absorbeurs seront plutôt les appareils de mesure
analysant le spectre de l'atome, par exemple. Il est clair que l'on a là la même distinction (sous
une forme plus précise) que l'interprétation de Copenhague entre systèmes microscopiques
évoluant librement et systèmes "classiques" (ici vu de manière plus "quantique", l'établissement
de transactions entre deux systèmes). On retrouve donc la même limite que l'interprétation de
Copenhague tellement critiquée (avec raison) par l'auteur !
 Principe anthropique.
Les systèmes macroscopiques sont privilégiés : ils jouent le rôle des émetteurs et des
absorbeurs. On peut a priori généraliser les émetteurs et absorbeurs aux particules quantiques
mais on a malgré tout un rôle différent attribué aux différentes particules, les absorbeurs jouant
en particulier le rôle de systèmes de mesure avec résultats définis.
 Réalisme ou positivisme.
La théorie est manifestement réaliste car elle donne un rôle physique à la fonction d'onde.
Malgré cela, elle ne possède pas les défauts de l'interprétation de Copenhague réaliste avec
fonction d'onde réelle, en acceptant toutefois la non-localité.
 Rasoir d'Ockham.
Formellement, la théorie n'ajoute rien par rapport au formalisme. Elle doit toutefois dédoubler
les solutions (en ondes avancées et retardées) et un dualisme semblable à l'interprétation de
Bohm existe (d'une part une onde qui sert à établir la transaction puis qui sert de guide au
"corpuscule" ou tout au moins à "l'onde réelle" qui exécute la transaction).
Contrairement à ce que semble suggérer l'auteur, ces solutions sous formes avancées ne sont
pas nécessairement une conséquence de la théorie car ce peut être des artefacts mathématiques.
En fait, même si on considère ces solutions comme une possibilité, on peut être amené à les
exclure. Déjà Wheeler et Feynman, dont la théorie a inspiré Cramer, ces solutions sont à
exclure pour des raisons de condition aux limites et de thermodynamique. Sinon
l'électromagnétisme ne serait plus correct. Si on doit exclure ces solutions pour que
l'électromagnétisme soit correct, elles ne sont plus utilisables pour l'interprétation. Cela peut se
discuter (Cramer dit qu'après transaction il n'y a plus d'ondes avancées qui permettrait une
communication violant la relativité). Mais il y a pire : dans le cadre de la théorie quantique des
champs, pourtant évoquée par l'auteur, ces solutions sont réinterprétées comme correspondant à
l'antimatière. C'est une nécessité. Si elles sont utilisées pour autre chose, cette fois, c'est sûr,
plus moyen de les utiliser. Il reste malgré tout une petite porte ouverte car l'onde avancée
pourrait très bien être vue comme une particule d'antimatière. C'est bizarre mais pas hérétique.
Nous ne considérerons donc pas cela comme un défaut.

Un autre problème est lié à l'invariance de Lorentz. L'auteur affirme que la théorie est
invariante de Lorentz (ce qui est vrai) au moins dans ses résultats. Les solutions avancées sont
aussi une conséquence des théories relativistes (avant leur réinterprétation en antimatière). C'est
aussi une conséquence de la symétrie T (sauf pour les mésons K). Celle-ci s'applique même à
l'équation non relativiste de Schrödinger comme le montre l'auteur. Toutefois la symétrie T doit
s'appliquer globalement. Pour qu'une théorie respecte la causalité relativiste, il faut que toutes
les ondes soit retardées ou toutes avancées (ce qui correspond à un simple changement de signe
de la variable t). Un mélange des deux pouvant conduire à des inconsistances. Mais, même si
les arguments de Cramer ne sont donc pas valables pour l'emploi des ondes avancées,
l'interprétation transactionnelle est libre de consistance. Nous ne considérerons donc pas cela
comme un défaut, juste comme un choix un peu étrange.

Notons que nous aurons l'occasion de revenir sur la flèche du temps.


 Bases privilégiées.
La théorie, de par ses émetteurs et absorbeurs, donne un rôle privilégié aux positions. Il ne
semble a priori pas évident de relier ce caractère privilégié à la décohérence.
 Caractère explicatif des probabilités et de la réduction.
Ni la nature exacte (essentiellement à cause du dualisme onde - corpuscule et du dualisme onde
- émetteur/absorbeur) de la fonction d'onde ni le mécanisme des probabilités n'est expliqué.

L'auteur dit que le choix de la transaction lève un coin du voile car la transaction s'établit (de
manière probabiliste) en fonction de l'intensité du lien. C'est certes astucieux et séduisant mais
la règle de Born ne dit pas autre chose (mais sous une forme très différente) en disant que la
probabilité est reliée à la grandeur de la composante. C'est donc plus une manière intéressante
de voir les choses qu'une véritable amélioration de la compréhension de ce caractère aléatoire.
 Coté pédagogique.
L'interprétation est simple et intuitive et autorise des représentations graphiques très claires de
situations complexes. Elle constitue un excellent outil pour expliquer la mécanique quantique (à
condition de prévenir du coté interprétatif), comme l'a d'ailleurs fait John Cramer.

Nous estimons toutefois que cela ne peut se faire que si l'on a bien avertit les étudiants du fait
que l'usage est uniquement pédagogique et que rien ne permet de prouver l'existence de ces
transactions (l'interprétation étant par essence infalsifiable). Il ne faut surtout pas induire les
étudiants en erreur en leur laissant croire qu'un élément interprétatif infalsifiable soit une réalité
avérée.
 Défauts.
Etant donné les objectifs que nous nous sommes fixés, la violation explicite et tout à fait
artificielle de la localité est à compter comme défaut. D'autant que les ondes avancées restent
expérimentalement inobservables (pourquoi introduire dans l'interprétation un phénomène que
l'on ne peut pas observer ?)

Pour le reste il serait difficile de trouver des défauts car cette interprétation est rigoureuse,
totalement consistante et en parfait accord avec les prédictions de la mécanique quantique.

Interprétation transactionnelle : -6.


III.6.Etats relatifs
La formulation des états relatifs d'Everett de la mécanique quantique est une tentative de résoudre
le problème de la mesure en éliminant la dynamique de réduction de la théorie standard de von
Neumann - Dirac de la mécanique quantique. Le principal problème avec la théorie d'Everett est
qu'il n'est pas du tout clair comment elle est supposée marcher. En particulier, bien qu'il soit clair
qu'il désirait expliquer pourquoi nous avons des résultats définis des mesures dans le contexte de sa
théorie, il n'est pas clair comment il comptait faire cela. Il y a eu plusieurs tentatives de reconstruire
la théorie sans réduction d'Everett afin de prendre en compte l'indétermination apparente du résultat
des mesures. Ces tentatives ont conduit à des formulations de la mécanique quantique telles que les
mondes multiples, les consciences multiples, les histoires multiples et les théories des faits relatifs.
Chacune capture une partie de ce que Everett affirmait pour sa théorie mais chacune rencontre aussi
des problèmes.
III.6.1. Introduction
Everett formula son interprétation des états relatifs de la mécanique quantique quand il était un
étudiant en graduat de physique à l'université de Princeton. Sa dissertation de doctorat fut
recommandée pour publication en mars 1957 et un article rapportant le résultat de sa dissertation
fut publié en juillet de la même année. Il publia aussi plus tard une discussion étendue de son
interprétation des états relatifs dans l'anthologie de DeWitt et Graham (1973). Après son graduat à
Princeton, Everett a travaillé comme analyste pour la défense. Il est mort en 1982.

La formulation sans réduction d'Everett de la mécanique quantique fut une réaction aux problèmes
soulevés par la formulation standard avec réduction de von Neumann - Dirac. La proposition
d'Everett était d'éliminer le postulat de réduction de la formulation standard de la mécanique
quantique et de déduire ensuite les prédictions empiriques de la théorie standard comme les
expériences subjectives des observateurs qui sont eux-mêmes traités comme des systèmes
physiques décrits par sa théorie. Il n'est cependant pas clair comment précisément Everett comptait
faire ce travail. Par conséquent, il y a eu plusieurs tentatives, mutuellement incompatibles, d'essayer
d'expliquer ce qu'il avait en fait en tête. En effet, il est probablement honnête de dire que la plus
part des théories sans réduction de la mécanique quantique ont à un moment ou à un autre été
attribuées à Everett.

Dans ce qui suit, nous décrirons les inquiétudes d'Everett sur la formulation standard avec réduction
de la mécanique quantique et ses propositions pour résoudre le problème comme il l'a présenté dans
son article de 1957. Nous décrirons alors brièvement quelques approches pour interpréter la théorie
d'Everett. Nous y reviendrons plus en profondeur par la suite.
III.6.2. Le problème de la mesure
Everett présenta sa formulation de l'état relatif de la mécanique quantique comme un moyen
d'éviter les problèmes rencontrés par la formulation standard avec réduction de von Neumann -
Dirac. Le principal problème, selon Everett, était que la formulation standard avec réduction de la
mécanique quantique nécessite que les observateurs soient toujours traités comme extérieurs au
système décrit par la théorie. Une conséquence de cela était que la formulation standard avec
réduction ne pouvait pas être utilisée pour décrire l'univers comme un tout puisque l'univers
contient les observateurs.

Afin de comprendre ce qui inquiétait Everett, on doit d'abord comprendre comment la formulation
standard de la mécanique quantique fonctionne. La théorie standard de von Neumann - Dirac est
basée sur les principes suivant (von Neumann, 1955) :
1. Représentation des états : les états physiques possibles d'un système S sont représentés par des
vecteurs de longueur unité dans un espace de Hilbert (que pour l'occasion on peut voir comme
un espace vectoriel avec un produit scalaire). L'état physique à un moment est alors représenté
par un seul vecteur dans l'espace de Hilbert.
2. Représentation des propriétés : pour chaque propriété physique P que l'on peut observer sur un
système S, il y a un opérateur (appelé aussi projecteur) P (sur les vecteurs qui représentent les
états possibles de S) qui représente la propriété.
3. Lien valeur propre - état propre : un système S déterminé a la propriété physique P si et
seulement si P opérant sur S (le vecteur représentant l'état de S) redonne S. Nous disons alors
que S est un état propre de P avec la valeur propre 1. S n'a pas la propriété P si et seulement si P
opérant sur S donne zéro.
4. Dynamique :
(a) si aucune mesure n'est faite, alors un système S évolue de manière continue selon la
dynamique linéaire, déterministe qui dépend seulement des propriétés énergie du système.
(b) Si une mesure est faite, alors le système S saute instantanément et aléatoirement dans un état
où il est ou bien déterminé ou il n'a pas la propriété mesurée. La probabilité de chaque état
possible après mesure est déterminée par l'état initial du système. Plus spécifiquement, la
probabilité de finir dans un état final est égale au carré de la norme de la projection de l'état
initial sur l'état final.
Selon le lien valeur propre - état propre (règle 3), un système pourrait être non déterminé et ne pas
avoir la propriété particulière donnée. Afin d'avoir une propriété particulière, le vecteur
représentant l'état d'un système doit être sur la ligne (ou le sous-espace) dans un espace d'états
représentant la propriété et afin de ne pas avoir la propriété l'état d'un système doit être dans le plan
(ou le sous espace) orthogonal, et la plus part des vecteurs d'état ne seront ni parallèles ni
orthogonaux à une ligne (ou un sous espace) donnée. De plus, la dynamique déterministe (règle 4a)
ne garantit typiquement pas qu'un système aura ou n'aura pas une propriété déterminée quand on
observe le système pour voir si le système a cette propriété. C'est pourquoi la dynamique de
réduction (règle 4b) est nécessaire dans la formulation standard de la mécanique quantique. C'est la
dynamique de réduction qui garantit qu'un système aura ou n'aura pas de manière déterminée une
propriété particulière quand on observe le système pour voir s'il a la propriété. Mais la dynamique
linéaire (règle 4a) est aussi nécessaire pour prendre en compte les effets d'interférences de la
mécanique quantique. Ainsi, la formulation standard de la mécanique quantique a deux lois
dynamiques : la règle 4a déterministe, continue, linéaire qui décrit comment un système évolue
quand il n'est pas mesuré et la règle 4b aléatoire, discontinue, non linéaire qui décrit comment un
système évolue quand il est mesuré.

Mais qu'est-ce qui fait qu'une interaction est du type mesure ? A moins que nous sachions cela, la
formulation standard de la mécanique quantique est au mieux incomplète puisque nous ne savons
pas quand chaque loi dynamique est applicable. De plus, et c'est ce qui inquiétait Everett, si nous
supposons que les observateurs et leurs dispositifs de mesure sont construits à partir de systèmes
plus simples qui obéissent chacun à la dynamique déterministe, alors les systèmes composites, les
observateurs et leurs dispositifs de mesure, doivent évoluer d'une manière déterministe continue et
jamais comme l'évolution aléatoire, discontinue décrite par la règle 4b qui ne peut jamais se
produire. C'est-à-dire que si les observateurs et leurs dispositifs de mesure sont vus comme étant
construits à partir de systèmes plus simples se comportant chacun comme la mécanique quantique
l'exige, chacun obéissant à la règle 4a, alors la formulation standard de la mécanique quantique est
logiquement inconsistante puisqu'elle dit que les deux systèmes ensembles doivent obéir à la règle
4b. C'est le problème de la mesure quantique dans le contexte de la formulation standard avec
réduction de la mécanique quantique.
Afin de préserver la consistance de la mécanique quantique, Everett en a conclu que la formulation
standard avec réduction ne pouvait pas être utilisée pour décrire les systèmes qui contiennent les
observateurs, c'est-à-dire qu'elle ne pouvait être utilisée que pour décrire un système où tous les
observateurs sont extérieurs au système décrit. Et pour Everett, cette restriction sur l'applicabilité de
la mécanique quantique était inacceptable. Everett désirait une formulation de la mécanique
quantique qui pourrait être appliquée à tout système physique quel qu'il soit, un qui décrit les
observateurs et leurs dispositifs de mesure de la même manière qu'elle décrit tout autre système
physique.
III.6.3. La proposition d'Everett
Afin de résoudre le problème de la mesure, Everett proposa d'éliminer la dynamique de réduction
(règle 4b) de la théorie standard avec réduction et proposa de prendre la théorie physique résultante
comme fournissant une description complète et précise de tous les systèmes physiques quels qu'ils
soient. Everett tenta alors de déduire les prédictions statistiques standard de la mécanique quantique
(les prédictions qui dépendent de la règle 4b dans la formulation standard avec réduction de la
mécanique quantique) comme les expériences subjectives des observateurs qui sont eux-mêmes
traités comme des systèmes physiques ordinaires dans la nouvelle théorie.

Everett dit :
Nous serons capables d'introduire dans les systèmes [de la théorie de l'état relatif] ceux qui
représentent les observateurs. De tels systèmes peuvent être conçus comme des machines
fonctionnant automatiquement (des servo mécanismes) possédant des dispositifs d'enregistrement
(mémoire) et qui sont capables de répondre à leur environnement. Le comportement de ces
observateurs sera toujours traité dans le cadre de la mécanique ondulatoire. De plus, nous
déduirons les affirmations probabilistes du processus 1 [règle 4b] comme des apparences
subjectives de tels observateurs, plaçant donc la théorie en correspondance avec l'expérience.
Nous sommes donc conduit à la situation nouvelle dans laquelle la théorie formelle est
objectivement continue et causale, bien que subjectivement discontinue et probabiliste. Tandis que
ce point de vue justifiera donc ultimement notre utilisation d'affirmations probabilistes de la vision
orthodoxe, elle nous permettra de le faire d'une manière logiquement consistante permettant
l'existence des autres observateurs (1973, P.9).

Le but d'Everett était alors de montrer que l'enregistrement mémoire d'un observateur comme décrit
par la mécanique quantique sans la dynamique de réduction serait tant bien que mal en accord avec
celle prédite par la formulation standard avec la dynamique de réduction. Le principal problème est
de comprendre ce qu'Everett avait à l'esprit en imaginant comment cette correspondance entre la
prédiction des deux théories était supposée marcher.

Afin de voir ce qui se passe, essayons la proposition sans réduction d'Everett pour une interaction
de mesure simple. On peut mesurer le spin S x , selon la direction x, d'un système physique. Plus
spécifiquement, un système de spin 1/2 sera trouvé ou " S x haut" ou " S x bas" quand son spin est
mesuré. Ainsi supposons que J est un bon observateur qui mesure le spin d'un système S de spin
1/2. Pour Everett, être un bon observateur de S x signifie que J a les deux dispositions suivantes (la
flèche ci-dessous représente l'évolution dans le temps déterminée par la dynamique déterministe de
la règle 4a) :

(1) " prêt" J


S x haut S
→ " spin haut" J
S x haut S

(2) " prêt" J


S x bas S
→ " spin bas" J
S x bas S

Si J mesure un système qui est défini S x haut, alors J enregistrera de manière définie "spin haut" et
si J mesure un système qui est défini S x bas, alors J enregistrera de manière définie "spin bas" (et
nous supposerons, par simplicité, que le spin du système objet S n'est pas perturbé par l'interaction).

Considérons maintenant ce qui se passe quand J observe le spin d'un système qui commence dans
une superposition d'états propres du spin :
(3) a S x haut S + b S x bas S

L'état initial du système composite est alors :


(
(4) " prêt" a S x haut S + b S x bas S )
Ici J est défini prêt à faire une mesure du spin, mais le système objet S, selon la règle 3, n'a pas de
spin défini. Etant donné les deux dispositions de J et le fait que la dynamique déterministe est
linéaire, l'état du système composite après la mesure du spin par J sera :
(5) a " spin haut" S x haut S + b " spin bas" S x bas S

Dans la formulation standard avec réduction de la mécanique quantique, quelque part durant
l'interaction de mesure, l'état se réduirait ou bien au premier terme de cette expression (avec une
probabilité égale au carré de a) ou au second terme de cette expression (avec une probabilité égale
au carré de b). Dans le premier cas, J termine avec l'enregistrement de mesure défini "spin haut" et
dans le deuxième cas J termine avec l'enregistrement de mesure défini "spin bas". Mais avec la
proposition d'Everett, aucune réduction ne se produit. Plutôt, l'état après mesure est simplement
cette superposition intriquée de J enregistrant le résultat "spin haut" avec S étant spin haut et J
enregistrant "spin bas" avec S étant spin bas. Appelez cet état E pour Everett. Pour le lien standard
valeur propre - état propre (règle 3), E n'est pas un état où J à un enregistrement défini "spin haut"
ni un état où J est un enregistrement défini "spin bas". Ainsi l'énigme pour une interprétation
d'Everett est d'expliquer le sens dans lequel la superposition intriquée de J d'enregistrements
mutuellement incompatibles est supposée être en accord avec la prédiction empirique faite par la
formulation standard avec réduction de la mécanique quantique. La théorie standard avec réduction,
à nouveau, prédit que J termine avec l'enregistrement de mesure parfaitement défini "spin haut" ou
avec l'enregistrement de mesure parfaitement défini "spin bas" avec les probabilités égales au carré
de a et au carré de b, respectivement.

Everett confesse qu'un état après mesure comme E est énigmatique :


Comme résultat de l'interaction de l'état de l'appareil de mesure, il n'est plus capable de définition
indépendante. Il peut être définit seulement relativement à l'état du système objet. En d'autres mots,
il existe seulement une corrélation entre les états des deux systèmes. Il semble comme si rien ne
pouvait jamais être défini par une telle mesure (1957b, p.318).

Et il décrit le problème auquel il fait par conséquent face :


Ce comportement indéfini semble être assez en désaccord avec notre observation puisque les objets
physiques nous apparaissent toujours comme ayant des positions définies. Pouvons nous
réconcilier ce phénomène de la théorie de la mécanique ondulatoire basée entièrement sur la [règle
4a] avec l'expérience ou la théorie doit-elle être abandonnée comme intenable ? Afin de répondre à
cette question, nous considérons le problème de l'observation lui-même dans le cadre de la théorie
(1957b, p.318).

Il décrit alors sa solution à ce problème de l'enregistrement défini (expérience définie) :


Voyons un observateur comme un sous-système du système composite : observateur + système
objet. C'est alors une conséquence inévitable qu'après que l'interaction a eut lieu il n'existe pas, en
général, un seul état observateur. Il y aura, cependant, une superposition d'états du système
composite, dont chaque élément contient un état observateur défini et un état système - objet relatif
défini. De plus, comme nous le verrons, chacun de ces états système objet relatif sera,
approximativement, l'état propre de l'observation correspondante obtenue par l'observateur qui est
décrit par le même élément de superposition. Donc, chaque élément de la superposition résultante
décrit un observateur qui perçoit un résultat défini et généralement différent et à qui il apparaît
que l'état du système objet a été transformé en l'état propre correspondant. Dans ce sens,
l'affirmation habituelle de [la dynamique de réduction (règle 4b)] apparaît valable à un niveau
subjectif de chaque observateur décrit par un élément de superposition. Nous verrons aussi que la
corrélation joue un rôle important pour préserver la consistance quand plusieurs observateurs sont
présents et autorisés à interagir avec un autre (pour "consulter" un autre) ainsi qu'avec d'autres
systèmes objets (1973; p.10).

A cette fin, Everett présente un principe qu'il appelle la relativité fondamentale des états de la
mécanique quantique. Avec ce principe, on peut dire que dans l'état E, J enregistre "spin haut"
relativement à S étant dans l'état spin haut et que J enregistre "spin bas" relativement à S étant dans
l'état spin bas. Mais ce principe ne peut pas en lui-même conduire Everett à l'enregistrement de
mesures définies (ou les expériences de mesures définies) prédites par la formulation standard avec
réduction de la mécanique quantique. La formulation standard prédit qu'en le mesurant, l'état de la
mécanique quantique du système composite se réduit précisément à un des deux états suivants :
(6) " spin haut" S x haut S ou " spin bas" S x bas S

Et qu'il y a donc de fait un seul cas sur le résultat enregistré par J. Avec l'explication d'Everett il
n'est pas clair si J termine par enregistrer un résultat ou l'autre ou peut-être d'une certaine manière
les deux.

Le problème est qu'il y a un trou dans la présentation d'Everett entre ce qu'il essaye d'expliquer et
ce qu'il finit ultimement par dire. Il essaye d'expliquer pourquoi les observateurs obtiennent
précisément les mêmes enregistrements des mesures (expériences) comme prédit par la formulation
standard avec réduction de la mécanique quantique en mécanique quantique sans la dynamique de
réduction mais il finit par une prise en compte où il n'est pas clair si tout enregistrement défini a un
observateur après une interaction de mesure typique. Puisqu'il n'est pas clair exactement comment
Everett entend expliquer un enregistrement de mesure défini d'un observateur (expériences), il n'est
pas clair non plus comment il compte expliquer pourquoi on devrait s'attendre à des
enregistrements de mesure définis de l'un pour exhiber les statistiques quantiques standards. Ce trou
dans la présentation d'Everett a conduit à plusieurs reconstructions mutuellement incompatibles de
sa prise en compte de la mécanique quantique. Chacune de ces reconstructions peut être prise
comme présentant une manière différente d'expliquer comment les enregistrements de l'un peuvent
être définis (ou semblent être définis pour un observateur ou pourquoi il ne devrait pas s'inquiéter si
oui ou non ils sont définis) dans un état après mesure comme E.
III.6.4. La théorie nue
La théorie nue de Albert et Loewer (Albert et Loewer, 1988, et Albert, 1992) est certainement
l'interprétation la plus sauvage de la théorie d'Everett. Dans cette lecture, on suppose qu'Everett
souhaitait enlever la dynamique de réduction mais garder le lien standard valeur propre - état
propre.

Ainsi, comment la théorie nue explique-t-elle l'expérience définie de J ? La réponse courte est
qu'elle ne le fait pas. Plutôt, pour la théorie nue, on essaie d'expliquer pourquoi J croit erronément
qu'il a un enregistrement de mesure définie ordinaire. Le truc est de demander à l'observateur non
pas quel résultat il a mais plutôt s'il a un certain résultat défini spécifique. Si l'état après mesure est
:
(1) " spin haut" J S x haut S
alors J rapporte "J'ai un résultat défini, ou bien spin haut ou bien spin bas". Et il ferait exactement le
même rapport s'il terminait dans l'état après mesure :
(2) " spin bas" J S x bas S |"spin bas">_J|spin-x bas>_S

Ainsi, par linéarité de la dynamique, J affirmerait erronément "J'ai un résultat défini, ou bien spin
haut ou bien spin bas" quand il est dans l'état E :
(3) a " spin haut" J S x haut S + b " spin bas" J S x bas S

Donc, on peut affirmer qu'il semble à J qu'il a un résultat de mesure ordinaire parfaitement défini
même quand ce n'est pas le cas (c'est-à-dire qu'il n'a pas de manière définie "spin haut" et n'a pas de
manière définie "spin bas").

L'idée est d'essayer de prendre en compte toutes les croyances de J sur ses expériences définies en
ayant recours à de telles illusions. Plutôt que de prédire les expériences que nous croyons que nous
avons, une proposition de la théorie nue nous dit que nous n'avons pas plusieurs croyances définies
du tout et alors essaye d'expliquer pourquoi nous croyons néanmoins défini ce que nous faisons.
Bien qu'on puisse dire plusieurs histoires suggestives sur le type d'illusions dont un observateur
ferait l'expérience, il y a au moins deux problèmes sérieux avec la théorie nue. Un problème est que
la théorie nue n'est pas empiriquement cohérente : si la théorie nue était vraie, il serait absolument
impossible d'avoir une évidence empirique pour l'accepter comme vraie. Une autre est que
si la théorie nue était vraie, on échouerait pratiquement à avoir la moindre croyance définie
(puisque pour la dynamique déterministe on ne devrait pratiquement jamais s'attendre à ce que l'état
global soit un état propre de tout observateur sensible particulier) ce qui n'est probablement pas le
type de prédiction que l'on recherche pour une théorie physique réussie (pour plus de détail
comment l'expérience est supposée marcher dans la théorie nue et certains problèmes qu'elle
rencontre, voir Bub, Clifton et Monton, 1998, et Barett, 1994, 1996 et 1999).
III.6.5. Mondes multiples
L'interprétation des mondes multiples de DeWitt (1971) (aussi appelée la théorie des mondes
divisés) est certainement la lecture la plus populaire d'Everett. Pour cette théorie, il y a un monde
correspondant à chaque terme dans le développement de E quand il est écrit dans la base privilégiée
(il y a toujours plusieurs manières de pouvoir écrire l'état de la mécanique quantique d'un système
comme la somme de vecteurs de l'espace de Hilbert; en choisissant une base privilégiée, on choisit
un seul ensemble de vecteurs qui peuvent être utilisés pour représenter un état et donc on choisit
une seule manière privilégiée de représenter un état comme une somme de vecteurs dans l'espace
de Hilbert). La base privilégiée de la théorie est choisie tel que chaque terme dans le
développement de E décrit un monde où il y a enregistrement d'une mesure définie. Etant donné la
base privilégiée (subrepticement) choisie ci-dessus, E décrit deux mondes : un où J (ou peut-être
mieux J1) enregistre de manière définie le résultat de mesure "spin haut" et un autre où J (ou J2)
enregistre de manière définie "spin bas".

DeWitt et Graham décrivent leur lecture d'Everett comme suit :


[L'interprétation d'Everett de la mécanique quantique] rejette l'existence d'une réalité classique
séparée et affirme qu'il y a un sens à parler d'un vecteur d'état pour le monde entier. Ce vecteur
d'état ne se réduit jamais et donc la réalité comme un tout est rigoureusement déterministe. Cette
réalité, qui est décrite conjointement par les variables dynamiques et le vecteur d'état n'est pas la
réalité que nous pensons habituellement mais une réalité composée de plusieurs mondes. En vertu
du développement temporel des variables dynamiques, le vecteur d'état se décompose
naturellement en vecteurs orthogonaux, reflétant une division continuelle du monde en une
multitude de mondes mutuellement inobservables mais également réels dans chacun desquels toute
bonne mesure a conduit à un résultat défini et dans la plus part desquels les lois familières de la
statistique quantique sont valables (1973, p.v.).

DeWitt admet que cette division constante des mondes et les états des systèmes sont corrélés est
contre-intuitive :
Je rappelle encore vivement le choc que j'ai ressenti en rencontrant la première fois ce concept de
multimondes. L'idée de 10100 copies légèrement imparfaites de soi-même toutes se divisant
constamment en copies supplémentaires qui ultimement deviennent impossibles à identifier n'est
pas facile à réconcilier avec le sens commun. C'est une schizophrénie avec une vengeance (1973,
p.161).

Mais bien que la théorie soit contre-intuitive, elle explique (contrairement à la théorie nue)
pourquoi les observateurs finissent par enregistrer des résultats de mesure définis. Dans l'état décrit
par E, il y a deux observateurs occupant chacun un monde différent et chacun avec un
enregistrement de mesure parfaitement défini. Il y a, cependant, d'autres problèmes avec la théorie
des mondes multiples.

Une critique standard est que la théorie est ontologiquement extravagante. On devrait probablement
n'avoir jamais besoin que d'un seul monde physique, notre monde, pour expliquer nos expériences.
L'idée derrière le postulat de l'existence réelle d'un monde physique différent correspondant à
chaque terme dans l'état de la mécanique quantique est qu'il permet d'expliquer nos expériences
définies en prenant l'état de la mécanique quantique évoluant de manière déterministe pour être
dans un certain sens une description complète et précise des faits physiques. Mais, à nouveau, on
peut se demander si le type de complétude qu'on obtient autorise la vaste ontologie des mondes.

Peut-être plus sérieusement, afin d'expliquer l'enregistrement de nos mesures définies, la théorie
nécessite de choisir une base privilégiée tel que les observateurs ont des enregistrements définis (ou
des expériences définies) dans chaque terme de l'état de la mécanique quantique comme exprimé
dans cette base. Le problème est qu'il n'y a pas seulement une base pour faire cela. En prenant le
moment angulaire de tous les moutons d'Australie déterminé et en choisissant une telle base
préférée qui nous dit quand le monde se divise, cela prendrait probablement peu en compte la
mémoire définie concernant ce que je viens de taper. Mais c'est le problème, nous ne savons pas
réellement quelle base rendrait le plus accessible immédiatement l'enregistrement physique, ces
enregistrements qui déterminent nos expériences et croyances, définies dans tout monde. Le
problème de choisir quels observables rendre définis est connu comme le problème de la base
privilégiée.

On peut espérer que la sélection d'une base privilégiée fonctionnerait de l'autre manière : que
l'évolution biologique des observateurs sélectionnerait les observateurs qui enregistrent leurs
résultats de mesure quels que soient les observables physiques réellement définis. L'idée est que les
observateurs commenceraient à enregistrer leurs résultats de mesure pour les observables physiques
en fait définis ou face à une certaine sorte d'échec de ne pas avoir d'enregistrement de mesure
définis. L'explication complète pour laquelle cela ne marche pas directement est subtile mais l'idée
de base est simple : dans une théorie sans réduction, il n'y a pas d'aptitude décroissante pour un bon
observateur qui échoue à avoir des enregistrements de mesure définis. Supposons que seule la
position des particules est en fait définie, comme dans la théorie de Bohm, mais qu'un observateur
essaie néanmoins d'enregistrer ses mesures en terme du spin des particules dans son cerveau. Un tel
observateur n'aurait typiquement pas d'enregistrement de mesure défini mais il serait difficile pour
qui que ce soit de le dire. L'observateur lui-même ne le saurait pas car, pour les raisons de la théorie
nue, il croirait erronément qu'il a enregistré des mesures définies. Mais les autres observateurs non
plus ne sauraient pas qu'il a échoué à avoir des enregistrements définis car aussitôt que l'état
cérébral de l'observateur est corrélé par la mécanique quantique avec la position de quelque chose,
l'observateur aurait effectivement un enregistrement de mesure défini par force de cette corrélation
dans la quantité physiquement privilégiée. Le résultat évolutif de ça est que, aussi tôt qu'il y a la
possibilité d'un échec défini dans l'action, un bon observateur aurait précisément ces dispositions
définies qui le conduirait à une action réussie car peu importe s'il a commencé avec un
enregistrement de mesure défini. Bien qu'un tel observateur a éventuellement quelque chose qui
sert le rôle de disposition d'un enregistrement de mesure, sa croyance qu'il a un enregistrement de
mesure défini avant qu'il corrèle son état cérébral avec l'état de l'observable privilégié défini était
simplement fausse (voir la discussion d'Albert 1992 des enregistrements définis pour plus de détails
sur la formation d'enregistrements définis effectifs à partir des dispositions d'un observateur à agir).

Etant donné les contraintes sur l'attribution de propriétés posées par le théorème de Kochen-
Specker, on peut affirmer que nous n'avons pas besoin de sélectionner une base privilégiée afin
d'avoir un ensemble significatif de propriétés physiques définies. Parmi les faits qu'on désirerait
avoir définis il y a les valeurs de nos enregistrements de mesures. Mais dire exactement ce qu'une
base privilégiée doit être afin de rendre définis nos enregistrements de mesure les plus accessible
est difficile puisque c'est quelque chose qui dépend ultimement des relations entre le mental et les
états physiques et sur exactement comment nous attendons que nos meilleures théories physiques
prennent en compte notre expérience. Le problème de la base privilégiée implique la mécanique
quantique, les questions ontologiques concernant la philosophie de la conscience et des questions
épistémologiques concernant la nature de nos meilleures théories physiques. C'est, par conséquent,
un problème qui nécessite une attention particulière.

Un autre problème avec une théorie de division des mondes concerne les prédictions statistiques de
la théorie. La théorie standard avec réduction prédit que J aura le résultat "spin haut" avec une
2 2
probabilité a et "spin bas" avec la probabilité b dans l'expérience précédente. Comme il y aura
deux copies de J dans le futur, J est garantit d'avoir chacun des deux résultats possibles des
mesures, ainsi, dans ce sens, la probabilité de J d'avoir le résultat "spin haut", disons, est un. Mais
c'est la mauvaise réponse. Un principe d'indifférence peut conduire à assigner des probabilités 1/2 à
chacun des deux résultats possibles de la mesure. Hélas un tel principe serait difficile à justifier et
la probabilité 1/2 est également la mauvaise réponse. La morale est qu'il est impossible d'avoir la
bonne réponse pour les probabilités sans ajouter quelque chose à la théorie.

Afin d'avoir une meilleure idée concernant ce qu'on devrait ajouter pour avoir les bonnes
probabilités, on peut noter que la question "quelle est la probabilité que J enregistre le résultat 'spin
haut' ?" est à strictement parler un non-sens si on ne peut pas identifier lequel des observateurs
futurs est J. C'est-à-dire que si on n'a pas d'identité transtemporelle pour les observateurs dans une
théorie, alors on ne peut pas assigner de probabilités à leurs futures expériences. Ainsi, afin d'avoir
des probabilités dans la théorie des mondes multiples, la première étape est de fournir une prise en
compte de l'identité transtemporelle des observateurs. Puisqu'il n'y a pas de règle qui nous dit quels
sont les mondes à différents moments, la théorie des mondes divisés ne peut pas, en tant que telle,
faire des prédictions statistiques sur ce qui concerne les expériences des futurs observateurs. Et ne
pas être capable de prendre en compte les probabilités quantiques standard est un sérieux problème
puisque ce fut les prédictions statistiques réussies de la mécanique quantique qui ont fait que la
mécanique quantique fut vraiment prise au sérieux. Pour plus sur la métaphysique des mondes
multiples, voir Geroch (1984), Stein (1994), Helay (1984), Bell (1987), Buttefield (1995), Albert et
Barrett (1995), Clifton (1996), Saunders (1997, 1998), Barrett (1999) et Wallace (2002).
III.6.6. Consciences multiples
Everett dit que dans sa formulation de la mécanique quantique "la théorie formelle est
objectivement continue et causale bien que subjectivement discontinue et probabiliste" (1973, p.9).
Albert et Loewer (1988) ont capturé cette propriété dans leur théorie des consciences multiples en
distinguant entre l'évolution temporelle de l'état physique d'un observateur, qui est continue et
causale, et l'évolution de l'état mental d'un observateur qui est discontinu et probabiliste.

Peut-être que la chose la plus bizarre dans cette théorie est qu'afin d'avoir l'état mental de
l'observateur d'une certaine manière au-dessus de son état physique, Albert et Loewer associent
avec chaque observateur une infinité continue de consciences. L'état physique évolue toujours de la
manière déterministe habituelle mais chaque conscience évolue aléatoirement (avec des
probabilités définies par l'état mental courant de la conscience particulière et l'évolution de l'état
global de la mécanique quantique). Pour la dynamique mentale qu'ils décrivent, on devrait
2 2
s'attendre à a consciences de J associées au résultat "spin haut" (le premier terme de E) et b de
consciences de J associées avec le résultat "spin bas" (le second terme de E). La dynamique
mentale est aussi stipulée comme préservant la mémoire.

Un avantage de cette théorie sur la théorie des mondes multiples est qu'il n'y a pas de base
physiquement privilégiée. Pour être sûr, on doit choisir une base privilégiée afin de spécifier la
dynamique mentale complètement (quelque chose qu'Albert et Loewer n'ont jamais complètement
spécifié) mais comme Albert et Loewer le signalent, ce choix n'a absolument rien à voir avec des
faits physiques. Plutôt, cela peut être vu comme une partie de la description de la relation entre
états physiques et mentaux. Un autre avantage de la théorie des consciences multiples est que
contrairement à la théorie des mondes multiples elle fait réellement les prédictions probabilistes
habituelles pour les expériences futures d'une conscience particulière (cela nécessite bien sûr qu'on
donne aux consciences avoir une identité transtemporelles ce qu'Albert et Loewer font comme une
partie de leur engagement ferme à un fort dualisme conscience - corps). Et finalement, c'est une des
quelques formulations de la mécanique quantique qui est manifestement compatible avec la
relativité restreinte (pour une discussion de pourquoi il est difficile de résoudre le problème de la
mesure quantique sous la contrainte de la relativité, voir Barrett 2000 et 2002, pour des discussions
de la localité dans la théorie des consciences multiples, voir Hemmo et Pitowski, 2001 et
Baccagialuppi, 2002 et pour la relation entre relativité et la théorie des mondes multiples, voir
Baccagialuppi 2002).

Le principal problème avec la théorie des consciences multiples concerne son engagement à un fort
dualisme conscience - corps et si le type de domination mentale qu'on obtient vaut la peine de
postuler une infinité continue de consciences associées à chaque observateur. Concernant ce dernier
point, on peut en conclure qu'une théorie à une seule conscience où chaque observateur a une
conscience qui évolue aléatoirement étant donné l'évolution de l'état standard de la mécanique
quantique serait préférable (voir Albert, 1992, Donald, 1997) et Barrett 1995 et 1999, pour plus de
détail et de critiques, pour une large discussion voir Lockwood, 1989 et 1996).

A la fois les théories de la conscience unique et des consciences multiples peuvent être vues comme
des théories à variables cachées comme la mécanique bohmienne (voir la mécanique bohmienne).
Mais au lieu que la position soit définie, comme dans la théorie de Bohm, et alors espérer que les
positions définies des particules fournissent aux observateurs des enregistrements de mesures
définies, c'est les états mentaux des observateurs qui sont directement rendu définis ici et bien que
ce soit un paramètre non physique, il est garantit fournir aux observateurs des enregistrements de
mesures définies.
III.6.7. Histoires multiples
Gell-Mann et Hartle (1990) voient la théorie d'Everett comme une théorie qui décrit plusieurs
histoires mutuellement décohérées. La principale différence entre cette approche et l'interprétation
des mondes multiples est qu'au lieu de stipuler une base privilégiée, ici on se rattache aux
interactions physiques entre un système physique et son environnement (la manière sous laquelle
les états de la mécanique quantique deviennent corrélés) pour effectivement choisir quelles
quantités physiques sont définies à chaque instant pour chaque système.

Un problème est si et en quel sens les interactions de l'environnement peuvent sélectionner une
base privilégiée physique pour le monde entier, qui est ce que nous avons probablement besoin afin
de donner un sens à la formulation d'Everett. Après tout, afin d'être impliqué dans les interactions
de l'environnement, un système doit avoir un environnement et l'univers entier, par définition, n'a
pas d'environnement. Et si on considère des sous-systèmes du monde, l'environnement de chaque
sous-système sélectionnerait probablement un observable physique privilégié différent (au moins
légèrement différent pour chaque système décohéré). Un autre problème est qu'il n'est pas clair si la
quantité définie sélectionnée par l'environnement à un instant est une quantité qui expliquerait nos
enregistrements et expérience de mesure définis. Les partisans de cette approche font souvent appel
à des arguments biologiques et évolutifs pour justifier la supposition que les êtres sensibles doivent
enregistrer leurs croyances en termes de propriétés physiques sélectionnées (ou décohérées) par
l'environnement (voir Gell-Mann et Hartle, 1990 et Zurek, 1991 pour ce type d'argument). La
courte histoire est qu'il n'est pas encore clair comment la prise en compte de notre expérience
définie est supposer marcher quand on se rattache à la décohérence pour sélectionner une base
privilégiée (voir Dowker et Kent, 1996, pour une discussion approfondie de certains des problèmes
qu'on rencontre dans une telle approche).

Il vaut la peine de noter que si on se permet le luxe de stipuler une base privilégiée (plus
spécifiquement une base où les enregistrements de tout observateur sont en fait définis, quoi qu'ils
soient), on peut construire une théorie des histoires multiples à partir de la théorie des consciences
multiples de Albert et Loewer même sans la nécessité que les histoires soient mutuellement
décohérées. Prenons la trajectoire de chacune des consciences des observateurs spécifiques pour
décrire l'histoire d'un monde physique possible. On peut alors stipuler une mesure sur l'ensemble de
toutes les histoires possibles (trajectoires) qui représenteraient la probabilité a priori de chaque
histoire décrivant réellement notre monde. C'est une version de quelque chose appelée la théorie
des processus multiples de Barrett (1999). Puisque de tels mondes (et tout leur contenu) auraient
des identités transtemporelles, contrairement à la théorie des mondes multiples, il n'y aurait pas de
problème particulier ici à parler de probabilités concernant l'expérience future de l'un d'eux. Les
probabilités quantiques dans une telle théorie peuvent naturellement être interprétées comme des
probabilités épistémiques.

Il est instructif de considérer la relation entre une théorie à variable cachée sans réduction comme la
mécanique bohmienne et une théorie à mondes multiples comme la théorie des processus multiples.
Dans la mécanique bohmienne, la fonction d'onde évolue toujours de la manière déterministe
habituelle mais les particules sont toujours prises comme ayant des positions totalement définies.
Pour un système à N particules, la configuration des particules peut être vue comme évoluant dans
un espace de configuration à 3N dimensions suivant le flot du carré de la norme de la fonction
d'onde juste comme une particule sans masse serait guidée par un fluide compressible (le fluide
compressible est ici la distribution de probabilité dans l'espace de configuration donné par la
fonction d'onde standard). Ici à la fois l'évolution de la fonction d'onde et l'évolution de la
configuration des particules sont totalement déterministes. Les probabilités quantiques sont le
résultat du postulat de distribution. Le postulat de distribution suppose que la distribution de
probabilité initiale a priori est égale au carré de la norme de la fonction d'onde à un instant initial.
On apprend que la nouvelle fonction d'onde effective est le résultat d'une mesure, mais on ne sait
jamais plus que ce qui est autorisé par les statistiques quantiques standards. En effet, la théorie de
Bohm prédit toujours les probabilités quantiques standards pour les configurations des particules,
mais elle prédit cela comme des probabilités épistémiques. La théorie de Bohm est supposée
donner des résultats de mesure définis en terme des configurations de particules définies (disons la
position de l'aiguille sur un dispositif de mesure).

Si on choisit la position comme l'observable physique privilégié et qu'on adopte la dynamique des
particules de la théorie de Bohm, alors on peut construire une version de la théorie des processus
multiples en choisissant un seul hamiltonien et en considérant toutes les configurations initiales
possibles des particules correspondant à un processus (monde) différent. Ici les probabilités a priori
sont données par le postulat de distribution de la théorie de Bohm et ces probabilités sont mises à
jours suivant la règle de Bayes comme résultat des mesures. Les probabilités épistémiques mises à
jour conduisent à la fonction d'onde effective de Bohm. Ainsi, la seule différence entre la théorie de
Bohm et la théorie des processus multiples associée est que la théorie des processus multiples traite
tous les mondes bohmiens comme des mondes existant simultanément, un seul d'entre-eux étant le
nôtre. Une théorie des processus multiples peut être construite pour virtuellement toute quantité
physique déterminée exactement comme on construirait une théorie à variables cachées ou modale.

Si l'on prend la théorie des consciences multiples ou la théorie des processus multiples et qu'on
prend pour des enregistrements de mesure définis et les probabilités quantiques standards dans une
formulation d'Everett, alors augmente la théorie par ajout de variables cachées à la mécanique
quantique : des états mentaux dans la première théorie et des observables privilégiés dans la
dernière. C'est la valeur définie de ces variables dites cachées avec les probabilités a priori qui
conduisent aux statistiques quantiques standards. Mais Everett lui-même ne souhaitait
probablement pas une théorie à variables cachées.
III.6.8. Faits relatifs, corrélations sans corrélats et mécanique quantique
relationnelle
Peut-être que l'approche la plus proche dans l'esprit de la formulation de l'état relatif d'Everett serait
simplement de rejeter qu'il y a typiquement toute question absolue de fait sur les propriétés des
systèmes physiques ou enregistrements, expériences et croyances des observateurs (voir Saunders,
1995 et Mermin, 1998 pour des exemples de comment cela peut marcher). Dans l'expérience ci-
dessus, la mécanique quantique ne décrirait pas J comme croyant que son résultat est "spin haut" et
ne décrirait pas J comme croyant que son résultat est "spin bas". Plutôt dans ce type de théorie, tous
les faits de la mécanique quantique seraient relatifs et toutes les probabilités quantiques décriraient
des corrélations de base, pas les corrélats sur lesquels on pourrait penser que les corrélations sont
basées. Ici les faits de la mécanique quantique ne sont pas relatifs à un monde particulier, une
conscience ou une histoire mais relatifs l'un à l'autre : ici J croit que son résultat "spin haut"
relativement à S étant spin haut et croit que son résultat est "spin bas" relativement à S étant spin
bas. Mais on peut se demander quel est l'état de S alors ? Et bien, S est spin haut relativement à J
croyant que son résultat est "spin haut", etc. A nouveau, dans ce type de théorie il n'y a typiquement
pas de questions absolues sur les faits sur les propriétés de systèmes physiques individuels.

Ici, plutôt que de s'occuper d'enregistrements de mesure définis, on rejette simplement qu'il y a un
intérêt concernant ce qu'est l'enregistrement de mesure d'un observateur. Ce qui signifie que tant
que l'on croit qu'il y a intérêt sur ce que donne une mesure particulière, une formation des faits
relatifs de la mécanique quantique ne fournit aucune explication de l'expérience de l'un. De même,
on ne peut pas donner un sens aux prédictions statistiques habituelles de la mécanique quantique
tant que l'on considère cela comme des prédictions concernant la probabilité qu'un résultat de
mesure particulier se produit en fait. A nouveau, il n'y a typiquement pas de tels faits simples dans
une telle théorie. C'est pourquoi, selon cette vue, toutes les probabilités quantiques concernent les
corrélations mais pas les corrélats. Mais il est difficile d'interpréter des affirmations probabilistes
sur les corrélations dans le contexte d'une théorie qui rejette qu'il y a des corrélats définis à corréler.
C'est-à-dire qu'on peut penser que tout discours cohérent sur les corrélations probabilistes entre
événements présuppose qu'il y a un intérêt concernant le fait que ces événements se produisent.
Une réplique à de telles objections serait d'affirmer que prendre en compte nos enregistrements de
mesure définis est simplement en dehors du domaine propre de la mécanique quantique. Puisque
nos résultats de mesures sont probablement enregistrés dans les états des systèmes physiques, ce
serait prendre la mécanique quantique comme ne s'appliquant pas à tous les systèmes physiques.
Mais adopter cette vue serait tomber dans le piège de la plainte initiale d'Everett sur la formulation
de réduction externe de la mécanique quantique comme étant non applicable à des systèmes
contenant les appareils de mesure. Ou on peut répliquer qu'il n'y a pas réellement d'enregistrements
de mesure définis. Mais cela nécessiterait une explication pourquoi il nous semble y avoir des
enregistrements de mesure totalement définis. Aussi, nous désirons probablement une théorie
physique qui est empiriquement cohérente : comme nous l'avons vu avec la théorie nue, si on n'a
pas d'accès fiable à des enregistrements de mesure définis, alors il n'est pas clair comment la
science empirique est possible.
III.6.9. Evaluation
Nous allons nous concentrer ici sur la théorie nue. Nous aurons l'occasion de revenir sur les autres
interprétations.

Nous éviterons aussi trop d'emballage philosophique que l'on a d'ailleurs rencontré de ci de là dans
la description.

Quelques remarques sont nécessaires.

 D'abord la critique de la théorie nue sur l'absence de résultats définis n'est probablement pas
justifiée. La science empirique se construit sur base des résultats définis obtenus par la mesure.
Mais si l'expérimentateur, ses appareils de mesure et le système quantique mesuré se retrouvent
dans un état quantique superposé, l'expérimentateur dispose bien de résultats définis sur
lesquels construire sa théorie. Il se retrouvera dans l'état :
"Je mesure un résultat définit, unique, non superposé, spin haut" + "Je mesure un résultat
définit, unique, non superposé, spin bas".
Le monde ainsi accessible à l'expérimentation est bien un monde donnant des résultats définis
même s'ils sont subjectifs, liés au fait que l'on n'a jamais accès qu'à une partie de l'état global.

Il n'est même pas nécessaire de supposer que chaque composante est un "monde séparé".

L'observateur se retrouve donc lui-même dans un tel état superposé et c'est une superposition
d'états où il dit "j'observe une valeur parfaitement définie". L'observateur n'est tout simplement
pas à même d'observer la réduction dès qu'il s'inclut dans le processus. S'il n'interagit pas avec
l'état superposé (disons avec S x haut + S x bas ) il est à même d'effectuer des mesures
d'interférences et de vérifier qu'il s'agit d'un état superposé, mais s'il interagit avec l'état afin
d'en mesurer les composantes, c'est fini, il est piégé !

Il est vrai que d'un point de vue "extérieur", celui du physicien tentant d'interpréter la théorie,
l'état est curieux et ne semble pas conduire à des états définis. Mais c'est faux. Cet observateur
extérieur n'existe pas. Ou, plutôt, c'est un "non-observateur", un théoricien examinant des
équations et pas un observateur observant le processus réel. Un observateur expérimentateur
serait dans la situation de J et constaterait bien des états définis. Un autre observateur postant la
question à J se retrouverait aussi dans un tel état superposé où il constate des états définis : "J
m'a dit qu'il a obtenu un résultat défini spin haut" + "J m'a dit qu'il a obtenu un résultat défini
spin bas".

Il ne faut surtout pas essayer de calquer un tel état quantique sur nos impressions "classiques",
mal adaptées. Il faut aussi éviter de trop philosopher en se demandant "qui suis-je ?", "quelle
composante suis-je ?". La question peut se poser mais n'est nécessaire ni pour la théorie ni pour
l'évidence empirique qui sont les seuls aspects qui nous importent.
 Notons que nous avons choisi une base privilégiée, la base position (ou plutôt ci-dessus la base
de spin dans la direction verticale), mais ce n'est pas une obligation. Nous pouvons prendre
n'importe quelle base et décomposer l'état de la particule et de l'appareil sur cette base. Si l'on
considère des systèmes microscopiques, c'est tout à fait possible et souhaitable.

Si l'on considère des appareils macroscopiques, comme peut-être l'appareil et, en tout cas,
l'observateur humain, la décohérence explique que le système complet (et donc la particule,
même si elle est microscopique) se retrouve dans un état en rapport avec une base privilégiée.
C'est cette base qui est stable ("robuste" au sens de la décohérence) et qui autorise des états
mémoires permettant de se rendre compte des états définis.

Le fait que l'observateur se retrouve lui-même dans un état superposé peut sembler dérangeant,
même s'il ne peut s'en apercevoir, et pose d'intéressantes et profondes questions philosophiques.
Mais de telles interrogations sortent en grande partie du cadre de cette analyse. Ce qui nous
importe, ici, est que l'interprétation fonctionne et est consistante avec les résultats
expérimentaux, ce qui est manifestement le cas.
 Tout n'est toutefois pas précisé comme, par exemple, l'ontologie (la nature) de la fonction
d'onde même si on peut sans difficulté lui donner un caractère réaliste. Les diverses variantes de
mondes, consciences, histoires et processus multiples vont dans ce sens.
 Un autre problème reste également ouvert, c'est le statut des probabilités. Puisque l'état final
contient tous les résultats, dans un état superposé, comment interpréter le caractère probabiliste
ou statistique des mesures ? On ne peut parler de résultat "spin haut" ou "spin bas" se
produisant avec une certaine probabilité (ou plutôt la mesure de ces résultats) puisque les deux
sont toujours présent. Comment, dans ce cas, expliquer les résultats statistiques expérimentaux
? Sans réduction, pas de règle de Born. Ce n'est pas évident à priori et plusieurs auteurs se sont
penchés sur le problème. Mais nous verrons que la solution n'est en définitive pas si
compliquée, l'arbre peut parfois cacher la forêt.

Toutefois, nous verrons cela un peu plus tard car, pour rester cohérent, il faut signaler que dans
sa thèse, Everett n'a pas clairement résolu les deux points précédents (l'ontologie et les
probabilités).

Passons à l'évaluation.

 Respect du formalisme de la mécanique quantique.


L'interprétation des états relatifs respecte entièrement le formalisme de la mécanique quantique
et même à la perfection car elle ne lui ajoute rien, même pas la réduction de la fonction d'onde
incompatible avec l'évolution linéaire.
 Limite.
Pas de limite connue puisque le formalisme quantique peut s'appliquer à toute situation. La
mesure par un appareil macroscopique n'est pas une obligation et on peut traiter tout type
d'interaction de tout système. On peut même considérer la fonction d'onde de l'univers dans sa
totalité.
 Principe anthropique.
Aucun rôle particulier n'est donné aux appareils macroscopiques et aux observateurs, on peut
s'en passer.
 Réalisme ou positivisme.
La théorie est réaliste ou, en tout cas, autorise une description réaliste sans aucune difficulté.
 Rasoir d'Ockham.
L'interprétation n'ajoute strictement rien au formalisme, c'est le strict minimum que l'on peut
faire et est même, en l'absence de réduction de la fonction d'onde, encore plus économe que
l'interprétation instrumentale.
 Bases privilégiées.
Aucune base privilégiée n'est nécessaire (avant la prise en compte de systèmes macroscopiques
où la décohérence donne alors les explications).
 Caractère explicatif des probabilités et de la réduction.
La nature de la fonction d'onde n'est pas réellement expliquée et le mécanisme des probabilités
ou plutôt leur manifestation expérimentale, reste mystérieux.
 Coté pédagogique.
L'interprétation n'est pas spécialement pédagogique. Elle n'est pas très difficile à comprendre,
mais du fait que l'état final ne corresponde pas directement à ce qui est observé (l'observateur
ne peut savoir qu'il est dans un état superposé) et du fait qu'elle pose de grandes questions
philosophiques, elle la rend assez déroutante pour un profane. Sa compréhension nécessite déjà
à la base une connaissance minimale de la mécanique quantique (superpositions, équation
d'évolution, décohérence).
 Défauts.
Outre les défauts signalés, aucun autre problème n'est à signaler ce qui n'est guère étonnant
puisque l'interprétation n'ajoute rien au formalisme de base de la mécanique quantique.

Interprétation des états relatifs : 3.

Sachant que deux des problèmes signalés vont pouvoir être résolus, c'est un résultat fort intéressant
à tenir à l'œil.
III.7. Mondes multiples
L'interprétation des mondes multiples est une approche de la mécanique quantique selon laquelle,
en plus du monde dont nous sommes directement conscients, il y a une infinité d'autres mondes qui
existent en parallèle dans le même espace et temps. L'existence des autres mondes rend possible
d'éliminer l'aléatoire et l'action à distance de la mécanique quantique et donc de toute la physique.
III.7.1. Introduction
L'idée fondamentale de l'interprétation des mondes multiples, en revenant à Everett 1957, est qu'il y
a une myriade de mondes en plus de celui dont nous sommes conscients. En particulier, chaque fois
qu'une expérience quantique avec différents résultats de probabilité non nulle est effectuée, tous les
résultats sont obtenus, chacun dans un monde différent, même si nous sommes conscients
seulement du monde avec le résultat que nous voyons. En fait, les expériences quantiques prennent
placent partout et très souvent, pas seulement dans les laboratoires de physique : même le
clignotement irrégulier d'un ancien bulbe fluorescent est une expérience quantique.

Il y a plusieurs variations et réinterprétations de la proposition originale d'Everett. Ici, une approche


particulière de l'interprétation des mondes multiples (qui diffère de l'approche populaire de
"division réelle des mondes" de DeWitt 1970) sera présentée en détail, suivi d'une discussion sur
les différentes variantes de l'interprétation des mondes multiples.

L'interprétation des mondes multiples consiste en deux parties :


i. Une théorie mathématique qui conduit à l'évolution dans le temps de l'état quantique du
Monde (unique).
ii. Une prescription qui pose une correspondance entre l'état quantique du Monde et notre
expérience.

La partie (i) est essentiellement résumée par l'équation de Schrödinger ou ses généralisations
relativistes. C'est une théorie mathématique rigoureuse et elle n'est pas problématique
philosophiquement. La partie (ii) implique "notre expérience" qui n'a pas de définition rigoureuse.
Une difficulté supplémentaire en posant (ii) vient du fait que le langage humain fut développé à une
époque où les gens ne suspectaient pas l'existence (éventuelle) de mondes parallèles. C'est,
cependant, seulement un problème sémantique.
III.7.2. Définitions

III.7.2.1. Qu'est-ce qu'un "monde" ?


Un monde est la totalité des objets (macroscopiques) : étoiles, villes, gens, grains de sable, etc. dans
un état défini décrit classiquement.

Cette définition est basée sur l'attitude commune du concept de monde partagé par les être humains.

Un autre concept (considéré dans certaines approches comme celle de base, par exemple dans
Saunders 1995) est un monde relatif, ou une perspective, défini pour tout système physique et
chacun de ses états (pourvu que ce soit un état de probabilité non nulle) : nous l'appellerons un
monde centré. Ce concept est utile quand un monde est centré sur un état de perception d'un être
sensible. Dans ce monde, tous les objets que l'être sensible perçoit ont des états définis, mais les
objets qui ne sont pas sous son observation peuvent être dans une superposition d'états (classiques)
différents. L'avantage d'un monde centré est qu'il ne se divise pas à cause d'un phénomène
quantique dans une galaxie distante, tandis que l'avantage de notre définition est que nous pouvons
considérer un monde sans spécifier un centre et, en particulier, notre langage usuel est juste utile
pour décrire un monde à la fois quand il n'y a pas d'être sensible.

Le concept de "monde" dans l'interprétation des mondes multiples appartient à la partie (ii) de la
théorie, c'est-à-dire que ce n'est pas une entité mathématique rigoureusement définie, mais un terme
défini par nous (être sensible) en décrivant notre expérience. Quand nous nous référons à "l'état
défini décrit classiquement" de, disons, un chat, cela signifie que la position et l'état (vivant, mort,
souriant, etc.) du chat sont spécifiés de manière maximale selon notre capacité à distinguer entre les
alternatives et que cette spécification correspond à une image classique, par exemple aucune
superposition de chats morts et vivants ne sont autorisées dans un seul monde.

Le concept d'un monde dans l'interprétation des mondes multiples est basé sur la conception du
profane d'un monde. Cependant, plusieurs propriétés sont différentes.
Evidemment, la définition du monde comme tout ce qui existe n'est pas valable dans l'interprétation
des mondes multiples. "Tout ce qui existe" est le Monde et il y a seulement un Monde. Le Monde
incorpore plusieurs mondes similaires à celui avec lequel le profane est familier. La majuscule
permettra ici de distinguer le Monde qui regroupe l'ensemble des mondes.

Le profane sait que les objets sont faits de particules microscopiques élémentaires et il croit que,
par conséquent, une définition plus précise du monde est la totalité de toutes ces particules. Dans
l'interprétation des mondes multiples, cette étape naïve est incorrecte. Les particules
microscopiques peuvent être dans une superposition tandis que les objets dans un monde (tel que
défini dans l'interprétation des mondes multiples) ne peuvent pas être dans une superposition. La
relation entre les objets macroscopiques définis selon notre expérience et les objets microscopiques
définis dans une théorie physique qui tente d'expliquer notre expérience est plus subtile et sera
discutée plus loin. La définition d'un monde dans l'interprétation des mondes multiples implique
seulement des concepts reliés à notre expérience.

Un profane croit que notre monde actuel a un passé et un futur unique. Selon l'interprétation des
mondes multiples, un monde défini à un certain moment du temps correspond à un monde unique à
un moment du passé mais à une multitude de mondes à un moment dans le futur.
III.7.2.2. Qui suis-"je"
"Je" suis un objet, tel que la Terre, un chat, etc. "Je" est défini à un moment particulier du temps par
une description (classique) complète de l'état de mon corps et de mon cerveau. "Je" et "Didier" ne
nomment pas la même chose (même si mon nom est Didier). Au moment présent, il y a plusieurs
Didier différents dans différents mondes (pas plus d'un dans chaque monde) mais il est sans
signification de dire que maintenant il y a un autre "moi". J'ai, en particulier, un passé bien défini :
je correspond à un "Didier" particulier en 2010 mais je n'ai pas un futur bien défini : je correspond
à une multitude de "Didier" en 2020. Dans le cadre de l'interprétation des mondes multiples, il est
sans signification de demander : quel Didier serai-je en 2010 ? Il correspondrait à tous. Chaque fois
que nous effectuons une expérience quantique (avec plusieurs résultats possibles), il nous semble
seulement que nous obtenons un seul résultat défini. En effet, Didier qui obtient ce résultat
particulier pense de cette manière. Cependant, ce Didier ne peut pas être identifié comme le seul
Didier après l'expérience. Didier avant l'expérience correspond à tous les "Didier" obtenant tous les
résultats possibles. Bien que cette approche du concept d'identité personnelle semble quelque peu
inhabituelle, elle est plausible à la lumière de la critique de l'identité personnelle de Parfit (1986).
Parfit considère certaines situations artificielles dans laquelle une personne se divise en plusieurs
copies et affirme qu'il n'y a pas de bonne réponse à la question : "quelle copie est moi" ? Il en
conclut que l'identité personnelle n'est pas ce qui est important lorsque nous nous divisons.
III.7.3. Correspondance entre le formalisme et notre expérience

III.7.3.1. L'état quantique d'un objet


La base pour la correspondance entre l'état quantique (la fonction d'onde) du Monde et notre
expérience est la description que le physicien donne dans le cadre de la mécanique quantique
standard pour des objets composés de particules élémentaires. Les particules élémentaires du même
type sont identiques. Donc, l'essence d'un objet est l'état quantique de ses particules et non les
particules elles-mêmes : un état quantique d'un ensemble de particules élémentaires peut être un
chat et un autre état des mêmes particules peut être une petite table. Clairement, nous ne pouvons
pas maintenant écrire une fonction d'onde exacte d'un chat. Nous connaissons avec une
approximation raisonnable la fonction d'onde de certaines particules élémentaires qui constituent un
nucléon. La fonction d'onde des électrons et des nucléons qui constituent un atome est même
connue avec une meilleure précision. Les fonctions d'onde des molécules (c'est-à-dire les fonctions
d'onde des ions et électrons dont sont constituées les molécules) sont bien étudiées. Beaucoup est
connu sur les cellules biologiques, ainsi le physicien peut écrire une forme grossière de l'état
quantique d'une cellule. C'est difficile car il y a beaucoup de molécules dans une cellule. Au-delà
des cellules, nous construisons différents tissus puis des corps entiers de chats ou de tables. Ainsi,
notons l'état quantique construit de cette manière ψ objet .

Dans notre construction, ψ objet


est l'état quantique d'un objet dans un état et une position définie.

Selon la définition d'un monde que nous avons adoptée, dans chaque monde le chat est dans un état
défini : ou vivant ou mort. L'expérience de Schrödinger avec le chat conduit à une division des
mondes même avant l'ouverture de la boite (voir l'expérience du chat de Schrödinger plus loin).
C'est seulement dans l'approche alternative que le chat de Schrödinger, qui est une superposition
d'un être vivant et mort, est un membre du monde centré (unique) de l'observateur avant qu'il ouvre
la boite scellée avec le chat (l'observateur perçoit directement le fait relié à la préparation de
l'expérience et il en déduit que le chat est dans une superposition).
III.7.3.2. L'état quantique qui correspond à un monde
La fonction d'onde de toutes les particules dans le monde correspondant à un monde particulier sera
un produit d'états de l'ensemble des particules correspondant à tous les objets dans le monde
multiplié par l'état quantique Φ de toutes les particules qui ne constituent pas des "objets". Dans
un monde, les "objets" ont des états macroscopiques définis de fait :
(1) ψ monde = ψ objet 1 ψ objet 2 L ψ objet N Φ

Les états quantiques correspondant aux mondes centrés des êtres sensibles ont exactement la même
forme. La seule différence est que dans le produit il y a seulement les états des objets perçus
directement, tandis que la plus grande part du monde est, en général, intriquée.
C'est décrit par Φ .
III.7.3.3. L'état quantique du Monde
L'état quantique du Monde peut être décomposé en une superposition de termes correspondant aux
différents mondes :
(2) ψ mondes = ∑ α i ψ monde i

Les différents mondes correspondent à différents états décrits classiquement d'au moins un objet.
Différents états décrits classiquement correspondent à des états quantiques orthogonaux. Donc,
différents mondes correspondent à des états orthogonaux : tous les états ψ monde i sont

∑α
2
mutuellement orthogonaux et par conséquent i = 1.
III.7.3.4. FAPP
La construction de l'état quantique du Monde en terme des états quantiques des objets présentée ci-
dessus est seulement approximative, elle est bonne seulement pour tout usage pratique (FAPP). En
effet, le concept d'un objet lui-même n'a pas de définition rigoureuse : est-ce qu'une souris qu'un
chat viens d'avaler doit être considérée comme une partie du chat ? Le concept de "position définie"
est aussi seulement approximativement défini : jusqu'où un chat devrait-il être déplacé afin qu'il
soit considéré être dans une position différente ? Si le déplacement est beaucoup plus petit que
l'incertitude quantique, il doit être considéré comme étant à la même place car dans ce cas l'état
quantique du chat est pratiquement le même et le déplacement est en principe indétectable. Mais
c'est seulement une limite absolue car notre capacité à distinguer des locations différentes du chat
est loin de cette limite quantique. De plus, l'état d'un objet (par exemple vivant ou mort) est
significatif seulement si l'objet est considéré pour une période de temps. En fait, nous devons
assurer que l'état quantique aura la forme de l'objet non seulement à ce moment mais pendant une
certaine période de temps. Diviser le monde pendant cette période est une autre source d'ambiguïté,
en particulier à cause du fait qu'il n'y a pas de définition précise du moment où la division se
produit.

La raison pour laquelle nous sommes seulement capables de proposer une prescription
approximative pour la correspondance entre l'état quantique du monde et notre expérience est
essentiellement la même qui a conduit Bell 1990 à affirmer que "la mécanique quantique ordinaire
est just bonne FAPP". Les concepts que nous utilisons : "objet", "mesure", etc. ne sont pas
rigoureusement définis. Bell et plusieurs autres recherchent (jusqu'à maintenant en vain) une
"mécanique quantique précise". Puisqu'il n'est pas suffisant pour une théorie physique d'être juste
FAPP, une mécanique quantique a besoin de fondations rigoureuses. Cependant, pour
l'interprétation des mondes multiples, juste bonne FAPP est suffisant. En effet, l'interprétation des
mondes multiples a des fondations rigoureuses pour (i), la "partie physique" de la théorie. Seule la
partie (ii), la correspondance avec notre expérience, est approximative (juste bonne FAPP). Mais
"juste bonne FAPP" signifie que la théorie explique notre expérience pour toute expérience possible
et c'est le but de (ii). Voir Butterfield 2001 et Wallace 2001 pour des arguments supplémentaires
pour laquelle une définition FAPP d'un monde ("division" dans leur langage) est suffisante.
III.7.3.5. La mesure de l'existence
Il y a plusieurs mondes existant en parallèles dans le Monde. Bien que tous les mondes soient de la
même taille physique (cela peut ne pas être vrai si nous prenons la gravité quantique en compte) et
dans tous les mondes les êtres sensibles le "sentent" comme réel comme dans tout autre monde,
dans un certain sens certains mondes sont plus larges que d'autres. Nous décrivons cette propriété
comme la mesure de l'existence d'un monde. La mesure d'existence d'un monde quantifie sa
capacité à interférer avec d'autres mondes dans une expérience de pensée, voir Vaidman 1998
(p.256) et c'est la base pour l'introduction de la probabilité dans l'interprétation des mondes
multiples. La mesure de l'existence rend précis ce que signifie la mesure de probabilité discutée par
Everett 1957 et est décrit visuellement par Lockwood 1989 (p.230).

Etant donné la décomposition de l'état du Monde, la mesure de l'existence du monde i est


µ i ≡ α i . Elle peut aussi être exprimée comme la valeur moyenne de Pi , le projecteur sur l'espace
2

des états quantiques correspondant à la valeur réelle de toutes les variables physiques décrivant le
monde i :
(1) µ i = ψ mondes Pi ψ mondes

"Nous" avons aussi une mesure d'existence. C'est la somme des mesures d'existence de tous les
mondes différents dans lesquels nous existons. De même, elle peut être définie comme la mesure de
l'existence de notre perception du monde. Notons que nous ne faisons pas directement l'expérience
de notre mesure de l'existence. Nous sentons le même poids, voyons la même lumière, etc. aussi
petite que soit notre mesure de l'existence.
III.7.4. Probabilité dans l'interprétation des mondes multiples
Il y a une sérieuse difficulté avec le concept de probabilité dans le contexte de l'interprétation des
mondes multiples. Dans une théorie déterministe telle que l'interprétation des mondes multiples, la
seule signification possible pour la probabilité est une probabilité d'ignorance, mais il n'y a pas
d'information pertinente qu'un observateur qui va effectuer une expérience quantique en est
ignorant. L'état quantique du Monde à un moment spécifie l'état quantique à tout moment. Si nous
effectuons une expérience quantique avec deux résultats possibles de manière à ce que la
mécanique quantique standard prédise une probabilité de 1/3 pour le résultat A et 2/3 pour le
resultat B, alors, selon l'interprétation des mondes multiples, à la fois le monde avec le résultat A et
celui avec le résultat B existeront. Il n'y a aucun sens à demander : "quelle est la probabilité d'avoir
A au lieu de B ?" car nous correspondons aux deux "Didier" : l'un qui observe A et l'autre qui
observe B.

Pour résoudre cette difficulté, Albert et Loewer 1988 proposèrent l'interprétation des consciences
multiples (dans laquelle les différents mondes sont seulement dans la conscience des être
sensibles). En plus de l'onde quantique du monde, Albert et Loewer postulent que tout être sensible
a un continuum de consciences. Quand l'onde quantique du Monde se développe en une
superposition contenant des états d'un être sensible correspondant à différentes perceptions, la
conscience de cet être sensible évolue de manière aléatoire et indépendamment des états mentaux
correspondant à ces différents états de perception (avec des probabilités égales aux propriétés
quantiques de ces états). En particulier, quand une mesure est effectuée par un observateur, la
conscience de l'observateur développe des états mentaux qui correspondent aux perceptions des
différents résultats, c'est-à-dire correspondant aux mondes A et B dans notre exemple. Puisqu'il y a
un continuum de consciences, il y aura toujours une infinité de consciences dans tout être sensible
et la procédure peut continuer indéfiniment. Cela résout la difficulté : chaque "je" correspond à une
conscience et se termine dans l'état correspondant à un monde avec un résultat particulier.
Cependant, cette solution coûte le prix d'introduire une structure supplémentaire à la théorie,
incluant un véritable processus aléatoire.

Vaidman 1998 (p.254) résout le problème en construisant une probabilité d'ignorance dans le cadre
de l'interprétation des mondes multiples. Il semble sans aucun sens de demander : "quelle est la
probabilité que Didier dans le monde A observe le résultat A ?" Cette probabilité est trivialement
égale à 1. La tâche est de définir la probabilité d'une telle manière que nous puissions reconstruire
la prédiction de l'approche standard 1/3 pour A. C'est en effet sans aucun sens pour vous de
demander quelle est la probabilité que Didier dans le monde A observe le résultat A. Sous des
circonstances normales, le monde A est créé (c'est-à-dire les dispositifs de mesure et les objets qui
interagissent avec les dispositifs de mesure seront localisés selon le résultat A) avant que Didier
soit conscient du résultat A. Alors, il est sensé de demander à ce Didier quelle est la probabilité
d'être dans le monde A. Le résultat que verra ce Didier est une certitude mais il est ignorant de ce
fait au moment de la question. Afin de rendre ce point précis, Vaidman propose une expérience
dans laquelle l'expérimentateur prend un somnifère avant l'expérience. Ensuite, pendant qu'il dort,
on le déplace dans la chambre A ou la chambre B selon le résultat de l'expérience. Quand
l'expérimentateur se réveille (dans une des pièces), mais avant d'ouvrir les yeux, il se demande
"dans quelle pièce êtes-vous ?" Certainement, la pièce dans laquelle il se trouve est une certitude (il
peut le découvrir en ouvrant les yeux) mais il est ignorant de ce fait au moment de la question.
Cette construction fournit l'interprétation d'ignorance de la probabilité, mais la valeur de la
probabilité doit être postulée.

Postulat de probabilité
La probabilité du résultat d'une expérience quantique est proportionnelle à la mesure totale
d'existence de tous les mondes avec ce résultat.

La question de la probabilité d'obtenir A prend aussi un sens pour le Didier dans le monde B avant
qu'il devienne conscient du résultat. Les deux "Didier" ont la même information sur la base de
laquelle ils devraient donner leur réponse. Selon le postulat de probabilité, ils donneront la même
réponse : 1/3 (la mesure relative de l'existence du monde A). Puisque Didier avant la mesure est
associé avec deux "Didier" après la mesure, qui ont des concepts de probabilité d'ignorance
identiques pour le résultat de l'expérience, nous pouvons définir la probabilité du résultat de
l'expérience à effectuer comme la probabilité d'ignorance des successeurs de Didier dans un monde
avec un résultat particulier.

L'argument du "somnifère" ne réduit pas la probabilité d'un résultat d'une expérience quantique à
un concept familier de probabilité dans le contexte classique. La situation quantique est
véritablement différente. Puisque tous les résultats d'une expérience quantique sont réalisés, il n'y a
pas de probabilité dans le sens habituel. L'argument explique le principe de comportement (voir ci-
dessous) pour un expérimentateur selon lequel il se comporterait comme s'il y avait certaines
probabilités pour différents résultats. La justification est particulièrement claire dans l'approche de
probabilité comme la valeur d'un pari rationnel sur un résultat particulier. Les résultats du pari de
l'expérimentateur sont pertinents pour ses successeurs émergeant après avoir effectué l'expérience
dans différents mondes. Puisque l'expérimentateur est relié à tous ses successeurs et ils ont tous des
stratégies rationnelles identiques pour parier, alors cela sera aussi la stratégie de l'expérimentateur
avant l'expérience.

Plusieurs auteurs justifient le postulat de probabilité sans se rattacher à l'argument du somnifère.


Tappenden adopte une sémantique différente selon laquelle "nous" vivons dans toutes les branches
et nous avons des "expériences distinctes" dans des "super tranches" différentes et il utilise le
"poids de super tranches" au lieu de la mesure d'existence. Il affirme qu'il est intelligible d'associer
des probabilités selon le postulat de probabilité : "face à une série de super tranches pondérées
comme partie de moi-même... quel choix dois-je avoir pour assigner une série d'attitudes, des
degrés de croyance, vers les expériences associées à ces super tranches ?". Saunders 1998,
exploitant une variété d'idées dans la théorie de la décohérence, la théorie rationnelle du temps et
les théories sur l'identité dans le temps, affirme aussi "l'identification de la probabilité avec la
norme de l'espace de Hilbert" (qui est égale à la mesure d'existence). Page promeut une approche
qu'il a récemment nommé sensationnalisme inconscient. Le concept de base de cette approche est
une expérience consciente. Il assigne des poids aux différentes expériences selon l'état quantique du
monde comme la valeur moyenne des opérateurs positifs actuellement inconnu correspondant aux
expériences (similaires à la mesure d'existence des mondes correspondant). Page écrit "... les
expériences avec de plus grands poids existent plus dans un certain sens..." Dans toutes ces
approches, le postulat est justifié par recours à une analogie avec le traitement du temps, par
exemple la mesure de l'existence d'un monde est analogue à la durée d'un intervalle de temps. Dans
un travail plus ambitieux, Deutsch 1999 a affirmé dériver le postulat de probabilité du formalisme
quantique et de la théorie classique de la décision, mais il est loin d'être clair qu'il a vraiment
obtenu cela (voir Barnum et al.)
III.7.5. Tests de l'interprétation des mondes multiples
En dépit du nom "interprétation", l'interprétation des mondes multiples est une variante de la
mécanique quantique qui est différente des autres. Expérimentalement, la différence est relative aux
théories avec réduction. Il semble qu'il n'y a pas d'expérience distinguant l'interprétation des
mondes multiples des autres théories sans réduction tel que la mécanique bohmienne ou d'autres
variantes de l'interprétation des mondes multiples.

La réduction conduit à des effets qui sont, en principe, observables. Ces effets n'existent pas si
l'interprétation des mondes multiples est la théorie correcte. Pour observer la réduction nous aurions
besoin d'une super technologie qui permet de "défaire" une expérience quantique, incluant un
renversement du processus de détection par des dispositifs macroscopiques. Voir Lockwood 1989
(p.223), Vaidman 1998 (p.257) et d'autres propositions dans Deutsch 1986. Ces propositions sont
toutes des expériences de pensée qui ne peuvent pas être effectuées avec la technologie courante ou
récemment à venir. En effet, dans ces expériences une interférence de différents mondes doit être
observée. Les mondes sont différents quant au moins un des objets macroscopiques est dans un état
macroscopiquement discernable. Donc, ce qui est nécessaire est une expérience d'interférence avec
un corps macroscopique. Aujourd'hui il y a des expériences d'interférence avec des objets de plus
en plus grands (par exemple, des molécules de fullerène, C60), mais ces objets ne sont pas encore
assez grands pour être considérés comme "macroscopiques". De telles expériences peuvent
seulement raffiner les contraintes sur la limite où la réduction peut prendre place. Une expérience
décisive devrait impliquer l'interférence d'états qui diffèrent par un nombre macroscopique de
degrés de liberté : une tâche impossible pour la technologie actuelle.

Le mécanisme de réduction semble être en contradiction avec les principes physiques de base tel
que la covariance relativiste mais, néanmoins, certaines propositions concrètes ingénieuses ont été
faites (voir Pearle 1986 et les théories avec réduction). Ces propositions (et l'idée de l'interprétation
des mondes multiples non linéaire de Weissman 1999) ont des effets observables supplémentaires
tel qu'une légère non-conservation de l'énergie, qui fut testée dans plusieurs expériences. Les effets
ne furent pas trouvés et certains (mais pas tous !) de ces modèles ont été écartés.
Dans la plus part des interprétations sans réduction, l'évolution de l'état quantique du monde est le
même. Cependant, on peut imaginer qu'il y a une expérience distinguant l'interprétation des mondes
multiples d'une autre interprétation sans réduction basée sur la différence dans la correspondance
entre le formalisme et l'expérience (les résultats des expériences).

Un candidat apparent pour une telle expérience est un dispositif proposé dans Englert et al 1992
dans lequel un monde bohmien est différent des mondes de l'interprétation des mondes multiples
(voir aussi Aharonov et Vaidman 1996). Dans cet exemple, la trajectoire bohmienne d'une particule
dans le passé est contraire à l'enregistrement d'appareils de mesure apparemment bons (de telles
trajectoires furent nommées surréalistes). Cependant, actuellement, il n'y a pas d'enregistrements
mémoires qui peuvent déterminer sans ambiguïté (sans déduction d'une théorie particulière) la
trajectoire de la particule dans le passé. Donc, cette différence ne conduit pas à une méthode
expérimentale pour distinguer entre l'interprétation des mondes multiples et la mécanique
bohmienne. A notre connaissance, il n'y a pas d'autres expériences qui peuvent distinguer
l'interprétation des mondes multiples et les autres théories sans réduction ou, excepté pour peut-être
certaines modifications exotiques, par exemple la mécanique bohmienne avec une distribution de
position initiale de la particule déviant de la distribution quantique.

Il y a d'autres opinions sur la possibilité de tester l'interprétation des mondes multiples. Il a été
fréquemment affirmé, par exemple par DeWitt 1970, que l'interprétation des mondes multiples est
en principe indiscernable de la théorie avec réduction idéale. D'autre part, Plaga 1997 affirme avoir
une proposition réaliste pour tester l'interprétation des mondes multiples et Page 2000 affirme que
certaines observations cosmologiques peuvent supporter l'interprétation des mondes multiples.
III.7.6. Objections à l'interprétation des mondes multiples
Certaines des objections à l'interprétation des mondes multiples viennent d'une mauvaise
interprétation due à la multitude de différentes interprétations des mondes multiples. La
terminologie de l'interprétation des mondes multiples peut être confuse : "univers" chez Deutsch est
"monde" chez d'autres, tandis que chez Deutsch "monde" est "multivers", etc. Il y a
deux approches très différentes avec le même nom "l'interprétation des consciences multiples
". L'interprétation des consciences multiples de Albert et Loewer 1988 mentionnée ci-dessus ne
devrait pas être confondue avec l'interprétation des mondes consciences multiples de Lockwood
1996 (qui ressemble à l'approche de Zeh 1981). Cette dernière est beaucoup plus proche de
l'interprétation des mondes multiples tel que présentée ici, voir la section 17 de Vaidman 1998. De
plus, l'interprétation des mondes multiples dans la représentation de Heisenberg (Deutsch 2001)
diffère significativement de l'interprétation des mondes multiples présentée dans la représentation
de Schrödinger (utilisée ici). L'interprétation des mondes multiples présentée ici est très proche de
la proposition originale d'Everett, mais dans la formulation des états relatifs d'Everett de la
mécanique quantique, ainsi que dans le livre de Barett 1999, Barett utilise le nom "interprétation
des mondes multiples" pour le point de vue de division des mondes proposée par DeWitt 1970.
Cette approche a été critiquée avec raison : elle a à la fois une certaine sorte de réduction (une
division irréversible des mondes dans une base privilégiée) et une multitude de mondes. Nous
allons maintenant considérer les principales objections en détail.
III.7.6.1. Le rasoir d'Ockham
Il semble que la majorité des opposants à l'interprétation des mondes multiples la rejette car, pour
eux, l'introduction d'un très grand nombre de mondes que nous ne pouvons pas voir est une
violation extrême du principe d'Ockham : "Les entités ne doivent pas être multipliées sans
nécessité". Cependant, en jugeant les théories physiques, on pourrait raisonnablement affirmer
qu'on ne devrait pas multiplier les lois physiques sans nécessité non plus (une telle version du rasoir
d'Ockham fut appliquée dans le passé) et sur ce point l'interprétation des mondes multiples est la
théorie la plus économique. En effet, elle a toutes les lois de la mécanique quantique standard mais
sans le postulat de réduction, la plus problématique des lois physiques. L'interprétation des mondes
multiples est aussi plus économique que la mécanique bohmienne qui a en plus l'ontologie des
trajectoires de particules et les lois qui donnent leur évolution. Tipler 1986 (p.208) a présenté une
analogie effective avec la critique de la théorie de Copernic sur la base du rasoir d'Ockham.

On peut aussi considérer un avantage philosophique de la pluralité des mondes dans l'interprétation
des mondes multiples, similaire à celle affirmée par les réalistes sur les mondes possibles, tel que
Lewis 1986 (voir la discussion de l'analogie entre l'interprétation des mondes multiples et la théorie
de Lewis par Skyrms 1976). Cependant, l'analogie n'est pas complète. La théorie de Lewis
considère tous les mondes logiquement possibles, beaucoup plus que tous les mondes incorporés
dans l'état quantique du monde.
III.7.6.2. Le problème de la base privilégiée
Une critique commune de l'interprétation des mondes multiples vient du fait que le formalisme de
la mécanique quantique permet une infinité de manière de décomposer l'état quantique du Monde
en une superposition d'états orthogonaux. La question se pose : "pourquoi choisir la décomposition
particulière donnée plus haut pour le Monde et pas une autre ?" Puisque les autres décompositions
peuvent conduire à des descriptions très différentes, la construction complète semble manquer de
puissance prédictive.

En effet, la structure mathématique de la théorie (i) ne conduit pas à une base privilégiée. La base
pour la décomposition en mondes suit de la conception commune d'un monde selon laquelle il
consiste en des objets avec des positions et états définis ("définis" à l'échelle de notre capacité à les
distinguer). Dans l'approche alternative, la base d'un monde centré est définie directement par un
observateur. Donc, étant donné la nature de l'observateur et étant donné ses concepts pour décrire le
monde, le choix particulier de la décomposition s'ensuit (à une précision qui est bonne FAPP,
comme requit). Si nous ne demandons pas pourquoi nous sommes ce que nous sommes et pourquoi
le monde que nous percevons est ce qu'il est, mais seulement comment expliquer les relations entre
les événements que nous observons dans notre monde, alors le problème de la base privilégiée ne
se pose pas : nous et les concepts de notre monde définissent la base privilégiée.

Mais une réponse plus forte peut être faite à cette critique. En regardant les détails du monde
physique, la structure de l'hamiltonien, la valeur de la constante de Planck, etc., on peut affirmer
pourquoi les être sensibles que nous sommes sont d'un type particulier et pourquoi ils ont les
concepts particuliers qu'ils ont pour décrire leurs mondes. L'argument principal est que la localité
des interactions conduit à la stabilité des mondes dans lesquels les objets sont bien localisés
pendant une période considérable de temps. Donc, de tels mondes (correspondant à l'état quantique
ψ i ) peuvent maintenir leur description macroscopique suffisament longtemps pour être perçus
par des êtres sensibles. Par contraste, un "monde" avec des objets macroscopiques dans une
superposition d'états macroscopiquement discernables (correspondant à un état quantique
1 / 2 ( ψ 1 + ψ 2 ) évolue durant une période de temps extrêmement petite, beaucoup plus petite
que la perception du temps de tout être sensible concevable, en une mixture de l'autre "monde"
1 / 2 ( ψ 1 − ψ 2 ) (voir Zurek 1998).

C'est un bon argument pourquoi des être sensibles perçoivent des objets localisés et non pas des
superpositions, mais on ne peut pas se rapporter seulement à l'argument de la décohérence afin de
sélectionner la base propre (voir quelques difficultés techniques dans Barvinsky et Kamenshchik
1995). Le fait que nous pouvons percevoir seulement des objets bien localisés dans des états
macroscopiques définis peut ne pas être juste une question physique : la chimie, la biologie et
même la psychologie peuvent être nécessaire pour prendre en compte notre évolution. Voir les
différentes tentatives pour construire une théorie de l'évolution des êtres sensibles basée sur
l'interprétation des mondes multiples ou ses variantes dans Albert 1992, Chalmers 1996, Deutsch
1996, Donald 1990, Gell-Mann et Hartle 1990, Lehner 1997, Lockwood 1989, Page 2002, Penrose
1994, Saunders 1994 et Zeh 1981.
III.7.6.3. Dérivation du postulat de probabilité du formalisme de
l'interprétation des mondes multiples
En dehors des questions de l'interprétation de la mesure de probabilité, que nous avons traité ci-
dessus, il y a des questions séparées sur les probabilités dans l'interprétation des mondes multiples,
c'est-à-dire l'affirmation qui était quelque fois faites, par exemple par DeWitt 1970, que le postulat
de probabilité, c'est-à-dire le postulat que la mesure de probabilité est proportionnelle à la mesure
de l'existence, peut être dérivé du formalisme de l'interprétation des mondes multiples. Plusieurs
auteurs, par exemple Kent 1990, critique l'interprétation des mondes multiples sur la base que cette
affirmation échoue. De fait, l'interprétation des mondes multiples n'a aucun avantage sur les autres
interprétations par rapport à cette question. Par contre, ce qui est vrai est qu'on peut dériver le
postulat de probabilité à partir d'un postulat plus faible selon lequel la probabilité est une fonction
de la mesure d'existence. La dérivation peut être basée sur le théorème de Gleason 1957 sur
l'unicité de la mesure de probabilité. Des résultats similaires peuvent être obtenus par l'analyse de
l'opérateur fréquence originaire de Hartle 1968 et d'arguments plus généraux de Deutsch 1999.
Tous ces résultats peuvent être dérivés dans le cadre de différentes interprétations et donc le succès
ou l'échec de ces preuves ne peut pas être un argument en faveur ou contre l'interprétation des
mondes multiples. L'interprétation des mondes multiples, comme toutes les autres interprétations,
nécessite un postulat de probabilité.

Une autre idée pour obtenir une loi de probabilité à partir du formalisme est de dire, par analogie
avec l'interprétation de fréquence des probabilités classiques, que la probabilité d'un résultat est
proportionnelle aux nombres de mondes avec ce résultat. Cette proposition conduit immédiatement
à des prédictions qui sont différentes de ce que nous observons dans les expériences. Certains
auteurs affirment que le comptage est la seule manière sensible d'introduire les probabilités,
considérant cela comme une difficulté fatale à l'interprétation des mondes multiples, par exemple
Belifante 1975. Graham 1973 suggère que le comptage des mondes conduit aux probabilités
correctes si on prend en compte la division détaillée des mondes dans des expériences réalistes,
mais d'autres auteurs ont critiqué l'interprétation des mondes multiples à cause de l'échec de
l'affirmation de Graham. Weissman 1999 a proposé une modification de la mécanique quantique
avec une décohérence supplémentaire non linéaire (et donc beaucoup plus de mondes que
l'interprétation des mondes multiples standard) qui peut conduire asymptotiquement à des mondes
de mesure moyenne égale pour les différents résultats. Bien que cela évite le processus aléatoire,
comme d'autres interprétations des mondes multiples, le prix dans la complication de la théorie
mathématique semble être trop coûteux pour la simplification dans l'explication de la probabilité.
Le formalisme de la mécanique quantique inclus différentes amplitudes pour des états quantiques
correspondant à des mondes différents. C'est une propriété positive de la théorie que les différences
dans les descriptions mathématiques des mondes (différentes valeurs absolues des amplitudes)
soient manifeste dans notre expérience. Voir Saunders 1998 pour une analyse détaillée de cette
question.

A partir du postulat de probabilité faible (la probabilité est une fonction de la mesure d'existence) il
s'ensuit que dans le cas où tous les mondes où une expérience particulière prend place ont des
mesures de probabilité d'existence égale, la probabilité d'un résultat est proportionnelle au nombre
de mondes avec ce résultat. Si la mesure d'existence de ces mondes n'est pas égale,
l'expérimentateur dans tous les mondes peut effectuer des mesures auxiliaires supplémentaires de
certaines variables tel que tous les nouveaux mondes auront une mesure égale d'existence. Les
expérimentateurs seront complètement indifférents aux résultats de ces mesures auxiliaires : leur
but principal est de diviser les mondes en mondes "de poids égal". Cette procédure reconstruit la
règle de probabilité quantique standard par l'approche du comptage des mondes, voir Deutsch 1999
pour les détails.
III.7.6.4. Comportement social d'un partisan de l'interprétation des
mondes multiples
Il y a des affirmations qu'un partisan de l'interprétation des mondes multiples se comporterait d'une
manière irrationnelle. L'affirmation est basée sur l'argument naïf décrit dans la section précédente :
un partisan qui assigne des probabilités égales à tous les mondes différents ferait des paris égaux
sur les résultats des expériences quantiques qui ont des probabilités différentes.

Une autre affirmation, discutée récemment par Lewis 2000, est reliée à la stratégie d'un partisan de
l'interprétation des mondes multiples qui offre de jouer à un jeu de roulette russe quantique.
L'argument est que moi, qui n'accepterait pas de jouer à un jeu de roulette russe classique, je serais
d'accord de jouer à la roulette un nombre quelconque de fois si le résultat se produit selon le résultat
de l'expérience quantique. En effet, à la fin il y aura un monde dans lequel Didier est
multimillionnaire et tous les autres mondes où il n'y aura plus de Didier vivant. Donc, dans le futur,
Didier sera riche et probablement un homme heureux.

Cependant, adopter le postulat de probabilité conduit tous les partisans de l'interprétation des
mondes multiples à se comporter selon le principe suivant :

Principe de comportement
Nous nous inquiétons de tous nos mondes successifs en proportion de leur mesure d'existence (donc
de leur probabilité).

Avec ce principe, notre comportement sera similaire au comportement d'un partisan de la théorie
avec réduction qui s'occupe de tous les mondes futurs possibles selon la probabilité de leur
survenue. Je ne serais pas d'accord de jouer à une roulette russe quantique car la mesure d'existence
des mondes avec Didier mort sera beaucoup plus grande que la mesure d'existence des mondes
avec Didier riche vivant.
III.7.7. Pourquoi l'interprétation des mondes multiples ?
La raison pour adopter l'interprétation des mondes multiples est qu'elle évite la réduction de l'onde
quantique et que d'autres théories sans réduction ne sont pas meilleures que l'interprétation des
mondes multiples pour différentes raisons, par exemple la non-localité de la mécanique bohmienne
et le désavantage de toutes celles qui ont certaines structures supplémentaires. Le postulat de
réduction est une loi physique qui diffère de toutes les lois physiques par deux aspects : elle est
réellement aléatoire et elle implique une certaine sorte d'action à distance. Selon le postulat de
réduction, le résultat d'une expérience quantique n'est pas déterminé par les conditions initiales du
monde avant l'expérience : seules les probabilités sont gouvernées par l'état initial. De plus, Bell
1964 a montré qu'il ne peut pas y avoir de théorie à variables locales compatibles qui rendrait les
prédictions déterministes. Il n'y a pas d'évidence expérimentale en faveur de la réduction contre
l'interprétation des mondes multiples. Nous n'avons pas besoin de supposer que la Nature joue aux
dés. L'interprétation des mondes multiples est une théorie déterministe pour un monde physique et
elle explique pourquoi un monde semble être indéterministe pour des observateurs humains.

L'interprétation des mondes multiples exhibe une certaine sorte de non-localité : "monde" est un
concept non local, mais il évite l'action à distance et donc n'est pas en conflit avec la mécanique
quantique relativiste, voir les discussions sur la non-localité dans Vaidman 1994, Tipler 2000,
Bacciagaluppi 2002 et Hemmo et Pitowsky 2001. Bien que les questions de (non) localité soient
plus transparentes dans le point de vue de Schrödinger, un apport supplémentaire peut être gagné à
travers l'analyse récente dans le cadre du point de vue de Heisenberg, voir Deutsch et Hayden 2000,
Rubin 2001 et Deutsch 2001. L'exemple le plus célèbre de non-localité fut donné par Bell 1964
dans le contexte de l'argument d'Einstein-Podolsky-Rosen. Cependant, dans le cadre de
l'interprétation des mondes multiples, l'argument de Bell ne peut pas enlever la base car elle
nécessite un seul résultat prédéterminé d'une expérience quantique.

Un autre exemple d'une sorte d'action à distance dans une théorie quantique avec réduction est la
mesure sans interaction de Elitzur et Vaidman 1993. Considérons une bombe super sensible qui
explose quand une seule particule arrive à sa position. Il semble qu'il est impossible de voir cette
bombe car tout photon qui arrive à l'endroit de la bombe causera une explosion. Néanmoins, en
utilisant la méthode de Elitzur et Vaidman (voir l'expérience plus loin), il est possible, au moins
quelque fois, de trouver la position de la bombe sans la faire exploser. Dans le cas d'un succès, une
situation paradoxale se produit : nous obtenons de l'information sur une certaine région sans
qu'aucune particule n'y soit. En effet, nous savons qu'aucune particule n'était dans la région de la
bombe car il n'y a pas eut d'explosion. Le paradoxe disparaît dans le cadre de l'interprétation des
mondes multiples. La situation est paradoxale car elle contredit l'intuition physique : la bombe
cause un changement observable dans une région éloignée sans envoyer ou refléter la moindre
particule. La physique est la théorie du monde et donc le paradoxe est réel si cette histoire est vraie
dans le monde physique entier (l'univers). Mais elle ne l'est pas. Il n'y a pas de photon dans la
région de la bombe dans un monde particulier, mais il y a d'autres mondes dans lesquels un photon
atteint la bombe et cause son explosion. Puisque le Monde inclus tous les mondes, il n'est pas vrai
que dans le Monde aucun photon n'arrive à l'endroit de la bombe. Il n'est pas surprenant que notre
intuition physique conduise à un paradoxe quand on se limite à un monde particulier : les lois
physiques sont applicables quand on les applique au Monde physique qui inclut tous les mondes.

L'interprétation des mondes multiples n'est pas la plus acceptée des interprétations de la théorie
quantique parmi les physiciens, mais elle est devenue de plus en plus populaire (voir Tegmark
1998). Les plus forts partisans de l'interprétation des mondes multiples peuvent être trouvés dans
les communautés de la cosmologie quantique et du calcul quantique. En cosmologie quantique, il
est possible de discuter de l'univers entier en évitant la difficulté de l'interprétation standard qui
nécessite un observateur extérieur. Dans le calcul quantique, la question clé est le processus
parallèle effectué sur le même ordinateur, ce qui est très similaire au schéma de base de
l'interprétation des mondes multiples.

Plusieurs physiciens et philosophes croient que la faiblesse la plus sérieuse de l'interprétation des
mondes multiples (et particulièrement de sa version présentée ici) est qu'elle "renonce à essayer
d'expliquer les choses". Avec les mots de Steane 1999, "il est inutile de dire que le chat [de
Schrödinger] est 'vraiment' à la fois vivant et mort quand tous les tests expérimentaux donnent sans
ambiguïté le résultat que le chat est ou bien vivant ou bien mort" (Steane rejette l'expérience
d'interférence qui peut révéler la présence de la superposition comme irréalisable). En effet, s'il n'y
a rien d'autre en physique excepté la fonction d'onde du monde évoluant selon l'équation de
Schrödinger, alors il y a des questions à résoudre qui nécessitent l'aide d'autres sciences.
Cependant, l'avantage de l'interprétation des mondes multiples est qu'elle nous permet d'utiliser la
vue de la mécanique quantique comme une théorie physique complète et consistante qui est en
accord avec tous les résultats expérimentaux obtenus jusqu'ici.
III.7.8. Evaluation
Cette interprétation est apparemment simple et solide, mais on peut déjà citer plusieurs difficultés :
 Le mécanisme provoquant la division en mondes n'est pas expliqué. N'oublions pas que le
processus de mesure est un processus complexe. Entre les interactions avec des particules
microscopiques jusqu'à la lecture d'un résultat défini, il y a toute une chaîne d'interactions. A
quel moment la "division" se produit-elle ? On pourrait, en effet, se demander pourquoi l'état
superposé initial n'est pas lui-même composé de deux mondes parallèles. La raison en est que
sur l'état superposé initial on peut effectuer des expériences d'interférences et constater qu'il
s'agit bien d'un état superposé. Manifestement, l'état initial n'est pas composé de deux mondes
parallèles indépendants. La division ne peut donc se produire que lorsque les résultats définis
sont établis par l'observateur. Ce problème est en fait tout à fait analogue à la réduction de la
fonction d'onde avec simplement une substitution sémantique de "réduction" vers "division".
Certains auteurs n'hésitent d'ailleurs pas à dire que dans l'interprétation des mondes multiples on
ne supprime pas la réduction mais, au contraire, on la rend encore plus flagrante en provoquant
une infinité de réductions possibles : une par monde.

La description des mondes multiples signale d'ailleurs cela. La division en mondes concerne les
objets macroscopiques. Et cette division en mondes est FAPP.

Mais on peut bien se demander quel peut être l'intérêt d'une interprétation FAPP ! Cela peut
s'admettre pour une théorie (par exemple, nous avions cité cela pour la classicalité dans la
décohérence), mais pour une interprétation ? D'un point de vue pratique, il semble assez
difficile d'utiliser l'interprétation des mondes multiples, surtout si elle manque de rigueur dans
la définition des mondes. D'un point de vue théorique, c'est aussi une grosse lacune (comment
décrire la division des mondes par des équations s'il y a de l'arbitraire dans cette division). Et
d'un point de vue philosophique, on aimerait une interprétation donnant un sens concret à ces
"mondes" plutôt qu'une définition aussi floue.

Elle peut toutefois avoir un intérêt conceptuel, comme signalé, dans certains domaines comme
la cosmologie quantique ou le calcul quantique.
C'est malgré tout fort ennuyant car nous ne cherchons pas à établir une théorie qui pourrait
admettre un certain domaine d'application, ici nous cherchons seulement à interpréter une
théorie déjà existante et qui est, elle, parfaitement rigoureuse.
 Bien entendu, l'existence de "mondes parallèles" entraîne de grosses difficultés philosophiques
en relation, en particulier, avec l'identité : dans quel monde suis-je et pourquoi justement celui-
là ? Pourquoi n'ai-je pas conscience des autres mondes ? On peut bien entendu se dire que les
"autres moi", dans chaque monde, se posent ce genre de question. On peut le voir comme de
simples "frères jumeaux". Nous nous contenterons de cette vue pragmatique dans la mesure où
nous ne voulons pas nous enfermer dans des raisonnements purement philosophiques.
 Le même problème avec les probabilités se pose qu'avec les états relatifs. Comment parler de
probabilités (expérimentalement constatées) alors que tous les cas se réalisent ? Certains ont
cherché des solutions statistiques, d'autres des solutions philosophiques comme la "mesure
d'existence" (qui n'est en réalité qu'un changement de vocabulaire pour désigner ces
probabilités) mais nous n'en avons pas été satisfait et nous montreront bientôt la solution. Cette
mesure d'existence est d'autant moins satisfaisante qu'un observateur dans un monde n'a pas
conscience de sa mesure d'existence et n'est pas en mesure de la mesurer.
 Nous avons choisi un cas simple où la probabilité de chaque résultat est 1/2. Mais que se passe-
t-il si la probabilité de l'un est 1/3 et l'autre 2/3 ? En quoi cela affecte-t-il la "division" ? On peut
imaginer qu'un exemplaire du monde 1/3 et créé et deux exemplaires pour la probabilité 2/3.
Mais que se passe-t-il lorsque les deux probabilités ne peuvent être représentées par des
fractions (comme le nombre pi ou la racine carré de deux), dans ce cas la seule solution est la
création d'une infinité de mondes et, qui plus est, une infinité non dénombrable. Un résultat
franchement étrange et difficile à expliquer.
 L'interprétation est obligée, à cause de l'existence de résultats définis dans chaque monde, de
privilégier une base : celle des résultats définis. Aucune explication n'est donnée sur ce choix en
dehors du simple constat et du choix FAPP (avec parfois un recours à la décohérence).
 Enfin, l'interprétation est non locale puisque l'on imagine une division instantanée de tout
l'univers. L'appel aux mondes centrés n'est pas très clair.
 L'interprétation impose une flèche du temps alors que toutes les lois physiques (sauf la
désintégration du méson K) sont invariantes par symétrie T. Mais avant d'avoir une explication
complète sur cell-ci on ne peut pas considérer cela comme une faute. L'observation des résultats
définis par la réduction semble aussi irréversible. Toutefois on aimerait éviter de forcer
l'existence de cette flèche du temps, justement pour essayer d'en comprendre l'origine.

Le problème de la base privilégiée a suscité la recherche de solutions. Ainsi, une variante consiste à
considérer que la réduction se produit sur les "univers décohérés", c'est-à-dire lorsque le mécanisme
de décohérence conduit à l'apparition de la base privilégiée, c'est-à-dire lorsque les comportements
classiques se manifestent. Il ne s'agit malgré tout pas vraiment d'une variante puisque nous avons
vu plus haut que la division en mondes ne pouvait se produire que lorsque les résultats définis,
classiques, sont établis.

Mais cette approche soulève malgré tout des questions :


 Pourquoi le mécanisme de décohérence provoque-t-il la séparation en mondes parallèles ?
 Quand se produit-il ? Car le problème de la chaîne de mesure existe toujours : le mécanisme de
décohérence est progressif et il reste toujours une petite superposition des états de base (le
problème des "queues de décohérence").
 On effectue une séparation arbitraire entre le monde classique et le monde quantique alors que
la décohérence tente justement d'expliquer les comportements classiques dans un cadre
strictement quantique.

Faisons encore quelques remarques :


 L'approche par les univers décohérés peut se rapprocher des histoires consistantes où chaque
histoire possible devient ici un monde différent.
 Ci-dessus, nous avons dit que la séparation n'était possible que lorsque les résultats définis
étaient établis par l'observateur. Cette remarque ainsi que le rapprochement avec une situation
analogue pour la réduction qui peut être poussée "aussi tard" que possible à conduit certains à
imaginer qu'il n'y avait pas réellement une division en mondes parallèles mais seulement une
"division de la conscience" (théorie des consciences multiples). Cette idée donne un statut
privilégié aux structures mentales et pousse à un fort dualisme entre corps et esprit. Cette
interprétation à un coté métaphysique parfois très marqué que nous n'aborderons pas ici.
 Enfin, l'interprétation des mondes multiples admet de nombreuses variantes, incluant parfois
beaucoup de spéculations. Certaines de ces variantes peuvent même conduire à des prédictions
différentes de la théorie orthodoxe et donc peuvent admettre une vérification expérimentale.
Toutefois, aucun résultat appuyant ces idées n'a jamais été constaté et on sort, en outre, du pur
cadre interprétatif que nous nous sommes fixé.
 Il existe aussi d'autres variantes rigoureuses comme les "processus multiples" qui est à
rapprocher de la théorie de Bohm et où chaque trajectoire possible devient un "monde" (un
processus).

Notons que la plus grande partie de ces critiques sont liées au caractère FAPP de l'interprétation.

Synthèse.
 Respect du formalisme de la physique quantique.
Sauf dans certaines variantes, l'interprétation des mondes multiples respecte le formalisme de
base.
 Limite.
L'interprétation s'applique à l'univers entier, elle n'a, a priori, pas de limite. De plus, à une
certaine échelle, macroscopique, les résultats des mesures étant définis, le principe de
l'interprétation peut toujours s'appliquer. Même dans une théorie telle que la gravité quantique
où l'on peut avoir des états passablement "chaotiques" où le caractère classique n'émerge pas,
l'interprétation peut marcher car dans ce cas on peut considérer que la division ne s'est pas
encore produite.
 Principe anthropique.
Elle donne aux résultats définis un rôle particulier et donc privilégie la mesure et l'observation
par des systèmes classiques, la division n'a lieu qu'au niveau classique. C'est un dualisme
quantique - classique analogue à l'interprétation de Copenhague ce qui n'est guère étonnant
puisque la division en monde n'est qu'une réduction déguisée par une habile ontologie.
 Réalisme ou positivisme.
La théorie est réaliste dans la mesure où elle identifie les composantes d'un état avec un monde.
 Rasoir d'Ockham.
La théorie ajoute un ingrédient supplémentaire : la division en mondes. Certains considère
même cela comme une violation maximale (une infinité de mondes) mais en réalité seul le
mécanisme de division est introduit et celui-ci se présente seulement comme un substitut
artificiel à la réduction.
 Bases privilégiées.
La base des états définis conduisant à la division en mondes est privilégiée.
 Caractère explicatif des probabilités et de la réduction.
L'interprétation n'explique pas plus la raison des divisions que l'interprétation de Copenhague
n'explique la réduction. Elle a bien du mal, en plus, a expliquer les probabilités.
 Coté pédagogique.
Elle est simple et intuitive bien que philosophiquement dérangeante. Ses difficultés et son coté
approximatif lui interdit toutefois d'être un véritable outil d'apprentissage.
 Défauts.
Outre ces défauts, rappelons que l'interprétation est :
 Assez approximative.
 Non locale.
Nous ne considérerons pas l'irréversibilité comme une faute (nous ne l'avons pas fait ailleurs).

Interprétation des univers multiples : -7.

On voit que la tentative d'apporter une meilleure ontologie aux états relatifs n'a fait qu'empirer les
choses. Du moins selon notre point de vue.
III.8. Relationnel
La mécanique quantique relationnelle est une interprétation de la mécanique quantique qui écarte
les notions d'état absolu d'un système, les valeurs absolues de ses quantités physiques ou les
événements absolus. La théorie décrit seulement la manière dont les systèmes s'affectent les uns les
autres au cours des interactions physiques. Néanmoins, la théorie est supposée être complète. Le
contenu physique de la mécanique quantique est compris comme exprimant le réseau de relations
connectant tous les systèmes physiques différents.
III.8.1. Introduction
La mécanique quantique est notre théorie générale courante du mouvement en physique. La théorie
est la composante au cœur du changement important que notre compréhension du monde physique
a subi durant les premières décennies du vingtième siècle. C'est une des théories scientifiques les
plus couronnées de succès : elle est supportée par un grand nombre de faits empiriques et
technologiques indiscutables et est aujourd'hui virtuellement impossible à défier. Mais
l'interprétation de ce que nous dit réellement la théorie sur le monde physique soulève un vif débat
qui a continué avec des fortunes diverses depuis les premiers jours de la théorie dans les années
vingt jusqu'aujourd'hui. Les interprétations relationnelles sont un certain nombre de réflexions de
différents auteurs qui ont développé indépendamment mais convergé en indiquant une
interprétation du contenu physique de la théorie. L'idée principale est de lire la théorie comme une
explication théorique de la manière dont les systèmes physiques s'affectent les uns les autres quand
ils interagissent (et pas la manière dont les systèmes physiques "sont") et l'idée que cette
explication est exhaustive sur tout ce qui peut être dit sur le monde physique. Le monde physique
est donc vu comme un réseau de composants en interaction où il n'y a pas de signification à l'état
d'un système isolé. Un système physique (ou, plus précisément, son état contingent) est réduit au
réseau de relations qu'il entretient avec les systèmes environnant et la structure physique du monde
est identifiée comme ce réseau de relations.

La possibilité que le contenu physique d'une théorie physique empirique couronnée de succès
puisse être débattue ne devrait pas être surprenante : les exemples abondent dans l'histoire des
sciences. Par exemple, la grande révolution scientifique fut alimentée par le grand débat sur le fait
que le système copernicien pouvait être pris comme une indication que la Terre n'était pas en fait au
centre de l'univers. A une époque plus récente, le premier succès théorique majeur célébré
d'Einstein, la relativité restreinte, consistait en un grand développement dans la compréhension de
la signification physique (la simultanéité est relative) d'un formalisme mathématique effectif déjà
existant (les transformations de Lorentz). Dans ces cas, comme dans le cas de la mécanique
quantique, une position empirique très stricte pourrait contourner le problème en réduisant le
contenu de la théorie à une liste de nombres prédits. Mais peut-être que la science peut nous offrir
plus qu'une telle liste et certainement la science à besoin de plus que de trouver de cette manière
une telle liste.
La difficulté dans l'interprétation de la mécanique quantique dérive du fait que la théorie fut d'abord
construite pour décrire des objets microscopiques (atomes, électrons, photons) et la manière dont ils
interagissent avec les appareils macroscopiques construits pour mesurer leurs propriétés. De telles
interactions sont appelées des "mesures". La théorie consiste en un formalisme mathématique qui
permet de calculer les probabilités de résultats alternatifs de telles mesures. Si elle est utilisée
seulement dans ce but, la théorie ne soulève pas de difficulté. Mais nous nous attendons à ce que les
appareils macroscopiques eux-mêmes, en fait, tout système physique dans l'univers, obéissent à la
mécanique quantique et cela semble soulever des contradictions dans la théorie.
III.8.1.1. Le problème
En mécanique classique, un système S est décrit par un certain nombre de variables physiques. Par
exemple, un électron est décrit par sa position et son spin (le moment angulaire intrinsèque). Ces
variables changent dans le temps et représentent les propriétés contingentes du système. Nous
disons que leur valeur détermine, à tout moment, "l'état" du système. Une mesure d'une variable du
système est une interaction entre le système S et un système externe O dont l'effet sur O dépend de
la valeur réelle q de la variable (de S) qui est mesurée. La propriété caractéristique de la mécanique
quantique est qu'elle ne permet pas de supposer que toutes les variables du système ont des valeurs
définies à tout moment (cela indépendamment du fait que nous connaissions ou pas de telles
valeurs). Ce fut Werner Heisenberg qui réalisa le premier la nécessité de nous libérer de la
croyance que, disons, un électron a une position bien définie à tout moment. Quand il n'interagit
pas avec un système externe qui peut détecter sa position, l'électron peut être "dispersé" en
différentes positions. Dans le jargon de la théorie, on dit que l'électron est dans une "superposition
quantique" de deux (ou plusieurs) positions différentes. Il s'ensuit que l'état du système ne peut pas
être capturé en donnant la valeur de ses variables. A la place, la mécanique quantique introduit une
nouvelle notion "d'état" d'un système qui est différent d'une liste de valeurs de ses variables. Une
telle nouvelle notion d'état fut développée dans le travail de Erwin Schrödinger sous la forme d'une
"fonction d'onde" du système, habituellement notée ψ . Paul Adrien Maurice Dirac donna une
formulation générale abstraite de la notion d'état quantique en terme d'un vecteur ψ se déplaçant
dans un espace vectoriel abstrait. L'évolution dans le temps de l'état ψ est déterministe et est
gouvernée par l'équation de Schrödinger. A partir de la connaissance de l'état ψ , on peut calculer la
probabilité des différents résultats de mesure q. C'est-à-dire la probabilité des différentes manières
avec lesquelles le système S peut affecter un système O en interaction avec lui. La théorie prescrit
alors que pour toute "mesure" de ce type, on doit mettre à jour la valeur de ψ pour prendre en
compte les différents résultats qui se sont produits. Ce changement soudain de l'état ψ dépend du
résultat spécifique de la mesure et est donc probabiliste. Il est appelé la "réduction de la fonction
d'onde".

Le problème de l'interprétation de la mécanique quantique prend alors différentes formes, selon le


poids ontologique relatif que nous choisissons d'assigner à la fonction d'onde ψ ou,
respectivement, à la séquence des résultats des mesures q, q', q",... Si nous prenons ψ comme
l'entité "réelle" qui représente complètement l'état réel des choses du monde, nous rencontrons un
certain nombre de difficultés. Premièrement, nous devons comprendre comment ψ peut changer
soudainement au cours d'une mesure : si nous décrivons l'évolution de deux systèmes quantiques en
interaction en terme de l'équation de Schrödinger, aucune réduction ne se produit. De plus, la
réduction, vue comme un processus physique, semble dépendre de choix arbitraires dans notre
description et montre une qualité perturbante de non-localité. Mais même si nous pouvons
contourner le problème de la réduction, la difficulté la plus sérieuse de ce point de vue est qu'il
semble impossible à comprendre comment des valeurs spécifiques observées q, q', q",... peuvent
émerger du même ψ . Une meilleure alternative est de prendre les valeurs observées q, q', q",...
comme les éléments réels de réalité et voir juste ψ comme un dispositif de comptabilité déterminé
par les valeurs réelles q, q', q",... qui se sont produites dans le passé. De ce point de vue, les
événements réels du monde sont la "réalisation" ("l'arrivée à la réalité", "l'actualisation") des
valeurs q, q', q",... au cours de l'interaction entre les systèmes physiques. Cette actualisation d'une
variable q au cours d'une interaction peut être notée comme l'événement quantique q. Un exemple
d'événement quantique est la détection d'un électron à une certaine position. La variable position de
l'électron suppose une valeur définie au cours de l'interaction entre l'électron et un système externe
et l'événement quantique est la "manifestation" de l'électron à une certaine position. Les
événements quantiques ont une structure intrinsèquement granulaire discrète ("quantifiée").

La difficulté de cette seconde option est que si nous prenons la nature quantique de tous les
systèmes physiques en compte, l'affirmation qu'un certain événement spécifique q "est arrivé" (ou,
de manière équivalente, qu'une certaine variable a ou n'a pas pris la valeur q) peut être vraie ou
fausse en même temps. Pour clarifier ce point clé, considérons le cas dans lequel un système S
interagit avec un autre système (un appareil) O et exhibe une valeur q d'une de ses variables.
Supposons que le système O obéit également aux lois de la mécanique quantique et utilisons la
mécanique quantique du système combiné formé de O et S afin de prédire la manière dont ce
système combiné peut interagir plus tard avec un système O'. La mécanique quantique nous interdit
de supposer que q s'est produit. En effet, tant que son comportement ultérieur est concerné, le
système combiné S+O peut très bien être dans une superposition quantique des valeurs alternatives
possibles q, q', q",... Cette situation de "second observateur" capture le cœur de la difficulté
conceptuelle de l'interprétation de la mécanique quantique : réconcilier la possibilité de la
superposition quantique avec le fait que le monde observé est caractérisé par uniquement des
événements définis q, q', q",... Plus précisément, elle montre que nous ne pouvons pas démêler les
deux : selon la théorie une quantité observée (q) peut être en même temps définie et non définie. Un
tel événement peut avoir eut lieu et en même temps ne pas avoir eut lieu.
III.8.2. Vue relationnelle des états quantiques
La manière de sortir de ce dilemme suggérée par l'interprétation relationnelle est que les
événements quantiques et donc les valeurs des variables d'un système physique S, c'est-à-dire les q,
sont relationnels. C'est-à-dire qu'ils n'expriment pas les propriétés du système S seul mais plutôt se
réfèrent à la relation entre deux systèmes. En particulier, le point central de la mécanique quantique
relationnelle (Rovelli 1996, 1997) est qu'il n'y a aucun sens à dire qu'un certain événement
quantique s'est produit ou qu'une variable du système S a pris la valeur q : plutôt il y a du sens à
dire que l'événement q s'est produit ou que la variable a pris la valeur q pour O ou par rapport à O.
La contradiction apparente entre les deux affirmations qu'une variable a ou n'a pas de valeur est
résolue en indiçant les affirmations avec les différents systèmes avec lesquels le système en
question interagit. Si nous observons un électron à une certaine position, nous ne pouvons pas en
conclure que l'électron est là : nous pouvons seulement en conclure que l'électron tel que vu par
nous est là. Les événements quantiques se produisent seulement en interaction entre systèmes et le
fait qu'un événement quantique s'est produit est seulement vrai par rapport aux systèmes impliqués
dans l'interaction. La considération unique de l'état du monde de la théorie classique est donc
fracturée en une multiplicité de considérations, une pour chaque système physique "observateur"
possible. Avec les mots de Rovelli (1996) : "la mécanique quantique est une théorie sur la
description physique des systèmes physiques relativement à d'autres systèmes et c'est une
description complète du monde."

Cette relativisation de la réalité est viable grâce à une propriété remarquable du formalisme de la
mécanique quantique. John von Neumann fut le premier à noter que le formalisme de la théorie
traite le système mesuré (S) et le système de mesure (O) différemment mais la théorie est
étonnamment flexible sur le choix où mettre la limite entre les deux. Différents choix donnent
différentes considérations sur l'état du monde (par exemple, la réduction de la fonction d'onde se
produit à différents moments), mais cela n'affecte pas les prédictions sur les observations finales.
von Neumann a seulement décrit une situation assez particulière mais cette flexibilité reflète une
propriété structurelle générale de la mécanique quantique qui garantit la consistance parmi toutes
les "considérations sur le monde" de différents systèmes observateurs. Cette manière sous laquelle
cette consistance est réalisée est cependant subtile.
Ce qui apparaît par rapport à O comme une mesure de la variable q (avec un résultat spécifique)
apparaît par rapport à O' simplement comme l'établissement d'une corrélation entre S et O (sans
aucun résultat spécifique). Aussi longtemps que l'observateur O est concerné, un événement
quantique s'est produit et une propriété q d'un système S a pris une certaine valeur. Aussi longtemps
que le second observateur O' est concerné, le seul élément pertinent de réalité est qu'une corrélation
est établie entre S et O. Cette corrélation se manifeste seulement dans une observation ultérieure
que O' effectuerait sur le système S+O. Au moment où il interagit avec S+O, le système O' n'a pas
accès aux résultats réels des mesures effectuées par O sur S. Ce résultat est réel seulement par
rapport à O (Rovelli 1996, pp.1650-1652). Considérons par exemple un système à deux états O
(disons une diode émettrice de lumière ou led qui peut être on ou off) interagissant avec un système
à deux états S (disons le spin d'un électron qui peut être haut ou bas). Supposons que l'interaction
est telle que si le spin est haut (bas) la led devient on (off). Pour commencer, l'électron peut être
dans une superposition de ces deux états. Dans la description de l'état de l'électron que nous
pouvons associer avec la led, un événement quantique se produit dans l'interaction, la fonction
d'onde de l'électron se réduit dans un des deux états et la led est alors ou bien on ou bien off. Mais
nous pouvons aussi considérer le système composite électron/led comme un système quantique et
étudier l'interaction de ce système composite avec un autre système O'. Dans la description associée
à O', il n'y a pas d'événement et aucune réduction au moment de l'interaction et le système
composite est encore dans la superposition de deux états [spin haut/led on] et [spin bas/led off]
après l'interaction. Il est nécessaire de supposer cette superposition à cause de la description d'effets
d'interférences mesurables entre les deux états : si la mécanique quantique est correcte, ces effets
d'interférence sont vraiment observables par O'. Ainsi nous avons deux descriptions discordantes
des mêmes événements. Les deux descriptions discordantes peuvent-elles être comparées et la
comparaison conduire à une contradiction ? Ils peuvent être comparés car l'information sur la
première description est enregistrée dans l'état de la led et O' a accès à cette information. Donc O et
O' peuvent comparer leurs descriptions de l'état du monde.

Cependant, la comparaison ne conduit pas à une contradiction car la comparaison elle-même est un
processus physique qui doit être compris dans le contexte de la mécanique quantique. En effet, O'
peut physiquement interagir avec l'électron puis avec la led (ou, de manière équivalente, la led puis
l'électron). Si, par exemple, il trouve le spin de l'électron haut, la mécanique quantique prédit qu'il
trouvera alors de manière consistante la led on (car dans la première mesure, l'état du système
composite se réduit à sa composante [spin haut/led on]). C'est-à-dire que la multiplicité des
descriptions ne conduit à aucune contradiction précisément parce que la comparaison entre
différentes descriptions peut seulement être une interaction physique quantique. Cette consistance
interne du formalisme quantique est général et est peut-être son aspect le plus remarquable. Cette
consistance est prise en mécanique quantique relationnelle comme une indication forte de la nature
relationnelle du monde.

En fait, on peut conjecturer que cette consistance singulière entre les observations de différents
observateurs est l'ingrédient manquant pour un théorème de reconstruction du formalisme de
l'espace de Hilbert de la mécanique quantique. Un tel théorème de reconstruction n'est pas encore
disponible : sur la base d'hypothèses physiques raisonnables, on est capable de dériver la structure
d'un réseau orthomodulaire contenant des sous-ensembles qui forment des algèbres de Boole qui
impliquent "presque", mais pas tout à fait, l'existence d'un espace de Hilbert et de son algèbre de
projecteurs (voir la logique quantique). Peut-être qu'une formulation algébrique appropriée sur la
condition de consistance entre les sous systèmes fournirait l'hypothèse manquante pour compléter
le théorème de reconstruction.
III.8.3. Corrélations
La pertinence conceptuelle des corrélations en mécanique quantique, un aspect central de la
mécanique quantique relationnelle, a été souligné par David Mermin qui analysa les propriétés
statistiques des corrélations (Mermin 1998) et arriva à une vue proche de celle de l'interprétation
relationnelle. Mermin indiqua qu'un théorème sur les corrélations dans l'espace de Hilbert de la
mécanique quantique est pertinent pour le problème de ce que nous dit exactement la mécanique
quantique sur le monde physique. Considérons un système quantique S avec des parties internes s,
s',... qui peuvent être considérés comme des sous-systèmes de S et définissons les corrélations
parmi les sous-systèmes comme les valeurs moyennes des produits des observables des sous-
systèmes. Il peut être prouvé que pour toute décomposition de S en sous-systèmes, les corrélations
des sous-systèmes déterminent de manière unique l'état de S. Selon Mermin, ce théorème met en
lumière deux leçons majeures que la mécanique quantique nous enseigne : premièrement, la
physique pertinente de S est entièrement contenue dans les corrélations parmi les s, s',... eux-mêmes
(corrélations internes) et parmi les s',... et les autres systèmes (corrélations externes).
Deuxièmement, les corrélations peuvent être attribuées à la réalité physique tandis que selon les
théorèmes d'impossibilité (Kochen et Specker et autres) les quantités qui sont les termes des
corrélations ne le peuvent pas (Mermin, 1998).
III.8.4. Auto-référence et auto-mesure
D'un point de vue relationnel, les propriétés d'un système existent seulement en référence à un autre
système. Qu'en est-il des propriétés d'un système par rapport à lui-même ? Un système peut-il se
mesurer lui-même ? Y a-t-il une signification aux corrélations d'un système avec lui-même ?
Implicitement, dans le point de vue relationnel, l'intuition est qu'une auto-mesure complète est
impossible. C'est cette impossibilité qui force toutes les propriétés à se référer à un autre système.
La question de l'auto-mesure a été analysée en détail dans deux travaux remarquables selon des
perspectives très différentes, mais avec des conclusions similaires, par Marisa Dalla Chiara et
Thomas Breuer.
III.8.4.1. Aspect logique du problème de la mesure
Marisa Dalla Chiara (1997) a abordé l'aspect logique du problème de la mesure. Elle observe que le
problème de l'auto-mesure en mécanique quantique est strictement relié au problème de l'auto-
référence qui est une vieille tradition en logique. D'un point de vue logique, le problème de la
mesure de la mécanique quantique peut être décrit comme une question caractéristique de
"fermeture sémantique" d'une théorie. Jusqu'à quelle portée la mécanique quantique peut-elle
s'appliquer de manière consistante aux objets et concepts en termes desquels cette métathéorie est
exprimée ? Dalla Chiara montre que la dualité dans la description de l'évolution d'un état, encodée
dans l'approche ordinaire (c'est-à-dire de von Neumann) du problème de la mesure, peut être
donnée par une interprétation purement logique : "si l'appareil observateur O est un objet de la
théorie, alors O ne peut pas réaliser la réduction de la fonction d'onde. Cela est seulement possible
pour un autre O' qui est "externe" par rapport à l'univers de la théorie. En d'autres mots, tout
appareil, en tant que système physique particulier, peut être un objet de la théorie. Néanmoins, tout
appareil qui réalise la réduction de la fonction d'onde est nécessairement seulement un objet
métathéorique" (Dalla Chiara 1977, p.340). Cette observation est remarquablement consistante
avec la manière sous laquelle la réduction du vecteur d'état est justifiée dans l'interprétation
relationnelle de la mécanique quantique. Quand le système S+O est considéré du point de vue de
O', la mesure peut être vue comme une interaction dont la dynamique est totalement unitaire, tandis
que du point de vue de O, la mesure brise l'évolution unitaire de S. L'évolution unitaire ne se brise
pas à travers des bonds physiques mystérieux dû à des effets inconnus mais simplement parce que
O n'a pas une description dynamique complète de l'interaction. O ne peut pas avoir une description
complète de l'interaction de S avec lui-même (O) car son information est une information de
corrélation et il n'y a aucun sens à être corrélé avec soi-même. Si nous incluons l'observateur dans
le système, alors l'évolution est encore unitaire mais nous traitons maintenant avec la description
d'un observateur différent.
III.8.4.2. Impossibilité d'une auto-mesure complète
Comme c'est bien connu, d'un point de vue purement logique, les propriétés auto-référentes d'un
système imposent des limites sur le pouvoir descriptif des systèmes eux-mêmes. Thomas Breuer a
montré que d'un point de vue physique cette propriété est exprimée par l'existence de limitations
dans la validité universelle des théories physiques, quelles soient classiques ou quantiques (Breuer
1995). Breuer étudie la possibilité pour un appareil O de mesurer son propre état. Plus précisément,
de mesurer l'état d'un système contenant un appareil O. Il définit une application de l'espace de tous
les ensembles d'états de l'appareil sur l'espace de tous les ensembles d'états du système. Une telle
application attribue à tout ensemble d'états d'appareil l'ensemble des états système qui est
compatible avec l'information que, après l'interaction de mesure, l'appareil est dans un de ces états.
Avec des hypothèses raisonnables sur cette application, Breuer est capable de prouver un théorème
disant qu'aucune application de ce type ne peut exister qui distingue tous les états du système. Un
appareil O ne peut pas distinguer tous les états du système d'un système S contenant O. Cette
conclusion est valable indépendamment de la nature classique ou quantique des systèmes
impliqués, mais dans le contexte quantique, elle implique qu'aucun appareil de la mécanique
quantique ne peut mesurer toutes les corrélations quantiques entre lui-même et le système externe.
Ces corrélations sont seulement mesurables par un second appareil externe observant à la fois le
système et le premier appareil.
III.8.5. Autres vues relationnelles

III.8.5.1. Systèmes de référence quantiques


Une vue relationnelle de la mécanique quantique a été proposée aussi par Gyula Bene (1997). Bene
affirme que les états quantiques sont relatifs dans le sens qu'ils expriment une relation entre un
système à décrire et un système différent contenant le précédent comme un sous-système et
agissant pour ça comme un système de référence quantique (ici le système est contenu dans le
système de référence tandis que dans le travail de Breuer le système contient l'appareil).
Considérons à nouveau un système de mesure (O) qui est intriqué avec un système mesuré (S)
durant une mesure. A nouveau, la difficulté de la théorie quantique est qu'il y a une contradiction
apparente entre le fait que la quantité q du système suppose une valeur observée dans la mesure
tandis que le système composite S+O devra encore être considéré dans un état de superposition.
Cette contradiction apparente est résolue par Bene en relativisant l'état non pas à un observateur,
comme dans la mécanique quantique relationnelle présentée précédemment, mais plutôt à un
système composite pertinent. C'est-à-dire : il y a un état du système S relatif à S seul et un état du
système S relatif au système composite S+O (de même, il y a un état du système O relatif à lui-
même et un état du système O relatif à l'ensemble S+O). L'ensemble par rapport auquel l'état est
défini est appelé par Bene le système de référence quantique. L'état d'un système par rapport à un
système de référence quantique donné prédit correctement les distributions de probabilité de toute
mesure sur le système de référence entier. Cette dépendance des états des systèmes quantiques de
différents systèmes quantiques qui agissent comme des systèmes de référence est vue comme une
propriété fondamentale qui est valable que le système soit observé ou pas.
III.8.5.2. Sigma algèbres des propriétés interactives
Des vues similaires ont été exprimées par Simon Kochen dans des notes non publiées mais assez
connues (Kochen, 1979, preprint). Avec les mots de Kochen : "Le changement de base dans le
cadre classique que nous défendons est l'abandon de l'hypothèse du caractère absolu des propriétés
physiques de systèmes en interaction... Donc les propriétés de la mécanique quantique acquièrent
un caractère interactif ou relationnel". Kochen utilise un formalisme de sigma algèbre. Chaque
système quantique a un espace de Hilbert associé. Les propriétés du système sont établies par ses
interactions avec d'autres systèmes quantiques et ses propriétés sont représentées par les opérateurs
projection correspondant sur l'espace de Hilbert. Ces projecteurs sont des éléments de la sigma
algèbre booléenne déterminée par la physique de l'interaction entre les deux systèmes. Supposons
qu'un système quantique S puisse interagir avec des systèmes quantiques Q, Q',... Dans chaque cas,
S acquerra une sigma algèbre d'interaction des propriétés sigma(Q), sigma(Q'), puisque l'interaction
entre S et Q peut être divisée plus finement que l'interaction en S et Q'. Donc les sigma algèbres
d'interaction ont des intersections non triviales. La famille de toutes les sigma algèbres booléennes
forment une catégorie avec les ensembles des projecteurs de chaque sigma algèbre comme objet.
Avec les mots de Kochen : "Juste comme l'état d'un système composite ne détermine pas les états
de ses composants, inversement, les états des... systèmes corrélés ne détermine par l'état du système
composite [...] Nous devons donc résoudre le problème de la mesure en coupant le nœud gordien
liant les états des systèmes composants en l'état du système combiné". C'est très similaire dans
l'esprit à l'approche de Bene et la mécanique quantique relationnelle de Rovelli, mais la relation
technique précise entre le formalisme utilisé dans ces approches n'a pas encore été analysé en
détail.

Des approches supplémentaires reliées au moins formellement à celle de Kochen ont été proposées
par Healey (1989) qui a aussi insisté sur un aspect interactif de son approche et par Dieks (1989).
III.8.5.3. Théorie quantique de l'univers
Les vues relationnelles sur la théorie quantique ont été défendues aussi par Lee Smolin (1995) et
Louis Crane (1995) dans un contexte cosmologique. Si on est intéressé par la théorie quantique de
l'univers entier, alors, par définition, un observateur extérieur n'est pas disponible. Le théorème de
Breuer montre qu'un état quantique de l'univers, contenant toutes les corrélations entre tous les sous
systèmes, exprime une information qui n'est pas disponible même en principe à tout observateur.
Afin d'écrire un état quantique significatif, affirment Crane et Smolin, nous devons diviser l'univers
en deux composantes et considérer l'état quantique relatif prédisant les résultats des observations
qu'un composant peut prendre par rapport à un autre.
III.8.5.4. Relation avec l'interprétation des états relatifs d'Everett
Les idées relationnelles sont aussi sous-jacentes dans les interprétations de la théorie quantique
inspirée par le travail d'Everett. Le travail original d'Everett (1975) se rattache à la notion "d'état
relatif" et a un ton relationnel marqué. Dans le contexte de la description d'Everett, un état peut être
pris comme relatif ou (plus communément) comme un "univers" ou une "branche" ou (quelque
fois) relatif à un autre système (voir par exemple Saunders 1996, 1998). Tandis que la première
variante (relationnaliste par rapport aux branches) est éloignée des vues relationnelles décrites ici,
la seconde variante (relationnaliste par rapport aux états d'un système) en est proche.

Cependant, il est différent de dire que quelque chose est relatif à un système ou quelque chose est
relatif à un état d'un système. Considérons par exemple la situation décrite ci-dessus : selon
l'interprétation relationnelle, après la première mesure, la quantité q a une valeur donnée et une
seule pour O tandis qu'en termes d'Everett la quantité q a une valeur pour un état de O et une valeur
différente pour un autre état de O et les deux sont également réelles. Dans Everett il y a une
multiplicité ontologique des réalités qui est absente du point de vue relationnel où les quantités
physiques sont déterminées de manière unique une fois que deux systèmes sont donnés.

La différence dérive d'une différence d'interprétation très générale entre la description d'Everett et
le point de vue relationnel. Everett (du moins dans ses versions répandues) prend l'état ψ comme la
base de l'ontologie de la théorie quantique. L'état ψ complet inclut différentes branches possibles
et différents résultats possibles. D'autre part, l'interprétation relationnelle prend les événements
quantiques q, c'est à dire la réalisation des valeurs des quantités physiques, comme les éléments de
base de la réalité et de tels q sont supposés être univoques. La vue relationnelle évite les difficultés
traditionnelles en prenant les q comme univoques simplement en notant que q ne se réfère pas à un
système mais plutôt à une paire de systèmes.

Pour une comparaison entre l'interprétation relationnelle et d'autres interprétations courantes de la


mécanique quantique, voir Rovelli, 1996.
III.8.6. Quelques conséquences du point de vue relationnel
Un certain nombre de questions conceptuelles ouvertes en mécanique quantique apparaissent sous
un nouvel éclairage quand on les voit dans le contexte de l'interprétation relationnelle. Par exemple,
les conclusions conventionnelles de l'argument Einstein-Podolsky-Rosen s'avèrent dépendre du
repère et ce résultat supporte la "coexistence pacifique" de la mécanique quantique et de la
relativité restreinte (Laudisa 2001). Dans certains cas, les descriptions données dans différents
repères de Lorentz peuvent être identifiées avec des descriptions relatives à différents systèmes
observateurs qui sont consistants.

L'interprétation relationnelle permet aussi de donner une définition précise du moment (ou, mieux,
de la distribution de probabilité dans le temps) ou une mesure se produit, en termes de la
distribution de probabilité de la corrélation entre système et appareil, comme mesurable par un
troisième observateur (Rovelli 1998).

Finalement, il a été suggéré dans (Rovelli 1997) que le relationnalisme au cœur de la théorie
quantique signalé par l'interprétation relationnelle peut être relié au relationnalisme spatio-temporel
qui caractérise la relativité générale. Le relationnalisme de la mécanique quantique est l'observation
qu'il n'y a pas de propriétés absolues : les propriétés d'un système S sont relatives à un autre
système O avec lequel S interagit, le relationnalisme de la relativité générale est l'observation bien
connue qu'il n'y a pas de localisation absolue dans l'espace-temps : la localisation d'un objet S dans
l'espace-temps est seulement relative au champ gravitationnel ou à tout autre objet O avec lequel S
est contigu. Il y a une relation entre les deux puisque l'interaction entre S et O implique la
contiguïté et la contiguïté entre S et O peut seulement être vérifiée via une certaine interaction
quantique. Cependant, à cause de la difficulté à développer une théorie consistante et
conceptuellement transparente de la gravité quantique, jusqu'ici cette suggestion n'a pas été
développée au-delà de l'étape de la simple intuition.
III.8.7. Conclusion
Les interprétations relationnelles de la mécanique quantique proposent une solution aux difficultés
d'interprétation de la théorie quantique en se basant sur l'idée de l'affaiblissement des notions d'état
d'un système, d'événement et sur l'idée qu'un système, à un certain moment, peut juste avoir une
certaine propriété. Le monde est décrit comme un ensemble d'événements ("l'électron est au point
x") qui se produisent seulement relativement à un observateur donné. Donc l'état et les propriétés
d'un système sont seulement relatives à un autre système. Il y a une large diversité dans le style,
l'accent et le langage des auteurs qui ont été mentionnés. En effet, la plus part des travaux
mentionnés ont été développés indépendamment des autres. Mais il est assez clair qu'il y a une idée
commune sous-jacente à ces approches et la convergence est remarquable.

Werner Heisenberg reconnu le premier que l'électron n'a pas une position bien définie quand il
n'interagit pas. Les interprétations relationnelles poussent cette intuition plus loin en disant que
même quand il interagit la position de l'électron est seulement déterminée en relation avec un
certain observateur ou un certain système de référence quantique ou similaire.

En physique, le mouvement d'approfondissement de notre investigation dans le monde physique en


relativisant les notions précédemment utilisées comme absolues a été appliqué de manière répétée
avec beaucoup de succès. Voici quelques exemples. La notion de vitesse d'un objet a été reconnue
comme sans signification à moins qu'elle soit indicée avec un corps de référence par rapport auquel
l'objet se déplace. Avec la relativité restreinte, la simultanéité de deux événements distincts a été
reconnue comme sans signification à moins de se référer à un état spécifique du mouvement de
quelque chose (ce quelque chose est habituellement appelé un "observateur" sans, bien sûr, aucune
implication que l'observateur soit humain ou a une certaine propriété singulière en dehors de celle
d'avoir un état de mouvement. De même le "système observateur" O en mécanique quantique n'a
pas besoin d'être un être humain ou d'avoir d'autres propriétés que celle lui permettant d'interagir
avec le système "observé" S). Avec la relativité générale, la position dans l'espace et le temps d'un
objet a été reconnue sans signification à moins qu'elle se réfère au champ gravitationnel ou une
certaine autre entité physique dynamique. Le mouvement proposé par l'interprétation relationnelle
de la mécanique quantique a une forte analogie avec tout cela mais est, dans un certain sens, un
grand saut puisque tous les événements physiques et l'entièreté des propriétés contingentes de tout
système physique sont considérées comme significatives seulement relativement à un deuxième
système physique. L'affirmation de l'interprétation relationnelle est que ce n'est pas un mouvement
arbitraire. Plutôt, c'est une conclusion auquel il est difficile d'échapper, venant de l'observation,
expliquée ci-dessus dans l'exemple du "second observateur", qu'une variable (ou un système S) peut
avoir seulement une valeur q bien déterminée pour un observateur (O) et en même temps ne pas
avoir de valeur déterminée pour un autre observateur O'.

Cette manière de voir le monde a certainement de lourdes implications philosophiques.


L'affirmation des interprétations relationnelles est que c'est la nature elle-même qui nous force à
penser de cette manière. Si nous désirons comprendre la nature, notre tâche n'est pas de l'encadrer
dans nos préjugés philosophiques mais plutôt d'apprendre comment ajuster nos préjugés
philosophiques à ce que nous apprenons de la nature.
III.8.8. Evaluation
Après cette présentation générale, nous allons maintenant étudier plus en profondeur une
interprétation due à Carlo Rovelli. C'est la plus aboutie et certainement celle qui est le plus dans
l'esprit "purement relationnel". C'est celle là que nous évaluerons.

Introduction
L'approche la plus simple et sans doute la plus proche de l'interprétation de Everett des états relatifs est de
considérer qu'il n'existe pas de propriétés absolues pour les systèmes physiques. Du fait de l'absence de réduction
les valeurs définies sont totalement subjectives. Un tel rejet de toute valeur absolue pouvant être attribuée aux
propriétés ou plus largement aux mesures et connaissances à été développé par plusieurs auteurs.

Le caractère relationnel des états relatifs est aussi le germe de l'interprétation relationnelle de la mécanique
quantique de Rovelli en 1996. Puisque l'état d'un système ne peut s'interpréter que relativement à un autre
système, alors il n'y a pas de sens à parler de l'état d'un système dans l'absolu mais seulement relativement à l'un
ou l'autre observateur. La description n'a de sens qu'à travers les relations tissées par les systèmes physiques via
mesure et plus généralement les interactions. Comme Rovelli le dit : "la mécanique quantique est une théorie sur
la description physique des systèmes physiques relativement à d'autres systèmes et c'est une description complèt
du monde."

Mesure et information
Qu'a-t-on à notre disposition pour déterminer l'état, la nature et le fonctionnement des systèmes physiques ? Tou
ce dont nous disposons ce sont des mesures (ou des observations). Même la préparation d'une expérience consist
en un ensemble de mesures : mesure de la position de l'appareil de mesure, observation que le dispositif est bien
celui imaginé, mesure tactile (le toucher) que l'appareil est bien là où on le voit,…

Chaque mesure nous apporte des informations sur le monde physique. La mesure ou l'observation nous disent qu
le système est bien là, qu'il a telle température, que sa couleur est verte, etc. En fait, dire que l'information reçue
correspond à une couleur, une température, etc. est une interprétation des mesures effectuées, avec des appareils
ou nos sens. Une simple sémantique correspondant à la description que l'on fait du système et faisant partie de sa
modélisation théorique ou sensorielle. Par exemple, lorsque nous disons que l'objet est vert, en réalité ce que nou
savons c'est que la lumière que nous recevons de lui est dans une certaine gamme de longueur d'onde et même
cela est interprété car ce que nous observons n'est pas la longueur d'onde mais, par exemple, la position de frang
d'interférences ou une série de réactions chimiques dans les cellules sensorielles de notre œil sensibles à cette
gamme de longueur d'onde. Nous n'avons aucune connaissance intrinsèque, même classique, d'un objet mais
seulement via les informations données par les mesures.

Donc, tout ce que nous apprenons d'un objet physique peut se concevoir en termes d'informations. Nous
reviendrons ci-dessous sur le genre d'information dont nous parlons.

Corrélations
Un acte de mesure peut aussi se concevoir comme une corrélation entre deux systèmes.

Effectuer une mesure c'est mettre deux systèmes (l'objet physique étudié et l'appareil de mesure) en corrélation.

Illustrons le processus de mesure comme suit, selon un schéma analogue à celui de von Neumann. On a un
système S pouvant se trouver dans les états S1 , S 2 ,… Au départ, l'appareil de mesure est dans l'état initial
A0 . Ensuite, l'appareil et le système sont mit en interaction afin de mesurer l'état du système. L'appareil peut se
retrouver dans plusieurs états possibles : A1 , A2 ,… Chacun de ces états pouvant être représenté, par exemple
par la position d'une aiguille sur un cadran.

Après l'interaction, l'état de l'appareil est modifié et il reflète l'état du système. Par exemple, on peut concevoir
l'appareil de manière à ce qu'il soit dans l'état A1 si le système est dans l'état S1 , dans l'état A2 si le systèm
est dans l'état S 2 , etc.

Après la mesure, l'état de l'appareil est donc corrélé à l'état du système :


A1  S1
A2  S 2

Ce raisonnement ne s'applique pas seulement à la mesure à l'aide d'un appareil ou à l'acte d'observation par un
observateur humain (dont l'état final est alors donné par l'état mental correspondant à ce qu'il a observé). Il
s'applique à toute interaction entre systèmes. Si un système S2 interagit avec un système S1, par exemple deux
particules qui entrent en collision, l'état de S2 peut être modifié en fonction de l'état de S1. Une corrélation plus
moins importante peut alors s'établir entre l'état de S1 et celui de S2. Plus la corrélation sera importante, plus l'ét
final de S1 reflétera l'état de S2 et plus S1 aura d'information sur S2.

Donc, tout ce dont nous disposons pour comprendre la nature, ce sont des informations obtenues par les
corrélations entre le système disposant de l'information sur un autre système.

Réalisme
Dire que l'on ne dispose que d'informations pour décrire le monde, dire que tout peut se décrire via le concept
d'information ne veut pas dire que tout ce qui existe n'est qu'information. Ce serait d'ailleurs contraire à la
philosophie réaliste que nous avons choisi d'adopter, même si c'est un réalisme pragmatique.

Il ne faut pas confondre l'objet et sa description. Si toute la description d'un objet ne peut se faire qu'en termes
d'informations, cela ne signifie pas que cet objet est de l'information mais au contraire que nous obtenons ainsi d
l'information sur quelque chose de concret : l'objet lui-même.

Ainsi, après avoir effectué une expérience sur un matériau, nous pouvons être amenés à dire que nous avons
obtenu un certain nombre d'informations sur les propriétés de ce matériau. Le résultat : "nous avons déterminé q
le matériau est du fer" est une information sur le matériau "fer" qui est on ne peut plus réel.

Tout peut donc se décrire avec de l'information et rien que de l'information sans pour autant remettre en cause la
philosophie réaliste. En outre, puisque nous ne disposons que d'informations, ces informations nous disent aussi
tout ce qu'il y a à savoir sur cette réalité.

A partir de ces informations, nous pourrons établir une modélisation théorique des systèmes et phénomènes
étudiés. C'est ainsi que l'on créera une représentation abstraite sur bases de variables positions, températures,…
prenant leurs valeurs dans un espace de configuration, ainsi que les lois qui relient ces variables. Cette
représentation pourra, dans le cas qui nous préoccupe, prendre la forme d'un espace de Hilbert et des lois
quantiques.
Le reste, décrire les systèmes sur bases des informations, est de l'ontologie et de l'interprétation. Par exemple
l'interprétation réaliste de la fonction d'onde. Comme nous en avons déjà parlé, puisque la fonction d'onde est la
description abstraite des données (informations) recueillies (des probabilités), cette fonction d'onde peut être
considérée comme une description de la réalité ou comme une définition du concept correspondant à la nature de
cette réalité ou comme l'information exhaustive décrivant cette réalité.

Information
L'information dont nous avons parlé jusqu'ici est une information au sens de la théorie de l'information (celle
créée par Shanon pour étudier les capacités de transmission des signaux par des canaux de transmission).
L'information peut obéir à de nombreuses définitions suivant les disciplines (scientifiques, techniques,…). Il fau
donc bien faire attention au sens que l'on donne ici à ce terme.

L'information est une mesure du nombre d'états dans lequel le système peut se trouver. Elle n'est pas liée à un
observateur humain, ni a un acte volontaire d'obtention de l'information ou à un acte volontaire de prise en comp
de cette information ni même à la nécessité de posséder un canal de transfert de cette information ou d'une
mémoire de stockage. Il s'agit d'une description de l'état physique ou des corrélations sous la forme la plus simpl
qui soit. On la retrouve aussi en physique statistique lorsque l'on relie le concept d'entropie à celui d'information
ou au nombre d'états que peut prendre le système (la probabilité thermodynamique).

Avec les mots de Rovelli : "un stylo sur ma table a de l'information car il pointe dans telle ou telle direction. Nou
n'avons pas besoin d'un être humain, d'un chat ou d'un ordinateur pour utiliser cette notion d'information."

Ainsi, nous ne considérons pas l'information au sens de l'informatique ou de l'information communiquée par un
media avec un support tel qu'un disque dur ou un journal. Il n'y a ici pas de considérations sur le stockage
physique de cette information. Ce stockage est dans l'état du système physique lui-même ou dans les corrélation
entre états physiques. L'information est ici une traduction de ces corrélations ou, via ces corrélations (mesures),
ce que l'on peut savoir sur un état physique.

Voyons cela à l'aide de l'exemple décrit ci-dessus du système S et de l'appareil de mesure A. A n'est pas
nécessairement un appareil de mesure classique mais peut-être tout autre système physique classique ou
quantique, par exemple une particule.
Au départ, A est dans l'état A0 qui ne dépend pas de S. Il ne dispose d'aucune information sur S.

Supposons que S puisse se trouver uniquement dans deux états : S1 ou S 2 . Nous envisageons ici le problème
de manière très générale, valable aussi bien en physique classique que quantique, et nous ne parlons pas encore d
superposition des états.

A effectue une mesure de S. C'est-à-dire qu'il y a une interaction entre A et S qui crée une corrélation entre les
états des deux systèmes.

Par exemple, l'état de A devient A1 . Comme A est corrélé avec S, cela donne une information sur S : il est dan
l'état S1 .

Etant donné qu'il y a deux états possibles, A possède 1 bit d'information sur l'état de S. Nous utilisons pour cela
relation bien connue, tirée de la théorie de l'information mais c'est aussi une formule classique concernant la
représentation en nombres binaires, et qui donne le nombre de bits nécessaires pour coder un nombre. Par
exemple, pour coder un nombre variant entre 0 et 255, il faut utiliser 8 bits. Une correspondance bien connue de
informaticiens.

Ce bit d'information est donc codé dans l'état de A.

Notons que l'information connue dépend de l'observateur, c'est-à-dire de A. L'information ci-dessus est celle
obtenue par A sur le système S.

Interprétation en termes d'information


Nous avons donc un outil extrêmement général, l'information, qui peut nous servir de base pour interpréter la
mécanique quantique. C'est important car ce concept est commun aussi bien à la physique classique qu'à la
mécanique quantique. Il atteint un de nos buts recherchés : ne pas utiliser des concepts purement classiques qui n
seraient pas nécessairement valables en mécanique quantique. Même si, dans la suite, nous effectuons nos
raisonnements à l'aides des états, des superpositions des espaces de Hilbert, etc., c'est toujours cela qu'il faudra
avoir à l'esprit : ce que l'on manipule est une information que possède un système sur un autre système.
Notons, pour être complet, qu'il faut distinguer deux formes d'informations.
 L'information directe, telle que nous l'avons décrit ci-dessus dans l'exemple de la mesure, est une information
obtenue par une interaction qui crée une corrélation entre les états.
 L'information épistémique. C'est une information déduite. C'est-à-dire obtenue à partir d'autres informations
obtenues par la mesure. A partir de ces informations, de l'utilisation du raisonnement (logique formelle) et de
lois physiques. Précisons deux choses.
 Les lois physiques sont elles-mêmes connues par l'observation des systèmes physiques, c'est-à-dire par la
réalisation d'expériences et de mesures puis par une modélisation théorique. C'est donc également un
certain nombre d'informations préalables et des raisonnements qui permettent de construire ces lois.
 Le raisonnement considéré ci-dessus n'implique pas nécessairement un observateur humain. Ces
informations épistémiques sont implicitement contenues dans les informations existantes et obéissent aux
règles de la logique formelle. C'est le type d'information déduite d'un raisonnement bien connu et aux
origines antiques : "Tous les hommes sont mortels, Socrate est un homme, donc Socrate est mortel". La
dernière affirmation est une information déduire des deux affirmations qui précèdent. Ces informations
peuvent avoir une conséquence dans les processus physiques.

Leur mise en évidence par le raisonnement humain ne sera pertinente que pour un physicien qui essaie
d'interpréter ce qui se passe et en particulier pour comprendre les conséquences de ces informations.

Relativité
Nous avons vu que l'information que l'on peut obtenir sur un système S dépend de l'observateur et plus
généralement du système O qui est en interaction avec le système S. Deux systèmes O1 et O2 en interaction ave
S obtiendront des informations différentes en fonction des interactions qu'ils ont avec S.

Nous avons vu aussi que ces informations sont tout ce dont nous disposons pour décrire S. En fait, on peut agir
comme si tout autre chose n'existait pas. Même des interprétations réalistes de l'état de S passeront forcément pa
l'analyse et l'interprétation des informations disponibles sur S. Quelle que soit la description de S, ce sera une
synthèse de ces informations et de rien d'autre. D'ailleurs, si nous savions la moindre chose en plus sur S, ce sera
forcément, par définition, une information. Cette affirmation que ces informations forment la totalité de la
connaissance de S est donc une évidence et même une tautologie.
Nous faisons donc l'hypothèse logique suivante :
Tout est relatif.

Par "tout", nous voulons bien sûr dire tout ce qui concerne S. C'est-à-dire les informations qui peuvent être
obtenues sur S et tout ce que l'on pourrait en déduire pour le décrire : ses propriétés, son état, sa nature,…

Cette hypothèse à laquelle nous sommes naturellement conduit est donc que tout est relatif et pas seulement,
comme en relativité restreinte, la vitesse, le temps, etc.

En fait, cette relativité "universelle" est bien ce que nous enseigne la relativité restreinte. Celle-ci concerne la
cinématique (le mouvement) et tout ce qui est pertinent pour décrire la cinématique (la position, le temps, la
vitesse) est relatif. Et cela se reflète aussi automatiquement sur tout ce qui se bâtit sur cette cinématique, ainsi en
dynamique, l'énergie, l'impulsion,… sont relatifs.

Toutefois, même en relativité restreinte, certaines choses restent invariantes. Citons, par exemple, la masse prop
d'un corps ou la vitesse de la lumière dans le vide. Il existe donc des propriétés qui peuvent être qualifiées
d'intrinsèques. C'est même l'objet de toute théorie : la recherche des invariants !

Ici, puisque tout ce dont nous pouvons disposer est relatif, nous poussons l'hypothèse plus loin en disant
qu'absolument tout est relatif. Il n'y a pas, a priori, de propriété absolue intrinsèque à un système.

Validité
L'hypothèse de relativité totale n'est pas contraignante. Elle n'oblige pas une information donnée d'être différente
pour tous les observateurs. Après analyse, elle pourrait s'avérer être invariante (avec le changement d'observateu
et donc être considérée comme une propriété intrinsèque du système. Par exemple, pourquoi pas, la masse propr
ou la vitesse de la lumière. Simplement, nous refusons d'imposer cette invariance par défaut à quelque propriété
que ce soit. C'est l'étude de la mécanique quantique qui doit, éventuellement, le montrer.

Les physiciens qui sont partisans de l'interprétation instrumentale rejettent en général les autres interprétations
pour une raison principale fort proche de la philosophie positiviste. Puisque tout ce dont nous disposons, nous,
physiciens, ce sont les résultats de nos mesures expérimentales et puisque le formalisme quantique et son
interprétation instrumentale rassemblent tout ce qui est nécessaire, ni plus, ni moins, pour analyser ces
expériences, alors toute interprétation supplémentaire du contenu physique du formalisme quantique fait partie d
champ de la philosophie et aucune donnée expérimentale ne permettrait de départager les différentes
interprétations. Elles seraient donc totalement sans intérêt.

C'est vrai mais c'est aussi faire fi de la théorie. La science ne se résumant pas seulement à des expériences mais
aussi à la formulation de théories utilisant ces expériences. Nous avons déjà vu que l'interprétation instrumentale
et son alter ego positiviste, l'interprétation de Copenhague, n'étaient pas appropriées dans le cadre théorique des
cosmologies quantiques où l'observateur extérieur effectuant les mesures n'existe tout simplement pas. Et nous
commençons cruellement à avoir besoin de développer ces théories qui restent, actuellement, très difficiles à
interpréter.

Il y a aussi une autre raison théorique. Nous savons que la physique obéit à la relativité restreinte (si l'on n'abord
pas la gravitation, décrite par la relativité générale). L'équation de Schrödinger, d'autre part, est non relativiste.
Parmi les nombreux efforts effectués par les physiciens au cours du vingtième siècle, celui consistant à marier ce
deux théories fut un des plus important et des plus difficile. La recherche d'une formulation relativiste de la
mécanique quantique, c'est-à-dire d'une formulation invariante sous les transformations de Lorentz, a aboutit à la
théorie quantique relativiste des champs, extrêmement puissante et féconde.

La théorie des champs permet, notamment, une description quantique totalement relativiste de l'électron et du
champ électromagnétique. Une théorie appelée électrodynamique quantique relativiste. Celle-ci, comme
l'électromagnétisme classique, admet une invariance de jauge qu'il faut fixer par une règle supplémentaire.
Plusieurs possibilités existent, tout comme en électromagnétisme classique. On peut par exemple choisir la jauge
de Coulomb ou la jauge de Lorentz.

La jauge de Coulomb est fort pratique pour effectuer certains calculs, notamment dans le régime des énergies
faibles. Par contre, elle brise explicitement l'invariance de Lorentz. La jauge de Lorentz, a contrario, bien que
donnant des calculs souvent plus difficiles, préserve cette invariance. Pour aller plus loin dans la théorie (par
exemple dans le domaine des théories de jauges et des théories unifiées), la jauge de Lorentz s'avère pratiquemen
incontournable et ce malgré la totale équivalence des deux formulations. Dans la mesure où la théorie est
naturellement invariante de Lorentz, il est plus facile de développer cette théorie en respectant cette invariance.
C'est assez logique. Rappelons-nous aussi du choix d'obéir au principe de relativité (qui conduit à la relativité) a
d'éviter d'introduire des artefacts mathématiques que l'on attribuerait à tort à des effets physiques.
Ici, nous affirmons que tout est relatif. Il est donc normal aussi de rechercher une interprétation qui respecte
totalement cet aspect de la nature. Cela peut faciliter, espérons-le, la formulation de la théorie et son utilisation
dans des domaines plus ardus et plus poussés tel que la gravitation quantique et la cosmologie quantique.

Il reste un dernier problème. Cette formulation "totalement relativiste" où plus aucune propriété absolue ne peut
exister n'est-elle pas contraire à la philosophie réaliste ? Non et cela sans même parler des éventuelles propriétés
qui pourraient s'avérer invariantes comme signalé plus haut.

En effet, comme nous l'avons dit, l'information obtenue par les observateurs sur un système est une information
sur "quelque chose". En l'absence totale de toute réalité du système considéré, en l'absence de tout, comment cet
information pourrait-elle avoir un sens, être structurée,… ? Sans réalité, même la relativité des propriétés ne peu
exister !

La seule chose que nous pouvons dire est que cette réalité du système a une manifestation multiforme. Chaque
observateur en observant une facette car toute information est relationnelle. C'est-à-dire que l'information obtenu
dépend du système S mais aussi de l'observateur O. La description la plus complète est donnée par l'ensemble de
informations que peuvent obtenir tous les observateurs. Toutefois :
 Il est évident qu'aucun observateur ne peut disposer de toutes ces informations. Nous verrons cela en décriva
l'interprétation relationnelle. Un observateur supplémentaire qui collecterait les informations de tous les autr
observateurs serait confronté à un problème ennuyant : l'information obtenue dépend de ces observateurs (ce
qu'il recherche) mais aussi de lui (aspect relationnel) ! Nous verrons bientôt cela de plus près.
 On se rend bien compte que l'écheveau des informations peut s'avérer très difficile à démêler et avoir une vu
la plus proche possible de la réalité du système pourrait être un problème insurmontable. Nous y reviendrons
aussi.

Théorèmes sur les variables cachées


Nous avons déjà parlé de l'existence de théorèmes d'impossibilité concernant les variables cachées. Ce sont
notamment les théorèmes de Kochen et Specker et de Bell. Revenons sur les raisonnements auxquels ils nous on
conduit afin de conforter les hypothèses précédentes.
Le principe des variables cachées consiste à dire ceci : l'état d'un système quantique S est décrit par un vecteur
d'état ψ d'un certain espace de Hilbert mais également par un certain nombre de variables inconnues
représentées collectivement par λ . Lorsque l'on mesure un certain observable O sur un système S décrit par ψ
on peut obtenir un certain nombre de résultats différents selon les coefficients de la décomposition de ψ sur le
valeurs propres de l'observable et ces résultats sont obtenus de manière probabiliste selon la règle de Born. L'idé
des variables cachées est de dire que le résultat est parfaitement défini mais dépend des variables cachées λ . Le
caractère probabiliste est alors le reflet de la distribution statistique des variables cachées sur un grand nombre d
systèmes préparés dans le même état ψ .

On postule donc l'existence d'une fonction, dépendant de l'observable, O( ψ , λ ) qui donne la valeur précise,
définie, qui sera mesurée en fonction de l'état et de la valeur des variables cachées.

Les théorèmes d'impossibilité de Kochen et Specker et de Bell montrent que sous des conditions très générales
une telle attribution de valeurs définies est impossible. C'est-à-dire que les prédictions d'une telle théorie à
variables cachées doivent être en conflit avec l'expérience (si la mécanique quantique est correcte). Ce qui a été
vérifié expérimentalement.

Toutefois ces théorèmes dépendent de certaines conditions qui pourraient de pas s'avérer être respectées.

La première condition est la non contextualité. La fonction ci-dessus suppose que le résultat de la mesure dépend
de l'état, des variables cachées et de l'observable mesuré mais pas du contexte. C'est-à-dire du contexte
expérimental ou encore de la procédure expérimentale utilisée pour mesurer l'observable. Or, en mécanique
quantique, ce genre d'hypothèse est assez douteuse. Il est généralement possible de trouver des observables O1 ,
O2 et O3 respectant les conditions suivantes :
- O1 , O2 ne commutent pas. Il est donc impossible d'avoir une procédure de mesure qui permet de mesurer
simultanément avec une précision arbitraire O1 et O2 .
- O1 et O3 commutent. On peut trouver une procédure expérimentale P(O1 , O3 ) permettant de mesurer
simultanément (avec une précision arbitraire) ces deux observables.
- O2 et O3 commutent. On peut trouver une procédure expérimentale P(O2 , O3 ) permettant de mesurer
simultanément (avec une précision arbitraire) ces deux observables.

Un exemple élémentaire d'un tel triplet est la position, l'impulsion et la charge électrique.

Les deux procédures P(O1 , O3 ) et P(O2 , O3 ) sont manifestement incompatibles car l'une permet la mesure de O
et l'autre la mesure de O2 . L'utilisation d'une procédure affectera le résultat de l'autre procédure (par exemple, la
mesure de la position d'une particule avec une très grande précision va considérablement perturber la particule e
rendre son impulsion incertaine même si on l'avait déjà mesuré au préalable). Par contre, ces deux procédures
permettent toutes les deux la mesure de O3 . Par conséquent, il existe des procédures incompatibles pour mesurer
le même observable. Il est assez difficile d'imaginer, si l'hypothèse des variables cachées était vraie, que la
fonction O( ψ , λ ) donne la même valeur dans les deux cas. Le seul choix de l'observable O3 (et donc d'une
fonction O3 ( ψ , λ ) ) peut s'avérer insuffisant.

En fait, si l'on admet que les variables cachées sont contextuelles, c'est-à-dire que les valeurs définies des mesure
dépendent non seulement de l'état, des variables cachées et de l'observable mais aussi de la procédure de mesure
(ou des classes de procédures compatibles, dans le sens que nous venons de voir) plusieurs de ces théorèmes
d'impossibilité sont invalidés.

Une telle contextualité va dans le sens de l'absence de propriétés absolues car dans ce cas, l'obtention
d'information sur le système dépend des interactions entre l'observateur et le système et donc de l'observateur.

C'est un argument très fort qui nous pousse à rejeter le caractère absolu (indépendant de l'observateur et de tout
contexte) des propriétés d'un système physique.

Mais il existe aussi une autre condition indispensable pour les variables cachées. Il faut que celle-ci soit non
locale. C'est ce que montre indubitablement le théorème de Bell. Toute théorie à variables cachées locales, mêm
non contextuelles, est en conflit avec la mécanique quantique et cela a été vérifié par l'expérience (expérience EP
d'Aspect).
La non-localité signifie que la valeur des variables cachées peut être affectée instantanément par un phénomène
produisant à distance.

On sait que le rejet de la localité est problématique en relativité restreinte. Il n'est en général pas très difficile d'e
tirer des situations paradoxales conduisant à des inconsistances. Cela est dû à la violation de la causalité
relativiste. L'ordre dans lequel les événements se produisent dépend, lorsqu'ils sont séparés par un intervalle de
type spatial, de l'observateur. Par conséquent, il est assez facile de trouver un enchaînement de signaux qui
conduisent à ce qu'un événement empêche, par exemple, sa propre réalisation en agissant "dans le passé" (ceci e
analogue aux paradoxes rencontrés dans les voyages dans le temps où le voyageur tue som père avant qu'il ait pu
avoir des enfants).

On peut objecter qu'il n'y a pas de tels signaux dans la théorie à variables cachées considérées, mais c'est faux
puisqu'une variable cachée peut être influencée par un phénomène distant. La variation de cette variable constitu
en soit un signal. On peut aussi objecter que ce signal n'est pas exploitable par un observateur (par exemple un
expérimentateur). Mais cela n'empêche pas d'imaginer une séquence paradoxale conduisant à une variable ayant
simultanément deux valeurs différentes, par exemple. C'est assez gênant !

De plus, la non-localité donne un sens absolu à la simultanéité ce qui est contraire à la relativité et va totalement
l'encontre de ce que nous avons dit : la nécessité de développer une théorie et une interprétation totalement
relativiste.

Enfin, la simultanéité absolue entraîne un temps et un espace absolu. Ce qui est contraire à tout ce que nous
savons de la physique.

On peut encore affirmer que les signaux instantanés sont inobservables pour un observateur extérieur (classique)
L'impossibilité d'utiliser, par exemple, l'intrication quantique à distance pour transmettre de tels signaux a
d'ailleurs été démontré en mécanique quantique. On peut même affirmer que les inconsistances, si elles existent
(par exemple les variables pouvant avoir deux valeurs en même temps), sont également inobservables. C'est-à-di
sans conséquence physique.
Mais dans ce cas on peut se demander si cette non-localité à un sens ! Quelle réalité attribuer à de tels effets
totalement inobservables même indirectement ? On peut les considérer à tous le moins comme un artefact
mathématique (plus précisément ici un artefact de la modélisation non relativiste utilisée par l'interprétation).

L'autre possibilité est de refuser l'existence de la non-localité et d'accepter, par conséquent, ce que disent ces
théorèmes : il n'y a pas de variables cachées. C'est-à-dire aucune propriété absolue, intrinsèque au système, qui
serait encodée dans ces variables.

Ceci nous ramène à notre hypothèse initiale : les seules choses ayant une réalité sont relationnelles, entre deux
systèmes. Elles sont décrites par les informations que l'on peut obtenir sur un système via les interactions de
mesure et elles dépendent entièrement de l'observateur.

Relationnel
Nous en arrivons donc aux résultats suivant :
 Tout doit être décrit dans le cadre du formalisme quantique, sans faire intervenir initialement des systèmes
classiques, des concepts classiques ou les lois de la physique classique. Ces dernières devront être dérivées d
la mécanique quantique et de son interprétation.
 Tout ce que nous pouvons avoir pour décrire les systèmes peut se traduire par des informations obtenues à
travers des interactions de type mesure (corrélations) entre deux systèmes. Même l'information épistémique
nécessite à la base de sa déduction un certain nombre d'informations obtenues par l'intermédiaire de telles
interactions.
 Toute description d'un système ne peut se faire que par comparaison avec un autre système obtenant ces
informations.
 Tout est donc relationnel et, en l'absence de propriétés absolues, il n'existe rien d'autre que ces informations
relationnelles.

En fait, il serait plus logique de parler d'interprétation relativiste de la mécanique quantique mais il y aurait bien
évidemment confusion avec la mécanique quantique relativiste qui est tout autre chose. La première concerne
l'interprétation la deuxième le formalisme. Même s'il est évident (d'où la confusion d'ailleurs) que les trois
appellations " mécanique quantique relativiste", "états relatifs", " mécanique quantique relationnelle" sont
intimement reliées dans leur principe. Dans les états relatifs, la valeur définie d'une propriété d'un système ne pe
être considérée que relativement à l'état d'un observateur qui est corrélé avec ce système. Un raisonnement
typiquement relationnel.

Notons que parler de valeurs définies obtenues par la mesure ou d'informations obtenues par l'interaction peut
sembler contradictoire avec l'affirmation de l'absence totale de propriétés absolues qui pourraient rendre ces
valeurs à travers la mesure. On pourrait présenter cette philosophie relationnelle avec les mots de Laudisa :
En particulier, le point central de la mécanique quantique relationnelle est qu'il n'y a aucun sens à dire qu'un
certain événement quantique s'est produit ou qu'une variable du système S a pris la valeur q : plutôt il y a du
sens à dire que l'événement q s'est produit ou que la variable a pris la valeur q pour O ou par rapport
à O. La contradiction apparente entre les deux affirmations qu'une variable a ou n'a pas de valeur est résolue en
indiçant les affirmations avec les différents systèmes avec lesquels le système en question interagit. Si j'observe
électron à une certaine position, je ne peux pas en conclure que l'électron est là : je peux seulement en conclure
que l'électron tel que vu par moi est là. Les événements quantiques se produisent seulement en interaction entre
systèmes et le fait qu'un événement quantique s'est produit est seulement vrai par rapport aux systèmes impliqué
dans l'interaction.

Ou avec les mots plus radicaux de Rovelli :


Je propose l'idée que la mécanique quantique indique que la notion de description universelle de l'état du mond
partagée par tous les observateurs, est un concept qui est physiquement intenable, sur des bases expérimentales

Au vu de ce que nous savons de la physique (mécanique quantique, relativité restreinte), des théorèmes
d'impossibilité et des données expérimentales (comme celles concernant ces théorèmes), les propos de Rovelli
semblent tout à fait pertinents.

Comme Laudisa le dit encore :


Le monde physique est donc vu comme un réseau de composants en interaction où il n'y a pas de signification à
l'état d'un système isolé. Un système physique (ou, plus précisément, son état contingent) est réduit au réseau de
relations qu'il entretient avec les systèmes environnants et la structure physique du monde est identifiée comme
réseau de relations.
Relations entre les descriptions
En utilisant les lois de la mécanique quantique, nous pouvons assez facilement en déduire ce qui se passe lors de
interactions entre deux systèmes. Même si cela reste encore à interpréter en détail.

Dire que chaque observateur a sa propre description d'un système donné S est très bien, mais encore faut-il relier
ces différentes descriptions entre elles. Est-ce que ces descriptions sont indépendantes ? Non, certainement pas
sinon on pourrait scinder l'univers en autant de mondes différents et indépendants qu'il y a d'observateurs. Cela n
correspondrait certainement pas à ce que nous pouvons constater expérimentalement. De plus, une telle
philosophie disant que le monde est centré autour de l'observateur et que tous les autres mondes ne sont pour lui
que des abstractions sans interactions causales ou, pire, sans signification physique a un petit parfum anthropiqu
assez désagréable.

De plus, il est certain que, puisque nous pouvons déduire de la mécanique quantique ce qui se passe entre deux
systèmes, nous pourrons en déduire les relations entre les différents points de vue.

Une telle relation entre les différentes descriptions est l'équivalent, en relativité restreinte, des transformations de
Lorentz.

Interpréter ce qui se passe entre deux systèmes et décrire le réseau de relations est le but de l'interprétation
relationnelle que nous allons maintenant aborder.

Mécanique quantique relationnelle


Rappelons ce que nous avons jusqu'ici.
 Tous les systèmes doivent être décrit par la mécanique quantique ainsi que tous les phénomènes physiques,
toutes les interactions physiques entre systèmes. Nous ne voulons pas donner un statut spécial à tel ou tel
système physique.
 En particulier, il ne doit pas y avoir de distinction entre des systèmes quantiques et des systèmes classiques.
Tous les systèmes sont quantiques. De même il ne doit pas y avoir de systèmes ayant un statut spécial
d'observateur. Tous les systèmes peuvent être considérés comme des observateurs. Un électron, un appareil d
mesure, un être humain sont tous des observateurs d'un système physique S s'ils interagissent avec celui ci et
voient leur état modifié en conséquence. Un observateur peut donc lui-même être un système observé par un
autre observateur.
Plus loin, nous utiliserons de manière interchangeable les termes de systèmes et observateurs pour un même
système physique selon le point de vue sous lequel on les considère.
 La mesure est une interaction entre deux systèmes mettant l'état de ces deux systèmes en corrélation. Un
observateur effectuant une mesure obtient de l'information sur un système à travers la modification de son ét
qui est maintenant corrélé à celui du système.

Nous ne ferons pas de distinction entre observation, mesure, interaction ou obtention d'information. Il est
toutefois bien entendu qu'une interaction qui n'aboutirait pas à une corrélation parfaite ne donnera pas toute
l'information attendue. On peut ainsi parler de "mesure imparfaite", par exemple. Mais la description exacte
l'interaction suffit pour savoir quelle est la situation.
 Il n'existe pas de propriété absolue pour un système. Toute propriété est relative à un observateur donné. De
plus cette propriété ne peut être connue de cet observateur qu'à travers une mesure. Enfin, les propriétés sont
décrites mathématiquement par l'état du système (la fonction d'onde). L'état d'un système est donc relationne
il résulte d'une relation, via des interactions, entre le système et un observateur. Chaque observateur ayant de
ce système une description (un état) différente.

Cette description par un observateur est tout ce qui existe pour lui. Le système n'ayant pas de propriétés
absolues, il n'y a rien d'autre. L'ensemble de ces descriptions de l'ensemble des systèmes par l'ensemble des
observateurs constitue toute la réalité du monde ou tout au moins tout ce qu'il nous est possible d'en savoir.
 La mécanique quantique est considérée correcte et complète. Toutes les données expérimentales connues son
en accord avec la mécanique quantique et jusqu'à preuve du contraire, si nous pouvons l'éviter, nous ne devo
pas modifier la mécanique quantique. Cela veut dire que si l'état d'un système S est ψ (relativement à un
observateur O donné), alors la totalité de ce qu'il y a à savoir sur S est donné par ψ .

Rovelli le dit de manière assez jolie :


La mécanique quantique fournit un schéma complet et consistant de la description du monde physique,
appropriée à notre niveau de l'observation expérimentale.
 On doit interpréter la fonction d'onde pour ce qu'elle est, comme une définition mathématique du concept
physique approprié pour décrire la réalité du système (pour l'observateur concerné).
 Nous n'acceptons que le formalisme de base de la mécanique quantique et nous ne souhaitons donc pas
introduire de mécanisme de réduction arbitraire. L'interprétation des états relatifs n'ajoutant rien de plus à ce
formalisme peut éventuellement être utilisée.

Toutefois, l'expérience de tous les jours montre que les mesures conduisent à des résultats définis avec
certaines probabilités.

L'existence de ces états définis devra être expliquée par l'interprétation.


 On devra expliquer ensuite la classicalité et l'existence de bases privilégiées. Mais nous verrons cela plus tar
car cela nécessite la description de systèmes complexes (macroscopiques). Nous avons vu qu'il n'y a aucune
raison de supposer l'existence intrinsèque de bases privilégiées car les espaces de Hilbert n'en contiennent pa
et nous considérons la mécanique quantique comme correcte. L'interprétation ne doit donc pas, initialement,
faire intervenir de bases privilégiées.

Considérons trois systèmes S, O et O'.

L'ensemble des systèmes S et O peut lui-même être considéré comme un système que l'on nomme S-O.

O effectue une mesure sur S tandis que O' effectue des mesures sur S-O.

Pour fixer les idées, supposons que S est un électron dont on désire mesurer la position. L'état initial est connu,
par des mesures préliminaires, par O et O'. Au départ, l'électron est dans un état de position indéfinie (on
supposera que seulement deux positions sont possibles comme nombre de nos exemples). Par exemple, si l'on
choisit la base position x1 x1 et position x 2 x 2 , alors l'état de S peut être représenté comme une superpositio
des deux états de base S = x1 + x 2 . Cet état appartient à un espace de Hilbert que l'on notera H S de
dimension deux (deux états de base).

O effectue ensuite une mesure de la position de S pour connaître l'état de S. C'est-à-dire qu'il effectue une mesur
pour savoir si la position est x1 ou x 2 .
O peut, par exemple, être une diode luminescente qui s'allume ou pas selon le résultat de la mesure ou O peut
même être un autre électron dont l'état (par exemple sa propre position ou son état de polarisation) indiquerait la
position de S après interaction. L'important est que la mesure consiste en une interaction mettant S et O en
corrélation de telle manière que l'état de O est modifié et reflète l'état de S. C'est-à-dire que O contient une
information sur l'état de S.

Lorsque O va mesurer l'état de S, il va trouver comme résultat soit x1 , soit x 2 , les vecteurs propres de
l'opérateur hermitique correspondant à la mesure (ici les positions de l'électron). Les probabilités d'observer tel o
tel résultat sont données par la décomposition de l'état sur cette base de vecteurs propres, soit ici 1/2, une chance
sur deux pour chaque résultat.

Disons, pour l'exemple, que O a mesuré l'état x1 .

Voyons maintenant le point de vue de O'.

O' peut mesurer l'état de O, de S ou des deux. O' peut être, par exemple, une diode luminescente, un appareil de
mesure sophistiqué ou un expérimentateur.

Avant d'effectuer une mesure, O' connaît la situation. Il connaît l'état initial de S et de O et sait (par des mesures
préliminaires ou en préparant l'expérience) que O effectue une mesure de S.

Nous parlons de "connaissance" de O' de la situation mais rappelons que nous entendons par là que O' a
simplement de l'information sur S-O. De l'information au sens de la théorie de l'information, qui ne nécessite pas
nécessairement un être conscient mais simplement que l'information soit encodée dans l'état de O'. Et cette
information sur S-O nous pouvons la décrire à l'aide de la mécanique quantique.

Pour O', l'espace de Hilbert de S-O est simplement le produit direct des espaces de Hilbert de S et O : H S ⊗ H 0

Ce qui nous intéresse, après la mesure effectuée par O, est le fait qu'il ait mesuré la position x1 ou x 2 . Le systèm
O peut être décrit par un espace de Hilbert extrêmement complexe mais nous ne considérons ici que le sous-
espace à deux dimensions avec, par exemple, la base allumé et éteint correspondant aux états allumé et étein
de la diode après la mesure, respectivement, des positions x1 ou x 2 de S.

Après l'interaction (la mesure) entre O et S, pour O', le système S-O se retrouve (comme nous l'avons vu avec le
schéma de von Neumann) dans un état où les états des sous-systèmes O et S sont corrélés. C'est-à-dire que lorsq
S est dans l'état de position x1 , O est dans l'état "allumé" et lorsque S est dans l'état de position x 2 , O est dans
l'état "éteint". L'état de S-O appartient donc à un sous-espace de H S ⊗ H 0 avec, par exemple, la base :
x1 allumé et x 2 éteint . Etant donné l'état initial superposé de S et l'évolution linéaire donnée par la
mécanique quantique, l'état final de S-O est S − O = x1 allumé + x 2 éteint , après interaction.

Nous avons donc deux situations différentes pour O et O'. Ce qui est, pour O, une mesure de l'état de S donnant
résultat défini est pour O' une mise en corrélation entre O et S qui se retrouvent dans un état de superposition
quantique.

Ces deux descriptions différentes ne sont pas surprenantes puisque nous avons affaire à deux observateurs
différents n'obtenant pas la même information et, ne l'oublions pas, seule cette information a un sens physique.
Pour O il y a un événement quantique qui se produit (son interaction avec S) lui fournissant une information,
tandis que pour O', tout ce qu'il peut savoir c'est qu'il existe une corrélation entre S et O. O' n'a pas encore effectu
de mesure sur S et O et ce qu'il sait est de nature épistémique, basé sur sa connaissance a priori de la situation (sa
connaissance de l'état initial de S et O et donc la possibilité d'en déduire son évolution).

Ensuite, O' va effectuer une mesure de S et O. Il existe une condition de consistance puisque nous savons (O le
sait) que la valeur mesurée par O est x1 . Dans ce cas, O' va mesurer x1 allumé pour l'état de S-O. Ceci est,
bien entendu, consistant avec le fait que S et O étaient dans des états corrélés. O' obtient de plus cette valeur ave
une probabilité 1/2, ce qui est également consistant avec le fait que O a obtenu son résultat avec une probabilité
1/2. Le fait que le résultat était prédéterminé pour O n'a pas d'influence sur O' qui n'avait à sa disposition que l'ét
superposé et aucune autre information. Et n'oublions pas, une fois de plus, que cette information est la seule cho
existant physiquement pour O'. Si O et O' effectuent la même expérience un grand nombre de fois, les statistique
effectuées par O et O' seront parfaitement en accord car ils disposeront de la même information.
Les deux séquences d'événements sont décrites différemment par O et O' mais elles sont toutes les deux correcte
car l'état du système S dépend de l'observateur. Seule la relation S-O ou S-O' ou (S-O)-O' a un sens physique.
Chacun a "sa réalité".

Puisque O et O' décrivent différemment le système S, on pourrait se demander quel est l'état réel de S. En fait,
cette question n'a pas réellement de sens. Nous savons que tout est relatif. Toute description du système ne peut
faire qu'en relation avec un observateur obtenant des informations sur le système. Et il n'y a aucune raison de
privilégier tel ou tel observateur. Bien entendu, O obtient des informations supplémentaires sur S avant O', mais
cela ne signifie pas que la description donnée par O a plus de "réalité" que celle de O'. La description de S par O
n'a de sens, de réalité, que pour O et la description donnée par O' n'a pas moins de réalité du fait que O a sa prop
description. Il y a deux raisons à cela. D'une part O' n'a d'information sur S et O qu'à travers ses propres mesures
La "réalité" de S-O pour O' n'existe qu'à travers les informations qu'il obtient. D'autre part, nous ne pouvons pas
comparer les situations et les descriptions de O et O' dans l'absolu. A nouveau, une telle comparaison n'a de sens
qu'à travers, par exemple, un troisième observateur O'' qui obtiendrait des informations sur O et O' à travers des
mesures. Et les réalités décrites par O et O' n'ont pas plus ou moins d'importance du fait qu'elles sont mesurées p
un troisième observateur. Tous ces observateurs doivent être considérés sur un pied d'égalité.

Cette remarque sur la comparaison de O et O' nous amène à une question importante. On peut se demander
comment la description de O' se déduit de celle de O. Nous en reparlerons un peu plus dans la section suivante,
mais l'important est que même cette question doit être envisagée d'un point de vue relationnel. En effet, pour
comparer deux points de vues, il faudra forcément un observateur interagissant physiquement avec les systèmes
qu'il souhaite comparer. On ne peut considérer la relation entre les vues de O et O' que du point de vue de O, du
point de vue de O' ou d'un troisième observateur O". Chacun peut décrire cette relation différemment. Tout
comme O et O' décrivent la relation S-O différemment.

Le caractère relationnel de la comparaison des points de vues est une conséquence du fait que la comparaison es
elle-même un processus physique puisque celui qui compare doit bien obtenir les informations (à comparer) d'un
manière ou d'une autre. C'est important. Comme le dit Rovelli :
[…] il est possible de comparer différentes vues mais le processus de comparaison est toujours une interaction
physique et toutes les interactions physiques sont quantiques dans la nature. Je pense que ce simple fait est oubl
dans la plus part des discussions sur la mécanique quantique, conduisant à de sérieuses erreurs conceptuelles.
C'est aussi ce que nous avons parfois constaté.
Par exemple, ci-dessus, O' a deux informations différentes dans la séquence d'événements : avant la mesure de S
O il sait que "O connaît la valeur de S" et après la mesure il sait "quelle valeur de S est connue par O". Ce sont
deux informations très différentes. La première résulte d'une interaction initiale (non décrite) lui permettant de
connaître l'état initial et le processus de mesure de O. C'est une information épistémique déduite de ce qu'il sait.
La deuxième est une mesure de l'état de S. La comparaison du résultat de O et O' n'a de sens qu'après la mesure
S, c'est-à-dire après une interaction physique avec le système.

Une question qui ne remet pas en cause l'analyse précédente est de savoir si O' est effectivement en mesure de
déterminer que O et S sont corrélés, c'est-à-dire de savoir que O a fait une mesure de S, sans que O' effectue lui
aussi cette mesure. Quelle que soit la manière dont O' obtient cette information. Nous avons parlé ci-dessus
d'interactions initiales non décrites permettant de connaître l'état initial et la situation, le fait qu'un processus de
mesure a lieu entre O et S, sans nous préoccuper de savoir si c'était effectivement possible.

Il n'est pas difficile de montrer que l'information initiale O' sait que "O connaît la valeur de S" est effectivement
possible à obtenir. C'est-à-dire "l'état de O est corrélé à celui de S". En effet il existe un observable correspondan
à cette mesure, c'est-à-dire à l'obtention de l'information requise. Appelons C cet observable. Il est simplement
défini par :
C ( x1 allumé ) = x1 allumé
C ( x1 éte int ) = 0
C ( x 2 allumé ) = 0
C ( x 2 éte int ) = x 2 éte int
Lorsque cet observable rend la valeur 0, cela signifie "O n'est pas dans l'état correspondant à celui de S" et
lorsqu'il vaut 1, cela signifie "O est dans l'état correspondant à celui de S", c'est-à-dire qu'il est corrélé.

Appliqué à l'état S-O il laisse celui-ci non perturbé et rend la valeur 1 avec certitude. Ce qui garantit que O' peut
effectivement obtenir l'information sans remettre en cause la séquence des événements étudiés plus haut.

Une mesure d'interférence avec des particules intriquées est une mesure de ce type : on peut constater l'intricatio
sans devoir mesurer l'état exact de chaque particule.
Problèmes
L'analyse qui précède, à condition d'accepter le fait qu'il n'existe aucune propriété absolue, semble parfaite et
complète. Mais à y regarder de plus près, en l'examinant attentivement à la lumière des problèmes que nous avon
soulevés dans les sections précédentes, on constate qu'il reste un peu de flou dans cette interprétation.
 La première qui vient à l'esprit est le caractère probabiliste qui ne trouve pas d'explication. Dans la
présentation ci-dessus, pourquoi O mesure-t-il, par exemple, la valeur x1 pour le système S ? Rien dans l'état
de S ne justifie un tel résultat. Nous savons, en outre, grâce aux théorèmes d'impossibilités que cette valeur n
peut être prédéterminée. Qu'est-ce qui, dans le processus de mesure, justifie la valeur totalement arbitraire qu
est obtenue ? Rien, et il faut bien avouer que c'est ennuyant. Il ne s'agit pas seulement ici d'un problème de
causalité (qu'est-ce qui cause le résultat obtenu) mais également une justification d'une valeur arbitraire parm
d'autre, toutes équivalentes. Ce caractère probabiliste peut être admis comme postulat supplémentaire au
formalisme de base de la mécanique quantique, ce que nous avons fait sans vergogne dans l'analyse qui
précède mais également dans l'interprétation instrumentale, c'est la règle de Born, mais si on peut l'éviter c'es
d'autant mieux.
 Dans l'analyse qui précède, nous avons supposé une base privilégiée. Nous avons supposé que l'état de S étai
représenté par la base ( x1 , x 2 ) . Mais il existe une infinité d'autres bases comme par exemple ( p1 , p 2 )
(pour être exact, donner seulement deux positions possibles entraîne, via le principe d'incertitude, un grand
nombre d'impulsions possibles, mais nous simplifions en n'en gardant que deux sans remettre en cause la
généralité du raisonnement). Dans ce cas, la décomposition de l'état initial peut se faire d'une infinité de
manières possibles : S = x1 + x 2 = p1 + p 2 , etc.

C'est particulièrement ennuyant dans les cas les plus simples, comme celui où O est un électron qui prend le
même état que S lors de l'interaction. Un tel processus n'a pas de valeur propre particulière : l'état final est
également une superposition possible parmi une infinité où aucun état n'est privilégié : position précise,
impulsion précise,…

Dans ces circonstances, dire que O mesure x1 ou x 2 plutôt que p1 ou p 2 , n'a guère de sens ! Nous avions dé
relevé cela au début de l'étude de la décohérence : sans réduction sans une base privilégiée, un appareil de
mesure put mesurer n'importe quoi ! Il ne remplit pas la fonction pour laquelle il a été créé.

En fait, l'absence de base privilégiée, au moins au niveau microscopique, interdit de facto la possibilité que O
mesure une valeur définie. Dire que O mesure x1 n'est pas seulement affirmer qu'il avait une probabilité 1/2
le faire, c'est aussi choisir une base privilégiée arbitrairement. Ce que nous avons exclu. D'ailleurs, aucune
règle (par exemple probabiliste de Born) ne nous guide pour ce résultat.

Ce problème est beaucoup plus sérieux que le caractère probabiliste soulevé ci-dessus. Le caractère
probabiliste peut être rejeté par le relationnaliste pur et dur qui affirme que la seule chose qui existe est la
valeur mesurée et qu'il n'y a donc pas réellement de sens à parler de "valeur obtenue à partir de l'état avec un
certaine probabilité". Ici, si l'interaction est un simple mise en corrélation (intrication) des états sans faire
appel à un observable ou une base privilégiée particulière, c'est la valeur mesurée elle-même qui perd tout
sens.
 Enfin, il existe un autre problème lié au premier. Supposons que O mesure x1 . Pour O', la situation entre O e
S est juste une corrélation. Lorsque O' mesure ensuite l'état de S, nous avons dit qu'il y avait une contrainte d
consistance : il doit lui aussi mesurer x1 , sinon en comparant son résultat avec celui de O il y aurait un
problème. Rovelli fait appel à un critère de consistance. Il est bien entendu que le respect de la mécanique
quantique l'oblige et c'est même un simple critère logique, mais ce critère entre de manière très artificielle da
l'interprétation, sans explication autre "qu'il doit en être ainsi". On aimerait comprendre ce qui, dans
l'interprétation, nous y conduit, indépendamment du fait que c'est la mécanique quantique que l'on désire
interpréter. Il y a trois manières de répondre à ce problème, toutes insatisfaisantes :
 O' mesure aussi x1 car c'est ce qu'a mesuré O, c'est la réalité, l'information était en possession de O mais pas
encore en possession de O'. Mais cela est totalement contraire à ce que nous avons affirmé plus haut ! La
réalité de O' n'est pas celle de O. Admettre cela c'est redonner un caractère absolu à certaines propriétés
mesurées par un observateur donné (ici O). Même si la valeur est inconnue de O', dire qu'il mesurera celle là
car c'est celle mesurée par O, dire que la valeur est déjà déterminée, est contraire à l'esprit relationnel.
 Le résultat obtenu par O' (et par O) est prédéterminé. Même s'il ne le sait pas encore. Malheureusement on
retombe sur le premier problème soulevé ci-dessus. Les résultats prédéterminés sont interdits par un certain
nombre de théorèmes de la mécanique quantique. Dans le cas où le résultat est prédéterminé, le fait que O' n
connaisse pas encore le résultat n'est plus de l'indétermination mais de l'ignorance et on sait que la mécaniqu
quantique ne se laisse pas réduire à une ignorance statistique. Sauf si l'on accepte la troisième possibilité.
 L'état superposé S-O constaté par O' avant la mesure n'est pas complet. Par exemple, il contient des variables
cachées contextuelles et non locales qui indiquent que la valeur à mesurer est x1 . Mais cela nous avons décid
de le rejeter : nous avons décidé de considérer la mécanique quantique complète tant que nous ne sommes pa
forcés d'aller au-delà. De plus, si c'est la mesure de O qui a altéré ces variables cachées et "inscrit" le résultat
obtenir dans ces variables, nous retombons sur la première possibilité : la valeur mesurée par O prend un
caractère absolu.
Bref, le fait que les propriétés absolues n'existent pas et sont totalement relatives à l'observateur et l'absence
résultats prédéterminés implique sans autre possibilité que pour O' aussi la valeur mesurée de la position est
totalement aléatoire. Et cela est contraire à toute contrainte de consistance imposée de manière totalement ad
hoc, sans explication physique plausible.

Cette contrainte de consistance semble, par sa simple existence, être en conflit avec les principes de la
mécanique quantique relationnelle.

On peut objecter que les réalités de O et O' étant totalement séparées, ces considérations n'ont pas d'intérêt ca
le raisonnement que nous menons ci-dessus a un caractère "global". Si l'on raisonne dans le cadre de, par
exemple, O' en excluant totalement la "réalité de O" car elle n'a pas d'existence pour lui, alors le problème ne
peut pas être soulevé. Mais c'est faux ! Un troisième observateur peut lui aussi effectuer des mesures sur O e
O', observer les corrélations puis les interroger sur les valeurs qu'ils ont mesurées et poser la question "mais
comment se fait-il que vous avez trouvé, comme par hasard, la même valeur ?" O" constate un lien mystérieu
entre O et O', lien qu'il ne peut expliquer entièrement par le flux d'informations entre S, O et O' en restant da
le cadre quantique et relationnel strict.

Evaluation
Passons à l'évaluation proprement dite.

 Respect du formalisme de la mécanique quantique.


La mécanique quantique relationnelle adopte le formalisme de la mécanique quantique sans le
modifier en quoi que ce soit.
 Limite.
Il n'y a pas de limite. Les systèmes considérés peuvent être quelconques : microscopique,
macroscopique, appareils, humains et même tout l'univers.
 Principe anthropique.
Aucun rôle privilégié n'est donné à un système quel qu'il soit ni à un type d'observateur.
 Réalisme ou positivisme.
L'interprétation est réaliste puisqu'elle affirme que la description "réelle" du système est donnée
au mieux par toutes les informations obtenues, c'est-à-dire par la connaissance de la fonction
d'onde. Cette dernière prend un caractère plus que de connaissance, elle traduit vraiment la
réalité du système S pour l'observateur. Ce réalisme prend toutefois une forme un peu spéciale
du fait que l'on considère qu'il n'existe pas de réalité absolue mais seulement relativement aux
observateurs effectuant les mesures sur le système. Mais souvenons-nous que nous avons refusé
d'avoir des préjugés sur la forme que la réalité doit prendre. Le réalisme basée sur
l'interprétation relationnelle a droit de cité.
 Rasoir d'Ockham.
Même si l'interprétation telle que décrite par ses auteurs se garde bien de dire qu'il y a réduction
(nous verrons qu'il est possible d'interpréter celle-ci en terme d'information incomplète), la
formulation telle que donnée implique bien une réduction pour un observateur donné (O qui
observe un résultat final x1 ), même si ce n'est que pour lui que cette réduction a lieu. On ne
peut la rejeter (via l'explication que nous verrons) dans cette version puisque l'on considère que
la réalité de S est relationnelle et la façon de considérer S par O est aussi valable que celle de
tout autre observateur. L'interprétation doit de plus ajouter une condition de consistance ad hoc.
 Bases privilégiées.
Pour être cohérente, cette interprétation échappe difficilement à l'utilisation d'une base
privilégiée. Ou plutôt une base privilégiée pour un observateur donné.
 Caractère explicatif des probabilités et de la réduction.
Le mécanisme expliquant la réduction et les probabilités reste inconnu
 Coté pédagogique.
Cette interprétation où tout est relatif et où la réalité elle-même est relative est assez déroutante
et peu poser de sérieuses difficultés si on l'adopte comme outil pédagogique.
 Défauts.
Les problèmes expliqués plus haut sont entièrement repris dans les points en rouge ci-dessus.

Interprétation relationnelle : -5.


Nous allons maintenant essayer de trouver les solutions pour arriver à un score encore plus faible,
sauf peut-être au niveau pédagogique (on ne peut pas tout avoir). Nous allons voir qu'en combinant
deux de ces interprétations on obtient d'excellents résultats.

La possibilité de marier la mécanique quantique relationnelle avec d'autres interprétations est liée à
un caractéristique fort intéressante. L'interprétation relationnelle est avant tout une méthode
d'analyse, une analyse relationnelle. C'est un outil d'analyse avant même d'être une interprétation.
Un tel outil peut être utilisé dans beaucoup de cadres, par exemple en relativité comme signalé plus
haut.

De plus, la mécanique quantique relationnelle est une interprétation strictement locale : tout se
passe à travers des relations entre systèmes, relations obtenues par des interactions physiques qui
sont soumises à la relativité (du moins en mécanique quantique relativiste) donc à vitesse finie et de
proche en proche.
III.9. Choix et solutions
Afin d'obtenir quelque chose de satisfaisant, nous allons maintenant marier deux des
interprétations, l'interprétation des états relatifs et l'interprétation relationnelle. L'interprétation
relationnelle est manifestement celle qui suit le mieux la philosophie que nous nous sommes fixée
mais il reste quelques problèmes à résoudre.

Mais, avant, il nous reste à résoudre un problème que nous n'avons pas vraiment résolu ci-dessus dans les
interprétations sans réduction, à savoir comment expliquer les probabilités de la mécanique quantique. C'est-à-di
les probabilités d'obtenir telle ou telle mesure selon la règle de Born alors que ces interprétations sans réduction
font par apparaître ces probabilités.

Nous allons analyser la problématique progressivement, en suivant les pistes possibles et en éliminant
progressivement les approches qui ne marchent pas jusqu'à pointer du doigt la solution. A la manière d'un
détective.

Probabilités
Ce n'est pas trivial puisqu'il n'y a pas réduction, toutes les composantes restent présentes en même temps.
Supposons, par exemple, qu'il y ait deux états possibles de position x1 et x 2 pour S avec des probabilités
respectives de 1/3 et 2/3 pour l'état de S donné, par exemple 1 / 3 x1 + 2 / 3 x 2 .

Il n'y a pas de sens a priori de dire que l'on va mesurer la position x1 avec la probabilité 1/3 et la position x 2 ave
la probabilité 2/3 puisque dans tous les cas on obtient deux composantes. L'état reste "complet", superposé. O ne
pouvant se rendre compte de la superposition ne voit qu'un résultat défini. Mais pourquoi des probabilités 1/3 et
2/3 pour les deux cas (dans cet exemple) ?

Le problème est assez épineux et est celui rencontré par toutes les interprétations sans réduction. Voyons cela de
plus près, en toute généralité
Présentation
Rappelons la règle de Born pour les probabilités quantiques. Soit un système S décrit par un l'état S appartena
à un espace de Hilbert H . Soit un observable O avec les vecteurs propres O1 et O2 (pour l'exemple, nous
prenons un espace de Hilbert à deux dimensions, c'est-à-dire deux états de base, mais tous les résultats et
raisonnements se généralisent aisément à un nombre quelconque de dimensions y compris infini). Alors l'état S
admet une décomposition unique S = a O1 + b O2 . Les coefficients a et b sont appelés amplitudes.

Soit une mesure, correspondant à l'observable O, appliquée au système S. Dans ce cas, la mécanique quantique
nous dit que les seules valeurs qui pourront être observées correspondent aux vecteurs propres de O (par exempl
les états "aiguille à gauche" et "aiguille à droite" pour un appareil de mesure). La probabilité de trouver le systèm
dans un état donné est donnée par une formule appliquée à l'amplitude.

2 2
Ainsi, avec l'exemple, on a la probabilité a de trouver le système S dans l'état O1 et la probabilité b de le
trouver dans l'état O2 . Bien entendu, la probabilité totale de trouver un résultat doit être égale à un, l'état est
2 2
donc "normalisé" pour que l'on ait la somme a + b = 1 , c'est juste un détail.

C'est la règle de Born telle qu'elle est utilisée de manière opérationnelle ou, comme on l'appelle parfois, dans
l'interprétation instrumentale.

Après la mesure, l'état du système est donné par l'état mesuré, par exemple O1 . On dit que l'état a subit une
réduction de l'état S à l'état O1 . Cette réduction est parfois appelée réduction du vecteur d'état ou réduction d
la fonction d'onde.

Pour toute interprétation de la mécanique quantique faisant appel à ce mécanisme de réduction, les probabilités
quantiques s'appliquent sans difficulté de la manière que nous venons de voir. Et elles sont, de plus, aisément
vérifiables expérimentalement.
Mais la réduction du vecteur d'état n'est pas sans poser divers problèmes (comme nous l'avons vu). C'est pour ce
raison que certains physiciens ont recherché une interprétation de la mécanique quantique ne faisant pas appel à
mécanisme.

L'interprétation de ce type la plus connue est l'interprétation des mondes multiples de DeWitt et Everett. Elle
dérive de l'interprétation des états relatifs d'Everett, comme nous l'avons vu. En réalité, il serait plus correct de
parler des interprétations et non de l'interprétation. Il existe en effet maintenant une multitude de variantes à ces
interprétations. Un autre exemple est la forme des états relatifs que nous avons développée ci-dessus où l'on se
retrouve avec plusieurs composantes (selon diverses bases) d'un état superposé (théorie nue).

Il est notoirement connu que l'interprétation des probabilités quantiques est difficile dans ces interprétations. C'e
à ce problème que nous allons tenter d'apporter une solution.

Par simplicité, pour faciliter les explications, nous utiliserons une variante des mondes multiples assez simple
mais les raisonnements qui suivent s'appliquent sans difficultés à toutes les variantes y compris l'interprétation d
états relatifs proprement dite.

Pour illustrer la variante utilisée, sans nous avancer trop loin dans les détails techniques, ontologiques ou
philosophiques, prenons le schéma de mesure de von Neumann.

Prenons un système S tel que celui donné plus haut en exemple. Soit un appareil de mesure A conçu pour mesur
l'observable O et se trouvant initialement dans l'état A0 . Pour la simplicité nous considérons un appareil de
mesure "au sens large", c'est-à-dire incluant également l'expérimentateur et éventuellement l'environnement.

Lorsque l'appareil mesure le système décrit par l'état O1 il se retrouve dans l'état A1 . Ce qu'on peut décrire
schématiquement par :
A0 O1 → A1 O1
De même pour l'état O2
A0 O2 → A2 O2
L'équation de Schrödinger décrivant l'évolution des systèmes physiques (quantiques) étant linéaire, on obtient
facilement le résultat général :
A0 S = A0 (a O1 + b O2 ) = a A0 O1 + b A0 O2 → a A1 O1 + b A2 O2

On dit que dans l'état résultant l'appareil et le système sont corrélés.

Dans le schéma avec réduction, on dit que la mesure provoque la réduction, par exemple :
A0 S → a A1 O1 + b A2 O2 → A1 O1 (le facteur a est éliminé par la normalisation) avec une probabilité
2
a .

Dans l'interprétation des mondes multiples, on dira que la mesure a provoqué la "scission" du monde en deux
mondes distincts décrits par les composantes du vecteur d'état global :
A1 O1
et
A2 O2

C'est la variante des mondes multiples la plus simple que nous avons déjà vu et qui nécessite le choix d'une base
privilégiée (ici O1 , O2 ). Mais notre problème ici n'est pas de résoudre le problème de la base privilégiée mai
celle-ci étant donnée, de comprendre l'origine des probabilités.

Dans l'approche des états relatifs, ces deux éléments sont conservés dans un seul état (somme, superposition).
Mais le résultat est analogue car sans passer par un autre observateur, chaque composante n'est pas influencée pa
l'autre (à cause de l'évolution linéaire). La différence est (sans un observateur supplémentaire) purement
sémantique. Dans ce qui suit, pour simplifier l'explication, nous continuerons à parler de "mondes" qui peut don
être pris dans un sens plus large que les mondes parallèles de l'interprétation de DeWitt.

Du fait de l'évolution linéaire, chaque monde est sans relation causale avec les autres (du moins si A inclut bien
l'appareil, l'observateur et même tout le reste de l'univers ou si les composantes concernent des objets
macroscopiques ayant subit le phénomène de décohérence).
Comment appliquer la règle ?
Comment les probabilités quantiques s'appliquent-elles dans le cas des mondes multiples ? La question est
épineuse car tous les mondes existant simultanément, la probabilité qu'un monde donné soit réalisé est tout
simplement égale à un ! Dans ce cas, il n'y a aucun sens à parler de probabilités.

Pourtant, l'expérience montre effectivement le caractère probabiliste des mesures quantiques. Pire encore, la
théorie elle-même, la mécanique quantique, tire ses fondements des expériences effectuées et de leur caractère
probabiliste. Rappelez-vous comment nous avons abordé et décrit la mécanique quantique au début de cette étud
Le fait de ne pas pouvoir parler de ces probabilités dans les mondes multiples est donc assez gênant. La théorie
perd le lien avec son propre fondement expérimental.

En fait, le problème n'est pas tant de comprendre la règle de Born, de comprendre son origine, que d'appliquer
cette règle.

Pour ce qui est de la raison de cette règle, on montre avec le théorème de Gleason (un des théorèmes
d'impossibilité que nous avons cités) que si la probabilité d'observer un résultat lors d'une mesure est égale à un
(une hypothèse qui semble évidente) alors seule la règle de Born est consistante avec la mécanique quantique.
C'est un résultat mathématique fort qui, au moins, fixe de manière définitive la raison mathématique d'une formu
2
comme a .

Mais ce résultat théorique ne nous aide pas beaucoup car on y suppose implicitement le caractère probabiliste de
mesures. Ce théorème suppose que "l'on sait comment appliquer la règle, quelle qu'elle soit" puis montre quelle
doit être cette règle.

Ici, c'est l'inverse qui nous préoccupe : on connaît la règle, mais on ne sait pas comment l'appliquer dans le cas d
mondes multiples ni même pourquoi on doit appliquer une telle règle !

Voyons donc les solutions envisageables.


Approches philosophiques
Plusieurs auteurs ont tenté de résoudre le problème. Les tentatives d'explication ont souvent pris une tournure
philosophique plutôt qu'orientée vers la physique, voire une explication plutôt métaphysique. Comme nous l'avo
déjà dit, cela est à éviter.

Les explications sont souvent alambiquées sans que l'on voie facilement le lien avec la physique.

Un exemple typique est la notion de "mesure d'existence" associée aux mondes et qui a été donnée plus haut. C'e
une expression dont la signification philosophique semble évidente mais dont la signification physique reste asse
mystérieuse. Elle donne l'impression d'une expression toute faite pour tenter d'expliquer l'application d'une règle
arbitraire. Mais remplacer un mystère par un autre, une expression (probabilité) par une autre (mesure
d'existence), ne donne en fait aucune explication. L'idée est peut-être satisfaisante pour le philosophe mais pas
pour le physicien qui n'y voit qu'une pirouette sémantique.

Ces approches basées sur des aspects philosophiques, abstraits ou peu concrets sont peut satisfaisantes dans la
mesure où les probabilités, les statistiques, les distributions de résultats de mesures,... sont des concepts
extrêmement concrets et tangibles liés à des données expérimentales.

Approche statistique
Puisque l'on souhaite avoir une approche physique, il faut relier les probabilités à ce qui est effectivement mesur
Or, ce qui est mesuré c'est un ensemble de résultats. Par exemple, on dispose de N systèmes identiques ou
préparés dans un état initial identique et on effectue une mesure sur chacun de ces systèmes. On va par exemple
mesurer (avoir pour résultat des mesures sur chaque système) la suite O1 , O1 , O2 , O1 , O2 , O2 , ... A partir de ce
résultats, on peut effectuer un calcul statistique : P = N (O1 ) / N (la probabilité ou du moins une valeur proche si
N est grand est donnée par le nombre de résultats O1 sur le nombre total de mesures). Si la distribution
statistique est conforme à la règle de Born, la loi des grands nombres nous affirme alors que P tend vers la
2
probabilité a .

Cette fois, nous n'avons plus une mystérieuse probabilité mais bien un ensemble concret de mesures qui existent
aussi dans le cas des interprétations des mondes multiples.
Malheureusement, cela ne résout pas le problème ! Après la première mesure, on va se retrouver, avec l'exemple
choisi, avec deux mondes O1 et O2 , puis, après la deuxième mesure, on se retrouve avec quatre mondes
O1 O1 , O1 O2 , O2 O1 , O2 O2 (le premier état se rapporte au premier système mesuré, le deuxième au
deuxième système, nous évitons des indices qui alourdiraient inutilement la notation. De plus effectuer
simultanément les mesures ne change pas le résultat, peu importe que l'ordre des états corresponde à un ordre
temporel ou un simple indiçage des mesures). Après, par exemple, trois mesures, on aurait les composantes
suivantes correspondant chacune à un monde :
O1 O1 O1
O1 O1 O2
O1 O2 O1
O1 O2 O2
O2 O1 O1
O2 O1 O2
O2 O2 O1
O2 O 2 O 2

Toutes les distributions existent dans tous les mondes. La première composante a l'amplitude a 3 , la deuxième
a 2 b , etc. Ceci est totalement équivalent à un système (composé de trois sous-systèmes identiques) dont l'état est
décrit par un espace de Hilbert à 8 dimensions (2 fois 2 fois 2, huit états de base possible pour les trois systèmes
mesurés) et la décomposition sur la base de l'observable O donne 8 composantes avec les amplitudes a 3 , a 2 b , e

On n'a fait que déplacer le problème en arrivant simplement à un système plus complexe, avec un espace de
Hilbert plus grand. Mais le problème reste entier !

Dans cette situation, demander à ce que les statistiques correspondent à la règle de Born, revient à se poser la
question : "Pourquoi suis-je dans ce monde où j'observe les bonnes distributions statistiques ?"
On pourrait imaginer que certaines "branches" (certains mondes) sont exclues. Par exemple le monde avec les
résultats O1O1O1O1O1 LO1O1 L dont la distribution statistique ne correspond manifestement pas à la distribution
probabiliste recherchée.

Mais outre l'absence de justification ou de mécanisme pour cela, ce n'est pas possible. En effet, si ces suites de
résultats sont extrêmement improbables, elles ne sont pas exclues. Cela peut très bien arriver de tirer 5 fois pile
dans une série de lancés à pile ou face. Et la probabilité, faible, d'avoir un tel monde est justement donnée par
l'amplitude a N ( a fois a fois a … N fois). La distribution de ces mondes correspond aux distributions
statistiques des différentes possibilités.

En fait, on a besoin de comprendre l'expression "je suis dans ce monde avec la probabilité donnée par l'amplitud
de la composante associée à ce monde".

Supposons que nous disions, lorsqu'une division en deux mondes se produit, "je me retrouve" dans l'un des deux
mondes au hasard. Ceci est logique dans la mesure où d'un point de vue "extérieur" les deux possibilités existent
simultanément, donc cette question probabiliste n'a pas de sens, tandis que de mon point de vue, je suis un
individu unique au départ, puis, après la mesure, nous sommes "deux moi", un dans chaque univers. Quel que so
le "moi" qui se pose la question "dans lequel des deux mondes je me trouve ?", il a une chance sur deux d'être un
des deux "moi".

2 1
Mais ça ne marche pas, sauf dans le cas particulier où a = b = 1 / 2 , car, dans ce cas, les statistiques observée
2 2
ne correspondraient pas aux probabilités quantiques. Par exemple, si a = 1 / 3 et b = 2 / 3 , alors la série de
mesure O1 O1 O1 O1 a une chance sur 81 de se produire, tandis que si je regarde la probabilité que j'ai de me
retrouver dans ce monde (celui avec cette distribution statistique), elle est de 1 / 2 4 = 1 / 16 (un des 16 mondes),
d'après le raisonnement précédent, c'est-à-dire une chance sur seize.

Quelque chose ne marche pas, mais quoi ?


Approche classique, décohérence
Peut-être que la solution est à rechercher du coté des objets macroscopiques, obéissant (au moins avec une bonn
approximation) aux lois de la physique classique. Plusieurs indices donnent à le penser.

1) C'est nous, expérimentateurs humains (et macroscopiques), qui effectuons ces calculs de probabilité à l'aide
mesures et d'instruments macroscopiques.
2) Considérons le cas des interprétations avec réduction de la fonction d'onde telles que l'interprétation
instrumentale ou l'interprétation de Copenhague. Dans ces interprétations, la mesure est un processus
classique. C'est-à-dire que l'appareil de mesure est considéré comme classique et c'est uniquement dans ce ca
que la réduction prend place ainsi que l'application de la règle de Born. Dans le cas d'un système
microscopique décrit par une superposition d'états, le système évolue selon l'équation de Schrödinger et on n
parle pas (avant la mesure) de probabilité (cela n'aurait d'ailleurs pas de sens, on a juste un état superposé, c'e
tout).
3) La théorie de la décohérence explique l'apparition de la classicalité. C'est-à-dire l'existence de bases
privilégiées pour la mesure et le fait que les états de cette base soient "robustes". Pour donner un exemple, si
base privilégiée est la base position, alors une particule observée en la position (environ) X y restera ou
changera "continûment" et lentement de position au cours de temps. Cela permet l'existence d'une "mémoire
stable, l'enregistrement de résultats définis, de trajectoires classiques et l'existence d'un monde obéissant aux
lois de la physique classique. C'est le strict minimum pour l'existence d'un monde classique.

Ce dernier indice nous donne une voie de recherche.

Un état "robuste" est donné, dans la théorie de la décohérence, par une opération mathématique sur l'état comple
dus système et de l'environnement pour en extraire l'état du système seul : la prise de la trace sur les variables
d'environnement pour en tirer la matrice de densité réduite.

Un tel état (macroscopique) correspond donc en réalité à un grand nombre d'états (microscopiques) possibles
(incluant l'environnement).

Si la "densité" (le nombre d'états microscopiques inclus dans un état macroscopique) correspond à la règle de
Born, nous aurions une solution et le raisonnement ci-dessus sur "le monde sélectionné au hasard" marcherait.
Malheureusement, une vérification élémentaire montre que l'opération mathématique utilisée implique une densi
uniforme. Chaque état macroscopique correspond au même nombre d'états microscopiques. Cela est dû aux
propriétés de linéarité de la trace. Chaque élément de la matrice réduite est la somme d'éléments en nombres
égaux.

On peut imaginer que la solution générale au problème de décohérence (la recherche des états macroscopiques
robustes) n'est pas aussi simple que la simple opération mathématique en question, en particulier si l'espace de
Hilbert (système plus environnement) n'est pas totalement séparable (en différents systèmes) ou si l'état de
l'environnement n'est pas totalement indépendant de l'état du système et que la dynamique implique qu'un état
macroscopique distinct soit composé d'un nombre variable d'états microscopiques selon des processus plus ou
moins complexes d'interactions entre le système physique étudié et l'environnement.

Mais comment espérer retrouver le caractère simple de la règle de Born à travers un processus dynamique aussi
complexe ? Aucun indice sérieux, expérimental ou théorique, ne laisse même supposer que ce soit possible.

Caractère arbitraire de la décomposition


Un point très important à noter est que la décomposition d'un état sur une base possède un caractère arbitraire.

Pour un système microscopique, plus exactement isolé de l'environnement (au moins entre deux mesures), il n'y
pas de base privilégiée. Nous l'avons déjà vu. Il y a autant de décompositions possibles que de bases possibles
pour l'espace de Hilbert. C'est-à-dire une infinité.

Par exemple, avec deux dimensions et deux bases :


S = a O1 + b O2 = a ′ V1 + b′ V2
où {V1 , V2 } peut être la base de vecteurs propres non dégénérés d'un autre observable V .
Comme il n'y a pas de raison de privilégier tel ou tel observable, la séparation en "mondes" est ambiguë.

Cette situation semble compliquer encore plus le problème d'affecter une probabilité à un monde.
Mais, en réalité, cela simplifie la situation ! Il n'y a pas de sens physique à dire "telle probabilité de telle
composante ou monde", car la décomposition est affaire de choix. On choisit une base pour la description en
termes de mondes multiples. Et ce choix purement descriptif, mathématique, ne devrait pas influencer les
phénomènes physiques et donc les probabilités mesurées. Le choix peut être basé, a posteriori, sur les bases
privilégiées (dont l'origine trouve son explication dans la décohérence et les systèmes "classiques") et donc le
choix d'un observable donné. Mais cela ne change rien au fait que la description en elle-même de l'interprétation
de la mécanique quantique effectue un choix arbitraire de décomposition de l'état. Quelle que soit la description,
est toujours possible de choisir une base totalement arbitraire pour décomposer l'état, même après décohérence (
matrice densité n'est alors pas diagonale).

Le seul système réellement physique est S .

Ca ne complique donc pas le problème, heureusement, mais cela le rend juste encore plus mystérieux car
manifestement nous n'avons pas cherché du bon coté !

Mathématique vs Physique
Bien séparer mathématique et physique
Lorsque l'on parle d'une théorie physique et encore plus lorsque l'on parle de son interprétation il convient de ne
pas confondre mathématique et physique. L'expression consacrée est de dire qu'il ne faut pas confondre la carte
le territoire, la peinture et le modèle, la description d'un phénomène et le phénomène lui-même. Nous avons, par
exemple, déjà parlé du risque de certains artefacts mathématiques si l'on ne respecte pas le principe de relativité
le risque de les confondre avec des effets physiques. En électromagnétisme, nous avons également cité la "jauge
qui n'a pas de conséquence sur les prédictions physiques de la théorie et dont l'arbitraire est fixé par une équation
supplémentaire et arbitraire mais que l'on choisit normalement pour respecter le principe de relativité (la jauge d
Lorentz).

Lorsque nous parlons ici de "mathématique", nous l'employons dans un sens très large qui va au-delà de la simpl
formulation de la théorie à l'aide d'équations.

Ce qui est considéré ou appelé mathématique ici est la description de la théorie en termes d'équations ou de
simples mots. Ces mots peuvent bien sûr faire appel à des concepts physiques que nous connaissons mais il ne
faut pas oublier que nous sommes ici dans un domaine très particulier (la mécanique quantique) où les concepts
habituels applicables à la physique classique, au quotidien, peuvent ne plus avoir le même sens ou être des
concepts émergeant d'une "réalité" plus fondamentale et très différente de celle que nous voyons au quotidien.
Bref, même en employant des mots tels que "particule", "monde" ou "onde", il n'est pas certain qu'ils se réfèrent
des entités physiques réelles et tant que l'on a pas fait le lien entre la description et les données expérimentales, c
mots doivent être pris comme de simples éléments ("mathématiques") de la description, jusqu'à preuve du
contraire.

Nous devons au tout premier chef considérer la description, quelle que soit sa formulation, pour ce qu'elle est : u
description "mathématique". Puis identifier ce qui peut réellement être considéré comme physique, comme le
résultat d'une mesure (et ce quel que soit le système, aussi complexe et mystérieux soit-il, qui conduit au résultat
observé).

S'il s'avère que plusieurs formulations différentes conduisent aux mêmes résultats physiques, alors on ne peut pa
considérer arbitrairement qu'une de ces formulations a un caractère "plus physique" qu'une autre. Il faut bien
admettre que ces formulations ne sont qu'un "habillage" qui permet une formulation de la seule partie réellement
physique que sont ces résultats (et leur cause). Cela n'a rien de choquant dans la mesure où toutes ces formulatio
décrivent quelque chose de bel et bien physique. Il y a souvent plusieurs manières de décrire une même chose, e
particulier si cette chose correspond à une réalité pour laquelle les mots et concepts habituels ne sont pas vraime
adaptés ou n'y prennent pas le même sens. Ce qui est le cas en mécanique quantique.

De nombreuses interprétations de la mécanique quantique laissent totalement inchangé le formalisme de base de


celle-ci et conduisent exactement aux mêmes prédictions physiques pour des situations initiales identiques. C'est
d'ailleurs un reproche qui a souvent été fait aux interprétations : elles ne sont pas toujours falsifiables. C'est un
reproche quelque peu injustifié dans la mesure où ces interprétations ont justement pour but principal de
comprendre la mécanique quantique (son formalisme) et non de modifier ses résultats.

Ici, nous n'avons pas l'intention de discuter de la pertinence d'étudier ou d'élaborer différentes interprétations de
mécanique quantique. Nous partons de l'hypothèse que l'interprétation des mondes multiples, comme la version
que nous utilisons ici, respecte aussi le formalisme de la mécanique quantique et ce qui nous intéresse est
l'interprétation des probabilités dans une telle situation. Force est alors d'admettre que la description en termes d
mondes multiples fait partie de la description "mathématique", au sens que nous avons précisé, et qu'elle est
totalement arbitraire. On ne peut pencher en faveur de cette interprétation que pour diverses raisons à caractère
philosophique et pas pour des raisons expérimentales, par exemple. Et ceci, même si on applique une ontologie
aux concepts appartenant à cette interprétation (les "mondes").

L'élaboration de l'interprétation à l'aide de la mécanique quantique relationnelle et des états relatifs en partant du
strict minimum (le formalisme sans la réduction), de principes généraux (respecter le principe de relativité, évite
le principe anthropique) et du refus d'utiliser des concepts philosophiques ou classiques sans preuve de leur
pertinence ne nous a d'ailleurs pas conduit d'office à cette ontologie des "mondes" (rappelez-vous son "score" trè
négatif) qui ne peut donc se rajouter que si on est insatisfait de la philosophie des états relatifs (ce qui fut le cas d
DeWitt, par exemple).

Physique et mondes multiples


Qu'est-ce qui peut être alors qualifié de physique dans l'interprétation ? C'est bien sûr le résultat des mesures. C'e
la seule chose concrète sur laquelle nous pouvons nous baser pour construire la théorie et son interprétation mais
également pour vérifier, par exemple, les prédictions de la théorie. Nous avons déjà insisté sur ce point et il
convient d'enfoncer le clou. Et ceci est entièrement valable dans l'interprétation des mondes multiples.

Or, pour nous qui effectuons une série de mesures, ces résultats correspondent à un seul "monde". Celui dans
lequel nous nous trouvons. Celui correspondant à la distribution statistique observée dans cette série de mesure.

Dans ce contexte, parler de la probabilité d'être dans tel ou tel monde n'a physiquement pas de sens : nous somm
dans ce monde, point ! De même pour les distributions statistiques des différents mondes.

Considérons maintenant l'ensemble des mondes multiples, globalement, comme un tout. Il n'y a ici pas
d'observateur extérieur à cet ensemble à même d'effectuer des mesures sur cet ensemble. Il n'y a, par exemple, p
d'observateur "extérieur" au(x) monde(s) qui pourrait effectuer une série d'expériences et déterminer la probabili
de se retrouver dans tel ou tel monde. A nouveau, parler de ce genre de probabilité n'a pas de sens physique. Les
descriptions en termes de mesures (au sens mathématique) sur ces espaces (de mondes) ne sont que des astuces
mathématiques qui n'ont pas nécessairement une justification physique et l'usage de mots comme
"transtemporalité" que nous avons rencontré sont plus philosophiques que physique.

Lorsque nous avons précédemment parlé d'avoir une chance sur deux de nous retrouver dans un des deux monde
résultant de la mesure, cela n'avait pas de sens. Plus exactement, pas de sens physique. Ce concept de probabilité
n'a aucune base physique sur laquelle elle pourrait reposer. Elle est totalement fictive. Un effet trompeur de
perspective (celle du physicien qui est "extérieur" à l'interprétation qu'il élabore, "extérieur" à ces mondes
multiples, et qui oublie que cette interprétation doit s'appliquer à la réalité et qu'en fait lui-même, plus exactemen
"cet" exemplaire de lui-même, ne fait partie que d'un monde donné).

Il existe un cas où un observateur extérieur peut exister. Lorsqu'un expérimentateur considère un système
mécanique quantique (microscopique) dans un état superposé. Il peut, par exemple, vérifier que l'état
correspondant est bien un état superposé en effectuant des expériences d'interférences comme l'expérience bien
connue des fentes de Young. Mais nous avons déjà parlé de ce cas dans le cadre des interprétations avec réductio
et la même conclusion s'applique : il n'y a pas de sens à parler de probabilité des différentes composantes car
toutes existent simultanément. Ce n'est qu'après la mesure que cela intervient. Et après la mesure, soit il n'y a plu
qu'une seule composante (interprétation avec réduction), soit c'est tout l'univers (expérimentateur et système) qu
se retrouve dans un état superposé pour les interprétations sans réduction comme celle des mondes multiples.
Nous retombons sur la situation précédente. Il n'y a pas de sens physique à parler de la probabilité d'être dans ce
monde, seulement de mesurer tel résultat dans le monde où nous constatons ce résultat.

Si l'on compare au raisonnement précédent, à savoir un expérimentateur qui effectue une série de mesure pour
déterminer quelle est la probabilité "d'être" (de mesurer) telle ou telle composante, il effectue en réalité
l'expérience sur un ensemble de systèmes puis réalise un calcul statistique sur l'ensemble des résultats. Cela ne lu
permet pas de tirer de conclusion sur le premier système (de la série de systèmes identiques mesurés) considéré
avant mesure ! On doit considérer l'ensemble des systèmes comme un seul système plus complexe et on retrouve
la situation que nous avions décrit avec les différentes distributions statistiques. Après les mesures, dans le cadre
de l'interprétation des mondes multiples, on se retrouve simplement avec une démultiplication de mondes
différents sans pouvoir parler réellement, physiquement, de probabilité affectée à l'un ou l'autre monde.

Caractère mathématique de la distribution de probabilité des mondes


Quel sens donner alors à l'expression "la probabilité d'être dans tel monde" ? On peut, bien entendu, considérer
cette distribution de probabilité d'un point de vue mathématique. Par exemple, considérer la distribution uniform
que nous avons envisagée plus haut (bien qu'elle ne donne pas le résultat attendu). C'est à dire affecter des poids
égaux à chaque composante, à chaque "monde".

Mais regardons les deux manières de décomposer l'état S suivant :


S = 2 O1 + O2
S = O1 + O1 + O2

La première décomposition nous dit que la décomposition conduit à deux composantes (avec des amplitudes
différentes) et on devrait dire que l'on a une chance sur deux de nous retrouver, après mesure, dans chacun des
mondes correspondants à ces deux composantes.

La deuxième décomposition nous dit qu'il y a trois composantes (dont deux identiques), et donc qu'on devrait
avoir une chance sur trois de se retrouver dans les mondes correspondant.

C'est d'ailleurs de cette manière que certains auteurs tentent de résoudre le problème des probabilités quantiques
dans l'interprétation des mondes multiples. Ce que nous avions appelé plus haut "densité d'états" dans un autre
contexte (celui de la décohérence) ou mesure (au sens mathématique) dans l'espace des mondes.

Mais la différence entre les deux situations est purement mathématique. Nous décomposons mathématiquement
deux manières différentes le même état. Et c'est justement la clef : il s'agit bel et bien du même état physique,
décrit par S , identique dans les deux cas.

Cela met bien en évidence le caractère purement arbitraire, non physique, de cette distribution de probabilité
malgré le raisonnement apparemment logique que nous avions tenté pour justifier le fait qu'on a des chances
égales de se retrouver dans tel ou tel monde.

Choix de la distribution
La distribution de probabilité appliquée aux mondes a donc un sens, mais un sens mathématique, pas physique.
Elle fait partie de l'interprétation, de la description, pas de ce qui est décrit. Nous l'avons vu : physiquement il n'y
pas de sens (ou pas de mesure physique) à parler de probabilité d'être dans tel ou tel monde. Et mathématiqueme
nous avons toute liberté de choisir la distribution de probabilité.

La seule chose que l'on doit exiger d'une formulation mathématique d'une théorie, c'est évidemment que la théor
ainsi construite corresponde aux données expérimentales. Même si le choix est purement mathématique, il ne fau
pas oublier que la théorie ou son interprétation sont sensés décrire des phénomènes physiques ! Il doit exister un
lien entre la description (mathématique) et les mesures (physiques).

Dans les interprétations instrumentales ou de Copenhague, ce lien est évident car les deux aspects (mathématiqu
et physique) sont intimement liés à travers le processus de réduction de la fonction d'onde lors de la mesure. La
règle mathématique (règle de Born) est le reflet immédiat des résultats physiques.

Plus précisément, la règle pouvant se déduire (via le théorème de Gleason avec quelques hypothèses raisonnable
on peut montrer que la règle de Born est la seule consistante), l'explication physique y trouve sa source. C'est le
lien opérationnel entre mathématique et physique qui est immédiat et évident.

Dans l'interprétation des mondes multiples, les deux aspects étant nettement séparés, d'un coté la mesure observé
dans un monde et de l'autre les probabilités d'être dans un monde, on a tendance à essayer de trouver une
explication indépendante pour cette distribution de probabilité sur les mondes. Mais le caractère séparé des deux
aspects, physique versus mathématique, doit être constaté et l'explication n'existe pas du coté mathématique seul
pour la distribution de probabilité sur les mondes. C'est arbitraire, comme nous l'avons vu.

Ici, pour que la règle mathématique corresponde aux résultats physiques, Il suffit de choisir la règle : "le monde
est choisi au hasard selon la règle de Born". C'est aussi simple que ça ! Maintenant qu'on lui colle le nom de
"mesure d'existence" ou une expression de ce style, c'est affaire de goût ou de philosophie.

La distribution de probabilité à appliquer aux mondes est donc non uniforme.

Notons que l'utilisation du théorème de Gleason pour déduire la règle de Born reste applicable dans ce contexte.
La notion de probabilité invoquée dans cette déduction est ici : "on est forcément dans un monde (la probabilité
totale est un)". D'où la déduction, la règle de Born, et le lien avec la physique : un observateur donné (une "copie
de l'observateur) se retrouve "au hasard" dans un des mondes selon cette règle. Mais ici il n'y a pas de contrainte
physique et le fait que la règle résulte du formalisme quantique et d'une règle de consistance est moins mystérieu

Si l'on reprend notre approche statistique, avec un ensemble de mondes correspondant à toutes les distributions
statistiques de mesures, on se retrouve au "hasard" dans un monde avec une distribution statistique donnée ayant
la même probabilité que ce "hasard", c'est à dire donné par la règle de Born.
Insistons sur le fait qu'en faisant ce choix pour la probabilité sur les mondes, on ne fait pas coller arbitrairement
deux aspects physiques mais l'aspect mathématique (statistiques) obtenu par des mesures physiques avec un autr
aspect mathématique (distribution probabiliste des mondes). Cette distribution de probabilité sur les mondes est
distribution de probabilité décrite par la règle de Born sur les différentes distributions statistiques mesurées. Tou
simplement. C'est le déplacement de paradigme (passage du concept de réduction à celui de monde multiple) qu
introduit cette subtilité.

Probabilités objectives versus subjectives


Les probabilités sont-elles dans ce contexte objectives ou subjectives (ou épistémiques) ?

C'est une question souvent évoquée. On parle de probabilité objective lorsque l'on observe un véritable système
aléatoire et de probabilité subjective lorsque l'on parle d'un système déterministe et d'une simple interprétation, p
l'expérimentateur, d'un comportement probabiliste suite à une méconnaissance des mécanismes microscopiques.
Le comportement statistique des molécules de gaz dans la physique statistique classique, conduisant aux lois de
physique des gaz et de la thermodynamique, obéissent à des probabilités subjectives dues au fait que l'on ne peu
pas suivre le mouvement individuel de chaque molécule bien que celles-ci aient un comportement parfaitement
déterministe (au moins dans l'approche classique où chaque molécule est assimilée à un petit corpuscule).

On dit que les interprétations avec réduction utilisent des probabilités objectives alors que les interprétations ave
mondes multiples utilisent des probabilités subjectives (puisque, en réalité, chaque monde existe simultanément
toute probabilité est égale, objectivement, à un, ce que nous avions signalé au début).

Mais cela a-t-il un sens physique de dire que c'est, ici, subjectif ou objectif ? Il ne faut pas oublier que ces deux
ensembles d'interprétations décrivent le même monde physique décrit par la même théorie (la mécanique
quantique) !

En réalité, ce qui est objectif, ce n'est jamais les probabilités mais uniquement la mesure des résultats. Et les
résultats, mesurés, ont toujours des valeurs définies, que ce soit la valeur précise obtenue après réduction ou que
ce soit la valeur précise observée par l'expérimentateur dans le monde considéré (ou dans sa composante intriqué
avec la composante obtenue par la mesure dans la théorie nue des états relatifs). Les probabilités sont des
prédictions purement mathématiques de distributions numériques de résultats ou un calcul mathématique
(statistique) effectué sur un ensemble de résultats mesurés.

Si l'on considère le point de vue d'un seul monde, celui où nous constatons un ensemble donné de résultats après
mesures, on a une distribution observée selon une certaine loi de probabilité, c'est objectif selon le sens
habituellement attribué à ce mot lorsqu'il s'applique aux probabilités.

Si l'on considère le point de vue de l'ensemble des mondes, toutes les distributions statistiques existent
simultanément et la distribution sur les mondes est totalement arbitraire donnant un caractère subjectif aux
probabilités.

Cette contradiction n'est qu'apparente puisque ces probabilités sur les mondes sont une partie de la description
mathématique et le caractère subjectif ou objectif tient seulement à la manière dont cette description est appliqué
aux données physiques objectives.

Cette difficulté d'attribuer un caractère objectif ou subjectif aux probabilités se retrouve dans une interrogation
tout à fait analogue : "comment justifier le caractère indéterministe observé alors que l'interprétation est
strictement déterministe plus une règle peut être probabiliste mais qui n'a qu'un caractère mathématique, pas
physique ?"

Imaginons que la théorie prédise le dédoublement en deux mondes, un observateur se retrouve alors dans chaque
monde. L'observateur (nommé A) dans le premier monde voit le phénomène X et l'observateur (nommé B) dans
deuxième monde voit le phénomène Y. La théorie peut prédire qu'un exemplaire de l'observateur verra X et un
autre verra Y. Mais la théorie ne peut pas prédire (avec certitude) que l'observateur (initial) verra X et pas Y (par
exemple) car pour cela elle doit préciser de quel exemplaire de l'observateur (A ou B) elle parle ! Si l'observateu
disons B, regarde ce qu'avait dit la théorie il pourrait dire que celle-ci s'est trompée. Il peut dire "la théorie avait
prédit X et je vois Y". Ou alors il peut dire "la théorie avait prédit que l'on verrait X et Y mais je ne vois que Y".
Par contre il peut aussi dire "la théorie avait prédit que j'avais une certaine chance, moi, un des exemplaires,
d'observer Y et c'est ce que j'observe".
De ce point de vue, les probabilités sont subjectives, une "illusion" statistique due à l'échantillonnage des monde
(l'observateur B qui raisonne est dans un seul monde). Mais ce qu'il observe est concret et les probabilités qu'il
mesure sont objectives.

Le caractère subjectif n'est qu'une conséquence de la manière de voir les choses (ici à travers les mondes
multiples). Les mesures sont toujours objectives mais le caractère objectif ou subjectif des probabilités dans une
interprétation est une conséquence d'un "choix mathématique" (le choix de la description, de l'interprétation, du
point de vue adopté).

Le formalisme de base de la mécanique quantique est déterministe et non probabiliste, toute probabilité que l'on
peut en déduire est subjective, comme dans le cas des modes multiples. Ce n'est qu'en attribuant un caractère
objectif à la réduction que les probabilités le deviennent.

Résumé et Conclusions
1) C'est la description (mathématique) qui a introduit le mystère. En changeant la description, en changeant de
concepts et en leur appliquant une ontologie, on a introduit une difficulté qui n'était qu'apparente. La physiqu
n'a pas changé, elle est exactement la même.
2) Appliquer correctement la règle mathématique (de Born) implique seulement de voir comment l'insérer dans
description mathématique. Voilà qui est fait.
3) En fait, la solution était simple et si on ne l'a pas compris plus tôt c'est sans doute pour des difficultés
philosophiques liées au concept de "mondes multiples". On recherche une interprétation de la mécanique
quantique et on donne aux éléments interprétatifs un caractère physique à travers des éléments ontologiques,
ce qui peut être extrêmement trompeur. Voir que ce problème était lié à une confusion entre physique et
mathématique n'était peut-être pas si évident !
4) L'avantage est d'avoir une explication extrêmement simple, qui ne concerne que la description mathématique
et pas la physique qui reste celle décrite, à la base, par la mécanique quantique.
5) Nous n'avons pas eut besoin d'introduite un postulat physique spécial, propre aux mondes multiples, mais
simplement de comprendre la description mathématique conforme à la physique.
6) Nous n'avons pas eut besoin de faire appel à des concepts philosophiques, à des concepts physiques non
justifiés ou à des aspects dynamiques complexes.
7) Enfin, nous n'avons pas besoin de justifier le caractère objectif ou subjectif des probabilités.
Etats relatifs
Revenons maintenant à l'interprétation relationnelle. Nous avons soulevé un certain nombre de problèmes que
nous pouvons résumer.
 Le caractère aléatoire de la mesure n'est pas expliqué.
 Il existe une base privilégiée.
 La contrainte de consistance viole l'interprétation relationnelle.

Une solution à ces difficultés se trouve dans l'interprétation des états relatifs d'Everett. Les états relatifs sont une
interprétation introduite par Everett pour tenter de résoudre les problèmes liés à la réduction de la fonction d'ond
Dans cette interprétation on reprend le formalisme de base et on supprime purement et simplement le postulat de
réduction.

Notons que dans notre approche réaliste, concernant la nature de la fonction d'onde ψ , nous avons bien dit que l
meilleure description physique de la nature de cette fonction d'onde est simplement donnée par la formulation
mathématique de ψ . Dans ce cas, on s'écarte forcément de l'approche pure et dure de l'interprétation relationnell
("à la Rovelli") et on est poussé irrémédiablement vers les états relatifs, comme nous l'avions déjà signalé lorsqu
l'on considère l'état quantique complet ψ comme la racine de l'ontologie plaquée sur la mécanique quantique.

Rappelons comment on procède en utilisant le schéma de mesure de von Neumann.

Supposons que le système S peut se trouver dans deux états de base "position x1 " et "position x 2 ", respectiveme
x1 et x 2 . L'observateur O est initialement dans l'état initial 0 . Il mesure l'état du système, c'est-à-dire se
retrouve dans un état corrélé, respectivement allumé et éteint pour les deux états de base du système. Si le
système est, par exemple, dans l'état " position x1 ", le processus de mesure est donné par :
0 x1 → allumé x1
Et si le système est dans l'état " position x 2 " :
0 x 2 → éte int x 2
Dans les deux cas, l'observateur se retrouve dans un état défini correspondant à la mesure de l'état du système.
Si le système est maintenant dans l'état superposé x1 + x 2 , la linéarité de la mécanique quantique nous donne
0 ( x1 + x 2 ) → allumé x1 + éte int x 2

Dans l'interprétation des états relatifs, on ne suppose pas qu'une seule des deux composantes de la superposition
subsiste après la mesure. On considère donc que l'état véritable de l'ensemble observateur - système est donné pa
allumé x1 + éte int x 2 . On ne donne pas, non plus, de caractère spécial (classique, macroscopique) à
l'observateur, celui-ci pouvant tout aussi bien être un autre système microscopique, un appareil de mesure ou un
observateur humain.

Quel statut donner à cet état superposé ? Simplement que l'état du système n'a de validité que relativement à l'éta
de l'observateur avec lequel il est corrélé. Ainsi, dans la superposition on voit que l'état "position x1 " est corrélé
avec l'état "allumé" et l'état "position x 2 " avec l'état "éteint". L'observateur ne peut pas se rendre compte de la
superposition. En sommes, il mesure bien un résultat défini mais relativement à l'état du système S. Par exemple
mesure d ' un état défini x1 x1 + mesure d ' un état défini x 2 x 2

Pour O, il n'y a pas d'autre moyen de mesurer, de déterminer l'état de S, par conséquent, quoi que fasse
l'observateur, il ne peut se rendre compte de la superposition et mesure toujours un résultat défini. La seule
manière de constater la superposition est de faire appel à un troisième observateur qui peut étudier l'état superpo
et constater la superposition par des mesures d'interférences.

Dans cette situation, l'observateur constate bel et bien une réduction de la fonction d'onde, mais cette constatatio
est totalement subjective. Elle est reliée au fait que l'observateur ne peut avoir conscience (ou plus généralement
l'information) sur l'état superposé complet qui l'inclut.

Comme Everett le dit "la théorie formelle est objectivement continue et causale, bien que subjectivement
discontinue et probabiliste."

Revenons à notre schéma relationnel où O mesure S et où O' mesure l'ensemble O-S.


Lorsque O effectue une mesure sur S, il se retrouve dans la même situation que celle décrite dans l'interprétation
des états relatifs. A un état précis de S, c'est-à-dire à une composante quelconque de l'état de S dans une base
donnée correspond un état précis de O. L'ensemble à la structure d'un état relatif, c'est-à-dire un état superposé
mais qui pour O correspond à une valeur définie de S car il n'a pas accès à toute l'information sur l'état complet d
l'ensemble O-S.

Pour O', avant la mesure, l'état correspondant de O-S est bien cet état superposé. Toutes les situations possibles d
mesure de O sont équivalentes : mesure de x1 , mesure de x 2 , mesure de l'impulsion précise p1 , mesure de p 2 ,
etc. En effet, tant que l'on considère des états microscopiques (tant que nous ne sommes pas à même de considér
des systèmes hautement complexes comme des systèmes macroscopiques) toutes les superpositions sont
équivalentes, il n'y a pas de base privilégiée. En fait, ceci est valable également pour un système macroscopique,
rien de particulier ne les différenties, si ce n'est que dans ce schéma idéal de mesure les systèmes sont totalemen
isolés ce qui est en pratique impossible pour des systèmes macroscopiques.

Ensuite, O' effectue une mesure de S-O et c'est cette fois l'ensemble O'-(S-O) qui prend cette structure d'état rela
dans laquelle O' mesure un état défini ou plus exactement a un état corrélé à celui de S-O.

Avec cette description, tous les problèmes de l'interprétation relationnelle disparaissent :


 Il n'y a plus de problèmes dans le fait qu'un résultat plutôt qu'un autre est obtenu par O lors de la mesure
puisque l'état obtenu est un état superposé relatif, tous les résultats existent dans la superposition.
 Il n'y a plus nécessité d'avoir une base privilégiée car on ne doit pas séparer (ou "réduire") les composantes.
 Le lien entre ce que mesure O' et l'état S-O est immédiat puisque pour O', avant mesure, l'état de S-O est bien
le même que celui de l'état relatif S-O. La différence entre l'état considéré par O' (un état superposé) et l'état
S considéré par O (un état défini) est subjectif et simplement dû au fait que O n'a pas accès à toute
l'information sur l'ensemble S-O auquel il appartient. La règle de consistance de l'interprétation relationnelle
trouve son explication dans la superposition et la linéarité de l'évolution des états.

Ainsi, considérons l'état relatif superposé de O et S. Une des composantes est "O mesure la position x1 de S".
Ensuite, O' mesure l'état superposé de S-O et se retrouve lui-même dans un état superposé dont une des
composantes sera "O' mesure la position x1 de S et constate que O a mesuré la position x1 ". Il y a toujours
cohérence entre les résultats de O et O' malgré que les points de vue de O et O' sont différents et malgré l'absenc
de propriété absolue pour S et malgré le caractère limité des informations transmises par la mesure et contenue
dans les états quantiques décrivant les différents systèmes et observateurs.

L'interprétation ainsi construite mixe donc les interprétations relatives et relationnelles. On peut aussi dire que
nous avons complété l'interprétation relationnelle par les états relatifs ou que nous avons donné une description
relationnelle de l'interprétation des états relatifs.

Tout cela sera plus clair à l'aide d'une représentation schématique de ce qui se passe.

Processus de mesure :

Processus de mesure d'autres résultats :


Toutes ces possibilités sont sur le même pied d'égalité que la première. En fait, l'état de S n'est pas x1 mais l'ét
superposé x1 + x 2 = p1 + p 2 = L et il n'y a aucune raison d'affirmer que l'état de S est modifié suite à
l'information obtenue par O (elle pourrait l'être, bien sûr, avec une mesure moins "parfaite") et, de plus, la valeur
de S ne peut être prédéterminée car l'état superposé ne représente pas de l'ignorance. Donc tous ces résultats son
aussi réels les uns que les autres mais simplement O n'est pas en mesure de s'en rendre compte car son état est
strictement corrélé à celui de S après la mesure.
Le résultat est plus clair si O est un système microscopique comme un autre électron car on n'est pas confronté a
problème des bases privilégiées rencontrées avec les systèmes macroscopiques. L'état final de O est aussi un éta
superposé, corrélé à celui de S. Mais ici, nous adoptons un point de vue "extérieur" car O n'est pas à même de se
rendre compte de cette situation (en analysant cette situation nous sommes, nous lecteur, dans la situation de O'
constatant que O et S sont corrélés). Pour O le résultat est toujours défini et corrélé à celui de S, comme dans les
premières figures, car les différentes composantes sont indépendantes, elles évoluent indépendamment et sans
interférer suite à la linéarité de la mécanique quantique, sauf intervention d'un observateur extérieur. Ceci nous
amène au point de vue de O'.
Les différentes possibilités que l'ont voit à droite ne sont pas différentes réalités mais une seule dont les différent
composantes sont déconnectées par l'évolution linéaire. Les différentes composantes correspondent à une partie
la réalité qui ne peuvent pas se connaître. Evitons le raisonnement anthropique qui dirait "O doit forcément n'avo
qu'un seul résultat, de son point de vue unique". On a "O mesure x1 " et "O mesure x 2 " et "O mesure p1 ",… Et
même "O mesure x1 et uniquement x1 , c'est la réalité pour lui, il avait telle probabilité de mesurer ça et l'état du
système a subit, pour lui, une réduction", etc.
Cela explique donc les résultats définis des mesures et l'existence (apparente) d'une réduction. La mécanique
quantique relationnelle suffit d'ailleurs à expliquer cette réduction apparente et, heureusement, l'introduction de
l'interprétation des états relatifs ne modifie pas cette conclusion et la rend même plus claire.

Lorsque O' effectue la mesure, il se trouve dans la même situation que O lorsqu'il a mesuré S. Il trouve un résult
défini correspondant à celui que O avait mesuré. Plus précisément, il se retrouve corrélé avec S-O et a donc un
état correspondant à celui de S et celui mesuré par O. L'état correspondant est à nouveau une superposition que O
ne peut détecter, que seul un observateur extérieur O" pourrait considérer, mais toutes les composantes ont une
réalité identique.

Revenons sur l'absence de base privilégiée. Celles-ci devront s'expliquer ultérieurement dans le cas de systèmes
plus complexes, "classiques". Le résultat a une ontologie assez étonnante, l'état S peut se décrire comme
différentes sommes. Ainsi les états " x1 ", " x 2 ", " p1 ", " p 2 ", sont tous valables. Mais le résultat n'est pas la somm
de toutes ces composantes possibles. Le résultat, c'est-à-dire l'état de S pour O avant mesure, est seulement la
somme " x1 " plus " x 2 ". Mais cet état est totalement identique à " p1 " plus " p 2 ", et il n'y a pas de raison de
privilégier une base plutôt qu'une autre.

Toutefois, bien que l'ontologie associée à l'état soit assez spéciale, elle est assez facile et on y retrouve des aspec
intuitifs (comme une affirmation "O mesure la position x1 " même si l'on y adjoint "est une partie de la réalité").
Les aspects les plus étranges (l'absence de base privilégiée donnant un mélange étrange et assez peu "naturel" de
états) se résoudront plus tard car l'existence de bases privilégiées pour les systèmes classiques fait disparaître ces
curiosités pour les objets classiques, c'est-à-dire ceux auquel notre intuition est habituée.

Revenons sur l'impossibilité pour O de savoir qu'il est dans un état superposé. Du point de vue de O (on devrait
dire "des points de vue de O", notre langue est parfois assez pauvre pour exprimer des situations aussi
inhabituelles, c'est une partie des difficultés des interprétations), le résultat obtenu est parfaitement défini (par
exemple la position x1 ) et il n'est pas en mesure de constater les autres composantes étant donné que pour tout
système décrit par la mécanique quantique, la linéarité implique que chaque composante évolue indépendammen

Une auto-mesure est en principe impossible. C'est-à-dire une mesure de O par O. Il n'y a pas de sens à parler de
corrélation avec soi-même ou plus exactement cela ne change rien. Cela ne fait qu'étendre le raisonnement à
chaque composante comme lorsque nous avons discuté des états relatifs. Par exemple un état du genre :

|J'ai mesuré la position x1 et rien que la position x1 , pas la position x 2 , et si "je me regarde", dans un miroir, par
exemple, je me vois ayant mesuré la position x1 et rien d'autre, je suis corrélé avec moi-même>
+
|J'ai mesuré la position x 2 et rien que la position x 2 , pas la position x1 , et si "je me regarde", dans un miroir, par
exemple, je me vois ayant mesuré la position x 2 et rien d'autre, je suis corrélé avec moi-même>

Notons que le schéma que nous avons étudié est relativement simple et est en plus hiérarchique. On peut imagin
des structures bien plus compliquées, en réseau, d'observateurs effectuant différents types de mesures à différent
moments des autres observateurs/systèmes ou de groupes de tels acteurs.

Pour illustrer l'impossibilité d'une mesure à l'aide d'une structure non hiérarchique, imaginons le processus
suivant.

O mesure la position de S. O souhaite savoir s'il a bien obtenu un état défini ou bien s'il se trouve dans un état
superposé. O' effectue donc une mesure sur O afin de le déterminer. Puis, enfin, O mesure O' afin de connaître le
résultat et donc son propre état (c'est-à-dire que O' communique à O ce qu'il a constaté).
Voici une représentation schématique de ce qui se passe. Par simplicité, nous avons nommé de la même manière
tous les états et nous ne considérons qu'une seule base.
Le dernier résultat est une conséquence de la linéarité de la mécanique quantique.

On voit clairement que O ne peut pas se rendre compte de son propre état superposé, même par ce biais l'auto-
mesure complète est impossible. L'état de O au final est du genre :
|J'ai mesuré la position x1 de S, et rien que ça, comme me l'a confirmé O' qui a pu m'observer>+
|J'ai mesuré la position x 2 de S, et rien que ça, comme me l'a confirmé O' qui a pu m'observer>

Notons toutefois que d'autres situations de mesure sont possibles. Ainsi, O' peut décider, au lieu de mesurer un
résultat définis, d'effectuer des mesures d'interférences sur S-O (du moins si ce ne sont pas des systèmes
macroscopiques, auquel cas l'idéalisation de systèmes parfaitement isolés nécessaire à ce type de mesure est
utopique). O' peut alors déterminer que O est dans un état superposé et ne fait que confirmer l'existence de la
superposition. C'est semblable à l'usage de l'observable C qui permettait de mesurer la corrélation. O' se retrouv
alors dans un état |J'ai mesuré que O est dans un état superposé> et peut communiquer l'information à O. Certain
informations sur la superposition peuvent donc être obtenues par O.

Toutefois, il n'existe pas d'observable donnant l'état complet, c'est-à-dire la valeur exacte de l'état dans l'espace d
Hilbert de tout le système (observateurs et système). Tout observable implique des "projections" (prendre une
partie de l'espace de Hilbert). Ainsi, une mesure des interférences ne peut se faire que sur un ensemble de
systèmes préparés (par exemple un grand nombre de photons dans l'expérience d'interférence de Young) et des
mesures de l'état final.

Ce que va mesurer O', par exemple, c'est que s'il prend des systèmes identiques O1, O2, O3, … et des mesures
répétées, alors il constate que l'état qui décrit chacun de ces systèmes est donné par une superposition. L'ensemb
O1-O2-O3-… se trouve dans la même situation que O dans le schéma d'auto mesure ci-dessus. O1 demandant
ensuite l'information à O', pourra alors dire quelque chose comme : "si j'admets que O2, O3, etc. étaient dans le
même état que moi alors nous étions dans un état superposé mais lorsque O' m'a observé, il a trouvé un résultat
défini". L'information qu'il a de son état superposé est donc épistémique (déduction sur base du fait que O' a
préparé des systèmes identiques et des résultats effectués sur l'ensemble des systèmes) et non directe (la mesure
O1 donne, subjectivement, un résultat défini). C'est d'ailleurs ainsi que l'on construit la théorie, la mécanique
quantique !
Bref, O a une connaissance incomplète de lui-même ou plus exactement chaque composante ne connaît pas les
autres, et considère une réduction qui n'existe pas. Plus précisément, elle existe pour lui mais pas pour O'. Comm
le dit Laudisa :
Cette observation est remarquablement consistante avec la manière sous laquelle la réduction du vecteur d'état
est justifiée dans l'interprétation relationnelle de la mécanique quantique. Quand le système S+O est considéré
point de vue de O', la mesure peut être vue comme une interaction dont la dynamique est totalement linéaire,
tandis que du point de vue de O, la mesure brise l'évolution linéaire de S. L'évolution linéaire ne se brise pas à
travers des bonds physiques mystérieux dû à des effets inconnus mais simplement parce que O n'a pas une
description dynamique complète de l'interaction. O ne peut pas avoir une description complète de l'interaction d
S avec lui-même (O) car son information est une information de corrélation et il n'y a aucun sens à être corrélé
avec soi-même. Si nous incluons l'observateur dans le système, alors l'évolution est encore linéaire mais nous
traitons maintenant avec la description d'un observateur différent.

Séparabilité
Avant d'aborder des cas plus complexes, il est nécessaire préciser ce que deviennent certaines notions dans le
cadre relationnel.

Considérons l'état intriqué de deux particules 1 et 2 pouvant prendre chacune deux états impulsion p1 et p 2 :
S = 1, p1 2, p1 + 1, p 2 2, p 2

Les deux particules sont habituellement dites non séparables car si la mesure sur 1 donne p1 (ou p 2 ) alors la
mesure sur 2 donne aussi p1 (ou p 2 ). Les deux particules peuvent prendre (avec une chance sur deux) les états
et p 2 mais les deux particules sont indissolublement liées.

L'espace de Hilbert correspondant est dit "non séparable" car on ne peut le représenter comme un produit de deu
espaces de Hilbert, un pour chaque particule, H = H 1 ⊗ H 2 (comme on l'a déjà vu, l'espace correspondant
contient toutes les "paires", pour chaque état de H 1 et chaque état de H 2 ). L'état du système correspondant sera
alors
S = ( 1, p1 + 1, p 2 )( 2, p1 + 2, p 2 )
qui n'est pas l'état donné ci-dessus mais l'état de deux particules indépendantes, comme nous l'avons déjà vu.
Mais dans le cadre de l'interprétation relationnelle, cette description n'est pas totalement correcte. L'état n'est pas
absolu, il dépend de l'observateur. Nous devons donc réviser notre concept de séparabilité.

Commençons d'abord par préciser la localité pour laquelle nous adoptons la définition suivante, fort proche ou
identique à celle rencontrée habituellement.

Localité
Lorsque deux événements (par exemple des mesures) sont séparés par un intervalle spatial (au sens de la
relativité), alors ces événements ne peuvent être liés de manière causale. C'est-à-dire que la réalisation d'un
événement ne peut influencer la réalisation de l'autre événement. Dans le cas contraire, on dira qu'il y a non-
localité.

Par exemple, si la localité est respectée, le résultat d'une mesure ne peut influencer le résultat d'une autre mesure
séparée par un intervalle spatial.

Bien entendu, les deux événements peuvent être liés par leur passé commun.

On peut aussi dire qu'une interprétation est locale si aucun signal ne peut transmettre d'information sur un
intervalle spatial, que cette information soir utilisable ou non (par exemple, dans l'interprétation transactionnelle
les ondes avancés, non locales, permettent d'établir la transaction et portent donc une information sans pouvoir
être utilisée par un expérimentateur pour transmettre des informations utiles).

Il est évident que si les deux mesures sont effectuées par des observateurs (spatialement) séparés, étant donné le
caractère relationnel (l'information dépend de l'observateur) et en l'absence d'une interaction pouvant se propage
plus vite que la lumière, l'interprétation relationnelle est locale. N'oublions pas que nous élaborons une
interprétation respectant la relativité. Par conséquent nous sommes bien dans ce cas de figure.

Nous étudierons plus tard les conséquences de la localité dans le cadre du paradoxe EPR.

Revenons à l'inséparabilité.
Etant donné le caractère relationnel, nous ne pouvons pas envisager la séparabilité de manière globale, absolue,
comme nous l'avons fait ci-dessus en considérant l'état du système indépendamment de tout observateur. Nous n
pouvons envisager la séparabilité que via des observateurs locaux des deux sous systèmes 1 et 2. D'où une
nouvelle définition.

Séparabilité
Soit l'ensemble des mesures qui peuvent être effectuées sur le système complet (par exemple les mesures de
l'impulsion dans l'état ci-dessus). S'il est possible d'effectuer les mesures localement (au sens précédent), à l'aide
de deux observateurs, sur les systèmes 1 et 2, alors le système est dit séparable.

Cette définition est extrêmement simple et beaucoup plus faible que la définition précédente. En fait, on ne peut
guère donner une définition plus évidente de la séparabilité !

Mais le caractère relationnel empêche d'avoir une vue globale (en cas de systèmes séparés spatialement) et donc
est difficile de faire mieux.

On voit deux choses :


 Si les mesures ne sont pas spatialement séparées, l'ensemble pourrait très bien ne pas être séparable.
 Si les mesures peuvent être spatialement séparées, alors le système est automatiquement séparable de par le
principe même de la mesure et la définition de la localité que nous avons adoptée.

Tout cela sera mis en lumière par l'étude de cas concrets (paradoxe EPR).

Description versus processus


Il ne faut pas non plus confondre description locale et processus locaux. Lorsque nous décrivons une boule de
pétanque en donnant la position de chaque atome, notre description n'est pas locale. Nous donnons la position
simultanée de chaque atome. Cela ne veut pas dire que la boule de pétanque viole la relativité !

Ce sont les processus (interactions physiques, relations et échanges d'informations) qui doivent être considérés
(comme ci-dessus) dans la définition de "interprétation locale ou non".
Notons que la description peut être locale si chaque composante (par exemple chaque atome) peut se faire
indépendamment du reste. Cela n'est possible que si c'est séparable. Et la situation est plus délicate en mécaniqu
quantique à cause de l'intrication. Nous avons deux séparabilités différentes. Un séparabilité faible, décrite ci-
dessus, reliée aux processus relationnels de mesure et une séparabilité forte, liée à une description globale (l'état
quantique complet, l'état relatif). Notre interprétation admet une description locale des processus mais l'état glob
est non séparable et donc sa description est non locale. Ce n'est toutefois qu'une description, comme celle de la
boule de pétanque, et on doit pouvoir passer de la description d'un repère à l'autre par une transformation de
Lorentz. La description globale non locale n'est valable que dans un repère donné et cela revient, en relativité, à
choisir un repère pour la description. Nous verrons cela plus loin.

Propagation de l'information
Soit un système S et deux observateurs A et B qui désirent acquérir de l'information sur S. Les trois sont situés à
des endroits différents.

A effectue une mesure sur S. Cette mesure consiste en une interaction utilisant tout type de procédé : un échange
d'ondes électromagnétiques, un électron se déplaçant de S vers A, etc. Peu importe le processus, tous respectent
covariance relativiste et donc le déplacement a vitesse finie et même inférieure à c . Mieux, la relativité nous dit
que tout transfert d'information ne peut se faire qu'à une vitesse inférieure ou égale à c . Nous choisissons, bien
sûr, de respecter ce principe.

B souhaite également obtenir de l'information sur S. Il peut le faire de trois manières.


 Il effectue une mesure directement sur S. Dans ce cas, nous sommes ramenés au cas précédent, la relativité e
respectée.
 Il effectue une mesure sur A, après que celui-ci a lui-même effectué une mesure sur S. Dans ce cas, la mesur
sur A respecte aussi la relativité et donc le transfert d'information de S vers B en passant par A respecte
également la relativité.
 Enfin, il effectue des mesures sur un système S' possédant une information (en partie) analogue à celle de S.
Par exemple S et S' peuvent être intriqués. Nous étudierons plus tard le cas de l'intrication avec le paradoxe
EPR. Ce que nous pouvons cependant déjà dire est que cela ne peut arriver que si S et S' ont un passé
commun, source de cette information. Ce passé commun ne peut être réalisé que dans le cône relativiste du
passé commun à S et à S'. De plus, nous savons déjà que l'intrication quantique ne peut être exploitée pour
transmettre instantanément de l'information. Dans ce cas, la relativité est également respectée.
Nous constatons donc que si les interactions respectent les lois de mécanique quantique relativiste, l'interprétatio
relationnelle elle-même n'introduit pas de violation de la relativité, c'est-à-dire qu'elle n'introduit pas de
phénomène non local.

Au vu de ce que nous avons vu jusqu'ici, ce n'est pas une surprise.

Mieux encore. Dans le cas de B qui mesure A qui avait mesuré S, on voit que l'information se propage de proche
en proche via une chaîne d'interactions / mesures ou via le transfert (le déplacement) du système. L'interprétation
une formulation intrinsèquement locale, ce qui est idéal pour une interprétation relativiste.

Super Observateur
L'inconvénient de l'interprétation que nous venons de voir est que chaque vue (d'un observateur) est partielle (et
variable dans le temps). On n'a jamais une vue globale de l'univers tel qu'en souhaiterait un physicien élaborant
une théorie dans le cadre de la cosmologie quantique, par exemple. Et cet inconvénient est incontournable, il fait
partie même de l'interprétation et de son caractère local et relatif.

Comment avoir une vue unifiée ?

Nous introduisons pour ce faire le concept de "super observateur". C'est-à-dire d'un observateur rassemblant les
vues de tous les observateurs. La vue d'un observateur qui aurait l'étrange faculté de se "mettre dans la peau" de
chaque observateur.

Est-ce que cette approche est en contradiction avec l'interprétation relationnelle ? Non, si ce super observateur
n'est pas et ne peut pas être un observateur physique. D'ailleurs, nous n'exigeons pas, comme c'est le cas des
véritables observateurs, qu'il obtienne ses informations par la mesure. Ses informations sont celles des
observateurs réels, réunis.

Une telle vue est moins radicale que celle de Rovelli qui se refuse à une telle approche car non physique. Nous
sommes plus souples de ce point de vue.
Attention toutefois aux inconsistances. Il ne faudra jamais agir comme si ce super observateur était réel ! Il n'est
qu'une représentation symbolique de la manière dont nous désirons obtenir une description globale de l'univers.
C'est l'aspect le plus délicat et un dérapage est vite arrivé !

Cette vue globale nous l'avons déjà esquissée dans la présentation de l'interprétation en montrant comment sont
états avant et après mesure pour chaque observateur (les différents schémas dans la partie intitulée "états relatifs
En sommes, c'est nous qui avons joué le rôle de super observateur. Mais nous-mêmes ne faisions pas partie du
monde imaginaire (de l'expérience de pensée) couchée sur le papier.

Déjà au début, pour effectuer la présentation de la mécanique quantique relationnelle, nous sommes partis d'un
état initial d'un électron. Mais de quel point de vue s'agissait-il puisqu'en mécanique quantique relationnelle on
doit toujours spécifier un observateur ? En fait c'est tout simplement celui du super observateur ! Un état imposé
de manière "extérieure" par le théoricien pour effectuer sa présentation. Même si nous avons justifié la possibilit
d'obtenir cette information par la mesure par la suite pour vérifier qu'elle avait un sens physique réel (c'est
indispensable pour vérifier si ce super observateur "non physique" n'introduit pas d'inconsistance, des situations
qui ne pourraient être obtenues par de véritables observateurs). Le super observateur est une métacollection
d'informations qui sont forcément obtenues, individuellement, par la mesure.

Une telle position, en présentant l'interprétation, est inévitable. On joue en sommes le rôle d'un "méta"observateu
Tout comme l'est Rovelli lui-même quand il présente son interprétation. Bien sûr, dans la situation physique qu'i
présente, Rovelli n'est pas présent ! Mais Rovelli existe et a couché sur papier cette situation physique,
globalement. Cette simple possibilité montre que le super observateur n'est pas un concept irréalisable.

On peut faire une analogie avec la relativité. Là aussi seul un observateur précis peut y effectuer des mesures
physiques données et là aussi il ne peut communiquer ses informations qu'à vitesse finie. Et pour attribuer des
valeurs quantitatives aux événements (position, instant), il faut choisir un repère et donc un observateur (qui
construit ce repère, se place à l'origine et utilises ses étalons de longueur et ses horloges). En fait, cette situation
que nous rencontrons avec l'interprétation relationnelle est tout à fait classique ! Chaque observateur a une vue
différente (par exemple de l'écoulement du temps) et n'a accès qu'on son cône de lumière.

Mais cela n'empêche pas une description unifiée utilisant l'espace-temps de Minkowski. Cet espace-temps, dans
globalité, ne correspond pas à un observateur physique, ceux-ci n'ayant qu'une vue très restreinte. Cela n'empêch
pas cette vue globale d'être extrêmement utile. Sans elle, décrire la relativité serait passablement ardue. Cette vu
globale est celle du physicien, du théoricien qui modélise la théorie. Cette vue globale est celle de la théorie.

Bien entendu, pour passer à un usage concret, il faut choisir un observateur réel, physique. C'est vrai de la
relativité, mais aussi de l'interprétation relationnelle.

Notons que pour la séparabilité, nous avons vu deux définitions. Une définition disant que l'état intriqué est
inséparable, c'est la vue du super observateur, et une définition plus faible, basée sur la mesure et les observateur
physiques considérant l'état intriqué comme séparable. Les deux ne sont pas contradictoires car il s'agit bien de
deux points de vue différents et nous choisissons d'adopter la définition liée aux observateurs réels c'est à dire
celle d'une "séparabilité physique". Nous avions déjà effleuré cette distinction dans l'avertissement concernant la
localité de description à ne pas confondre avec la localité des processus.

Encore faut-il construire cette vue unifiée !

Description globale
Nous n'allons pas décrire ici l'analyse complète permettant de reconstruire la vue globale. Nous
n'allons prendre que quelques exemples relativement simples et conclure (de manière d'ailleurs
assez évidente). Nous avons déjà cité les travaux de logique quantique montrant que l'état global
peut être reconstruit à partir de l'ensemble des corrélations internes d'un système. Formellement
c'est assez compliqué à démontrer mais intuitivement c'est assez simple.

Système isolé S
Le système S est simplement décrit par son espace de Hilbert H S et son état S . Il n'y a pas d'autre possibilité.

Par exemple, dans le cas de l'espace de Hilbert à deux dimensions pour deux impulsions possibles, on a une base
p1 , p 2 . Et l'état peut varier dans le temps. Par exemple :
p1 f 1 (t ) + p 2 f 2 (t )

Où f1 et f 2 sont deux fonctions quelconques du temps donnant l'amplitude des deux états.
L'évolution est donnée par l'hamiltonien du système.

Le passage à un observateur particulier n'a pas de sens ici car S est seul.

Système avec mesure : AS (point de vue de A)


Initialement, avant la mesure, l'état de S peut-être décrit comme précédemment par un état S d'un espace de
Hilbert H S . Cet état variant dans le temps selon un hamiltonien donné.

Supposons que A mesure l'impulsion. La mesure correspond à un observable A . Après la mesure, A obtient une
information sur l'impulsion. Par exemple il obtient p1 . Il y a réduction qui, nous l'avons vu, correspond
seulement à une connaissance imparfaite de A de son propre état.

L'état S évolue dans le temps comme nous l'avons vu et la mesure se fait à un instant donné t 0 puis l'état évolu
comme avant selon son hamiltonien. L'importance de cet instant interviendra surtout pour un autre observateur q
considère l'état de A.

Cette mise en perspective du temps qui lui donne un rôle particulier n'est pas en accord avec notre souhait d'une
description relativiste. Mais nous devons procéder par étape et voir comment s'enchaînent les opérations.

Notons que la réduction est non linéaire.

L'observable considéré a un certain nombre de valeurs propres, p1 et p 2 dans l'exemple considéré.

La mesure consiste donc à appliquer à l'état un des deux projecteurs P( p1 ) ou P( p 2 ) (c'est le "ou" qui donne le
caractère non linéaire et probabiliste). Un projecteur est simplement une opération mathématique qui consiste à
sélectionner un sous-espace de l'espace de Hilbert. Par exemple, P( p1 ) sélectionne le sous-espace (à une
dimension) avec un seul état de base p1 et un éventuel état S est "projeté" sur p1 .
Notons que l'état d'impulsion appartient à H S mais H S peut-être lui-même un sous-espace d'un espace de Hilbe
plus grand décrivant le système S avec plusieurs propriétés telle que la position, la charge électrique, l'énergie,...
Le projecteur ne réduit la dimension que du sous espace considéré.

Bien entendu, rappelons-nous qu'à ce stade nous ne souhaitons pas imposer de base privilégiée. Ainsi on a d'autr
bases comme : p1 + p 2 , p1 − p 2 .

Les projecteurs correspondant projettent sur les vecteurs de base et le sous-espace correspondant.

Notons qu'à partir d'une base donnée on peut générer tous les vecteurs de l'espace de Hilbert (ou le sous-espace
considéré) et, en particulier, toutes les bases. Notons aussi que tout vecteur normalisé (pour avoir une probabilité
totale égale à un) peut être un vecteur de base et que non normalisé (simplement multiplié par un nombre) il
constitue un vecteur de l'espace à une dimension généré par ce vecteur de base. Par conséquent, cela démontre q
l'union de tous les sous-espaces réduit possibles redonne l'espace H S complet. C'est une propriété élémentaire d
espaces vectoriels (ou plus simplement des espaces admettant une infinité de bases et une décomposition unique
sur une base donnée, vous pouvez vérifier en vous amusant à prendre un état quelconque, une décomposition
donnée et en jouant avec les sous-espaces donnés par un seul vecteur de base).

Ce résultat est simple mais important et nous verrons que cela permet de retrouver la vue linéaire.

Repasser à un observateur particulier ne pose, ici, guère de problème puisque nous n'en considérons qu'un !

La vue unifiée (observateur A plus système S) peut-être considérée ici comme l'espace H S découpé en sous-
espaces dont l'un correspond à l'observation par A.

Le système est linéaire et évolue selon son hamiltonien mais la relation (l'information échangée) entre A et S ne
concerne qu'un sous-espace non spécifié a priori.

Rappelons notre analogie avec la relativité concernant le super observateur et le passage à un observateur
physique, réel, particulier.
En relativité, un observateur c'est en fait choisir un système de coordonnées (dont l'origine est éventuellement
attachée à un observateur physique). Ici, le découpage en coordonnées est en fait un découpage en sous-espaces.
La différence étant que le découpage dépend de l'observable (par exemple le sous-espace H S pour l'impulsion
que nous avons considérée) et que A ne dispose comme information que du résultat d'une projection donnée, don
d'un seul sous-espace. Par conséquent, il y a un lien intrinsèque entre ce découpage et la dynamique des
événements (des interactions, des mesures).

Notons que nous avons considéré que l'état initial de S était totalement indéterminé, c'est-à-dire une superpositio
quelconque des états de base. Il va de soit que si son état est précis, avant mesure, par exemple p1 , il n'y a plus
de sous-espace à choisir car il n'y en a plus qu'un : celui généré par p1 . Ce n'est pas un cas particulier car si
avant mesure l'état est précis, l'espace de Hilbert du système est en réalité plus restreint et dans le cas d'espèce il
n'est plus qu'à une dimension. C'est seulement une situation différente de la première avec un espace de Hilbert
différent.

Deux mesures indépendantes : AS, BS'


Cette situation est assez simple.

Les deux mesures étant indépendantes, on se retrouve simplement dans la situation précédente mais deux fois.
L'espace de Hilbert des systèmes étant H S et H S ′ , l'espace de Hilbert global est le produit des deux espaces
H S ⊗ H S ′ . De même pour les sous-espaces. Les sous-espaces de H S et H S ′ sont les produits de tous les sous-
espaces de H S et H S ′ , c'est-à-dire un ensemble de toutes les paires de sous-espaces possibles.

Choisir un observateur A particulier revient à choisir un des membres de la paire et pour B l'autre membre de la
paire.

Mesure d'une mesure : BAS


Nous nous retrouvons en fait à la fin du cas de la mesure simple où A effectue une mesure sur S.
Donc, pour B l'état de S est S d'un espace de Hilbert H S . Mais il considère également l'état de A qui est l'état
A de H A . Supposons que l'état initial de A soit A0 puis, après mesure, l'état allumé ou éte int
correspondant aux deux états d'impulsion (ou toute superposition). C'est un espace de Hilbert à deux dimensions
(ou un sous-espace à deux dimensions d'un espace plus grand).

Après la mesure de A, B sait (par déduction, c'est-à-dire information épistémique ou par mesure, nous avons vu
que cela était possible) que A et S sont corrélés. C'est-à-dire qu'ils se retrouvent dans les états allumé p1 ou
éte int p 2 ou toute combinaison.

C'est-à-dire que l'espace global A+S est obtenu par produit direct (le produit direct nécessite que les dimensions
des deux espaces soient identiques et on associe un état d'un espace à un état de l'autre et non toutes les
combinaisons possibles) : H AS = H A ⋅ H S . Chaque sous-espace de H AS est le produit d'un sous-espace de H A
avec le sous-espace correspondant (à la corrélation) de H S . C'est-à-dire une paire de sous-espaces.

Lorsque B effectue la mesure de A, de S ou de A+S il mesure un des éléments de la paire ou la paire (ce qui
revient au même vu la corrélation).

En fait, la situation est totalement identique à celle du cas précédant mais ici avec B effectuant une mesure d'un
état de H AS .

A nouveau, la vue unifiée du super observateur c'est H AS et l'ensemble de ses sous-espaces.

Pour repasser à un observateur particulier (A ou B), on choisit simplement un sous-espace particulier, par exemp
celui généré par allumé p1 . Dans le cas de A, cela revient à choisir p1 alors que lui-même est dans l'état
allumé . La structure de H AS garantit la condition de consistance de la mécanique quantique relationnelle.

Mesure des mesures : AS, BS, CA, CB


Voici un cas un peu plus compliqué. A et B mesurent S puis C mesure A et B.
La première partie est en réalité fort semblable au cas précédent. Par exemple, si A effectue la mesure avant B, A
et S sont alors corrélés et B peut effectuer la mesure de A, S ou A+S indifféremment (comme nous venons de le
voir, il sélectionne simplement un sous-espace de H AS ).

Supposons que B puisse se trouver dans les deux états oui et non correspondant aux deux états d'impulsion.
Alors l'état global après la mesure de B sera un état corrélé, par exemple oui allumé p1 .

On constate immédiatement que si B effectue d'abord la mesure, on obtient le même résultat : oui p1 puis
oui allumé p1 .

Ensuite C effectue la mesure sur l'espace S+A+B, que ce soit en mesurant A ou B, il sélectionne ainsi un des sou
espaces.

Le résultat revient simplement à ajouter "un étage" de plus dans la chaîne de mesure CBAS.

Boucle : SBAS
Revenons au cas où B a effectué la mesure de A qui avait effectué la mesure de S. Que se passe-t-il si S mesure
?

La situation est en fait fort simple. On est dans la même situation que le dernier cas où B effectue une mesure de
A qui lui-même a effectué une mesure de S et où B est lui-même mesuré par un autre observateur. L'ensemble es
décrit par H BAS dont un état typique est, par exemple, oui allumé p1 .

Si on prend un observateur S particulier, on doit sélectionner un sous-espace particulier. Par exemple, cela peut
être justement le sous-espace généré par oui allumé p1 . Il effectue donc la mesure qui lui donne pour B (et A
le résultat oui p1 .
Nous avons vu lors de l'étude du deuxième cas que cela correspond en fait pour S à un espace de Hilbert à une
dimension ou l'état est parfaitement déterminé. La mesure de B ne peut que donner oui . Tout est consistant
puisque c'est, bien entendu, l'état dans lequel se trouve B lorsque A a mesuré p1 .

Et la vue unifiée reste H BAS avec sa structure de sous-espaces.

Conclusion
On voit que, lorsque l'on reconstruit l'espace d'état complet du super observateur, on obtient en fait
tout simplement l'espace de Hilbert donné par la mécanique quantique orthodoxe pour le système
complet (l'ensemble des observateurs et les systèmes étudiés).

Les espaces d'états considérés par les observateurs sont des sous-espaces de cet espace complet et
le jeu de sélection des sous-espaces dépend de l'ordre dans lequel les mesures ont lieu.

Enfin, la consistance est assurée sans devoir introduire une règle spéciale.

La reconstruction globale de l'état global a partir de l'analyse relationnelle du réseau d'observateur


par le physicien couchant la théorie sur papier (le super observateur) montre que l'utilisation des
états relatifs est consistante (mais pas obligatoire, le purement relationnel restant une option
philosophique possible puisque le super observateur ne fait pas partie des systèmes étudiés et s'il est
vu comme un observateur extérieur effectuant des mesures sur ce réseau relationnel alors il n'a
qu'une vue partielle, relationnelle, lui permettant cette description par les états relatifs). Mais
puisque cette vue permet de résoudre les problèmes et est possible, nous l'adoptons.

Quelques remarques
Pour terminer, faisons deux remarques :
 L'interprétation physique de la fonction d'onde est claire : c'est la représentation mathématique
la plus fidèle possible de l'état réel d'un système physique. Un observateur donné n'ayant accès
qu'à une partie (un sous-espace) de cette représentation.
 La mécanique quantique est considérée ici comme complète : toute information disponible à la
mesure est incluse (décrite) dans la fonction d'onde.
Synthèse
Pour faire simple nous appellerons cette interprétation : interprétation relationnelle des états
relatifs.

 Respect du formalisme de la mécanique quantique.


Cette interprétation respecte entièrement le formalisme de base de la mécanique quantique.
 Limite.
L'interprétation s'applique sans aucune différence à des systèmes microscopiques,
macroscopiques, des appareils ou des observateurs humains voire l'univers dans sa globalité
 Principe anthropique.
Aucun rôle particulier n'est donné à un observateur particulier et certainement pas à un
observateur humain.
 Réalisme ou positivisme.
L'interprétation est réaliste car elle affirme que la fonction d'onde représente réellement l'état
physique du système. Mais étant conscient de ses limites (l'information partielle obtenue par la
mesure) il s'agit plus d'un réalisme pragmatique que d'un réalisme naïf.
 Rasoir d'Ockham.
Absolument rien n'est ajouté au formalisme de base : pas de réduction, pas de "monde", pas de
règle de consistance. On se contente d'analyser la structure de l'espace de Hilbert tel qu'il est
obtenu dans des circonstances particulières par le jeu des interactions entre systèmes.
 Bases privilégiées.
Aucune base n'est privilégiée par l'interprétation. Suivant les bases choisies, le découpage en
sous espaces est différent mais pour un système donné (avec un certain nombre d'observateurs)
l'espace complet sera le même/
 Caractère explicatif des probabilités et de la réduction.
Le caractère probabiliste et la réduction apparente sont expliqués par la connaissance imparfaite
de l'espace complet que peut obtenir un observateur lors d'une mesure. Il n'a accès qu'à un sous-
espace ce qui constitue une "réduction" de l'espace complet. Le lien entre états (sans réduction)
et le coté probabiliste de la mesure a été expliqué au début de cette section.
 Coté pédagogique.
Cette approche n'est pas des plus pédagogique. Elle reste assez complexe à manipuler, parfois
même un peu délicate, et n'est pas nécessairement la plus appropriée pour l'analyse pratique de
cas concrets en laboratoire. Elle n'a été conçue que pour satisfaire les besoins d'une
interprétation correcte de la mécanique quantique et pas pour être adaptée à l'enseignement.
 Défauts.
Aucun défaut particulier n'a été relevé.

Interprétation relationnelle des états relatifs : -1.

Il est difficile de faire mieux. Un pédagogue particulièrement doué réussira peut-être à en faire une
présentation simple pour l'étudiant, éliminant ainsi son dernier défaut.

Un tel score ne doit pas étonner : nous avons construit cette interprétation afin de satisfaire les
critères que nous nous étions fixés. Nous avons cherché volontairement à avoir ce score !

On voit ainsi qu'il est possible d'obtenir une interprétation correcte de la mécanique quantique
répondant à toute une série de critère philosophique ou physique naturel, même si la mécanique
quantique reste une théorie inhabituelle, mais, ça, on ne pourra pas le changer : elle ne fait que
décrire un monde qui, à la base, a un comportement parfois déroutant, bien différent du peu que
nous pouvons percevoir par nos sens à notre échelle. Il ne faut pas oublier qu'un être humain est un
observateur physique et, en tant qu'individu, il n'a accès qu'à une connaissance incomplète du
système complet. Ajoutons à cela qu'il n'a qu'une vue macroscopique et cela rend l'être humain
presque aveugle aux mystères du monde. Mais nous venons de voir qu'il est possible de surmonter
ce handicap et d'enlever le voile de mystère qui entourait la mécanique quantique.

Récapitulatif des scores obtenus classés en ordre décroissant.

Interprétation Score
Réduction physique -16 (ou -6)
Copenhague -10
Théorie de Bohm -9
Mondes multiples -7
Transactionnel -6
Relationnel -5
Interprétations modales -4
Histoires consistantes -4
Etats relatifs -3
Relationnel + relatif + aménagements -1

Rappelons que ce classement est très subjectif, il dépend des critères que nous nous sommes fixés
et que nous avons évalués de manière fort qualitative. On doit plus le prendre comme un guide des
objectifs que nous nous sommes fixés que comme un jugement de valeur. Toutes ces interprétations
sont respectables, ont leurs justifications philosophiques ou leurs critères de choix et ont toutes été
élaborées par des physiciens de renom. Nous ne considérons la dernière interprétation comme la
plus utile que du point de vue que nous avons choisi d'adopter et non dans l'absolu. Certaines des
autres interprétations peuvent d'ailleurs s'avérer plus utiles pour comprendre l'une ou l'autre
expérience que ce soit pour des raisons pratiques ou pédagogiques.
IV. Expériences
Nous allons examiner une série d'expériences célèbres mettant en évidence certains aspects
particuliers, étranges, étonnants ou dérangeants de la mécanique quantique.

Ces expériences sont parfois de simples expériences de pensée, appliquant seulement la mécanique
quantique à la lettre. D'autres ont réellement été réalisées.
IV.1. Le chat de Schrödinger et l'ami de Wigner
Commençons par une expérience de pensée simple et probablement la plus célèbre.

Le chat de Schrödinger
Imaginons l'expérience suivante.

Un chat est enfermé dans une boite parfaitement étanche et isolée du monde extérieur. Dans cette
boite, on a placé un dispositif contenant un atome radioactif. Cet atome est choisi de manière à ce
qu'il ait une demi-vie de 10 minutes. C'est-à-dire qu'il a une chance sur deux de se désintégrer en
dix minutes. Lorsque l'atome se désintègre, il enclenche la rupture d'une capsule de cyanure qui
libère un gaz empoisonné tuant le malheureux félin.

La question que l'on pose est celle-ci : lorsque l'on ouvre la boite, le chat est-il mort ou vivant ? Et
avant l'ouverture ?
Lorsque l'on ouvre la boite, il est bien entendu que l'on va trouver le chat soit mort, soit vivant,
avec une chance sur deux. Mais avant d'observer ce qu'il y a dans la boite ?

La mécanique quantique nous apprend que cet atome est en fait dans un état superposé "désintégré"
- "non désintégré". Ce genre de situation ne devrait plus vous paraître étrange maintenant.

Par interaction avec cet atome, le dispositif, la capsule de cyanure et le chat sont tous dans un état
superposé. Ainsi, le chat est dans un état superposé " vivant" - "mort".

Voilà qui est bien étrange ! On n'observe jamais un chat à la fois mort et vivant !

L'interprétation de Copenhague affirme que lorsque l'on effectue la mesure, c'est-à-dire lorsqu'on
ouvre la boite pour regarder, on observe un des résultats avec une probabilité donnée par la règle de
Born (ici, une chance sur deux d'avoir un chat vivant ou mort) et la fonction d'onde du système se
réduit dans l'état correspondant.

Donc, l'interprétation de Copenhague affirme que le chat est à la fois mort ou vivant et que c'est
seulement lors de l'ouverture de la boite que son état devient défini : soit mort, soit vivant.

Voilà quelque chose de bien étrange et assez difficile à accepter : quoi, quand on ne l'observe pas le
chat n'est jamais tout à fait mort ? C'est d'ailleurs ce genre de considération qui a conduit à la phrase
célèbre adressée à Bohr : "Croyez-vous que la Lune n'est pas là lorsque je ne la regarde pas ?".
Schrödinger a imaginé cette expérience de pensée pour bien illustrer ce caractère problématique de
la mécanique quantique ou tout au moins de l'interprétation de Copenhague.

L'ami de Wigner
La situation devient encore plus étrange si l'on introduit un autre protagoniste.

Celui qui effectue l'expérience est Wigner et il est lui-même enfermé (avec la boite) dans une
grande pièce bien isolée.
Un peu après qu'il a ouvert la boite pour vérifier l'état du chat, l'ami de Wigner ouvre la pièce pour
regarder ce qui se passe.

Du point de vue de l'ami de Wigner, la pièce et tout son contenu est dans un état superposé "chat
mort, Wigner voit un chat mort" - "chat vivant, Wigner voit un chat vivant" et c'est quand il
effectue la mesure, en ouvrant la pièce, que la fonction d'onde du système se réduit en un état
défini.

Voilà qui est plutôt contradictoire avec la version précédente où l'on affirmait que la réduction se
produisait quand Wigner ouvrait la boite.

La question se pose donc : à quel moment la réduction se produit-elle ? Lorsque Wigner ouvre la
boite ? Lorsque l'ami de Wigner ouvre la pièce ? Quant l'ami de l'ami de Wigner rentre dans la
maison ? Est-ce que la réduction se produit dès qu'un être conscient effectue la mesure ?

L'intervention de la conscience est assez sulfureuse et l'interprétation de Copenhague strictement


positiviste s'en sort en affirmant que la fonction d'onde n'est pas réelle et ne représente qu'un état de
connaissance du système, état de connaissance mis à jours (réduit) lors de l'ouverture de la boite ou
de la pièce. Il n'est pas totalement absurde d'avoir des fonctions d'onde différentes (réduite ou pas)
pour deux observateurs si cette fonction d'onde n'est qu'un état de connaissance.

Toutefois, cette approche ne résout pas la question de savoir quand le chat est réellement mort. De
plus, nous avons déjà vu que l'interprétation de Copenhague positiviste n'était pas exempte de
contradictions. Enfin, étant donné que les résultats de la mesure ne sont pas prédéfinis (inscrit à
l'avance dans l'état, à travers des variables cachées), se pose la question de la cohérence des
différentes connaissances des observateurs, un problème analogue à la condition de consistance de
l'interprétation transactionnelle.

Le chat, un système macroscopique


Mais pourquoi donner une telle importance à l'être humain (voire à la conscience) ? Le chat aussi
est macroscopique. D'ailleurs, l'interprétation de Copenhague parle avant tout de mesure par un
dispositif macroscopique et le chat est bien de ce type, ainsi, d'ailleurs, que le dispositif enregistrant
l'atome.

La curiosité des situations différentes de Wigner et de son ami est ainsi résolue.

Bien entendu, ici, il est difficile de parler de connaissance, d'une fonction d'onde subjective. Si la
réduction se produit à cause du dispositif de mesure, on ne peut que parler d'une réduction
physique.

On retombe sur les difficultés propres à l'interprétation de Copenhague réaliste et en particulier sur
quand et pourquoi la réduction se produit.

Certains invoquent la décohérence. C'est-à-dire la disparition des états superposés dans un système
suite aux interactions avec l'environnement et l'apparition des bases privilégiées (ici la base
"vivant" - "mort").

Il est vrai qu'un système de cette taille ne peut être totalement isolé et la décohérence est rapide et
inévitable. Il y a toujours des chocs avec des molécules d'air, du rayonnement (lumineux ou autre)
venant frapper la boite, etc.

Mais cette situation est insatisfaisante car si l'on considère le système constitué de la boite et de son
environnement (Wigner, l'air, la pièce, etc., voire tout l'univers), alors il n'y a pas d'environnement
extérieur pouvant faire disparaître la situation superposée indésirable. On se retrouve dans une
superposition de deux états "chat vivant - environnement corrélé au chat vivant" et "chat mort -
environnement corrélé au chat mort". Et la question de la réduction se pose à nouveau.

Interprétation relationnelle des états relatifs


Dans l'interprétation des états relatifs, la situation est infiniment plus facile puisqu'il n'y a jamais de
réduction !
On admet, de facto, la situation curieuse d'un état superposé pour la totalité du système. La
situation est alors analogue à celle que nous avons déjà analysée dans l'étude de l'interprétation
relationnelle et la mesure de la position d'une particule qui est dans un état superposé.

Et les états relatifs expliquent que l'on n'observe pas l'état superposé car on a une connaissance
imparfaite de l'état du système complet. Plus exactement, on a un état superposé (après ouverture
de la boite) : "chat vivant - Wigner voit un chat vivant" + "chat mort - Wigner voit un chat mort".

Mais il reste encore un truc étrange : avant d'ouvrir la boite, Wigner a-t-il une boite avec un chat
dans un état superposé ? (ou l'ami de Wigner a-t-il une pièce avec Wigner dans un état superposé
avant d'ouvrir la pièce) Si oui, alors nous avons vu qu'il pourrait, sans mesurer l'état exact du chat,
vérifier qu'il est dans un état superposé, nous avons vu qu'il existe un observable pour cela. Il
pourrait même effectuer des interférences de chat ! Voilà qui n'a jamais été fait !

En fait, ici intervient bien la décohérence. Impossible d'isoler un système aussi complexe. Wigner
mesure, même involontairement, même sans le savoir, en permanence l'état du chat, à travers les
interactions inévitables avec la boite (molécules d'air, etc.). Plus exactement il obtient de
l'information sur le chat, information dont il n'a pas conscience mais qui est encodée dans les
détails de son état et de son environnement (dans la disposition légèrement différente des molécules
d'air, etc.). L'état, avant ouverture de la boite, est une superposition des deux états "chat vivant -
Wigner avec un chat vivant dans une boite, mais il ne le sait pas encore" + "chat mort - Wigner
avec un chat mort dans une boite, mais il ne le sait pas encore".

Avec des systèmes microscopiques, on peut observer l'état de superposition avant que la mesure ou
des interactions involontaires ne la détruisent. C'est effectivement de cette manière que l'on effectue
des vérifications expérimentales de la décohérence. Ce type d'expérience est d'ailleurs parfois
appelé "expérience du chat de Schrödinger quantique" ou analogue.
IV.2. Expérience de Young
Revenons sur l'expérience de Young qui nous a tant servi et voyons maintenant comment elle est
interprétée dans le cadre des états relatifs.

Initialement nous avons donc une particule (un électron, un photon) qui est envoyée vers deux
fentes, passe à travers et atteint un écran. La particule, microscopique et se déplaçant rapidement,
peut être considérée comme étant isolée pendant tout son trajet du moment que l'on effectue un
isolement approprié (par exemple, dans le cas des électrons, un blindage magnétique et dans le
noir).

Lorsque la particule passe à travers les fentes, elle est dans un état superposé correspondant au
passage par chaque fente : F1 + F2 , puis, la particule continuant son trajet, nous avons vu que la
particule atteignait l'écran avec un phénomène d'interférence produisant des franges sombres et
claires sur l'écran. En fait, si on a une seule particule, il n'y a pas de sens à parler de franges claires
et sombres, il n'y a qu'un seul impact sur l'écran, mais on peut parler de la probabilité qu'à la
particule d'atteindre une position x sur l'écran. Ce point est l'état x affublé d'une probabilité
donnée par sa fonction d'onde, probabilité variant de point en point (alternativement une grande
probabilité et une faible probabilité correspondant respectivement aux zones claires et sombres).

En l'absence de réduction, tous les états finaux subsistent dans un état superposé :
a1 x1 + a 2 x 2 + a3 x3 + L
où chaque amplitude a1 , a 2 , ... permet de calculer la probabilité d'atteindre ce point.

Lorsqu'un observateur observe la cible afin de vérifier l'impact, il entre en corrélation avec cet état
et on a également un état superposé :
"L'observateur voit l'impact en x1 " + "l'observateur voit l'impact en x 2 " + …
avec chacun la même amplitude et cet état est à interpréter comme nous l'avons vu par les états
relatifs.
La décohérence fait que la base privilégiée est la base position et l'expérimentateur observe bien
des impacts isolés avec la distribution de probabilité appropriée.

Supposons maintenant que l'observateur installe un dispositif afin de savoir par où passe la
particule, comme nous l'avons vu. Il effectue une mesure et entre donc en corrélation avec l'état
initialement donné :
"L'observateur voit la particule passer par la première fente, état F1 pour la particule" +
"L'observateur voit la particule passer par la deuxième fente, état F2 pour la particule"

Puis, chacune de ces composantes évolue indépendamment (à cause de la linéarité) selon l'équation
de Schrödinger. Chacune de ces évolutions correspond à une propagation avec une seule fente, sans
interférence, et le résultat est un état superposé :
"L'observateur a vu la particule passer par la première fente et arriver en x1 " +
"L'observateur a vu la particule passer par la première fente et arriver en x 2 " +
etc.
"L'observateur a vu la particule passer par la deuxième fente et arriver en x1 "+
"L'observateur a vu la particule passer par la deuxième fente et arriver en x 2 " +
etc.

Chacun des deux ensembles correspond à une distribution sans interférence et donc un observateur
voyant la particule passer par une fente précise (l'une ou l'autre) n'observe aucune interférence !

Par exemple, une des composantes est "L'observateur a vu la particule passer par la deuxième fente
et arriver en x1 " qui a évolué indépendamment des autres (en particulier après la décohérence sui
supprime toute interférence entre les composantes de la base privilégiée).

Même si l'ensemble était parfaitement isolé (dispositif plus observateur, un observateur


microscopique échappant ainsi à la décohérence), un observateur extérieur (dans le style de l'ami de
Wigner) aurait face à lui un système décrit par une superposition complète, mais il n'observerait pas
non plus d'interférence car la modification de l'état de l'observateur microscopique, corrélé avec
l'état de l'électron, fait que les composantes sont différentes et n'interfèrent plus, exactement comme
ci-dessus. L'observateur extérieur n'a pas besoin d'effectuer de mesure pour que l'état du système
soit ce qu'il est. Tout est donc cohérent.
IV.3. Expérience EPR
L'expérience EPR est particulièrement importante. Outre qu'elle intervient dans beaucoup de
développements et d'expériences pratiques, elle est au cœur des fondations de la mécanique
quantique. Souvenons-nous des inégalités de Bell. Elle contient, avec les phénomènes
d'interférence, une bonne part des mystères et informations sur la nature de la mécanique quantique.
Elle intervient en outre en partie dans beaucoup d'expériences de pensées comme celles que nous
allons voir.

Nous allons donc analyser en détail cette expérience dans le cadre de l'interprétation relationnelle
des états relatifs.

Rappel
Rappelons comment s'effectue l'expérience EPR.

Une particule pouvant avoir les propriétés a ou b est initialement disponible dans un état superposé a + b .
Puis, la particule se scinde en deux particules identiques 1 et 2, s'éloignant l'une de l'autre. Nous représenterons l
propriétés des particules correspondantes par des indices. L'état du système est alors :
a1 a 2 + b1 b2

C'est un état intriqué où la propriété d'une particule est corrélée à celle de l'autre particule.

Ensuite, on effectue la mesure des propriétés des deux particules lorsqu'elles sont distantes. On effectue ces
mesures en même temps de manière à ce qu'aucun signal n'ait le temps de se propager entre les deux mesures
(intervalle spatial).

On obtient alors le même résultat des deux cotés. Par exemple, si la mesure sur la première particule donne a1 ,
alors la mesure sur l'autre particule donnera a 2 .

Le résultat n'est pas prédéterminé, c'est-à-dire qu'il n'y a pas de variables cachées dans les particules qui
prédétermineraient le résultat de la mesure.
Le processus semble violer la localité car, comment, si la mesure n'est pas prédéterminée, la deuxième particule
peut-elle fournir le même résultat si aucun signal n'est échangé ? Pourtant, l'intrication quantique ne peut pas êtr
utilisée pour transmettre de l'information plus vite que la lumière.

C'est là tout le mystère du paradoxe EPR dont nous avions déjà parlé. En particulier, l'expérience a montré que d
variables cachées locales ne marchent pas à cause de la violation des inégalités de Bell.

L'interprétation instrumentale se contente du résultat. En somme, elle dit, "c'est comme ça". C'est assez peu
satisfaisant. La plus part des interprétations peinent à donner une explication de cette situation sauf si elles viole
explicitement la localité (théorie de Bohm, interprétation transactionnelle). Dans l'interprétation transactionnelle
on suppose même explicitement l'échange d'ondes (les ondes offres et de confirmation) de manière non locale.

Voyons si ce que nous avons appris nous permet une description satisfaisante.

Interprétation relationnelle des états relatifs


Dans la description, on doit tenir compte de la séparation spatiale et donc de la propagation de l'information. En
effet, l'absence de signaux allant plus vite que la lumière ne permet pas à un seul utilisateur d'effectuer
simultanément les deux mesures. Nous avions déjà souligné que cela était important dans la description de
l'interprétation. Le plus simple est donc d'utiliser plusieurs observateurs et de décrire la séquence des événement

On aura donc trois observateurs : A, qui effectue la mesure sur la particule 1, B, qui mesure la particule 2, et C q
collectera l'ensemble des résultats pour comparaison.

Etape 1
L'état initial a été décrit ci-dessus. Les deux particules identiques forment au départ le système intriqué
(1) a1 a 2 + b1 b2
Notons qu'à ce stade, tout se passe localement, en C, et il n'y a pas besoin de faire de distinction entre l'observate
réel en ce point (C ici, mais on aurait pu mettre C ailleurs et avoir un observateur différent en ce point) et le supe
observateur.

On n'abordera pas ici la problématique de la base privilégiée et on considérera comme acquit le fait que l'on
mesure ces deux propriétés et non des superpositions. Notons que dans le paradoxe EPR les particules sont
microscopiques et qu'aucune base n'est privilégiée, on mesure en pratique de telles superpositions pour vérifier l
inégalités de Bell ou pour faire de la cryptographie. Nous avons déjà vu cela et ce qui nous intéresse ici est
seulement la raison du "lien mystérieux" entre les deux particules.

La base privilégiée et la décohérence n'interviennent qu'après. Lorsque les observateurs ont mesuré les propriété
a et b (par exemple le spin), cela se traduit par des enregistrements électroniques, des aiguilles sur un cadran etc.
Et là, la décohérence joue, rendant les enregistrements de a et b parfaitement séparés (décohérés, sans
interférences ou superposition). Cela se produisant après, nous pouvons ignorer et considérer uniquement nos
propriétés a et b comme base privilégiée. Ce sera un rien plus délicat dans la vérification de la violation des
inégalités de Bell plus loin.

Etape 2
Ensuite, les particules se propagent pour arriver à hauteur des observateurs. Durant cette propagation, l'état des
particules n'est pas altéré et l'état reste donc décrit par la relation précédente.

Arrivé à hauteur de A, celui-ci peut effectuer une mesure sur la particule 1. L'état initial de A sera noté A0 et
son état après mesure sera noté Aa et Ab selon la valeur de la propriété qu'il mesure.

Notons que A n'a accès qu'à la particule 1, tout ce qu'il peut vérifier (en utilisant, par exemple, un observable
approprié) c'est que la particule est dans un état superposé a1 + b1 . Il n'a qu'une connaissance locale de
l'information.

Il peut bien sûr avoir une connaissance épistémique de l'état global en sachant comment les particules ont été
émises ou si une information accompagne parallèlement la particule pour informer A de la situation. Cela n'est p
interdit. Par contre, depuis que la particule 2 a quitté la particule 1, elle pourrait avoir connu bien des vicissitude
sans que A le sache et aucune mesure sur la particule 1 ne lui permettrait de le savoir.

Le processus de mesure est une mise en corrélation que nous connaissons bien. Localement nous avons :
(2) A0 ( a1 + b1 ) → Aa a1 + Ab b1
Etat que nous pouvons interpréter par les états relatifs.
L'état global du système est :
(3) Aa a1 a 2 + Ab b1 b2

L'existence de cet état global n'est pas une violation de la localité car il résulte seulement de l'origine commune
des deux particules, le lien se trouve dans leur passé commun. A ne peut pas savoir que l'autre particule est
intriquée autrement que par une connaissance épistémique et pas par une mesure directe de la particule 2 qui se
trouve, à cet instant, spatialement séparée. Cet état global est d'ailleurs supposé : la particule 2 pourrait avoir sub
une altération, A ne peut pas le savoir.

Le super observateur qui a une connaissance globale constate ce lien global se "former" mais n'oublions pas que
ce super observateur n'est pas physique, nous, en tant que physicien raisonnant sur l'ensemble, jouons ce rôle ma
uniquement à travers des déductions, pas avec des mesures réelles instantanées à distance, notre connaissance es
également épistémique, par la connaissance que nous avons de l'ensemble de l'expérience.

Enfin, l'observateur A peut altérer l'état de la particule 1 mais cela n'affecte pas la particule distante. Par exemple
le processus de mesure, tout en fournissant l'information à A pourrait altérer la particule 1 et lui donner une
nouvelle propriété. L'état global serait
(4) Aa c1 a 2 + Ab c1 b2
Mais cela ne change en rien la connaissance que A a de la mesure.
Etape 3
Ensuite B effectue une mesure de la particule 2 (éventuellement en même temps que B, du moins dans un repère
donné). Tout ce que nous avons dit sur la mesure de A peut se répéter ici.

Supposons que A et B altèrent l'état de la particule. Dans ce cas l'état global après la mesure sera :
(5) Aa c1 c 2 Ba + Ab c1 c 2 Bb

Mais en réalité, B ne sait pas si A a déjà effectué la mesure, pour lui, en fonction de ce qu'il sait, l'état global est
(6) a1 c 2 Ba + a 2 c 2 Bb

Nous observateur, savons que l'état global est différent car 1 est altéré mais B ne le sait pas et ça n'a pas
d'influence, à nouveau nous avons une connaissance épistémique ou a posteriori du fait que nous connaissons le
déroulement de l'expérience : aucune information n'a voyagé instantanément pour "informer" 2 ou
l'expérimentateur que l'état de 1 a été altéré.
Etape 4
Enfin, l'observateur C reçoit l'information des deux observateurs et se retrouve en corrélation :
(7) C a Aa Ba + C b Ab Bb
(nous n'avons pas noté l'état altéré ou non des particules).

C a obtenu l'information localement, par des signaux à vitesse finie, et il constate que A et B ont eut le même
résultat pour la mesure.
Tout s'est passé localement et séparément pour les deux particules 1 et 2 (du point de vue des mesures, des
modifications des états locaux = partie de l'état global de l'ensemble) et par propagation de l'information.

Simultanéité
Que se passe-t-il si nous considérons le point de vue d'un observateur (ou un super observateur ou
l'expérimentateur) en mouvement ? Dans ce cas, la simultanéité étant relative (la mesure simultanée des deux
particules par les observateurs), l'ordre des événements peut très bien être modifié. Ainsi, les étapes 2 et 3 se
retrouvent renversée.

Peu importe quelle particule est altérée / mesurée d'abord puisque aucun signal plus rapide que la lumière ne peu
être échangé par A et B pendant leurs mesures.

Dans le premier cas, lorsque A a effectué la mesure et B n'a pas encore effectué la sienne, l'état global (en ignora
l'état des observateurs) est :
(8) c1 a 2 + c1 b2

Dans le deuxième cas, puisque l'ordre des mesures est différent, nous avons ;
(9) a1 c 2 + b1 c 2

L'état global différent, mais c'est la vue du super observateur non physique, il faut tenir compte, pour des
observateurs physiques, de ce qu'ils peuvent réellement avoir comme information. La connaissance épistémique
peut être différente car elle dépend de la déduction que l'on en fait et celle-ci dépend de la relativité de la
simultanéité. Pour C, lorsqu'il reçoit l'information, il n'a que le résultat final donné plus haut, indépendant de
l'ordre des événements. Quant aux observateurs A et B, peu importe ce qui se passe à distance, nous avons vu ce
qu'il en est de la vue locale qu'ils ont à partir des mesures.

L'ensemble de la situation est donc cohérent. La seule chose que l'on peut retenir c'est que l'état global est
différent pour le super observateur selon le point de vue global considéré (état de mouvement différent). Cela
équivaut à effectuer une transformation de Lorentz sur l'état et c'est tout à fait logique. Comme nous l'avions dit,
avoir un super observateur est équivalent à faire un choix de repère pour une description globale "simultanée" en
relativité.
Considérons un cas simple ou l'état des particules n'est pas altéré par une transformation de
Lorentz. Nous voulons surtout savoir comment l'état global (du super observateur) est, lui,
modifié selon le point de vue.

On peut décrire l'état global (sans les particules et sans C) comme suit :
A0 (1 − θ (t A )) B0 (1 − θ (t B )) +
A0 (1 − θ (t A )) Ba θ (t B ) +
A0 (1 − θ (t A )) Bb θ (t B ) +
(9) Aa θ (t A ) B0 (1 − θ (t B )) +
Ab θ (t A ) B0 (1 − θ (t B )) +
Aa θ (t A ) Ba θ (t B ) +
Ab θ (t A ) Bb θ (t B )
où θ (T ) est la fonction échelon (égale à 1 pour t > T et 0 pour t < T). Et t A , t B sont les instants de
mesure de A et B

Cet état a l'air un peu compliqué mais il est facile a comprendre. Supposons que t A < t B comme
dans la situation envisagée ci-dessus. Dans ce cas l'état (9) vaut :
- Avant mesure par A
(10) A0 B0
- Entre les deux
(11) Aa B0 + Ab B0
- Après mesure par B
(12) Aa Ba + Ab Bb

Considérons maintenant un autre super observateur correspondant à un choix différent de repère


dans lequel t ′A > t ′B . Dans ce cas, l'état de A et B n'est pas modifié, mais l'état de A, par exemple,
passe de A0 à Aa ou Ab en l'instant t ′A différent de t A . L'état (9) est donc le même mais avec
t' au lieu de t. Donc entre les deux mesures on a :
(13) A0 Ba + A0 Bb
qui est aussi la transformée de (11), ce qui est correct. Et l'état final est inchangé. De plus, cela n'est
que la description globale (l'état décrit dans un repère donné = un super observateur). Et les états
locaux ou épistémiques restent inchangés.

Ajouter C et les particules est juste une question de complexification de l'état.

La description est donc entièrement compatible avec la relativité.

Les inégalités de Bell


Les inégalités de Bell sont-elles violées ?

Plus précisément, retrouve-t-on les corrélations prédites par la mécanique quantique ?

En principe oui puisque l'on n'a rien changé aux états de la mécanique quantique si ce n'est qu'on
les décrit de manière particulière (relationnelle) et qu'on n'a pas la réduction avec toutefois les
mêmes statistiques (ou probabilités subjectives ou objectives selon le point de vue, comme nous
l'avions remarqué) que la mécanique quantique orthodoxe.

Mais la question est d'importance et des résultats quelques peu inattendus peuvent surgir de
changements anodins. Nous allons donc regarder ça d'un peu plus près pour nous en assurer et nous
en convaincre.

Considérons un paramètre α pouvant varier dans la mesure. Par exemple un angle de mesure avec
des propriétés matérialisées par le spin/polarisation.

A effectue sa mesure dans la base habituelle a , b .


B effectue sa mesure avec un paramètre α donné, dans une base a ′ , b′ et un changement de
base typique :
a ′ = cos α a + sin α b
(14)
b ′ = − sin α a + cos α b

On peut aussi inverser la transformation


a = cos α a ′ − sin α b ′
(15)
b = sin α a ′ + cos α b ′

Considérons l'état global après mesure. Les états locaux seront Aa a + Ab b et


Ba′ a ′ + Bb′ b′ . Mais ce dernier peut s'écrire dans la même base que A, c'est
le même état dans l'espace de Hilbert, Ba a + Bb b . L'état global reste donc inchangé !
(16) Aa Ba + Ab Bb

C'est une réminiscence de ce qui avait été dit dans le problème des bases privilégiées dans l'étude
de la décohérence : sans décohérence et base privilégiée, peu importe l'observable, c'est comme si
on mesurait tout ! Notons qu'un fois la mesure effectuée la décohérence peut prendre place mais il
vaut mieux qu'elle ne se produise pas avant (ce n'est normalement pas un problème technique vu
que ce sont des particules isolées, dans le vide pour des électrons, ou très peu perturbables pour des
photons, voyageant peu de temps) sous peine de perdre l'intrication ! C'est un problème rencontré
en calcul quantique ou l'intrication doit être maintenue longtemps.

Mais à la fin, il y a décohérence et le résultat final doit être exprimé dans les bases privilégiées de
A et B. L'état global en C (après décohérence et propagation de l'information) devient
(17) cos α Aa Ba′ − sin α Aa Bb′ + sin α Ab Ba′ + cos α Ab Bb′
On voit clairement que plusieurs résultats sont maintenant possibles et que la probabilité de trouver,
par exemple, a et a', est cos 2 α . C'est assez immédiat et sans mauvaise surprise. On retrouve bien
les résultats de la mécanique quantique et donc la violation des inégalités de Bell.

Conclusions
Nous avons donc, sur cet exemple caractéristique, la preuve que nous avons bien une interprétation
déterministe et locale de la mécanique quantique et respectant parfaitement les prédictions de la
mécanique quantique.

En n'oubliant pas de distinguer d'un côté les processus physiques locaux et de propagation et les
observateurs physiques, strictement locaux, et de l'autre côté les super observateurs, non physiques,
ne faisant que décrire globalement la situation, une description générale non locale, ce qui n'est pas
propre à la mécanique quantique (comme peut l'être la description globale d'une situation dans un
repère donné, en relativité restreinte).

En fait c'est la mécanique quantique, même pas une reformulation comme pourrait l'être une théorie
à variables cachées. Seule la description de ce qui se passe est différente, relationnelle, et la
réduction absente, à l'aide des états relatifs.

C'est une partie des objectifs que nous nous étions fixés et ce sont les plus difficiles puisque aucune
interprétation ne remplissait ces objectifs. Les auteurs n'ont pas connaissance d'une autre
interprétation remplissant ces objectifs sauf peut-être l'interprétation relationnelle "pure et dure" de
Rovelli.

Nombre de physiciens sont persuadés que la non-localité est une caractéristique intrinsèque et
incontournable de la mécanique quantique. Ils pensent que toute description locale, quelle qu'elle
soit, doit forcément respecter les inégalités de Bell même sans variables cachées. D'autres pensent
que le caractère probabiliste n'est pas qu'épistémique ou subjectif mais intrinsèque. Parfois
(souvent) ils pensent les deux. Ceci est un contre exemple et cela suffit à montrer que ce sont de
fausses croyances (d'ailleurs aucune démonstration du caractère non local n'avait jamais été donnée
étant entendu que le théorème de Bell, par exemple, ne fait que montrer que les variables cachées
locales ne marchent pas, il ne faut pas inverser l'implication). Des croyances peut-être basées sur
les difficultés conceptuelles de la mécanique quantique et sur l'absence jusqu'ici d'une interprétation
qui remplissait ces objectifs. Gageons d'ailleurs que cette croyance perdurera, ne fut ce que parce
que tout le monde n'est pas obligé d'accepter cette interprétation ! Pourtant son caractère non
falsifiable suffit à prouver que cette description est valide (c'est une des manières de décrire la
mécanique quantique, sans plus) et donc que ce contre exemple suffit à invalider ces croyances.
Mais les préjugés philosophiques ont la vie dure. Très dure !
IV.4. Expérience de Renninger
Passons maintenant à une expérience tout à fait nouvelle.

Description
Imaginons l'expérience suivante

Une source S est placée au centre d'un écran circulaire E 2 , à mi-chemin, est placé un écran circulaire partiel E1 .
La source est conçue pour émettre des particules dans des directions totalement aléatoires. La source peut, par
exemple, émettre des électrons et les écrans être fluorescent, comme les écrans cathodiques des anciennes
télévisions.

L'état de la particule peut être décrit par une fonction d'onde évoluant dans le temps ou, plus simplement, par l'ét
de la particule aux différents instants considérés.

Au départ, la particule a une probabilité p1 d'être émise en direction de E1 et une probabilité p 2 d'être émise en
direction de E 2 (sans pouvoir être interceptée par l'écran intermédiaire). Avec, bien entendu, p1 + p 2 = 1 .

L'état initial (en confondant, pour la facilité, amplitude et probabilité) est donc :
(1) p1 E1 + p 2 E 2
(où nous notons E1 l'état "émit en direction de E1 ").

Si la particule se déplace à la vitesse V (la source peut être conçue pour communiquer une énergie précise aux
particules et donc une vitesse précise), elle se retrouvera à hauteur de l'écran E1 au bout du temps R1 / V . C'est-à
dire qu'à ce stade elle a parcouru la distance R1 .

Si la particule est émise en direction de E1 , on observe l'impact sur cet écran sous forme d'un petit spot lumineux
L'état se réduit en E1 .

Mais si on n'observe pas d'impact, alors on sait que la particule n'a pas été émise en direction de E1 et donc, l'éta
de la particule se réduit en E 2 . Quelques instants plus tard, on observe effectivement l'impact sur l'écran E 2 .

Le deuxième cas est une situation très étrange où l'état de la particule se réduit alors qu'aucune mesure n'a été
effectuée : aucun impact n'a été relevé sur E1 et aucun impact ne s'est encore produit sur E 2 , celui-ci ayant lieu
peu plus tard.

Ce genre de raisonnement jette encore plus la suspicion sur le caractère physique de la réduction de la fonction
d'onde.
Cette expérience nous aide à comprendre pourquoi von Neumann (1932) et Wigner (1962) insistaient sur la
nécessité d'un observateur conscient et intelligent comme l'agent déclenchant de la réduction. Le changement da
la "connaissance" quand aucun impact n'est observé sur E1 quand t = R1 / V requiert une déduction de la part de
l'observateur sur ce qui aurait dû se passer si l'électron avait été détecté en E1 . De plus, on pourrait imaginer une
version plus élaborée de cette expérience avec un très grand nombre d'écrans à l'intérieur de E 2 , si compliquée
qu'aucun observateur humain ne pourrait garder trace de tous les temps attendus de flash qui signaleraient
l'apparition ou l'élimination des différents résultats possibles. Et on pourrait spéculer sur comment la réduction
peut se produire dans cette situation.

Notons que les distances peuvent être choisies de telle manière qu'entre l'écran E1 et l'écran E 2 dans la direction
opposée aucun signal n'ait le temps d'être envoyé (à une vitesse inférieure à celle de la lumière) entre un éventue
impact qui aurait pu avoir lieu sur E1 (c'est-à-dire l'instant t = R1 / V ) et l'impact sur E 2 (en t = R2 / V ). Donc, o
ne peut imaginer que, si la particule est une onde, son interaction avec l'écran E1 affecte l'onde à l'autre extrémit
permettant à la particule d'y produire un impact. On est à nouveau confronté à la non-localité, que l'on imagine l
particule comme une onde ou via le processus de réduction.

Interprétation relationnelle des états relatifs


Voyons maintenant comment les états relatifs décrivent la situation.

Au départ, l'état est p1 E1 + p 2 E 2 .

Puis, au moment où l'écran E1 est atteint, l'état correspondant à la bonne direction provoque un impact sur E1 ,
nous noterons cet état par ∗ E1 , et l'état devient :
(2) p1 ∗ E1 + p 2 E 2

Et un peu plus tard, lors de l'impact sur E 2 :


(3) p1 ∗ E1 + p 2 ∗ E 2
Ces états s'interprètent par les états relatifs et ne recèlent plus aucun mystère.

Aucun observateur humain n'est nécessaire pour interpréter la situation. Mais imaginons un observateur humain,
après le temps R1 / V . Du fait qu'il observe l'écran, il y a mise en corrélation avec l'état de la particule. Appelons
O0 l'état "je n'ai rien observé", O1 l'observation d'un impact sur l'écran E1 , et O2 sur E 2 . Puisque l'impact sur E
peut déjà avoir eut lieu mais pas encore sur E 2 , on a :
(4) p1 O1 ∗ E1 + p 2 O0 E 2

On voit que la composante de l'observateur n'est pas encore corrélée avec E 2 , il n'y a pas encore eut observation
et la composante de l'observateur est corrélée avec l'impact sur E où il y a eut impact.

L'observateur dans l'état correspondant à la composante O1 estime qu'il y a eut réduction de la fonction d'onde
car il n'a qu'une connaissance incomplète de l'état total. L'observateur dans l'état O0 ne voit aucun impact donc
aucune réduction même apparente. Mais, il connaît la situation et sait ce qu'il aurait déduit de l'impact sur E1 et
sait aussi que dans sa situation l'état ne peut évoluer que comme suit O0 E 2 → O2 ∗ E 2 .

Il a une connaissance épistémique de la situation mais ne considère qu'une partie de l'état, celle qui correspond à
connaissance directe (par des mesures) qu'il peut avoir de l'état total. Il estime donc qu'il y a aussi réduction dans
son cas mais il s'agit d'une simple confusion entre connaissance épistémique et connaissance directe mais partiel
de l'état total.
IV.5. Expérience du choix différé de Wheeler

Description
Imaginons l'expérience suivante.
On a là une expérience classique de Young. Des particules, par exemple des photons, sont émises
par la source S et envoyées vers deux fentes F1 et F2 , les photons interfèrent ensuite pour former
une figure d'interférence sur l'écran E.

On peut aussi disposer deux télescopes T1 et T2 pointés sur les fentes afin de savoir par laquelle des
fentes les photons sont passés.

Evidemment, les photons vont soit aller sur l'écran soit être observés par les télescopes. Les deux
expériences sont indépendantes et nous avons déjà analysé ce genre de situation. L'observation des
fentes provoque une réduction de la fonction d'onde empêchant la formation de la figure
d'interférence.

Il faut aussi imaginer un dispositif optique adéquat pour que les photons puissent aller jusqu'aux
télescopes, sans les rater.

L'idée de Wheeler intervient ensuite. L'écran E est placé sur un dispositif permettant de l'escamoter
rapidement. L'observateur choisit librement l'envoi des photons par S et décide librement
d'escamoter ou non l'écran afin d'observer la figure d'interférence ou les fentes. Supposons que
l'observateur attende que les photons soient passés par les fentes (sans nécessairement savoir par
lesquelles). Dans ce cas, la fonction d'onde ne doit pas se réduire puisque l'on observe pas encore
les fentes. Puis, avant que les photons n'atteignent l'écran, l'observateur escamote l'écran et observe
les fentes, c'est à dire les photons qui vont aller frapper soit T1 soit T2 lui disant par quelle fente ils
sont passés.

La fonction d'onde se réduit donc brusquement lorsque l'on enlève l'écran alors que les photons sont
déjà passés par les fentes et n'ont pas encore interagit ni avec l'écran ni avec les télescopes.

Ce genre de situation, tout comme celle de la section précédente, a également poussé les analystes à
faire intervenir la conscience de l'observateur intelligent (qui effectue les choix) dans la réduction
de la fonction d'onde.
Interprétation relationnelle des états relatifs
Dans le cas des états relatifs la solution est immédiate puisqu'il n'y a pas de réduction. L'état de la
particule est toujours superposé et inchangé que l'on observe ou pas les fentes. L'observateur, par
son interaction avec les particules, à l'aide de l'écran ou des télescopes, entre simplement en
corrélation avec certaines composantes de la superposition au moment de l'interaction, lui donnant
éventuellement l'impression d'une réduction ou autorisant une interférence (sur l'écran) avant
observation. Nous avions déjà analysé cela et le choix différé de Wheeler n'y change rien.
IV.6. L'expérience de Freedman - Clauser et le paradoxe de Herbert

Description

L'expérience de Freedman et Clauser est une variante plus simple de l'expérience d'Aspect.
Historiquement elle fut la première mesure de la violation des inégalités de Bell.

Une paire de photons intriqués est émise par la source S et deux filtres polarisant sont placés aux
extrémités avec des angles variables. Les détecteurs permettent de mesurer les coïncidences dans la
transmission par les deux filtres des deux photons.

Nous ne reviendrons pas sur cette expérience que nous avons analysée en profondeur mais sur des
variantes intéressantes.

Notons déjà quelque chose de particulier, si l'on place les deux filtres du même coté avec un seul
détecteur :

Dans ce cas, bien sûr, il n'y a pas besoin de paires de photons.


Alors, le nombre de détections par D2 est identique au nombre de coïncidences dans l'expérience
originale.

Ce genre de constatation a renforcé le sentiment de non-localité en laissant supposer que la


première expérience fonctionne de manière identique à savoir que la mesure (le passage à travers le
filtre polarisant) sur le photon de gauche altère le photon de droite comme dans la deuxième
expérience.

Modification de Furry
Face à l'apparente non-localité de la mécanique quantique révélée par ces expériences, certains ont
essayé de modifier la mécanique quantique de manière à la rendre compatible avec la localité telle
qu'elle était vue par Einstein dans l'article EPR.

Furry proposa la modification suivante. Il imagina que, dès que deux systèmes sont isolés de
manière à ne plus pouvoir échanger de signaux à une vitesse inférieure à celle de la lumière, par
exemple lors d'une détection sur un intervalle spatial, alors l'état de chaque particule se réduit
immédiatement et spontanément en un état définit aléatoire. Une espèce de variante de la théorie
avec réduction physique.

Cette idée est tout de même assez curieuse et même douteuse car lorsque deux particules intriquées
se séparent, elles sont immédiatement séparées par un intervalle spatial. Pire, le type d'intervalle
dépend des événements considérés et l'intervalle peut être aussi bien de type spatial que de type
temps selon l'instant où l'on considère chacune des deux particules.

On ne peut évidemment pas modifier les lois de la nature afin de les comparer. Mais on peut
simuler l'hypothèse de Furry à l'aide du dispositif suivant :
Deux filtres supplémentaires identiques sont placés près de la source. Pour chaque photon,
l'orientation de ces deux filtres est choisie aléatoirement. Les photons ainsi filtrés sont dans un état
défini (identique) mais aléatoire donné par ces filtres.

Le résultat est identique à des photons dont l'état serait prédéterminé, comme avec des variables
cachées. Le résultat est donc que l'expérience (avec les deux détecteurs aux extrémités) doit
respecter les inégalités de Bell.

C'est effectivement ce qui est constaté et est donc différent des résultats de Freedman et Clauser ou
d'Aspect. L'expérience montre donc que la modification de Furry n'est pas acceptable car elle ne
reproduit pas les résultats de la mécanique quantique et des expériences.

Modification de Herbert
Herbert imagina le système suivant.
Le photon de droite passe dans un dispositif permettant de dupliquer le photon à volonté. Chaque
clone du photon est envoyé vers un détecteur doté d'un filtre polarisant différent. En mesurant tous
les angles de polarisation (ou du moins un grand nombre), on obtient une mesure exacte de son état.

Imaginons que D1 soit utilisé un peu avant les autres détecteurs. L'interprétation de Copenhague dit
alors que le photon se réduit dans l'état mesuré, par exemple ici vertical. Les photons étant
intriqués, ils se réduisent tous instantanément dans l'état vertical. La mesure sur le photon de droite
permet alors de le savoir et de découvrir que le photon de gauche a été détecté à travers un filtre
vertical.

Le dispositif permet ainsi de transmettre une information "instantanée" : quel filtre polarisant a été
utilisé sur le photon de gauche ? Et il permettrait ainsi de servir d'appareil de transmission.

Comme cela viole explicitement la relativité et peut conduire à des contradictions, on parle du
paradoxe de Herbert.

Interprétation relationnelle des états relatifs


En fait, Herbert s'est trompé dans son analyse. Il s'est laissé aveugler par l'interprétation de Copenhague qui
montre ici ses dangers.

En fait, l'interprétation de Copenhague n'est pas réellement en jeu car il semble que cette analyse néglige aussi u
autre élément important : le caractère aléatoire des photons émis par la source. De fait, le filtre polarisant ne
laissera pas systématiquement passer le photon. Cela ne se produira en moyenne qu'une fois sur deux. Pour que,
droite, on sache (par exemple en constatant que la polarisation est verticale) que le photon a bien été détecté (et
donc qu'à gauche on a utilisé un filtre vertical) il faut forcément transmettre le résultat de la mesure par un autre
canal. Au minimum il faut transmettre l'information disant si le photon a bien été détecté ou pas à gauche.

Ce genre de situation est d'ailleurs exploité dans la cryptographie quantique comme nous avons vu.

L'interprétation par les états relatifs ne pose pas ce problème car il n'y a jamais réduction. On ne risque pas de se
laisser leurrer.

Supposons, pour simplifier, que l'on n'utilise à droite qu'un détecteur vertical D3 et un horizontal D4 . Le photon
étant initialement dans un état superposé horizontal + vertical. Deux résultats peuvent se produire pour D1 : soit
une détection (composante verticale), soit une non-détection (composante horizontale). Notons 0 et 1 ces résulta
et indiçons par le détecteur. L'état final sera :
01 0 3 14 + 11 13 0 4
On voit qu'à droite, une fois sur deux un détecteur est déclenché et une fois sur deux (en moyenne, au hasard) c'e
l'autre détecteur qui est déclenché. Aucune information ne peut en être retirée sur le fait que le détecteur de gauc
est vertical.

On obtient un résultat analogue si le filtre de gauche est horizontal :


11 0 3 14 + 01 13 0 4

On voit que l'état de droite sera toujours le même 0 3 14 + 13 0 4 et donc on ne peut pas savoir comment on a
disposé le filtre de gauche.

Ce n'est qu'en comparant le résultat de la mesure que l'observateur de droite saura quel filtre l'observateur de
gauche avait utilisé et ce résultat, seul, étant aléatoire il ne suffit pas en lui-même à déduire l'information.
L'information est donc cryptée mais non pas instantanée.

Le dispositif de Herbert ne marche pas.


IV.7. L'effet Hanbury - Brown - Twiss

Description
L'effet Hanbury - Brown - Twiss (HBT) est un exemple d'interférences de sources de radiations qui
sont incohérentes (Klauder, 1968), c'est-à-dire de sources dont la phase n'est pas corrélée, chaque
source émettant indépendamment l'une de l'autre, contrairement à l'expérience de Young où l'on
utilise une seule source afin de garantir que la phase des deux ondes qui interfèrent est toujours
cohérente et donne toujours la même interférence.

Il a été appliqué à la mesure du diamètre des étoiles proches par radio interférométrie et pour
analyser le "point chaud" développé dans une collision relativiste d'ions lourds dans laquelle des
pions sont produits (Gyulassy, 1979). L'effet s'applique aussi bien aux ondes classiques qu'aux
particules quantiques.
Une version simplifiée de la mesure d'interférence HBT est illustrée dans la figure ci-dessus. Les
sources 1 et 2 sont séparées par une distance d12 . Les deux sources émettent des photons de la
même énergie (même longueur d'onde) mais sont complètement incohérentes. Les rayonnements
des deux sources sont détectés par les détecteurs A et B qui sont séparés par une distance d AB . La
ligne des centres des sources est parallèle à la ligne des centres des détecteurs et les deux lignes
sont séparées par une distance L . Par simplicité, nous avons placé les sources AB exactement à
hauteur du milieu de la ligne séparant 1 et 2 mais ce n'est pas une obligation.
Un signal qui est un produit à partir (ou des coïncidences entre) des signaux reçus en A et B
(indiquant que des photons ont simultanément déclenché les deux détecteurs) reflète l'interférence
cohérente des deux sources et dépend de la séparation des sources d12 ainsi que de la séparation des
détecteurs d AB . Les mesures faites avec plusieurs valeurs de d AB peuvent donc être utilisées pour
déterminer d12 , d'une manière analogue à déplacer un seul détecteur dans une figure d'interférence
de Young permet de déterminer la séparation d'une paire de fentes. C'est l'effet d'interférence HBT.

Interprétation transactionnelle des états relatifs


Comment peut-on obtenir une interférence à partir de sources incohérentes ? En fait, le processus
est assez simple. Nous n'aurons pas besoin des états relatifs mais nous gardons le titre afin de
rappeler dans quel contexte interprétatif nous nous plaçons.

Appelons ψ 1 l'onde émise par la première source et ψ 2 l'onde émise par la deuxième source.
Ces deux ondes sont incohérentes, c'est-à-dire que leur phase n'est pas identique. Pire, au cours du
temps le décalage de phase entre ces deux ondes peut varier. Cela se produit si le signal émit par les
sources est constitué de trains d'ondes chacune avec un décalage différent.

On supposera toutefois que les trains d'ondes sont suffisament long pour que le décalage de phase
reste identique durant une mesure et surtout que les mêmes trains d'ondes frappent les détecteurs A
et B. Même si un peu plus tard, lors d'une autre mesure, ce décalage est différent. Les deux états ci-
dessus représentent deux trains d'ondes. La condition sera remplie si la différence de temps de
parcourt pour que le signal arrive en A ou B (sachant que A et B sont proches) est plus faible que la
longueur d'un train d'ondes.

Lors de leur voyage, ces ondes subissent un décalage de phase proportionnel à la distance
parcourue, ce qu'on indiquera en ajoutant la distance parcourue dans l'état. Ainsi, au détecteur A on
recevra :
ψ 1 , l1 + ψ 2 , l 2
et en B :
ψ 1 , l 2 + ψ 2 , l1

Le décalage entre les deux ondes ψ 1 et ψ 2 est équivalent au fait qu'une des ondes se serait
déplacée d'une distance d , comme dans la figure ci-dessus où l'onde en bas à droite est légèrement
décalée vers la droite. Cette valeur d est inconnue et varie dans le temps car les sources sont
incohérentes.

Les deux états deviennent :


ψ 1 , l1 + ψ 1 , l 2 + d et ψ 1 , l 2 + ψ 1 , l1 + d

Ces deux états reviennent donc à réaliser une interférence entre deux ondes identiques, comme dans
l'expérience de Young, avec un décalage l1 − l 2 − d pour l'une et l1 − l 2 + d pour l'autre.

L'interférence ne dépend pas du signe du décalage, peu importe que ce soit une onde qui soit
décalée ou bien l'autre. On voit que le décalage inconnu influence de la même manière les deux
états reçus en A et B. En faisant varier la position des détecteurs, on peut faire varier les distances
l1 et l 2 afin d'éliminer l'influence de la variable inconnue d et en déduire les différences entre l1 et
l 2 à partir des mesures d'interférences (nous invitons le lecteur à faire le calcul détaillé). Et,
connaissant la distance L, on en déduit d12 .
IV.8. Les prédictions de Albert - Aharonov - D'Amato

Contrafactuel
Le terme contrafactuel fut introduit par Stapp (1971, voir aussi Herbet, 1978) comme une supposition minimale.
Elle signifie que pour les différentes mesures alternatives possibles (éventuellement de variables non
commutantes) qui peuvent avoir été effectuées sur un système quantique, chacune pourrait avoir produit un
résultat observable définit (mais inconnu et éventuellement aléatoire) et de plus que cet ensemble de résultats est
une matière appropriée pour la discussion. C'est donc la prise en compte dans les raisonnements d'un résultat qui
aurait dû être obtenu si l'on avait effectué une mesure donnée mais sans avoir réellement fait la mesure. La
contrafactualité est réellement une supposition assez faible et est souvent employée par les physiciens
expérimentaux dans l'investigation et la discussion sur les systèmes quantiques. Elle est complètement compatib
avec les mathématiques de la mécanique quantique mais est un peu en conflit avec l'élément positiviste de
l'interprétation de Copenhague et avec certaines autres interprétations. Elle reste d'un usage délicat et peut amene
à de sérieuses erreurs d'interprétation.
Description

Les prédictions d'Albert - Aharonov - D'Amato (1985) clarifient un vieux problème, la question de la
connaissance rétrospective d'un état quantique suivant des mesures successives des variables non commutantes
(Aharonov, 1963). La supposition de la définition contrafactuelle joue un rôle important dans les prédictions
d'Albert, Aharonov et D'Amato (AAD) car elles concernent la connaissance rétrospective de l'observateur sur le
résultat d'expériences qui peuvent avoir été effectuées sur le système dans l'intervalle de temps entre une des
mesures et une autre. Nous avons besoin de la supposition contrafactuelle que les différentes alternatives possibl
des mesures qui peuvent avoir été effectuées sur le système auraient produit chacune un résultat observable défin
(bien qu'inconnu et éventuellement aléatoire) et que nous avons le droit de discuter de ces résultats. Sous la
supposition contrafactuelle, les prédictions AAD fournissent un défi pour les problèmes d'interprétation quantiqu

Comme exemple simple des prédictions AAD, considérons l'expérience illustrée dans la figure (a) ci-dessus. Un
photon est émit par la source S et transmit à travers un filtre V qui laisse passer seulement la lumière polarisée
verticalement. Elle voyage ensuite sur une certaine distance et est transmise à travers un second filtre I qui laisse
passer seulement la lumière polarisée avec une inclinaison à 45°. Le photon est alors détecté par un détecteur D
qui génère un signal électrique enregistrant l'arrivée du photon. Les questions qui sont traitées par AAD sont : (1
Quel est l'état quantique du photon dans la région qui se situe entre V et I et (2) quel serait le résultat des mesure
sur le photon qui pourraient être faites dans cette région ?

Les auteurs de AAD utilisent le formalisme de la mécanique quantique appliqué pour lier la probabilité d'une sér
de mesures (Aharonov, 1964) pour démontrer une paire remarquable de prédictions (ici appliqué à l'exemple
présent) : (1) si une mesure de polarisation verticale a été effectuée (b) dans la région intermédiaire, le photon
aurait été trouvé dans un état vertical et (2) si une mesure de polarisation inclinée (c) avait été effectuée dans la
région intermédiaire le photon aurait été trouvé dans un état incliné. En d'autres mots, la mesure intermédiaire de
polarisation s'avère être également influencée par la première mesure de polarisation linéaire qui a été effectuée
V et par la future mesure de polarisation circulaire qui sera effectuée en I, elles semblent dans les deux cas
également préparer le système dans un état défini qui "force" le résultat de la mesure intermédiaire.

Le fait que l'expérience (b) donne le même résultat est logique puisque après avoir passé le filtre V, le photon es
dans un état vertical et le filtre V' le laisse passer.

Le fait que l'expérience (c) donne le même résultat est plus délicat. En effet, le filtre I' ne laissera passer que la
moitié des photons et donc provoque une influence sur le photon. Une fois passé, il est dans un état incliné et le
filtre I le laisse passer. Toutefois dans l'expérience (a), le filtre I laisse aussi passer la moitié des photons et le
résultat est identique. De plus, sous l'hypothèse contrafactuelle, on peut supposer que les photons qui sont passés
par I dans (a) seraient également passés par I' dans (c) et donc étaient dans le même état. Ces photons passant I'
sont dans l'état incliné, d'où le raisonnement de AAD.

Cette application parfaitement valide du formalisme de la mécanique quantique s'avère être en conflit
d'interprétation avec le principe d'indétermination qui affirme que puisque les états verticaux et inclinés sont des
états propres de variables non commutantes (les observables "filtre vertical" et "filtre incliné"), un photon ne peu
pas avoir ces deux valeurs propres simultanément. Les auteurs de AAD, d'un autre coté, interprètent leur résultat
comme indiquant que "sans violer les prédictions statistiques de la mécanique quantique, il peut être supposé de
manière consistante […] que des observables non commutants peuvent être bien définis simultanément" et qu'en
effet, "étant donné ces prédictions statistiques […] il est consistant de ne rien supposer d'autre". Le résultat AAD
été résumé dans un rapport populaire (S&TC, 1985) comme indiquant que "la mesure du vendredi a causé, dans
un certain sens du mot cause, la dispersion des valeurs de la polarisation du mercredi réduit dans une certaine
configuration définie. La question logique sur le temps et la causalité que ces développements engendrent n'as p
encore été totalement explorée."

Interprétation relationnelle des états relatifs


Pour mieux comprendre ce qu'il en est, voyons ce que donnent la description des états et leur analyse par les état
relatifs.

Considérons d'abord la première expérience. Les photons qui sortent du filtre V sont dans l'état V et ils garden
cet état tout au long de leur déplacement entre les deux filtres.

Arrivés au filtre I, seuls la moitié des photons passent. Pour bien voir ce qui se passe, au lieu de considérer la ba
d'états "horizontal" - "vertical" H , V , on peut considérer la base "incliné à 45°" - "incliné dans l'autre sens à
45°" que nous noterons I , I . Ces états se décomposent sur la première base comme :
I = H + V et I = H − V
(à un facteur 1 / 2 près).

On voit clairement que la probabilité d'avoir un photon qui passe est 1/2.
On voit également que :
V = I − I
(nous avons négligé le facteur 1 / 2 non essentiel et qui disparaît de toute façon quand on normalise les états).

Le filtre I ne laisse passer que la composante I et donc l'état final sera une superposition de "état I détecté p
D" et "état I absorbé par le filtre". L'observateur va sélectionner volontairement les cas où le détecteur a
absorbé un photon.

La deuxième expérience (b) ne change rien puisque le filtre V' laisse l'état V inchangé.

La troisième expérience (c) est plus intéressante. L'état du photon est également décrit par V = I − I et I' ne
laisse passer qu'une composante, l'état final (après passage du filtre I) sera "état I détecté par D" et "état I
absorbé par le filtre I'".

On peut analyser la situation par les états relatifs et remarquer que l'observateur, lorsqu'il observe le photon sur l
détecteur n'est en fait qu'une composante d'un état plus complet. Statistiquement cela revient à dire qu'il
sélectionne les états où un photon est observé. Si l'on ne considère que la composante "photon observé", alors
l'état avant le passage du filtre I (ou avant le filtre I') est déjà I , tandis qu'avant le filtre V il est dans l'état V .
Mais ceci n'est vrai que parce que l'on ignore volontairement une partie des composantes, le choix dépendant de
l'expérience considérée.

Il n'y a donc pas de mystère. L'état est constamment une superposition de I et I entre les deux filtres dans (a
et la composante I est absorbée mais ignorée par le premier filtre I ou I' qui se présente.

L'analyse contrafactuelle est équivalent à une connaissance épistémique : une déduction. Mais il faut être pruden
comme nous l'avons déjà vu, et ne pas confondre état réel de la particule et ignorance de l'état complet de la
particule (et de l'observateur) dans un état superposé.
Il n'y a pas non plus violation du principe d'indétermination en affirmant que la particule est à la fois dans un éta
définit V et I . La particule est toujours dans un état superposé avec une composante absorbée à des moment
différents selon la situation. Ce n'est qu'en ignorant volontairement la composante absorbée qu'on a l'impression
d'avoir simultanément des états définis incompatibles. En réalité l'état est toujours une superposition et la situatio
physique est différente (absorption à des moments différents). Il n'y a pas de contradiction.
IV.9. L'expérience d'Afshar

Description de l'expérience
L'expérience d'Afshar est une expérience réellement réalisée par celui-ci dans le but d'invalider
l'interprétation de Copenhague. L'expérience part d'une situation analogue à l'expérience de Young

:
Mais Afshar va plus loin. Il note d'abord soigneusement l'emplacement des franges d'interférences sombres et
claires.
Il remplace ensuite l'écran par une lentille. On voit sur la figure le trajet optique des différents rayons lumineux.
Grâce à ce dispositif, le détecteur D1 observe la fente F1 et le détecteur D2 observe la fente F2 . Si le photon
passe, par exemple, par la fente F1 , il termine alors dans le détecteur D1 . Ce dispositif permet de savoir par où e
passé le photon. C'est une expérience typique avec détection de fentes par lesquelles passent les particules. Cette
expérience est quelque peu analogue à celle du choix différé de Wheeler.

Enfin, Afshar ajoute une grille. Cette grille est constituée de fils disposés à l'endroit des franges sombres
observées plus haut. C'est-à-dire que les fils sont placés là où il n'y avait pas de photons.
Il effectue d'abord l'expérience avec une seule fente. Dans ce cas, il n'y a pas d'interférence et les photons passen
à l'endroit des fils. La présence de la grille perturbe donc le trajet des photons ce qui se vérifie.
Enfin, on a l'expérience complète avec les deux fentes, la grille et la lentille. On vérifie que la grille ne perturbe
pas la réception des photons ce qui s'explique par le fait que les fils sont aux endroits des franges sombres. De pl
les détecteurs captent les photons et cela permet de savoir par où ils sont passés.

Interprétation d'Afshar
Afshar affirme que cette expérience viole le principe de complémentarité de l'interprétation de Copenhague.
Celui-ci affirme, notamment, qu'une particule se comporte comme une onde ou comme un corpuscule mais jama
les deux à la fois. Or l'expérience ci-dessus montre qu'une figure d'interférence se produit (comportement
ondulatoire) et qu'en outre on sait par quelles fentes passent les photons (comportement corpusculaire).

Critique de l'interprétation d'Afshar


En fait, si on regarde l'expérience de Young on a déjà deux comportements : ondulatoire avec la figure
d'interférence et corpusculaire avec les impacts sur la cible (les points formant la figure d'interférence). Et ce
double comportement ne pose pas de problème puisqu'il se produit à des moments différents (l'interférence est d
à la propagation des deux composantes qui se superposent).

Ce qui est plus problématique est, comme nous l'avons vu, lorsque l'on comptabilise les photons passant par telle
ou telle fente. On a du mal à justifier pourquoi les photons se répartissent de telle ou telle manière sur la cible
(pour former la figure d'interférence). Mais ici, la situation est moins problématique puisque l'on n'observe pas la
figure d'interférences, on ne sait pas exactement en quel point le photon aurait terminé sa course sur la cible. Tou
au plus sait-on qu'à l'emplacement des fils les photons ne sont pas passés.

De plus, l'interprétation de Copenhague affirme que le comportement ondulatoire (états superposés) a lieu penda
tout le processus sauf au moment de l'observation par les détecteurs où il y a réduction. Donc la situation est
compatible avec la présence de la grille.

Où est alors le problème ? Le problème vient du fait que l'analyse d'Afshar est une analyse contrafactuelle
erronée. Il suppose erronément que l'observation d'un état défini (aux détecteurs) implique que le photon avait
forcément un état défini précédemment (la fente par laquelle il est passé). On n'en a aucune garantie et cela est
même en contradiction avec la mécanique quantique qui affirme que les états ne sont pas prédéfinis (il n'y a pas
variables cachées).

Interprétation relationnelle des états relatifs


L'analyse par les états relatifs est immédiate car, au moins jusqu'à la détection, elle est identique à l'interprétation
de Copenhague : on a des états superposés jusqu'aux détecteurs où, ensuite, la situation s'interprète par les états
relatifs.

Par exemple, au niveau de la grille, l'état du photon est la superposition des positions x1 + x 2 + L
correspondantes aux franges claires de la figure d'interférence, cet état résultant de l'interférence. Et la grille
n'intervient pas puisqu'elle se trouve en des positions où il n'y a pas de franges claires. Avant, au niveau des
fentes, le photon étaient dans l'état F1 + F2 . Ensuite les photons arrivent aux détecteurs avec la superposition
"détection par D1 , photon venant de F1 " et " D2 , photon venant de F2 ". L'évolution des composantes (de l'onde
travers la lentille regroupant les composantes telles qu'elles venaient des fentes F1 et F2 . Une telle expérience
avec des vagues ou des ondes sonores donnerait exactement la même chose (la grille ne perturberait pas la
propagation des ondes). Et l'état final s'interprétant par les états relatifs (une composante pour chaque détecteur).

Il est certain que l'absence de réduction permettant de raisonner avec les états superposés du début à la fin facilit
l'interprétation de ce genre de situation problématique.

Notons aussi que d'un point de vue ondulatoire, l'interférence ne modifie pas les ondes. Observez des vagues qui
se croisent, on a des interférences au point de rencontre, puis les vagues se séparent et retrouvent leur aspect
normal, inchangé. Ceci est dû au fait que l'interférence est linéaire : une simple addition des deux ondes qui
poursuivent imperturbablement leur chemin.

Il en est de même ici, le fait que l'on modifie l'état des ondes après la grille ne modifie donc pas le résultat. Ce
serait plus problématique si on modifiait les ondes (ou l'état des photons) au niveau de la grille. Par exemple, ave
une cible. Dans ce cas il n'est plus possible de voir par où son passé les photons et on ne peut le faire qu'avant
l'impact sur la cible, détruisant les interférences.
IV.10. L'expérience de Marlan Scully
L'expérience de Marlan Scully est une expérience qui combine l'intrication quantique et les interférences de
Young dans un dispositif qui semble indiquer que le futur permet d'influence le passé.
Description

Le dispositif comprend une source de photons S ainsi qu'une série de miroirs semi-transparents A, E, D et F. Un
miroir semi-transparent reflète ou laisser passer le photon avec une chance sur deux. Au centre du dispositif, en
on a placé un dispositif d'interférences classique de Young.
Supposons que B et C soient de simples miroirs. Dans ce cas, le dispositif est une expérience de Young
traditionnelle avec observation des interférences.

B et C sont en fait des "diviseurs". Ils transforment un photon en deux photons intriqués (en diminuant leur
longueur d'onde de moitié, pour des raisons de conservation de l'énergie, ce que peuvent faire certains cristaux).
De fait, la mesure sur un des photons renseigne sur l'état de l'autre photon.

Supposons qu'il n'y ait aucun miroir en D et E. Dans ce cas, on détecte les photons directement en J ou en K selo
qu'ils ont été transmis ou réfléchis par A. Ainsi, on sait par où sont passés les photons, soit par B, soit par C. C'e
une expérience classique où l'on observe par quelles "fentes" passent les photons et la figure d'interférence est
détruite.

Si l'on place les miroirs D et E, alors les photons ont une chance sur quatre d'être envoyés en F. En l'absence de
les photons venant de B seraient simplement détectés soit par J, soit par H et ceux venant de C par K et G. La
figure d'interférence est toujours absente (observation de la direction empruntée par le photon).

Que se passe-t-il maintenant si on ajoute F ? Les photons venant aussi bien de B que de C ont une chance sur de
de finir dans les détecteurs G ou H, il devient impossible de savoir si les photons sont passés par B ou C. Ce
dispositif est appelé "gomme quantique" par Scully car elle permet de détruire l'information portée par les
photons.

Est-ce que dans ce cas on observe une figure d'interférence en I ? Non, car peut importe que l'on détecte ou pas l
photons, si le dispositif permet de savoir par où passent les photons la figure d'interférence est détruite.

Il se passe toutefois quelque chose de particulier. Supposons que l'on ne sélectionne que les photons ayant attein
les détecteurs G et H et pas ceux aboutissant en K et J. Dans ce cas on observe une figure d'interférence. Plus
exactement, la sélection des impacts des photons en I corrélés à ceux aboutissant en G ou en H donne une figure
d'interférence, tandis que la somme des deux n'en donne pas (pour le comprendre, il suffit de savoir qu'une des
deux figures est le négatif de l'autre, les franges sombres de l'une sont les franges claires de l'autre et vis et versa
l'addition des deux donnant une distribution uniforme sans structure apparente).
L'idée de Marlan Scully est alors la suivante : plaçons F extrêmement loin de façon à ce que le résultat en I soit
enregistré depuis longtemps lorsque les photons arrivent en F. Puis, à ce moment, loin dans le futur, on décide ou
pas d'utiliser F permettant ainsi ou pas l'existence d'une figure d'interférences. Le choix de F dans le futur sembl
donc influencer le résultat mesuré dans le passé en I.

Interprétation
Il serait instructif de dresser la liste de tous les états et d'interpréter par les états relatifs, cela combine les analyse
EPR et Young. Mais en réalité il n'est pas nécessaire de s'embarquer dans une analyse aussi compliquée.

Le fait de placer F ou pas ne change pas la figure en I qui n'a pas d'interférence. Ce n'est qu'en corrélant les
impacts sur I avec les détecteurs que l'on trouve une figure d'interférence. Donc si F très loin, on ne peut pas
savoir en examinant I s'il y aura ou pas figure d'interférence. Ce n'est que plus tard, après un échange classique
d'informations que l'on sait quels sont les résultats sur les détecteurs et qu'on peut sélectionner les impacts qui
forment une figure d'interférence. Et si l'on décide de ne pas employer F, on ne sera pas en mesure de détermine
la figure d'interférence mais l'ensemble des impacts en I ne change pas.

Ce phénomène est analogue à la cryptographie quantique ou à l'effet EPR : la figure possède une information qu
l'on ne peut décoder qu'après analyse des données de F et il n'y a aucun mystère.
IV.11. Problème d'Elitzur - Vaidmann
Le problème d'Elitzur - Vaidmann est un problème typique de contrafactualité où une interaction qui aurait pu se
produire, mais ne s'est pas produite, influence le résultat.

Ce type d'expérience permet aussi une mesure sans interaction.

Description

Une source envoie des photons vers un miroir semi-transparent. Après réflexion sur les miroirs B et C, ils se
rejoignent au miroir semi-transparent D qui envoie les photons vers les détecteurs E et F.
L'analyse des états montre que dans cette situation les interférences entre les deux composantes passant par B et
empêchent toute détection en E. Tous les photons terminent donc leur course dans le détecteur F. Ceci est dû au
fait qu'un photon qui se réfléchit sur un miroir est déphasé d'un quart de longueur d'onde. Les deux composantes
arrivant en F sont ainsi en phase tandis que celles en E sont en opposition de phase.

Supposons maintenant que l'on place en B un détecteur capable d'absorber le photon qui passe par-là ou, tout
simplement, que l'on coupe le chemin par B à l'aide d'un obstacle.

Dans ce cas, il n'y a plus qu'une seule composante passant par C et donc plus d'interférences. Le miroir semi-
transparent dévie alors les photons venant de C avec une chance sur deux vers E ou F.

Cela signifie que lorsqu'on capte un photon en E, il n'est pas passé par B (sinon il aurait été absorbé) mais
l'existence de cet obstacle en B influence malgré tout le résultat. Le résultat qui "aurait pu" se produire en B
permet au photon d'arriver jusqu'au détecteur E.

Cette expérience permet aussi une petite histoire amusante. Supposons que l'on invente une nouvelle bombe très
puissante. Ces bombes sont ultra sensibles et se déclenchent avec un seul photon. Le gouvernement décide d'en
fabriquer un grand nombre mais :
 Ces bombes sont difficiles à fabriquer. Le processus de fabrication est peu efficace et il faut absolument
s'assurer qu'une bombe qui vient d'être fabriquée fonctionne.
 Lorsqu'une bombe ne fonctionne pas, elle n'absorbe pas le photon.
 Il est impossible de tester la bombe autrement qu'en lui envoyant un photon.

Voilà qui est gênant car si on envoie un photon et que la bombe marche bien, elle explose !

L'idée est alors de placer la bombe à la place de B dans le dispositif précédent. Supposons que la bombe ne
marche pas. Alors, les photons passeront par B et l'on se retrouve dans la situation décrite initialement. Ces
photons sont détectés uniquement par F. En effectuant plusieurs fois l'expérience, on a une garantie aussi bonne
que l'on veut que la bombe ne marche pas.
Supposons maintenant que la bombe marche. Si le photon transite par B, la bombe explose. C'est dommage mais
on avait une chance sur deux. Si le photon transite par C, alors la bombe n'explose pas. Mais on est dans la
deuxième situation, quand il n'y a plus d'interférence. Le photon a alors une chance sur deux d'arriver en F ou en
E. Si le photon arrive en F, on ne sait pas décider et il faut recommencer (avec à nouveau le risque que la bombe
explose). Mais si le photon arrive en E, on a gagné : la bombe marche et elle n'a pas explosé !

Un petit calcul montre qu'on peut ainsi détecter un tiers des bombes fonctionnelles (les deux autres tiers
explosent). Ce qui n'est pas si mal pour une bombe qu'il est en principe impossible de tester sans la faire explose

Interprétation relationnelle des états relatifs


Le raisonnement précédent conduit à des conclusions étranges : mesures sans interaction, effets qui auraient pu s
produire et qui influencent le résultat malgré qu'ils ne se sont pas produit…. Mais en réalité le raisonnement est
faussé par l'interprétation de Copenhague qui a implicitement été adoptée. On raisonne comme si le photon pass
vraiment par une et une seule branche alors que l'on sait qu'il doit s'agir d'une superposition quantique (ou d'une
interférence d'ondes dans une approche plus ondulatoire).

Pour effectuer le raisonnement, il faut savoir un chose : les lois de l'optique (et l'expérience) montrent qu'une ond
qui se reflète sur un miroir subit un déphasage d'un quart de longueur d'onde, comme nous l'avons signalé plus
haut. En outre, nous savons que deux ondes vont interférer destructivement si le déphasage est d'une demi
longueur d'onde.

Au départ, le photon est émit par la source, appelons cet état ψ S . Puis le photon est transmit ou réfléchi par le
miroir semi-transparent A avec une chance sur deux. L'état résultant est donc superposé avec, en outre, un
déphasage d'un quart de longueur d'onde, ce que nous indiquons par +1/4 dans l'état :
ψ C + 1/ 4 + ψ B
où on a indicé par le chemin emprunté.

Puis chaque composante est réfléchie par un miroir avant d'arriver en D :


ψ C + 1/ 2 + ψ B + 1/ 4

Enfin, chaque composante est elle-même séparée en deux par le miroir D :


ψ CE + 3 / 4 + ψ CF + 1 / 2 + ψ BE + 1 / 4 + ψ BF + 1 / 2

Mais la première et la troisième composante arrivent sur le détecteur E et on voit qu'elles sont déphasées d'une
demi longueur d'onde. Elles se détruisent par interférence.

Par contre, les deux autres composantes arrivent sur le détecteur F et sont en phase. Elles s'additionnent et il rest
ψ CF + 1 / 2 + ψ BF + 1 / 2 . Tous les photons arrivent en F.

Supposons maintenant que le miroir B est remplacé par un détecteur. L'état après réflexion sur le miroir C devie
alors
ψ C + 1/ 2 + B
où la deuxième composante indique l'absorption par B.

Enfin, la première composante elle continue son chemin et est divisée par le miroir D :
ψ CE + 3 / 4 + ψ CF + 1 / 2 + B
(nous avons négligé les facteurs qui donnent les probabilités)

On voit qu'il n'y a plus d'interférence et le photon a une chance sur deux d'être absorbé, une chance sur quatre
d'arriver en E et une chance sur quatre d'arriver en F.

Cet état final est bien sûr à interpréter par les états relatifs.

Quelle est la différence entre les deux ? Simplement, dans la première situation, une composante passe par B et
interfère destructivement. Comme l'observateur ne mesure que le résultat des détecteurs, il ne se retrouve en
corrélation qu'avec les composantes après interférence. Il observe donc toujours le photon en F, tandis que dans
deuxième cas, plusieurs possibilités existent, l'observateur observe trois résultats et se retrouve corrélé avec les
trois possibilités. C'est le raisonnement (connaissance épistémique) de l'observateur corrélé avec la composante
arrivant en E qui lui permet d'inférer l'existence de B.

Il ne faut donc pas inverser le raisonnement : ce n'est pas l'interaction qui "aurait pu se produire" qui influence le
résultat mais le fait qu'il "ne peut pas y avoir interaction" qui donne un résultat particulier (interférences
empêchant le photon d'arriver en E). Dans le cas où "l'interaction aurait pu se produire", en réalité, l'interaction a
bien lieu ! Mais comme il y a superposition et que l'observateur n'a pas connaissance de l'état total du système, il
ne voit pas toujours l'interaction.

La situation reste étonnante (principalement à cause de la superposition, du caractère déroutant des états relatifs
du fait qu'une composante particulière, l'absorption par B, se retrouve superposée avec une situation sans
absorption) mais elle est maintenant nettement moins mystérieuse.
IV.12. Action sans interaction
Nous allons maintenant présenter une expérience due à Kwiat et qui est une amélioration de la mesure sans
interaction.

Description

P.G.Kwiat et ses collaborateurs, une collaboration basée à LANL et Innsbruck, ont démontré à la fois
théoriquement et expérimentalement que l'efficacité d'une mesure sans interaction peut être augmentée, de 33%
dans le schéma de Elitzur - Vaidmann, à une valeur significativement plus grande. En fait, l'efficacité peut
s'approcher de 100% selon le nombre possible N de cycles que le photon incident fait dans l'appareil. Leur
schéma est montré dans la figure ci-dessus.

Ici une source de lumière S fournit des photons qui sont polarisés horizontalement (H). Ils sont injectés dans un
circuit qui est capable de faire voyager un photon autour d'une boucle rectangulaire N fois avant d'être extrait
vers un schéma d'analyse. Après injection, le photon passe à travers un élément "rotateur de polarisation optique
π
(R) réglable qui change sa direction de polarisation d'un angle θ = . Notez que si N est grand, cette rotation
2N
est petite (par exemple, si N est égal à 10, l'angle de rotation de la polarisation est de seulement 9 degrés).

Le photon voyage alors vers un séparateur de polarisation ( S1 ) qui transmet la lumière polarisée horizontalemen
(H) et reflète la lumière polarisée verticalement (V). L'objet à mesurer peut (ou peut ne pas) être placé dans le
chemin V. Au-delà de l'objet, les composantes H et V des photons entrent dans un second séparateur de
polarisation qui les recombine en un seul flux. Le photon recombiné cycle alors à travers l'appareil. Après N
cycles, le photon est extrait et envoyé vers un troisième séparateur de polarisation ( S 3 ) qui, selon sa polarisation
l'envoie vers une paire de détecteurs de photons ( DH et DV ). Cette détection est en effet une mesure de la
polarisation finale du photon, horizontale ou verticale.

Si aucun objet n'est sur le chemin V, la division de polarisation et la recombinaison n'a aucun effet. On recombin
exactement ce que l'on avait séparé Le rotateur de polarisation tourne le plan de polarisation N fois, chaque fois
d'un angle π / 2 N . La rotation cumulée est donc une rotation de π / 2 (c'est-à-dire de 90°, un angle droit). Donc
un photon qui était initialement polarisé horizontalement (H) émergera de l'appareil avec une polarisation vertica
(V) et sera détecté par le détecteur de photons DV .

D'autre part, si un objet est placé sur le chemin V, les flux H et V ne sont pas recombinés et la division par le
premier diviseur de polarisation ( S1 ) est en effet une mesure de polarisation. Les lois de l'optique permettent de
calculer la probabilité (que nous noterons p H ) que le photon survive à chaque mesure de polarisation horizontal
et émerge dans un état pur de polarisation horizontale (H) (et donc échappe à l'absorption par l'objet placé sur le
trajet). Lorsque N est grand, la valeur de p H est proche de 1 (grande probabilité de ne pas être absorbé). Après
chaque cycle dans lequel le photon survit, il est remit dans son état initial de polarisation horizontale (H) tel que
quand il est extrait après N cycles, il sera détecté par le détecteur DH . A chaque cycle, il y a une petite
probabilité ( 1 − p H ) que le photon soit projeté dans un état pur vertical (V), qu'il voyage sur le chemin V, qu'il
interagisse avec l'objet et soit éliminé du processus.

En résumé, si l'objet n'est pas présent, le photon émergeant sera détecté dans 100% des cas par le détecteur DV .
l'objet est présent, le photon émergeant sera détecté par le détecteur DH avec une probabilité p D = p H
N
( pH
exposant N ) et le photon interagira avec l'objet et sera éliminé avec une probabilité p R = 1 − p H . Le calcul
N

montre que lorsque N est grand, p D vaut environ 1 − (π / 2 ) / N et p R environ (π / 2 ) / N . Donc, la probabili
2 2

d'absorption décroît comme 1 / N et tend vers zéro lorsque N tend vers l'infini. Donc, la procédure améliore
fortement l'efficacité des mesures sans interaction. Par exemple, lorsque le nombre de passages N est égal à 5, l
mesure est efficace à 60%. Avec N égal à 10, elle est efficace à 78% , avec N égal à 20, elle est efficace à 88%
et avec N égal à 100, elle est efficace à 98 %.

En pratique, on est limité par le nombre de cycles car les instruments ne sont pas parfaits (les miroirs peuvent
parfois absorber un photon, par exemple). Mais avec des instruments de bonne qualité, plusieurs centaines de
cycles sont possibles sans difficulté et l'appareil atteint une précision considérable.

L'interprétation par les états relatifs se fait comme dans la section précédente et ne pose pas de problème
particulier.

Expérience de Young et mesure sans interaction


Imaginons le dispositif suivant :
A la sortie des fentes d'un dispositif de Young on place un matériau transparent "non linéaire". Si un seul photon
se présente, il passe. Mais si deux photons se présentent, le matériau devient opaque et bloque les photons.

Ce matériau peut donc faire office "d'objet" pour un appareil Elitzur - Vaidmann ou Kwiat. Ici l'objet est "présen
si le photon passe par la fente du dispositif de Young, sinon, un seul photon passe (celui de l'appareil EVK) et
c'est comme si "l'objet" n'était pas présent.
Ce système permet donc de mesurer si un photon passe par une fente du dispositif de Young.

Une autre possibilité est d'effectuer l'expérience de Young avec des électrons, le photon éventuel de l'appareil
EVK étant dévié par l'électron, cet électron fait office d'objet présent ou non (suivant que l'électron passe ou pas
par la fente).

Mais, le dispositif EVK permet une mesure sans interaction, c'est-à-dire qu'il permet de mesurer si un photon (ou
un électron) passe par une fente sans le perturber. Pourrait-on, grâce à ce système, observer par où passent les
photons et en même temps observer la figure d'interférence ?

Non. La figure d'interférence serait détruite ! Il y a deux raisons à cela.


 L'analyse de l'expérience de Young par les états relatifs à bien montré que la destruction de la figure
d'interférence ne vient pas de la perturbation à proprement parler. Il vient de la corrélation de l'observateur
avec les différentes composantes. L'observateur perd la connaissance de l'état global (la superposition des
photons passant par les deux fentes) et n'est plus en mesure d'observer les interférences (il observe une
réduction apparente de la fonction d'onde).
 L'analyse de Elitzur - Vaidmann a montré que l'absence d'interaction est également apparente. En fait, il y a
bien interaction mais, à nouveau, l'observateur n'ayant pas accès à toute l'information, il ne le sait pas
nécessairement.

Il n'est donc pas étonnant qu'il puisse entrer en corrélation avec un objet avec lequel il croît erronément ne pa
avoir interagit, cette corrélation suffisant à faire valoir l'argument précédent. L'observateur ne voit plus de
figure d'interférence.

La mécanique quantique perd en partie une voile de son mystère mais se montre particulièrement vicieuse dans
certains cas !
IV.13. Le paradoxe des trois boites

Pré et post sélection


Soit un système physique ψ quelconque. On effectue une pré sélection en préparant l'état du
système au départ dans un état donné ψ in . Plus exactement, on va utiliser un observable capable
de mesurer cet état et qui donnera, par exemple, la valeur 1 si le système est dans cet état et 0 sinon.
On sélectionne alors le système qui est dans le bon état.

Un exemple d'une telle opération est l'utilisation d'un filtre polarisant vertical. Les seules particules
qui passent sont dans l'état de polarisation verticale.

On peut aussi effectuer une post sélection, c'est-à-dire une sélection des systèmes qui sont dans un
état donné ψ fin . On procède de même. Par exemple, on pourrait utiliser un filtre polarisant
horizontal.

On peut, bien sûr, entre les deux, avoir toutes sortes d'événements et de mesure. Par exemple, on
pourrait utiliser un rotateur, comme dans l'expérience de la section précédente, pour effectuer une
rotation de la polarisation.

Paradoxe des trois boites


Considérons trois boites A, B et C et une particule pouvant se trouver dans ces boites. Ces boites
pourraient, par exemple, être des atomes auquel il manque un électron et la particule considérée un
électron qui vient se placer autour d'un des atomes.

Bien entendu, l'état de ce système peut être superposé et on sélectionne un état initial :
ψ in = A + B + C
C'est-à-dire que la particule a autant de chance de se trouver dans chacune des trois boites. Ce genre
d'états pour un électron et des atomes n'est pas rare. Dans une molécule de benzène, par exemple,
avec six atomes de carbones, il y a six électrons qui sont dans cet état (sauf que là on a six atomes
de carbone au lieu de trois boites). Les électrons sont dit "délocalisés".

On post sélectionne l'état final comme suit :


ψ fin = A + B − C
C'est également un état équiprobable mais on notera le signe moins (toutes sortes de combinaison
sont possibles, y compris de ce type, changer le signe est équivalent à changer la phase dans la
description ondulatoire).

Supposons que l'on ouvre la boite A (ou que l'on "sonde" l'atome A pour vérifier la présence d'un
électron). L'opération se faisant entre les instants initiaux et finaux. Quelle chance avons-nous d'y
trouver la particule ?

On démontre qu'avec les pré et post sélections ci-dessus, la particule sera trouvée dans A avec
certitude. On peut aussi le démontrer par l'absurde. Supposons que l'on ne trouve pas la particule
dans A, alors l'état de la particule sera B + C . Mais on vérifie (par un calcul simple) que la
probabilité d'être dans l'état A + B − C est alors 0. Les deux états sont "orthogonaux". Ils
peuvent également être des états de base (qui doivent être mutuellement exclusifs, comme ici).

Le calcul est le suivant. On calcule l'amplitude d'être dans les deux états :
( B + C )( A + B − C )
= B A + B B − B C + C A + C B − C C en multipliant tous les termes entre eux
= B B − C C car la probabilité d'être dans une boite à coup sûr quand on est dans une autre à
coup sûr est évidemment 0, par exemple B A = 0
= 1 - 1 car la probabilité d'être dans une boite à coup sûr quand on est dans cette boite à coup sûr est
évidemment 1
=0
Mais on peut également effectuer ce raisonnement avec la boite B. Si on ouvre la boite B, alors on
a la certitude d'y trouver la particule ! Voilà un joli paradoxe : peu importe la boite qu'on ouvre, A
ou B, on y trouve la particule. Pourtant, si on ouvre les deux boites, on n'y trouve bel et bien qu'une
seule particule (dans la première boite ouverte).

Contrafactuel
Le raisonnement affirmant le paradoxe est contrafactuel. On affirme "j'ouvre A et je trouve la
particule et pourtant si j'avais ouvert B c'est là que je l'aurais trouvée". On sait combien les
raisonnements contrafactuels sont dangereux et, en tout cas, qu'il ne faut pas les utiliser pour en
déduire l'existence d'états définis (la particule est dans A ou B avant mesure).

On est maintenant habitué aux comportements quantiques curieux, en particulier dans le cas d'états
superposés. Le comportement constaté ne devrait donc pas être exclu a priori.

Le raisonnement contrafactuel n'est ici pas vraiment erroné, mais le fait de savoir qu'il est
contrafactuel montre aussi qu'il n'y a pas nécessairement paradoxe : l'ouverture de A et l'ouverture
de B sont des situations différentes.

Interprétation relationnelle des états relatifs


N'avez-vous pas relevé une contradiction dans ce qui est expliqué plus haut ? On affirme que dans
l'état initial la particule a autant de chance d'être dans les trois boites et plus loin on dit qu'elle sera
avec certitude dans la boite qu'on ouvre ! On sait que le résultat de mesure est aléatoire et les deux
affirmations ne semblent donc pas compatibles. Et ceci n'est pas contrafactuel (il suffit de faire
juste l'affirmation sur A pour avoir cette incompatibilité).

Pour mieux comprendre ce qui se passe, étudions l'état du système au cours de l'évolution du
système.

Au départ, on a donc l'état :


ψ in = A + B + C
Puis, on ouvre, disons, la boite A. Appelons PA la mesure de "la particule est dans A" et PA la
mesure de "la particule n'est pas dans A". L'état à ce moment est donc :
PA A + PA ( B + C )

A ce stade, on n'exclut donc pas a priori de trouver la boite vide. On n'a pas encore pris en compte
la post sélection.

L'utilisateur applique ensuite un observable (une mesure) pour déterminer si la particule est dans
l'état A + B − C ou pas. Appelons PF cette mesure et PF la mesure contraire. L'état final sera
alors
p1 PA PF A + p 2 PA PF A + p3 PA PF ( B + C ) + p 4 PA PF ( B + C )

Nous avons ajouté les coefficients p1 , p 2 , p3 , p 4 dont nous donnons le résultat sans calcul :
p1 donne une probabilité 1/9, p 2 donne 2/9, p3 donne 0 et p 4 donne 1/3. Le résultat ne 0 devrait
pas vous surprendre, on l'a déjà affirmé plus haut : pour B + C on n'a aucune chance de trouver
le système dans l'état A + B − C , ces états sont mutuellement exclusifs.

Donc, l'état final (en négligeant les coefficients) sera :


PA PF A + PA PF A + PA PF ( B + C )

On constate donc que si l'on ne trouve pas la particule dans A, alors il est impossible de post
sélectionner le résultat recherché. Les deux situations sont incompatibles.

Il n'est donc pas tellement étonnant de trouver la particule dans la boite A : c'est la seule situation
qui permet la post sélection ou, dit autrement, on exclut par post sélection tous les cas où la
particule n'est pas dans A ! On "force" le paradoxe.
Et bien entendu, comme avec l'état initial il y a autant de chance de trouver la particule dans A que
dans B, l'autre alternative : la particule toujours dans B, est également possible.

Notons qu'il existe une interprétation de la mécanique quantique, tout à fait valide, appelée
"mécanique quantique symétrique dans le temps" qui envisage la mécanique quantique comme
étant totalement réversible. Nous reviendrons sur cet aspect de la réversibilité plus tard.

Dans cette interprétation, on considère vraiment l'état post sélectionné comme réel (sans faire de
"tri" comme on le suggère ici) et le raisonnement (parfaitement correct) est "si l'état initial et l'état
final sont tel que donné, alors la particule sera trouvée avec certitude dans la boite ouverte". C'est
vrai, mais en réalité ce qui est fait ici est de choisir certaines "histoires" particulières (allant de l'état
initial à l'état final considéré), celles où la particule est avec certitude dans la boite ouverte. Le seul
avantage de cette interprétation est de mettre en lumière ce coté réversible de la mécanique
quantique que nous verrons bientôt. Nais en choisissant arbitrairement certaines "histoires", nous
considérons qu'elle est trompeuse et donc dangereuse. Nous éviterons donc de détailler cette
formulation.
IV.14. Le paradoxe de Hardy
Un autre effet surprenant est l'expérience de pensée de Hardy qui est une variation des mesures sans
interaction consistant en deux dispositifs de Elitzur - Vaidmann (EV), aussi appelés interféromètres
de Mach - Zehnder, "superposés", un avec un positron ( e + ) et l'autre avec un électron ( e − ).
Le positron étant la particule d'antimatière correspondant à l'électron, lorsqu'un électron et un
positron se rencontrent, ils s'annihilent en se transformant en photons.

Considérons d'abord un seul interféromètre, par exemple celui du positron (indicé par +). Nous
avons vu que dans ce dispositif, le positron peut seulement émerger vers le détecteur C + à cause
des différences de phase. Cependant, la différence de phase peut être altérée par la présence d'un
objet, par exemple dans le bras inférieur, auquel cas le détecteur D + peut être déclenché. C'est
l'expérience d'Elitzur - Vaidmann que nous connaissons.

Dans le double EV, les choses sont arrangées tel que si chaque EV est considéré séparément,
l'électron peut seulement être détecté en C − et le positron en C + . Cependant, comme il y a
maintenant une région où les deux particules se superposent, il y a aussi une possibilité qu'elles
s'annihilent. Nous supposons que cela se produit avec la probabilité unité si les deux particules se
trouvent dans cette région (en pratique il suffit que ces particules ne se déplacent pas trop vite et
qu'elles arrivent en même temps dans la zone grise. Comme elles ont des charges opposées, elles
s'attirent et leur annihilation est quasiment une certitude).

Selon la mécanique quantique, la présence de cette interférence destructive alternative permet une
situation similaire à l'expérience EV dans laquelle les détecteurs D − et D + peuvent se déclencher
en coïncidence (auquel cas, évidemment, il n'y a pas d'annihilation) puisque cette annihilation
possible fait office "d'objet bloquant le passage des électrons et positrons".

Supposons que D − et D + se déclenchent. Essayer de comprendre "intuitivement" cette situation


conduit au paradoxe. Par exemple, nous devrions inférer du déclenchement de D − que le positron
doit avoir emprunté le bras superposé, autrement rien n'aurait pu perturber l'électron et l'électron
n'aurait pas pu terminer en D − . Inversement, la même logique s'applique au déclenchement de D +
et nous en déduisons que l'électron doit avoir aussi emprunté le bras superposé. Mais ils auraient dû
alors s'annihiler et ne pourraient pas avoir atteint les détecteurs. D'où le paradoxe.
Contrafactuel
Ces affirmations, cependant, sont contrafactuelles, c'est-à-dire que nous n'avons pas vraiment
mesuré les positions des particules. Supposons que nous mesurions réellement la position de
l'électron en insérant un détecteur D dans le bras superposé du EV électron. En effet, l'électron est
toujours dans le bras superposé. Mais nous ne pouvons plus inférer du déclenchement de D − qu'un
positron aurait voyagé dans le bras superposé du EV positron afin de perturber l'électron. Le
paradoxe disparaît.

L'analyse par les états relatifs de la séquence d'événements se produisant dans ce double EV ne
pose pas de difficulté particulière, c'est exactement la même chose que pour l'expérience de Elitzur
- Vaidmann. Et nous avons vu que supposer l'absence d'interaction avec l'objet est erroné,
l'observateur n'a simplement pas accès à toute l'information. Le coté particulièrement étrange est ici
le fait que non seulement il n'y a pas d'interaction apparente avec l'objet mais qu'en plus c'est le
simple passage des électrons et positrons qui fait office d'objet et donc non seulement on ne
constate pas d'interaction (d'annihilation) mais on ne constate même rien qui aurait pu empêcher le
passage, par exemple, de l'électron dans le bras superposé. En quelque sorte ce n'est plus seulement
l'objet qui "aurait pu bloquer le passage" c'est carrément "il y aurait pu avoir un objet qui aurait pu
bloquer le passage" ! Mais l'annihilation a bien lieu dans une des composantes et, comme nous
l'avons vu, cela seul suffit à expliquer le résultat final. Le fait que l'observation finale corrèle
l'observateur avec une composante n'enlève rien à la forme de l'état final (ici une superposition d'un
état où les deux particules arrivent en D − et D + et d'un état où les deux s'annihilent).
Exercices
1. Faites une analyse détaillée avec les diagrammes espace-temps (comme dans le cas de
l'expérience EPR de la section IV.3) pour l'expérience de Renninger de la section IV.4.
2. Procédez de même pour l'expérience du choix différé de Wheeler de la section IV.5.
3. De même pour l'expérience de Marlan Scully de la section IV.10.
4. De même pour le problème d'Elitzur - Vaidmann de la section IV.11. Faites de même pour
l'application de cette expérience à l'expérience de Young décrite dans la section IV.12.
5. Faites enfin de même pour le paradoxe de Hardy de la section IV.14.
V. Du quantique au classique

Présentation
Nous sommes partit du principe que toute la physique devait se décrire à partir de la mécanique
quantique puisque c'est la physique qui décrit tous les objets microscopiques et que tout objet,
même macroscopique, était constitué de tels objets microscopiques.

Nous avons d'ailleurs pris le parti de ne pas donner de rôle particulier aux objets classiques,
macroscopiques dans l'interprétation.

Mais comment alors expliquer les différences si importantes entre notre quotidien et le
comportement des objets microscopiques ? Pourquoi une pomme se décrit-elle et se comporte-t-elle
de manière si différente d'un électron ?

Nous sommes maintenant suffisament armés pour aborder cette question, qui est d'ailleurs
largement encore maintenant un domaine de recherche très actif, et nous allons passer en revue les
différents éléments pouvant intervenir dans ces différences.

Nous n'allons pas entrer dans tous les détails, cette description du classique à partir du quantique
pourrait nécessiter un livre entier. C'est d'ailleurs ce que nous avons en partie fait dans le tome IV
sur la matière en décrivant les propriétés de la matière à partir des lois de la mécanique quantique et
de la physique statistique. Ici on va se contenter de parcourir les aspects importants permettant de
faire le lien entre mécanique quantique et physique classique afin de mettre en lumière les
difficultés et leurs solutions.

Différences entre quantique et classique


Mais avant de comprendre la raison de ces différences, passons en revue les principales différences.
 Tout d'abord, le quotidien ne manifeste pas ces étranges superpositions quantiques qui ont été
notre lot dans toute l'étude de la mécanique quantique. Lorsque l'on observe la position d'une
aiguille sur un instrument de mesure, on n'observe pas l'aiguille dans un état de superposition
indiquant plusieurs positions mais toujours dans un état bien défini.
 La précision peut être aussi grande que souhaitée. Ainsi, lorsque l'on mesure la position d'une
bille et sa vitesse (ou son impulsion), on peut mesurer les deux simultanément avec autant de
précision que nécessaire. En sommes, au niveau classique, tous les observables commutent. Le
principe d'indétermination ne s'applique pas à notre échelle.
 Nous avons dit que toutes sortes de bases étaient possibles et que ce que nous appelons des états
superposés peuvent parfaitement être des états "purs" constitutifs d'une base différente. Mais à
notre échelle nous n'observons jamais ces états "spéciaux", nous observons toujours les objets
en des endroits précis. En sommes, il existe des bases privilégiées à l'échelle macroscopique.
 Les lois physiques classiques, telles que les lois de la mécanique de Newton, sont
manifestement très différentes des lois de la mécanique quantique comme l'équation de
Schrödinger.

Interprétation
La toute première chose importante à prendre en compte est l'interprétation de la mécanique
quantique. Celle-ci ne doit pas présupposer certains des aspects de la physique classique sous peine
de ne pouvoir les expliquer ou, pire, de conduire à un raisonnement circulaire qui donne la fausse
impression d'avoir compris le lien entre les deux.

Nous avons vu que l'interprétation relationnelle des états relatifs atteint tous les buts recherchés
dont celui-là. En particulier, les états relatifs permettent d'expliquer l'existence des résultats définis,
sans avoir recours à une mystérieuse réduction de la fonction d'onde apanage des systèmes
classiques.

Mais l'existence des états définis n'est pas tout et, en particulier, cela n'explique pas l'existence des
bases privilégiées.
V.1. Principe de correspondance
Rappelons le principe d'indétermination de Heisenberg :
h
∆x ⋅ ∆v ≥
2πm
qui exprime que l'indétermination ∆x sur la position d'un objet multipliée par l'indétermination ∆v
sur la vitesse de l'objet est au moins égale à une certaine valeur qui dépend de la constante de
Planck h et de la masse de cet objet.

Ces indéterminations se traduisent, lors d'une mesure, par des incertitudes.

Mais la constante de Planck est très petite et par conséquent les incertitudes sont très petites. Par
rapport à la taille des objets microscopiques comme les atomes, ces écarts ont toute leur
importance, mais pour un gros objet, c'est nettement moins problématique. De plus, la valeur à
droite de la relation est d'autant plus petite que l'objet est massif.

Donnons un ordre de grandeur. Il n'est pas rare dans les technologies de pointe de devoir mesurer
des grandeurs ou des positions à l'ordre du micron (un millionième de mètre). Cela se rencontre
dans les usinages de précision ou même lorsqu'il faut ajuster de grosses pièces pour une
construction. Supposons qu'un chercheur souhaite faire une expérience de très haute précision, par
exemple de la métrologie (la science qui étudie les unités de mesure afin d'obtenir des standards de
référence) et souhaite avoir le maximum de précision. Il mesure la position de, disons, un bloc en
platine de un kilogramme à mieux que un nanomètre (un milliardième de mètre).

Mais il souhaite aussi que son bloc de platine soit immobile. Quelle sera l'incertitude sur la vitesse
due à la mécanique quantique ? La relation ci-dessus indique que ∆v sera plus grand que 10 −25
mètre par seconde, c'est-à-dire 0,0000000000000000000000001 m/s. C'est vraiment très peu. Sur
un an cela correspond à un déplacement de l'ordre du milliardième de nanomètre ! Il peut donc
considérer sans risque que son bloc de platine est immobile. En fait, une vitesse aussi faible serait
impossible à mesurer.

Ceci nous amène à deux facteurs importants à notre échelle :


 La précision des mesures est limitée par nos instruments. Un simple mètre d'écolier ne permet
pas d'être plus précis qu'environ un millimètre. Et un pied à coulisse permet des précisions au
mieux de l'ordre du centième de millimètre. Pour avoir des mesures plus précises il faut utiliser
des techniques optiques et là on peut atteindre des précisions de l'ordre du micron voire du
nanomètre avec des techniques encore plus élaborées.
 Il existe de nombreux phénomènes perturbateurs. Le principal est en général la température.
Celle-ci est responsable d'une agitation thermique des molécules constituant les objets. Ces
fluctuations entraînent des petites imprécisions dans les mesures de différentes grandeurs tel
que la position ou la vitesse. Si la température varie, c'est encore pire car on est alors confronté
à des phénomènes de dilatation thermique. Même lors de la pose des rails de chemin de fer ou
du tablier d'un pont, on prévoit des interstices suffisament grands (de l'ordre de quelques
millimètres à plusieurs centimètres) pour éviter des problèmes avec la variation de la longueur
des pièces avec la température. Ces difficultés obligent souvent les chercheurs à effectuer les
mesures de haute précision à des températures extrêmement basses (-273 degrés). Une autre
source importante de perturbations sont les vibrations : vibrations sismiques du sol, bruit et
même parfois le vent ou les pas des chercheurs dans le laboratoire ! Cela nécessite dans certains
cas l'utilisation de divers systèmes d'amortisseurs. Il existe encore bien d'autres perturbations
telles que celles dues aux champs magnétiques et électriques ou, dans certaines mesures, le fait
que la Terre elle-même soit en rotation !

Tous cela fait que les incertitudes quantiques sont, pour des objets macroscopiques, totalement
noyées dans les incertitudes dues à d'autres phénomènes. En pratique, à condition de palier aux
différentes perturbations, un expérimentateur qui travaille avec des objets macroscopiques peut
effectuer les mesures de position et vitesse avec toute la précision souhaitée et disponible.

Les lois de la physique classique sont décrites à l'aide de variables mesurées sur des objets
macroscopiques. Par exemple, la position et la vitesse d'un boulet de canon montre que celui-ci
parcourt une trajectoire en forme de parabole ce qui est parfaitement décrit par la physique de
Newton. Mais nous venons de voir que les incertitudes quantiques étaient, dans ce cas, totalement
inobservables. En fait, tout se passe en pratique comme si ∆x ⋅ ∆p = 0 . L'incertitude n'est pas une
limite et ne dépend que de l'habilité de l'expérimentateur.
Cela justifie le principe de correspondance de Bohr qui affirme que les lois classiques doivent
correspondre aux lois quantiques lorsque l'on pose h égal à zéro. Il est douteux de changer la
valeur d'une constante ! Mais les remarques précédentes montre que cela est justifié pour comparer
les lois quantiques et les lois classiques.

Rappelons comment nous avions décrit la manière d'obtenir les lois de la mécanique quantique à
partir de celles de la mécanique quantique. On écrivait les lois de la mécanique quantique sous une
forme particulière, on remplaçait les variables par des opérateurs et on écrivait les relations de
commutation entre variables dites conjuguées : [xˆ , pˆ ] = ih .

Le fait de poser h = 0 et de pouvoir mesurer les variables avec une précision arbitraire permet de
faire l'opération inverse et permet d'obtenir les lois de la physique classique à partir des lois de la
mécanique quantique en remplaçant les observables par des variables classiques.

Rien que ces observations permettent d'expliquer bien des lois de la physique classique.

Donnons l'exemple de l'oscillateur harmonique. Nous avons vu que la simple donnée de


l'hamiltonien et de la règle [xˆ , pˆ ] = ih permettait de trouver toute la description quantique de
l'oscillateur harmonique. x̂ , p̂ étant considérés comme des opérateurs agissant dans un certain
espace de Hilbert.

On peut faire exactement l'inverse. On peut considérer la description quantique de l'oscillateur


harmonique comme acquise, fondamentale. Pour retrouver la description classique on pose
[xˆ, pˆ ] = 0 . Mais si les opérateurs commutes, on peut alors leur trouver une base d'états propres
commune. Pour des états purs on peut alors identifier les opérateurs x̂ , p̂ avec leurs valeurs
propres x, p, et nous voilà revenu à des variables classiques. L'hamiltonien suffit alors à donner le
comportement de l'oscillateur classique.

Bien sûr, l'espace de Hilbert avec cette base commune, même après avoir posé h = 0, ne se limite
pas au sous-espace des états propres. Il reste à expliquer le problème des superpositions, c'est-à-dire
des états définis et des bases privilégiées.
V.2. Théorème optique
Une difficulté se pose. Comment un objet peut-il avoir une trajectoire classique bien définie (par
exemple une ligne droite) alors qu'il est décrit par une fonction d'onde répartie dans tout l'espace ?

Ce que l'on peut d'abord définir, c'est une "trajectoire moyenne". Si l'on observe des vagues, celles-
ci peuvent recouvrir une grande étendue. Mais on peut voir nettement une direction de propagation.
Mais, pour des particules, cette trajectoire correspond-elle à celles que nous observons à notre
échelle ?

Regardons ce qui se passe lorsqu'une onde passe par une petite ouverture :
On s'aperçoit que les ondes forment un étroit faisceau qui sort de l'ouverture. C'est un phénomène
qui est facilement constaté avec des vagues ou du son (on entend mieux le bruit face à une porte
ouverte que sur le coté).

Vu de loin, ce faisceau étroit paraîtra même rectiligne. En optique on parlera de "rayon lumineux".
Le calcul avec la théorie ondulatoire montre (théorème optique) que cette approximation dite de
"l'optique géométrique", où on considère que les rayons lumineux se propagent inchangés en ligne
droite, est valable si la longueur d'onde est très petite par rapport à la largeur du trou (ou la largeur
du faisceau).
Ce qui est remarquable, et cela se démontre, c'est que cela reste vrai pour la fonction d'onde. L'onde
ci-dessus pouvant représenter la fonction d'onde donnant la position de, par exemple, un électron.
Une grande fonction d'onde signifiant que la position pour la particule est très probable, alors un tel
faisceau étroit correspondra à la trajectoire de la particule. Une petite ouverture correspond à une
localisation précise de la particule, c'est-à-dire à une mesure précise de sa position. Le principe
d'indétermination montre alors que si la précision est trop grande la particule va avoir une vitesse
très imprécise et elle va se disperser (plus de faisceau étroit).

Il y a donc un lien très fort entre le principe de correspondance et la longueur d'onde. Le principe de
correspondance nous indique déjà que pour un objet macroscopique, la mesure de la position peut
être très précise tout en gardant une vitesse précise. Qu'en est-il alors du critère sur la longueu