Académique Documents
Professionnel Documents
Culture Documents
DE ZILBER-PINK
P. Habegger, G. Rémond, T. Scanlon,
E. Ullmo, A. Yafaev
Panoramas et Synthèses
Numéro 52
Diffusion
Maison de la SMF AMS
Case 916 - Luminy P.O. Box 6248
13288 Marseille Cedex 9 Providence RI 02940
France USA
smf@smf.univ-mrs.fr www.ams.org
Tarifs
Vente au numéro : 55 e ($ 82)
Des conditions spéciales sont accordées aux membres de la SMF.
ISSN 1272-3835
ISBN 978-2-85629-856-5
Gaël Rémond
Institut Fourier, UMR 5582, CS 40700, 38058 Grenoble Cedex 9, France
E-mail : Gael.Remond@univ-grenoble-alpes.fr
Thomas Scanlon
Department of Mathematics, University of California, Berkeley, Evans Hall, Berkeley, CA
94720-3840, USA
E-mail : scanlon@math.berkeley.edu
Emmanuel Ullmo
Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures sur Yvette,
France
E-mail : ullmo@ihes.fr
Andrei Yafaev
University College London Department of Mathematics Gower street WC1E 6BT London
United Kingdom
E-mail : yafaev@math.ucl.ac.uk
Classification mathématique par sujets. (2010) — 03C64, 11G10, 11G15, 11G50, 11J81, 14G35,
14K15, 14G40, 14J20, 14T05, 22E40.
Mots-clés et phrases. — Bornes explicites, conjecture d’André-Oort, conjecture de Manin-
Mumford, conjecture de Zilber-Pink, géométrie diophantienne, géométrie tropicale, hauteurs,
intersections exceptionnelles, multiplication complexe, o-minimalité, problème de Lehmer, sous-
groupe algébrique, sous-variétés de tores algébriques, théorème de Pila-Wilkie, théorie ergodique,
tores, variétés abéliennes, variétés de Shimura.
Keywords and phrases. — Bi-algebraicity, Zilber-Pink conjecture, functional transcendence,
o-minimality, Pila-Wilkie theorem, Shimura varieties, abelian varieties, complex multiplication, al-
gebraic tori, André-Oort conjecture, Manin-Mumford conjecture, Diophantine geometry, heights,
unlikely intersections, ergodic theory, tropical geometry.
AUTOUR DE LA CONJECTURE DE ZILBER-PINK
Abstract. — Around the Zilber-Pink conjecture. Following Faltings and Vojta’s work
proving the Mordell-Lang conjecture for abelian varieties and Raynaud’s work proving
the Manin-Mumford conjecture, many new Diophantine questions appeared, often
described as problems of unlikely intersections. The arithmetic of moduli spaces of
abelian varieties and more generally Shimura varieties has been parallely developed,
around the central André-Oort conjecture.
These two themes can be placed in a common frame - the Zilber-Pink conjecture.
This volume proposes an introduction to these problems and to the various techniques
used : geometry, height theory, reductive groups and Hodge theory, Shimura varieties,
model theory via the notion of o-minimal structure. It contains texts corresponding
to courses presented at CIRM, in May 2011, by Philipp Habegger, Gaël Rémond,
Thomas Scanlon, Emmanuel Ullmo and Andrei Yafaev and an ample introduction by
E. Ullmo, centered on the notion of bi-algebraicity, aiming at a presentation of the
general setting.
TABLE DES MATIÈRES
Avant-propos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
Foreword . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii
3. O-minimality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4. Pila-Wilkie counting theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5. Applications of the counting theorem to diophantine geometry . . . . . . . . . . 145
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Le texte est la version écrite des exposés donnés par l’auteur au CIRM en mai
2011 sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann gé-
néralisée due à Klingler, Ullmo et Yafaev. Il contient également une introduction
à la théorie des variétés de Shimura.
Points spéciaux et intersections dans les variétés abéliennes et les variétés de Shimura
Andrei Yafaev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Dans ce texte nous présentons les idées centrales des preuves des conjectures
de Manin-Mumford et d’André-Oort (admettant l’Hypothèse de Riemann Géné-
ralisée) basées sur la combinaison des techniques galoisiennes, géométriques et
ergodiques.
viii RÉSUMÉS DES ARTICLES
Au cours des dernières années une activité intense s’est développée autour des pro-
priétés arithmétiques et géométriques des sous-variétés spéciales des tores algébriques,
des variétés (semi)-abéliennes et des variétés de Shimura. Dans ce cadre les conjectu-
res de Manin-Mumford et d’André-Oort caractérisent les sous-variétés spéciales par
la densité des points spéciaux.
Boris Zilber et Richard Pink, avec des motivations assez éloignées, ont dégagé l’é-
noncé d’une conjecture « d’intersections atypiques » pour les variétés de Shimura mix-
tes ou les variétés semi-abéliennes qui généralise les conjectures de Manin-Mumford
et d’André-Oort. Les premiers résultats dans la direction de ces énoncés au delà des
questions de type Manin-Mumford ou André-Oort sont dus à Bombieri, Masser et
Zannier. Les textes qui composent cet ouvrage se proposent de faire le point sur les
progrès récents concernant ces questions et de tracer quelques perspectives d’avenir.
Quatre cours ont été présentés aux États de la Recherche au CIRM en mai 2011 sur
ces thématiques. Le premier, donné par Emmanuel Ullmo et Andrei Yafaev, portait
sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann généralisée
(GRH), preuve due à Klingler, Ullmo et Yafaev. Le cours de Thomas Scanlon exposait
l’approche o-minimale initiée par Pila et Zannier pour des preuves inconditionnelles
de Manin-Mumford et de certains cas de la conjecture d’André-Oort. Les cours de
Philipp Habegger et de Gaël Rémond portaient sur le problème de Zilber-Pink pour
les variétés abéliennes et les tores.
Les textes qui composent ce volume suivent en grande partie les présentations
orales. Cependant un texte d’introduction générale au volume, Structures spéciales et
problème de Zilber-Pink écrit par Emmanuel Ullmo ne correspond à aucun exposé. Il
fait le lien entre les différents thèmes de l’ouvrage en cherchant à dégager le cadre
naturel « bi-algébrique » pour les problèmes de type Manin-Mumford, André-Oort
et Zilber-Pink. Un point rapide sur certains progrès importants du sujet, obtenus
principalement via la méthode o-minimale, depuis la session des États de la Recherche
en 2011, est aussi présenté dans ce texte.
Le texte d’Emmanuel Ullmo : Autour de la conjecture d’André-Oort introduit les
outils nécéssaires à la compréhension de la preuve de la conjecture d’André-Oort sous
GRH par la méthode d’Edixhoven-Hindry. On y trouve une présentation de la théorie
des variétés de Shimura qui insiste sur les aspects qui interviennent dans la conjecture
xii AVANT-PROPOS
STRUCTURES SPÉCIALES
ET PROBLÈME DE ZILBER-PINK
par
Emmanuel Ullmo
1. Introduction
Au cours des dernières années une activité intense s’est développée autour des pro-
priétés arithmétiques et géométriques des sous-variétés spéciales des tores algébriques,
des variétés abéliennes et des variétés de Shimura. Boris Zilber [86] et Richard Pink
([55], [56]), avec des motivations très éloignées, ont dégagé l’énoncé d’une conjecture
« d’intersections atypiques » pour les variétés de Shimura mixtes ou les variétés semi-
abéliennes qui généralise la conjecture de Manin-Mumford pour les variétés abéliennes
et la conjecture d’André-Oort pour les variétés de Shimura. Les premiers résultats
dans la direction de ces énoncés au delà des questions de type Manin-Mumford ou
André-Oort sont dus à Bombieri, Masser et Zannier [8]. Une session des « États de la
recherche » de la Société Mathématique de France (SMF) consacrée à ces problèmes
a été organisée au CIRM en mai 2011 et les textes qui composent cet ouvrage se pro-
posent de faire le point sur les progrès récents concernant ces questions et de tracer
quelques perspectives d’avenir.
Dans la première partie de cette introduction nous essayons d’expliquer dans quelle
situation une variété algébrique possède un ensemble de points spéciaux et un en-
semble de sous-variétés spéciales de dimension positive pour lesquels les problèmes de
type Manin-Mumford-André-Oort ou Zilber-Pink sont à la fois vraisemblables et in-
téressants. On développe une approche inspirée de la théorie des modèles et on insiste
tout particulièrement sur l’interprétation bi-algébrique des sous-variétés spéciales et
des points spéciaux. On fait ensuite le point sur les résultats récents sur la conjecture
d’André-Oort par la méthode de Pila-Zannier et l’on conclut par une discussion rapide
sur quelques résultats dans la direction de Zilber-Pink.
Remerciements. – C’est un plaisir de remercier Yves André, Daniel Bertrand, Jean-
Benoît Bost, Marc Hindry, Ehud Hrushovski, Bruno Klingler, Michel Waldschmidt et
Andrei Yafaev pour des discussions éclairantes et des remarques mathématiques et
typographiques.
L’un des rapporteurs de cet article m’a donné des indications bibliographiques pré-
cieuses concernant le théorème 2.8 et m’a fourni l’énoncé et la preuve du théorème 2.9
ainsi que celle du théorème 2.10. Sa lecture détaillée m’a aussi permis d’améliorer plu-
sieurs points du texte et je lui adresse tous mes remerciements.
(a) Σ0 (V r ) = Σ0 (V )r .
Pn
(b) Pour tout r-uplets d’entiers (a1 , . . . , ar ) tels que a = i=1 ai , on a
r
Y
Σai (V ) ⊂ Σa (V r ).
i=1
2
(c) L’ensemble Σn (V ) contient une infinité dénombrable de correspondances al-
gébriques de V .
Dans ce texte une correspondance algébrique de V est une sous-variété algébrique
W de V 2 telle que les projections de W sur les facteurs sont finies et surjectives.
vérifie sans peine que ce sont des exemples de variétés algébriques munies d’une struc-
ture spéciale. Seule la condition (c) sur les correspondances méritent une explication.
Explicitons le cas d’une variété abélienne et le cas des variétés de Shimura pures.
Soit A une variété abélienne et soit α un endomorphisme de A. En prenant pour α
la multiplication par un entier n on voit que l’on dispose d’un ensemble dénombrable
de tels endomorphismes. Soit
Aα ⊂ A × A
le graphe de α. Alors Aα est une correspondance algébrique de A × A qui est une
sous-variété spéciale de A × A.
Soit S une variété de Shimura pure. Les correspondances de Hecke fournissent
un ensemble dénombrable infini de correspondances de S qui sont des sous-variétés
spéciales de S × S.
Remarque 2.2. – Je ne sais pas si la condition portant sur les sous-variétés spéciales
W de V est automatique. Seule la propriété (c) ne l’est pas de manière évidente.
– Il est très naturel du point de vue de la théorie des modèles ou des géométries
de Zariski de considérer des structures spéciales sur V r pour tout entier r. Les
sous-variétés spéciales se comportent alors comme les ensembles définissables
de la théorie. La condition sur les correspondances assure que V est muni de
structures supplémentaires (endomorphismes, correspondances de Hecke) et les
sous-variétés spéciales sont, au moins dans les exemples que nous avons en vue,
celles qui héritent de cette structure supplémentaire.
– Dans l’esprit de la théorie des catégories, on peut définir les morphismes entre
sous-variétés spéciales. Soit Y une sous-variété de V r et Z une sous-variété
de V s . On dit qu’un morphisme algébrique φ : Y → Z est spécial si le graphe
de φ est spécial dans V r+s . Il serait intéressant de rédiger une preuve que l’on
retrouve bien pour les variétés de Shimura et les variétés semi-abéliennes la
notion usuelle de morphismes.
– Dans les exemples que nous avons en tête, les variétés munies de structures
spéciales admettent des revêtements finies de degrés arbitrairement grands non
ramifiés en dehors d’un ouvert fixe par des variétés qui sont elles mêmes munies
d’une structure spéciale. Si fN : VN → V est un tel revêtement, l’image par fN
d’une sous-variété spéciale de VN est spéciale et une composante de l’image
inverse par fN d’une sous-variété spéciale de V est spéciale dans VN . Dans
les situations classiques (variétés semi-abéliennes, variétés de Shimura mixtes)
VN × V est aussi une variété semi-abélienne ou une variétés de Shimura mixte
selon le cas et possède donc une structure spéciale naturelle. Dans cette situation
le graphe de fN , ou celui de la restriction de fN a une sous-variété spéciale est
une sous variété spéciale de VN × V .
sont définies sur Q. Une telle structure est dite triviale. Les énoncés que l’on a en vue
ne sont pas intéressants dans ce cas. Une manière d’exclure ce cas est d’introduire une
notion plus forte de structure spéciale qui contient le cas des variétés semi-abéliennes
et des variétés de Shimura mixtes.
Soit V une variété algébrique quasi-projective. Une correspondance algébrique T ⊂
V ×V de V est dite modulaire si les deux projections de T vers V sont des morphismes
étales. On vérifie que si V est une variété semi-abélienne ou une variété de Shimura
mixte définie par un réseau sans torsion, les correspondances W de V qui sont spéciales
dans V × V sont les correspondances modulaires. De manière générale si V est une
variété de Shimura arbitraire, il existe un ouvert de Zariski U de V tel que pour toute
correspondance de Hecke T ⊂ V × V , les deux projections de T vers V sont non
ramifiées au dessus de U . Si V = SL2 (Z)\H ≃ C, on peut prendre U = C − {0, 1728}.
Cela suggère la définition suivante.
Définition 2.3. – Une variété algébrique lisse quasi-projective V est munie d’une
structure spéciale forte si elle est munie d’une structure spéciale et d’un ouvert de
Zariski U de V tel que l’ensemble (infini dénombrable) des correspondances algé-
briques T qui sont spéciales dans V × V sont les correspondances de V dont les deux
projections sur V sont non ramifiées au dessus de U .
Dans l’esprit de la dernière partie de la remarque 2.2, on aurait pu définir la notion
de structure spéciale forte sur une variété quasi-projective V de la manière proche
suivante. On demande qu’il existe un ouvert de Zariski U de V et des revêtement
finis de degrés arbitrairement grands fN : VN → V non ramifiés au dessus de U tels
que VN soit muni d’une structure spéciale tels que les sous-variétés spéciales de V n
et de VNn se correspondent via fN n
pour tout N , et tout entier positif n. La notion de
sous-variété spéciale forte donnée dans la définition 2.3 nous semble plus géométrique.
L’autre justification de la définition 2.3 provient d’un théorème de Kazdhan et
Margulis que l’on décrit de la manière suivante. Le lecteur peut consulter la section 9
du livre de Margulis [40] pour des précisions, des preuves et bien plus.
Soit S une variété de Shimura. Alors S est associée à une donnée de Shimura
(G, X) où G est un Q-groupe algébrique réductif et X une G(R)-classe de conjugaison
de morphisme du tore de Deligne S vers GR vérifiant les conditions de Deligne. Une
composante connexe X + de X est un espace symétrique hermitien.
On fixe une représentation fidèle de dimension finie G ⊂ GLn,Q dans un Q-espace
vectoriel de dimension n. On définit
G(Z) := G(Q) ∩ GLn (Z).
Un sous-groupe Γ de G(Q) est commensurable à G(Z) si Γ ∩ G(Z) est d’indice fini
dans G(Z) et dans Γ. La notion de commensurabilité est indépendante du choix du
plongement choisi G ⊂ GLn,Q . Un sous-groupe Γ de G(Q) est dit arithmétique si il
est commensurable à G(Z).
Soit X + un espace symétrique hermitien. On note Aut(X + ) le groupe des automor-
phismes holomorphes de X + . On peut alors munir X + d’une métrique riemanienne
invariante par l’action de Aut(X + ) et Aut(X + ) agit sur X + par isométries. Un ré-
seau de X + est un groupe discret Λ agissant sur X + par automorphismes holomorphes
de X + tel que tout domaine fondamental de X + sous l’action de Λ soit de volume
fini pour la mesure Aut(X + )-invariante.
D’après un théorème de Borel ([10], lemme 12.5 p. 87), l’image d’un sous-groupe
arithmétique Γ de G(Q) dans Aut(X + ) est un réseau de X + . De manière générale,
soit Λ un réseau de X + . On dit que Λ est un réseau arithmétique de X + si il est
obtenu de la manière suivante. Il existe un groupe algébrique G1 sur Q, semi-simple
tel que si K∞ est un sous-groupe compact maximal de G1 (R), alors X + ≃ G1 (R)/K∞
et tel que Λ est commensurable à G1 (Z).
Notons qu’il existe en général une infinité de groupes semi-simples G1 sur Q qui ne
sont pas isomorphes sur Q tels que X + ≃ G1 (R)/K∞ . Explicitons le cas des réseaux
arithmétiques du demi-plan de Poincaré H en notant que toute surface de Riemann
projective lisse de genre au moins 2 est un quotient de H par un réseau.
Exemple 2.4. – Soit F un corps de nombres totalement réel de degré d. Soit B une
algèbre de quaternions B sur F déployée en une unique place archimédienne de F .
Soit G := F∗ \B∗ le groupe algébrique adjoint dont les points sur Q sont F ∗ \B ∗ . On
a alors
G(R) ≃ PGL2 (R) × SOr−13 ,
de sorte que pour tout sous-groupe compact maximal K∞ de G(R) on a G(R)/K∞ ≃
H. Si Γ ⊂ G(Q) est un réseau arithmétique de G(Q), alors l’image de Γ dans PGL2 (R)
est un réseau arithmétique de H.
Réciproquement tout réseau arithmétique de H est obtenu par une telle construction.
Deux réseaux arithmétiques de H associés à des algèbres de quaternions distinctes ne
sont pas commensurables.
La justification de la notion de structures spéciales fortes sur une variété provient
de l’énoncé suivant dû à Kazdhan et Margulis [40] prop. 7.7.
Théorème 2.5. – Soit V une variété algébrique complexe lisse admettant une infinité
de correspondances modulaires. On suppose que le revêtement universel de V est un
espace symétrique hermitien X + et que π1 (V ) est un réseau de X + . Alors π1 (V ) est
un réseau arithmétique de X + .
Dans cette situation, il existe une variété de Shimura S = Γ\X + avec Γ commen-
surable à π1 (V ). Soit
π : X + −→ V = π1 (V )\X + .
On note
C = CommAut(X + ) (π1 (V ))
le commensurateur de π1 (V ) dans Aut(X + ). Un point c de C est un point de Aut(X + )
tels que cπ1 (V )c−1 ∩ π1 (V ) est d’indice fini dans π1 (V ) et dans cπ1 (V )c−1 . Pour
tout c ∈ C,
Tc := {(π(x), π(c.x)), x ∈ X + } ⊂ V × V
2.2. Structures spéciales bi-algébriques. – Il est probable que l’on puisse construire des
structures spéciales fortes sur certaines variétés qui ne se ramènent pas aux cas des
variétés semi-abéliennes ou à celui des variétés de Shimura mixtes.
On peut encore préciser le cadre en ne regardant que les variétés V munies d’une
structure spéciale bi-algébrique.
2.2.1. Structures spéciales bi-algébriques sur les tores.– Le paradigme du monde bi-
algébrique est la fonction π(z) := exp(2iπz) qui est une fonction transcendante entre
deux variétés algébriques complexes
π : C = Lie(Gm ) −→ C∗ = Gm (C).
On dit qu’un élément α de C∗ est bi-algébrique au sens arithmétique si α ∈ Q et
si il existe β ∈ Q tel que π(β) = α. Dans cette situation π −1 (α) = β + Z ⊂ Q. C’est
la justification pour le choix de la fonction exp(2iπz) plutôt que de celui de exp(z).
La bi-algébricité d’un élément α ∈ Gm (Q) ne dépend pas ainsi d’un relevé de α
par l’application d’uniformisation. Une autre présentation possible est de prendre
π = exp(z) mais de choisir H1 (Gm , Q) = 2iπQ ⊂ C comme structure rationnelle
sur C.
Le théorème de Gel’fond-Schneider ([78] thm 1.4, p.3) dit que si λ et β sont deux
nombres complexes avec λ 6= 0 et si les trois nombres eλ , β et eβλ sont algébriques
alors β ∈ Q.
En prenant λ = 2iπ dans cet énoncé, on voit qu’un nombre algébrique α ∈ Gm est
bi-algébrique (au sens arithmétique) si et seulement si il est de la forme α = e2iπβ
avec β ∈ Q. Ceci est équivalent à dire que α est un point de torsion de Gm ou que α
est spécial dans le sens précédent pour le tore algébrique Gm . L’importance de la
notion du point de vue de la théorie de Galois provient du fait qu’alors Q[α] est une
extension abélienne de Q et que l’on engendre ainsi toutes les extensions abéliennes
de Q d’après le théorème de Kronecker-Weber.
On peut remarquer que si l’on avait choisit π(z) = exp(z) et la structure rationnelle
usuelle sur C, seule l’origine de Gm serait bi-algébrique (au sens arithmétique) par le
théorème d’Hermite-Lindemann ([78] thm 1.2, p. 2).
Analysons alors la structure spéciale sur le tore Grm . On dispose de l’application
d’uniformisation
Π := (π, . . . , π) : Cr −→ Grm (C) = (C∗ )r .
On dispose alors de la notion de points bi-algébriques (au sens arithmétique) qui
correspond donc à la notion de points spéciaux.
Par ailleurs si V est une sous-variété algébrique de Grm , on dit que V est bi-
algébrique (au sens géométrique) si une composante analytique de Π−1 (V ) est une
sous-variété algébrique de Cr . Comme l’action de Zr sur Cr est algébrique, si V
est bi-algébrique alors toute composante analytique de Π−1 (V ) est algébrique. Une
conséquence simple du théorème d’Ax [6] est que les sous-variétés bi-algébriques sont
les translatés de sous-tores V = zT pour un sous-tore T de Grm et un point arbi-
traire z de Grm . Pour les variétés de dimension positive, la notion de bi-algébricité
ne dépend pas du choix de l’application d’uniformisation (on pourrait prendre Π =
(exp(z), . . . , exp(z)). Pour les points, on a donc deux notions de bi-algébricité une
arithmétique et une géométrique qui est toujours réalisée. Quand le contexte est clair,
en particulier quand la discussion porte uniquement sur des points on ne précisera
pas toujours que l’on parle du sens arithmétique.
On remarque cependant, qu’avec nos conventions, les sous-variétés spéciales sont les
sous-variétés bi-algébriques contenant un point bi-algébrique. De manière équivalente
ce sont les sous-variétés algébriques de Grm définies sur Q telle qu’une composante
analytique de π −1 (V ) soit algébrique et défini sur Q.
Nous dirons dans la suite que les sous-variétés bi-algébriques sont les sous-variétés
faiblement spéciales, de sorte qu’une sous-variété spéciale est une sous-variété faible-
ment spéciale ayant un point spécial. Du point de vue de la géométrie riemannienne
les sous-variétés faiblement spéciales de Grm apparaissent de manière naturelle. Ce
sont les sous-variétés totalement géodésiques.
2.2.2. Structures spéciales bi-algébriques sur les variétés abéliennes.– Soit A une va-
riété abélienne de dimension g sur C, on dispose donc d’une application d’uniformi-
sation
π : Cg → A ≃ Cg /Γ
pour un réseau Γ de Cg . L’application π est une application transcendante entre
deux variétés algébriques. On dit alors comme précédemment qu’une sous-variété V
de A est faiblement spéciale si les composantes analytiques complexes de π −1 (V )
sont des sous-variétés algébriques de Cn . On vérifie que V est faiblement spéciale
si et seulement si V = P + B pour une sous-variété abélienne B de A et un point
P ∈ A(C) ([73] prop. 5.1). On remarque que tout point de A est faiblement spécial,
que les sous-variétés spéciales de A sont faiblement spéciales et qu’une sous-variété
faiblement spéciale est spéciale si et seulement si elle contient un point spécial donc
est de la forme P + B avec P de torsion. Notons encore une fois que la notion de
bi-algébricité pour les sous-variétés de dimension positive ne dépend pas du choix de
l’application d’uniformisation.
Les variétés abéliennes complexes ne sont pas toutes définissables sur Q. Si on fait
l’hypothèse supplémentaire que A est défini sur Q, on écrit de manière canonique
Dans cette situation Lie(AQ ) est un Q-vectoriel de dimension n tel que Lie(AQ ) ⊗ C =
Lie(AC ). Ce choix naturel ne donne cependant pas lieu à une structure bi-algébrique
intéressante. On dispose en effet du résultat suivant (thm. 3 p. 28 [37]) .
Proposition 2.6. – Soit z ∈ Lie(AQ ) tel que π(z) ∈ A(Q). Alors z = 0 et π(z) = 0 est
l’élément neutre de A(C).
On rappelle tout d’abord l’énoncé du théorème du sous-groupe analytique de Wüs-
tholz ([79] thm. 1) qui est valable plus généralement pour un groupe algébrique com-
mutatif GQ défini sur Q arbitraire d’algèbre de Lie gQ . Si gC désigne l’algèbre de Lie
de G(C) et
expG : gC = gQ ⊗ C → G(C)
l’application exponentielle de G(C), on a :
Théorème 2.7. – (Wüstholz) (i) Soit b un sous-Q-vectoriel de gQ de dimension po-
sitive. Soit B = expG (b ⊗ C). On suppose que B ∩ G(Q) 6= {0}. Il existe alors
un Q-sous-groupe algébrique HQ de GQ de dimension positive d’algèbre de Lie hQ tel
que hQ ⊂ b.
De façon équivalente :
(ii) Soit u ∈ g ⊗ C tel que expG (u) ∈ G(Q). Soit h le plus petit sous-espace vectoriel
de g défini sur Q et tel que u ∈ h(C). Alors h est l’algèbre de Lie d’un sous-groupe
algébrique H de G défini sur Q.
La preuve de Lang de la proposition 2.6 n’utilise pas le théorème de Wüstholz. On
peut cependant le déduire simplement du théorème 2.7 de la manière suivante. On
peut supposer que z ∈ Lie(AQ ) est non nul. On prend GQ = Lie(AQ ) × AQ de sorte
que l’application exponentielle de G(C),
expG : gC = Lie(AC ) × Lie(AC ) −→ Lie(AC ) × AC
est simplement expG = (Id, π). Soit b = Q(z, z) c’est une Q-sous-algèbre de Lie de gQ .
Par hypothèse B ∩ G(Q) = expG (b ⊗ C) ∩ G(Q) contient le point (z, π(z)) donc est
non nul. D’après le théorème de Wüstholz, il existe un sous-groupe algébrique HQ
de GQ , de dimension positive, tel que hQ ⊂ b = Q(z, z). On a donc hQ = Q(z, z) et
HC := {(zt, π(zt)), t ∈ C}
serait un groupe algébrique. Ceci contredirait le fait que les seuls sous-groupes al-
gébriques connexes de Ga × A, de dimension 1, sont Ga et les courbes elliptiques
contenues dans A.
Soit AC une variété abélienne sur C, de dimension g, qui est définissable sur Q
et π : Lie(AC ) −→ A(C) comme précédemment. Pour pouvoir espérer caractériser
les points de torsion de A par une propriété de bi-algébricité, on cherche une base
(e1 , . . . , eg ) de Lie(AC ) tel que l’on puisse caractériser les points de torsion de A(C)
comme les images des
x ∈ VectQ (e1 , . . . , eg ) := Qe1 ⊕ · · · ⊕ Qeg ⊂ Lie(AC )
tels que π(x) ∈ A(Q). Une condition nécessaire pour cela est que le réseau des périodes
Γ = Ker(π) soit contenu dans un Q-vectoriel de dimension g. Si on suppose que A est
muni d’une polarisation principale φ pour simplifier la discussion, alors
(A, φ) ≃ (Aτ , φτ ) := (Cg /(Zg + τ Zg ), φτ )
avec τ dans le demi-espace de Siegel Hg formé des matrices symétriques d’ordre g
de partie imaginaire définie positive et φτ la forme symplectique standard sur Γ =
Zg + τ Zg . Pour que Γ soit contenu dans un Q-vectoriel de dimension g il faut et il
suffit que les entrées de la matrice τ soient dans Q. Soit
Jg : Hg −→ A g (C) ≃ Sp2g (Z)\Hg
l’application modulaire telle que Jg (τ ) soit le point modulaire de (Aτ , φτ ) :=
(Cg /(Zg + τ Zg ), ψ). Comme A est défini sur Q, Jg (τ ) est défini sur Q. D’après le
résultat de Cohen et de Shiga-Wolfart discuté plus loin dans ce texte (thm. 2.16),
on trouve que A est à multiplication complexe. Le résultat suivant est obtenu par
Masser [41]. Un énoncé proche est aussi donné par Lang [38].
Théorème 2.9. – Soit A une variété abélienne définie sur Q. Soient D = End(A) ⊗ Q
son algèbrePd’endomorphismes et Λ = Zω1 +· · ·+Zωr un sous-groupe de H1 (A(C), Z).
r
Soit x = i=1 αi ωi un point de Λ ⊗ Q tel que expA (x) ∈ A(Q). Alors x ∈ D ⊗ Γ
et expA (x) est un point de torsion de A.
Comme les αi sont algébriques, b est défini sur Q. Le point u := (x, ω1 , . . . , ωr ) de b⊗C
est tel que expG (u) ∈ G(Q). Il existe donc une sous-variété abélienne H de G = Ar+1
Théorème 2.10. – Soit A une variété abélienne définie sur Q. Soient EA son extension
vectorielle universelle et Γ le groupe H1 (EA , Z) = Ker(expEA ). Soit
U ∈ Γ ⊗ Q ⊂ T0 (EA )(C)
tel que expEA (U ) ∈ EA (Q). Alors U ∈ Γ ⊗ Q et de façon équivalente expEA (U ) est
un point de torsion de EA .
On peut remarquer que cet énoncé caractérise de manière bi-algébrique les points
de torsion de A(C) car le groupe des points de torsion de A(C) est canoniquement
isomorphe à celui de EA (C).
Preuve. Soit u l’image de U par la projection T0 (EA ) → T0 (A). Alors u ∈
H1 (A, Z) ⊗ Q et expA (u) ∈ A(Q). D’après le théorème 2.9, u ∈ H1 (A, Q). Soit U ′ le
relèvement de u dans H1 (EA , Q). Alors Ũ := U − U ′ vérifie les mêmes hypothèses
que U et Ũ ∈ VA (C). Comme la restriction de expEA à VA est l’identité, on voit que
Ũ ∈ VA (Q) ∩ (Γ ⊗ Q).
Plusieurs approches utilisant le théorème de Wüstholz permettent de montrer
que VA (Q) ∩ (Γ ⊗ Q) est réduit à 0, donc que Ũ = 0 et que
U = U ′ ∈ H1 (EA , Q).
Cela se déduit en particulier d’un autre énoncé de Wüstholz ([79] thm. 2) qui assure
que les périodes de deuxième espèce d’une variété abélienne sont nulles ou transcen-
dantes.
ψx0 : G(R) → X
g 7→ g.x0
Toutes les réalisations mentionnées dans cette section sont isomorphes de sorte
qu’elles sont toutes semi-algébriques.
dans H(Q). Dans cette situation le théorème de Schneider ([64] 1937) assure que x est
bi-algébrique si et seulement si x est un point à multiplication
√ complexe. Dans cette
situation Q[τ ] est une extension quadratique imaginaire Q[ −d] de Q et Q[τ, x] est
une extension galoisienne de Q[τ ] de groupe de Galois abélien. C’est une réponse pour
les corps quadratiques imaginaires au « Kronecker Jugentraum » également connu
comme le 12e problème de Hilbert qui prédit que les extensions abéliennes d’un corps
de nombres F sont contenues dans des extensions de F engendrées par des valeurs
spéciales de fonctions analytiques.
L’extension de ce résultat à l’espace de modules A g des variétés abéliennes prin-
cipalement polarisées de dimension g est donnée par Cohen [15] et Shiga-Wolfart [66]
en utilisant le théorème du sous-groupe analytique de Wüstholz (thm. 2.7).
Par la théorie des modèles canoniques, A g (C) admet une modèle canonique A g
sur Q qui est une variété algébrique quasi-projective sur Q. Les points spéciaux sont
alors dans A g (Q). On peut normaliser la fonction
Jg : Hg := {z ∈ Mg (C)|z = z t , Im(z) > 0} −→ A g (C) ≃ Sp2g (Z)\Hg
qui uniformise A g (C) de sorte que l’image inverse d’un point CM est dans Hg (Q) :=
Hg ∩ Mg (Q). On fixe une telle normalisation, de sorte que les points spéciaux sont
bi-algébriques.
Théorème 2.16 (Cohen, Shiga-Wolfart). – Un point z ∈ A g (Q) est bi-algébrique si et
seulement si il est spécial.
Dans cette situation une sous-variété spéciale V de S est une sous-variété algébrique
définie sur Q telle que les composantes de π −1 (V ) soient algébriques et définies sur Q,
i.e. composante d’une intersection d’une sous-variété algébrique de Mg,Q avec Hg .
La notion de bi-algébricité pour les points d’une variété de Shimura S = Γ\X +
dépend à priori de la réalisation X de X + et de la normalisation de l’application
d’uniformisation. Pour les variétés de Shimura de type PEL des normalisations sont
donnés dans les travaux de Shimura et reprises dans le texte de Shiga-Wolfart [66].
Les choix sont faits de tel sorte que les points CM sont bi-algébriques.
Pour une variété de Shimura arbitraire, on procède de la manière suivante ([73],
ch. 3.3 et 3.4). Soit (G, X) une donnée de Shimura et V une Q-représentation fidèle
de dimension finie. Au vue de l’interprétation de Deligne de X comme G(R)-classe
de conjugaison de morphismes du tore de Deligne S = C∗ dans GR on dispose pour
tout x ∈ X + d’une structure de Hodge Vx sur V , donc d’une filtration de Hodge
Fx∗ (VC ) sur VC ([72] 3.2). D’après Deligne, le plongement de Borel X ⊂ X ∨ de X +
dans son dual compact X ∨ est l’application
x 7→ Fx∗ (VC ).
Si on fixe x0 dans X + et que l’on note Q le sous-groupe de GL(VC ) stabilisant Fx∗ (VC ),
on voit que X ∨ est réalisé comme une sous-variété de la variété de drapeaux ΘC :=
GL(VC )/Q. Comme V est un Q-vectoriel, ΘC est canoniquement l’extension à C d’une
variété algébrique ΘQ sur Q. Par la définition du corps reflex E(G, X) de (G, X) on
voit que X ∨ comme sous-variété de ΘC est défini sur E(G, X). On dit alors qu’un
point de X est algébrique si P ∈ X + ∩ X ∨ (Q) = X + ∩ ΘQ (Q).
Un point x ∈ X + est CM si et seulement si
x : S → GR
se factorise par l’extension TR d’un Q-tore maximal TQ de GQ . Un argument simple
donné dans ([73] ch 3.4) montre que si π : X → S désigne l’application d’unifor-
misation, les point spéciaux de S sont bi-algébriques. Je ne sais pas, en dehors du
cas des variétés de Shimura de type abélien qui se déduit des résultats de Cohen et
Shiga-Wolfart si cela caractérise les points spéciaux de S.
Les isomorphismes de réalisations entre la réalisation bornée et les réalisations non
bornées de Siegel de X sont donnés par des transformations de Cayley explicites qui
sont automatiquement des applications semi-algébriques comme on l’a vu. On peut
vérifier que les Q-structures naturelles sont préservées de sorte que pour les questions
de bi-algébricités on peut passer d’une réalisation à l’autre. La brique élémentaire de
ces transformations de Cayley sont du type
c : H := {z ∈ C, |Im(z) > 0} −→ ∆ := {z ∈ C, |z| < 1}
z−i
z 7→ .
z+i
Le lecteur intéressé peut consulter par exemple la section I.5 de [11] pour plus de
précisions sur les réalisations des espaces symétriques hermitiens et sur leurs isomor-
phismes via les transformations de Cayley.
2.2.5. Structures spéciales bi-algébriques et conjecture de Kollar-Pardon. – Pour ré-
sumer les structures que nous avons rencontrées, on fait les définitions suivantes.
Définition 2.17. – (i) On dit qu’une variété algébrique V sur C est munie d’une struc-
ture bi-algébrique si son revêtement universel Vb est biholomorphe à un ouvert semi-
algébrique d’une variété algébrique. Si V est muni d’une structure bi-algébrique alors
pour tout r ∈ N∗ , V r est muni d’une structure bi-algébrique.
(ii) On dit qu’une variété algébrique V sur C est munie d’une structure spéciale
bi-algébrique forte si V est à la fois muni d’une structure spéciale forte et d’une
structure bi-algébrique telle que les sous-variétés spéciales de V r sont les sous-variétés
bi-algébriques ayant un point spécial.
(iii) On dit qu’une variété algébrique V sur C est munie d’une structure spéciale
bi-algébrique forte arithmétique si elle est munie d’une structure spéciale bi-algébrique
ayant les propriétés arithmétiques suivantes.
(a) La variété V est définie sur Q.
(b) Le revêtement universel Vb se plonge dans une variété algébrique définie sur Q.
(c) Soit π : Vb → V l’application d’uniformisation. Les points spéciaux de V sont
les points z de V (Q) tels que tout y ∈ π −1 (z) soit dans Vb (Q).
Les variétés semi-abéliennes et les variétés de Shimura mixtes sont munis de struc-
tures spéciales bi-algébriques fortes. Les variétés de Shimura de type abélien et Gm
sont munies de structures spéciales bi-algébriques fortes arithmétiques. Une question
naturelle dans ce langage est de vérifier que les variétés abéliennes à multiplication
complexe et les variétés de Shimura mixtes sont munies de structures spéciales bi-
algébriques fortes arithmétiques.
Explicitons l’exemple de la variété de Shimura mixte U g qui est la variété abélienne
universelle sur A g .
La construction de U g s’obtient à partir du Q-groupe algébrique
P2g = V2g ⋊ GSp2g
où V2g est le Q-vectoriel de dimension 2g muni de l’action naturelle du groupe sym-
plectique GSp2g . Le groupe P2g (R) agit de manière transitive sur
Xg+ := R2g × Hg .
par
(v, h).(v ′ , x) := (v + hv ′ , hx).
On peut plonger Xg+ comme un ouvert (pour la topologie archimédienne) d’une va-
riété algébrique complexe Xg∨ munie d’une action transitive de P2g (C). Ce plongement
est P2g (R)-équivariant de sorte que l’on a
Xg+ = P2g (R).x0 ֒→ P2g (C).x0 = P2g (C)/StabP2g (C) (x0 ) = Xg∨ .
On vérifie encore que Xg+ est semi-algébrique réel et on définit comme dans le cas
pur la notion de sous-variété algébrique de Xg+ . Au vu de sa description explicite, on
dispose aussi d’une Q-structure sur Xg+ .
Soit Γ = Z2g ⋊ GSp2g (Z). Alors Γ est un réseau arithmétique de Xg+ et on a une
application d’uniformisation
π : Xg+ −→ U g = Γ\Xg+ .
Plus généralement si N est un entier positif, on note GSp2g (Z)(N ) l’ensemble des
matrices de GSp2g (Z) qui sont congrues à 1 modulo N et
Γ(N ) = Z2g ⋊ GSp2g (Z)(N ).
Soit A g,N l’espace de modules des variétés abéliennes principalement polarisées de
dimension g munies d’une structure symplectique de niveau N . On a alors A g,N ≃
GSp2g (Z)(N )\Hg et A g,N = A g . On note
U g,N := Γ(N )\Xg+ .
On a un morphisme
η = ηN : U g,N −→ A g,N
tel que pour tout N pair avec N ≥ 4 et tout x ∈ A g,N (C) représentant la variété
abélienne principalement polarisée Ax de dimension g munie d’une structure symplec-
tique de niveau N , la fibre η −1 (x) de η au dessus de x est Ax munie de sa structure
symplectique. Le lecteur peut consulter la thèse de Pink ([54] ch. 10), en particulier
le théorème 10.6 et la proposition 10.8 pour des énoncés plus précis ainsi que des
preuves. Les points spéciaux sont dans ce cas les points de torsion des fibres au dessus
d’un point spécial. D’après la thèse de Pink [54] on dispose d’un modèle canonique
de U g,N sur Q et le morphisme η est lui même défini sur Q.
Richard Pink donne une définition des sous-variétés faiblement spéciales pour les
variétés de Shimura mixtes en terme de données de Shimura mixtes ([55] def. 4.1).
Ziyang Gao vérifie alors que les variétés faiblement spéciales sont les variétés bi-
algébriques. Dans la situation précédente une sous-variété algébrique de U g est fai-
blement spéciale si et seulement si une composante de son image inverse par π est
algébrique [24].
2
Par ailleurs Xg+ = R2g × Hg est naturellement plongé dans R2g × (C)g . On peut
donc parler de la notion de point algébrique de Xg+ et les points spéciaux de U g
sont alors bi-algébriques. On s’attend à ce que ce soient les seuls. Cela contient le
théorème 2.8 pour les variétés abéliennes à multiplication complexe. Cela explique
aussi pourquoi on ne trouve une interprétation bi-algébrique satisfaisante pour les
points de torsion des variétés abéliennes que dans le cas des variétés abéliennes à
multiplication complexe.
Il me semble plausible qu’il n’y ait pas d’autres variétés algébriques sur C munies
d’une structure spéciale bi-algébrique forte arithmétique ou non au delà des exemples
déjà rencontrés dans ce texte. La conjecture suivante de Kollar et Pardon [36] prévoit
en tout cas des restrictions très fortes sur les variétés munies d’une structure bi-
algébrique.
Conjecture 2.18. – Soit V une variété algébrique projective lisse munie d’une structure
bi-algébrique. Alors le revêtement universel Vb de V est biholomorphe à un produit
(1) Vb = W × Cn × D
où W est une variété algébrique projective normale simplement connexe et D un
domaine symétrique hermitien.
Il est tentant de penser que les 3 facteurs du membre de droite de l’équation (1)
sont le reflet de la trichotomie de Zilber. Je ne sais cependant pas donner un sens
précis à cette assertion.
Conjecture 2.20. – (i) Si δ(Z) > 0 alors Z(δ(Z) − 1) n’est pas Zariski dense dans Z.
(ii) On suppose que Z est Hodge générique dans S = <Z> (def 2.1). Soit
s = dim(S) − dim(Z) = δ(Z).
Alors Z(s − 1) n’est pas Zariski dense dans Z.
3. La conjecture de Zilber-Pink
Dans cette partie on fait un point rapide sur ce qui est connu pour les problèmes
de type Manin-Mumford-André-Oort ou Zilber-Pink dans les exemples classiques de
variétés algébriques munies d’une structure spéciale.
3.1. Manin-Mumford. – Quand V = A est une variété abélienne ou une variété semi-
abélienne, la conjecture 2.19 est connue sous le nom de conjecture de Manin-Mumford.
La première preuve de la conjecture de Manin-Mumford pour les sous-variétés des
variétés abéliennes est donnée par Raynaud [59] par des techniques p-adiques. De
nombreuses preuves alternatives sont apparues par la suite par des approches très
diverses montrant la richesse de la question. Citons notamment :
– la preuve de Hindry [32] par une combinaison de méthodes galoisiennes et géo-
métriques,
– celle de l’auteur de ces notes et de Zhang via la conjecture de Bogomolov [69],
[84] par des techniques de théorie d’Arakelov et d’équidistribution de suites de
points de petite hauteur,
3.2. André-Oort. – Yves André [2], intéressé par des problèmes de transcendance des
périodes des variétés de Shimura propose la conjecture 2.19 pour les courbes dans
une variété de Shimura. Frans Oort [47], motivé par des questions concernant les ja-
cobiennes à multiplication complexe propose la conjecture 2.19 pour les sous-variétés
de l’espace de module A g des variétés abéliennes principalement polarisée de dimen-
sion g. Il ne fait pas de doute que l’un et l’autre avait en tête l’analogie avec l’énoncé de
la conjecture de Manin-Mumford. Le problème précédent pour une variété de Shimura
mixte est donc connu sous le nom de conjecture d’André-Oort.
Pour la conjecture d’André-Oort pour les variétés de Shimura plusieurs séries de
travaux ont été inspirés des différentes méthodes ayant permis de donner une preuve
de Manin-Mumford.
Les méthodes p-adiques de Raynaud [59] ont été la source d’inspiration de Oort
et de son école dans un premier temps. Des résultats notables dans la direction de
la conjecture d’André-Oort pour l’adhérence de Zariski d’un ensemble de points CM
d’une variété de Shimura vérifiant des hypothèses de réduction en une place fixée sont
obtenus par Moonen ([46] thm 5.7) et Yafaev [80].
Edixhoven a développé une approche de la conjecture d’André-Oort qui après ana-
lyse s’avère très proche dans l’esprit de celle d’Hindry pour Manin-Mumford. Nous
parlerons donc de la méthode d’Edixhoven-Hindry. Cette méthode est expliquée en
détail dans ce volume dans mon texte [72] ainsi que celui de Yafaev [81]. Les résul-
tats obtenus ainsi utilisent de manière essentielle l’hypothèse de Riemann générali-
sée (GRH) via des énoncés de type Cebotarev effectifs [65]. Edixhoven montre tout
d’abord la conjecture d’André-Oort sous GRH pour un produit de 2 courbes modu-
laires [21]. Edixhoven et Yafaev [23], obtiennent ensuite le résultat pour une courbe
dans une variété de Shimura arbitraire et Edixhoven traite le cas des sous-variétés
de dimension arbitraire dans un produit de n copies de la courbe modulaire [22]. La
conjecture d’André-Oort sous GRH est alors obtenue pour une variété de Shimura ar-
bitraire par Klingler-Yafaev et l’auteur de ce texte ([35], [74]) en incorporant des idées
de théorie ergodique sur les espaces homogènes à la Margulis-Ratner ([14], [70]), dans
la méthode galoisienne et géométrique d’Edixhoven-Hindry. Notons aussi que la mé-
thode d’Edixhoven-Hindry donne des résultats inconditionnels concernant l’ahérence
de Zariski d’un ensemble de points CM contenus dans une orbite de Hecke.
Le premier résultat inconditionnel de la conjecture d’André-Oort est obtenu par
André pour un produit de 2 courbes modulaires par une méthode utilisant les déve-
loppement de Puiseux qui n’a pas pu s’étendre à d’autres cas [3].
La méthode de Pila-Zannier pour Manin-Mumford a été adaptée par Pila qui ob-
tient ainsi une preuve inconditionnelle d’AO pour un produit arbitraire de courbes
Ax Lindemann est prouvé par Pila pour les produits de courbes modulaires
[49], par Ullmo-Yafaev pour les variétés de Shimura compactes [75], par Pila-
Tsimerman pour A g [50] et par Klingler-Ullmo-Yafaev pour une variété de
Shimura arbitraire [34].
– Des bornes inférieures convenables pour la taille des orbites sous Galois de points
spéciaux. Cet ingrédient est aussi au centre de l’approche de Edixhoven-Hindry.
Pour une discussion sur le type de borne attendu pour une variété de Shimura
arbitraire nous référons à la section 2.3 de [71]. Notons que les bornes recherchées
sont connues sous GRH pour toute variété de Shimura d’après des résultats de
Tsimerman [67] et Ullmo-Yafaev [76]. Pour un point z de A g paramétrant la
variété abélienne Az , on note dz la valeur absolue du discriminant du centre des
endomorphismes de Az . Si z est un point spécial alors le corps de définition k(z)
de z est un corps de nombres. On cherche à montrer dans ce cas qu’il existe des
constantes positives α et β tels que pour tout point spécial de A g on ait
Colmez a conjecturé [16] une formule close pour la hauteur de Faltings d’une
variété abélienne à multiplication complexe. Nous renvoyons au texte de Colmez
ou à [39] pour les notions de base de la théorie des variétés abéliennes à mul-
tiplication complexe. On se ramène simplement au cas où les endomorphismes
de Az sont l’anneau d’entiers d’un corps CM, Ez de degré 2g sur Q. Dans cette
situation Colmez montre que hF (Az ) ne dépend que du type CM (Ez , Φ) de Az .
En fixant le corps de multiplication complexe E et en faisant la moyenne sur les
2g -types CM Φ possibles de E, on obtient conjecturalement une formule qui se
présente sous une forme plus simple pour la moyenne des hauteurs de Faltings
des variétés abéliennes CM par OE . Des arguments classiques de théorie analy-
tique des nombres montrent alors que la conjecture de Colmez ou sa version en
moyenne entraînent la majoration de l’équation (3).
Finalement une preuve de la conjecture de Colmez en moyenne a été obtenu
par Andreatta, Goren, Howard et Madapusi-Pera [5] par une étude des points
CM sur les variétés de Shimura de type orthogonal et par Yuan et Zhang par
une analyse de points de Heegner sur certaines courbes de Shimura [82].
Daw et Orr [20] montrent que la méthode de Pila-Zannier permet de donner
une nouvelle preuve d’André-Oort sous l’hypothèse de Riemann généralisée. En
étendant les arguments précédents aux variétés de Shimura mixtes, Gao montre
la conjecture d’André-Oort pour U g ou plus généralement pour les variétés de
Shimura mixtes dont la projection sur la partie pure est de type abélien. En
utilisant les résultats de Daw et Orr, Gao montre aussi la conjecture d’André-
Oort sous l’hypothèse de Riemann généralisée pour une variété de Shimura mixte
arbitraire [25].
([56] thm. 6.3). Pour les familles de variétés semi-abéliennes la conjecture est fausse
comme cela a été remarqué par Bertrand [7] mais les contre-exemples fournis par les
« sections de Ribet » sont expliqués par la conjecture initiale de Pink pour les variétés
de Shimura mixtes paramétrant des familles de variétés semi-abéliennes (introduites
pour le cas abélien dans la section 2.2.5 de ce texte).
Les textes de Philippe Habegger [29] et Gaël Rémond [62] dans ce volume décrivent
les progrès en direction de la conjecture de Zilber-Pink pour un tore Grm ou une variété
abélienne. Nous renvoyons à ces textes pour une présentation précise des résultats
connus. La notion de hauteur est centrale dans les approches envisagées pour ces
cas. Pour une variété abélienne définie sur Q ou sur le tore Grm on dispose d’une
hauteur canonique b h sur les points algébriques qui prend des valeurs positives ou
nulles. Les points spéciaux (i.e. les points de torsion) sont alors les points de hauteur
0. La définition de hauteur canonique s’étend aussi aux sous-variétés. La conjecture
de Bogomolov prouvée par Zhang et l’auteur ([69], [84]) puis par David et Philippon
pour les variétés abéliennes, caractérise les sous-variétés spéciales comme étant celles
de hauteur nulle. Les résultats analogues pour Grm sont dus à Zhang [85].
Il n’existe pas de caractérisation des points spéciaux ou des sous-variétés spéciales
des variétés de Shimura en terme de hauteur de Faltings même si comme on l’a vu
les résultats récents sur la conjecture de Colmez fournissent des bornes supérieures
très précises sur la hauteur de Faltings des points à multiplication complexe. Colmez
montre par exemple que la hauteur de Faltings des points CM sur SL2 (Z)\H tend
vers l’infini quand le discriminant de l’anneau de multiplication complexe de la courbe
elliptique Ez paramétrée par z tend vers l’infini [17].
Soit S le tore Grm ou une variété abélienne définie sur Q. La stratégie initiée par les
travaux fondateurs de Bombieri, Masser et Zannier a plusieurs étapes. La première
est la proposition suivante. On utilise les notations de la section 2.3.
Ce résultat est obtenu par Bombieri, Masser et Zannier pour Grm [9] et par Rémond
dans le cas abélien ([60], [61]). On constate que Z oa est vide si Z est contenu dans une
sous-variété faiblement spéciale propre. Il existe cependant des exemples ou Z n’est
pas contenu dans une sous-variété spéciale propre et pour lesquels Z oa est vide ([83]
section 1.3.3).
L’étape suivante est le théorème suivant (conjecture de la hauteur bornée).
Ce résultat est au centre des textes d’Habegger [29] et de Rémond [62] dans ce
volume. Il est dû à Habegger pour Grm [28] et une preuve effective est donnée dans le
texte de Habegger dans ce volume. Dans le cas des variétés abéliennes le résultat est
dû à Rémond ([60], [61]) et Habegger [27].
Même si cette condition de transversalité est trop forte par rapport à ce qui est
attendu pour Zilber-Pink il semble difficile avec les techniques actuelles d’obtenir des
résultats en direction de Zilber-Pink quand elle n’est pas vérifiée. Cette condition
est naturelle dans un contexte ou l’on dispose d’un lemme de Poincaré mais s’adapte
assez mal dans le contexte des variétés de Shimura. Il serait bon de trouver une bonne
notion de transversalité pour la conjecture de Zilber-Pink concernant les variétés de
Shimura mixtes ou pures.
Une nouvelle approche qui précise la conjecture des hauteurs et permet aussi d’ob-
tenir des résultats de finitude passe par des estimations effectives de type Bogomolov,
c’est à dire des minorations effectives de la hauteur canonique ou du minimum es-
sentiel des sous-variétés qui ne sont pas spéciales. Des bornes de ce type ont été
envisagées par David et Philippon pour les tores [18] et les variétés abéliennes [19].
Les applications en direction de la conjecture de Zilber-Pink par cette approche ont
été développées par Viada [77], Habegger [26] et Rémond.
Les résultats sur Zilber-Pink pour les variétés de Shimura sont limités. Une rai-
son est que la question d’André-Oort n’était pas entièrement résolue. Une autre est
que la notion de hauteur, centrale dans les approches pour les variétés abéliennes et
les tores n’est pas adaptée au moins de manière directe au cas des variétés de Shi-
mura. On peut cependant prévoir que la méthode de Pila-Zannier via l’o-minimalité,
la transcendance fonctionnelle et des techniques galoisiennes seront l’objet de futurs
développements qui permettront d’améliorer notre compréhension du problème de
Zilber-Pink pour les variétés de Shimura. Les premiers résultats en ce sens sont obte-
nus par Pila-Tsimerman ([51], [52] ) et Habegger-Pila ([30], [31]) pour un produit de
courbes modulaires. Il ne fait pas de doute que ces méthodes sont promises à un bel
avenir.
Références
[1] F. Amoroso & S. David – « Le problème de Lehmer en dimension supérieure »,
J. reine angew. Math. 513 (1999), p. 145–179.
[2] Y. André – G-functions and geometry, Aspects of Mathematics, E13, Friedr. Vieweg
& Sohn, Braunschweig, 1989.
[3] , « Finitude des couples d’invariants modulaires singuliers sur une courbe algé-
brique plane non modulaire », J. reine angew. Math. 505 (1998), p. 203–208.
[4] , « Shimura varieties, subvarieties and CM points », lectures NCTS, Hsinchu,
2001.
[5] F. Andreatta, E. Goren, B. Howard & K. Madapusi-Pera – « Faltings heights
of abelian varieties with complex multiplication », prépublication https://www2.bc.
edu/~howardbe/Research/research.html.
[6] J. Ax – « On Schanuel’s conjectures », Ann. of Math. 93 (1971), p. 252–268.
[7] D. Bertrand – « Special points and Poincaré bi-extensions », avec un appendice
par Bas Edixhoven. preprint 2011, disponible sur la page web de l’auteur https:
//webusers.imj-prg.fr/~daniel.bertrand/Recherche/recherche.html.
[8] E. Bombieri, D. W. Masser & U. Zannier – « Intersecting a curve with algebraic
subgroups of multiplicative groups », Int. Math. Res. Not. 1999 (1999), p. 1119–1140.
[9] , « Anomalous subvarieties—structure theorems and applications », Int. Math.
Res. Not. 2007 (2007), Art. ID rnm057, 33.
[10] A. Borel – Introduction aux groupes arithmétiques, Publications de l’Institut de Ma-
thématique de l’Université de Strasbourg, XV. Actualités Scientifiques et Industrielles,
No. 1341, Hermann, Paris, 1969.
[11] A. Borel & L. Ji – Compactifications of symmetric and locally symmetric spaces,
Mathematics : Theory & Applications, Birkhäuser, 2006.
[12] M. a. Carrizosa – « Petits points et multiplication complexe », Int. Math. Res. Not.
2009 (2009), p. 3016–3097.
[13] A. Chambert-Loir – « Relations de dépendance et intersections exceptionnelles »,
Séminaire Bourbaki, vol. 2010/2011, exposé no 1032, Astérisque 348 (2012), p. 149–
188.
[14] L. Clozel & E. Ullmo – « équidistribution de sous-variétés spéciales », Ann. of Math.
161 (2005), p. 1571–1588.
[15] P. B. Cohen – « Humbert surfaces and transcendence properties of automorphic func-
tions », Rocky Mountain J. Math. 26 (1996), p. 987–1001, Symposium on Diophantine
Problems (Boulder, CO, 1994).
[16] P. Colmez – « Périodes des variétés abéliennes à multiplication complexe », Ann. of
Math. 138 (1993), p. 625–683.
[17] , « Sur la hauteur de Faltings des variétés abéliennes à multiplication complexe »,
Compositio Math. 111 (1998), p. 359–368.
[18] S. David & P. Philippon – « Minorations des hauteurs normalisées des sous-variétés
des tores », Ann. Scuola Norm. Sup. Pisa Cl. Sci. 28 (1999), p. 489–543.
[19] , « Minorations des hauteurs normalisées des sous-variétés de variétés abeliennes.
II », Comment. Math. Helv. 77 (2002), p. 639–700.
[20] C. Daw & M. Orr – « Heights of pre-special points of Shimura varieties », Math. Ann.
365 (2016), p. 1305–1357.
[21] B. Edixhoven – « Special points on the product of two modular curves », Compositio
Math. 114 (1998), p. 315–328.
[22] , « Special points on products of modular curves », Duke Math. J. 126 (2005),
p. 325–348.
[23] B. Edixhoven & A. Yafaev – « Subvarieties of Shimura varieties », Ann. of Math.
157 (2003), p. 621–645.
[24] Z. Gao – « Towards the André-Oort conjecture for mixed Shimura varieties : The
Ax-Lindemann theorem and lower bounds for Galois orbits of special points », https:
//doi.org/10.1515/crelle-2014-0127, 2015.
[25] , « About the mixed André-Oort conjecture : reduction to a lower bound for the
pure case », C. R. Math. Acad. Sci. Paris 354 (2016), p. 659–663.
[26] P. Habegger – « A Bogomolov property for curves modulo algebraic subgroups »,
Bull. Soc. Math. France 137 (2009), p. 93–125.
[27] , « Intersecting subvarieties of abelian varieties with algebraic subgroups of com-
plementary dimension », Invent. math. 176 (2009), p. 405–447.
[28] , « On the bounded height conjecture », Int. Math. Res. Not. 2009 (2009), p. 860–
886.
[29] , « Effective height upper bounds on algebraic tori », prépublication
arXiv:1201.3255.
[30] P. Habegger & J. Pila – « Some unlikely intersections beyond André-Oort », Com-
pos. Math. 148 (2012), p. 1–27.
[31] , « O-minimality and certain atypical intersections », Ann. Sci. Éc. Norm. Supér.
49 (2016), p. 813–858.
[32] M. Hindry – « Autour d’une conjecture de Serge Lang », Invent. math. 94 (1988),
p. 575–603.
[33] E. Hrushovski – « The Manin-Mumford conjecture and the model theory of difference
fields », Ann. Pure Appl. Logic 112 (2001), p. 43–115.
[34] B. Klingler, E. Ullmo & A. Yafaev – « The hyperbolic Ax-Lindemann-Weierstraß
conjecture », Publ. math. IHÉS 123 (2016), p. 333–360.
[35] B. Klingler & A. Yafaev – « The André-Oort conjecture », Ann. of Math. 180
(2014), p. 867–925.
[36] J. Kollár & J. Pardon – « Algebraic varieties with semialgebraic universal cover »,
J. Topol. 5 (2012), p. 199–212.
[37] S. Lang – Introduction to transcendental numbers, Addison-Wesley Publishing Co.,
Reading, Mass.-London-Don Mills, Ont., 1966.
[38] , « Diophantine approximation on abelian varieties with complex multiplica-
tion », Advances in Math. 17 (1975), p. 281–336.
[39] , Complex multiplication, Grundl. math. Wiss., vol. 255, Springer, New York,
1983.
[82] X. Yuan & S.-W. Zhang – « On the averaged Colmez conjecture », prépublication
arXiv:1507.06903.
[83] U. Zannier – Some problems of unlikely intersections in arithmetic and geometry,
Annals of Math. Studies, vol. 181, Princeton Univ. Press, Princeton, NJ, 2012.
[84] S.-W. Zhang – « Equidistribution of small points on abelian varieties », Ann. of Math.
147 (1998), p. 159–165.
[85] S. Zhang – « Positive line bundles on arithmetic varieties », J. Amer. Math. Soc. 8
(1995), p. 187–221.
[86] B. Zilber – « Exponential sums equations and the Schanuel conjecture », J. London
Math. Soc. 65 (2002), p. 27–44.
[87] , « Model theory of special subvarieties and Schanuel-type conjectures », Ann.
Pure Appl. Logic 167 (2016), p. 1000–1028.
Emmanuel Ullmo, Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures
sur Yvette, France • E-mail : ullmo@ihes.fr
par
Emmanuel Ullmo
Résumé. – Le texte est la version écrite des exposés donnés par l’auteur au CIRM en
mai 2011 sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann
généralisée due à Klingler, Ullmo et Yafaev. Il contient également une introduction à
la théorie des variétés de Shimura.
Abstract (Around the André-Oort conjecture). – The text is the written part of the
lectures by the author at the CIRM in May 2011 on the proof of the André-Oort
conjecture assuming the generalized Riemann hypothesis due to Klingler, Ullmo and
Yafaev. It also contains an introduction to the theory of Shimura varieties.
1. Introduction
H = SL2 (R)/K∞
où
( ! )
cos θ − sin θ
K∞ ≃ SO2 (R) = ,θ ∈ R
sin θ cos θ
est un sous-groupe compact maximal de SL2 (R).
On a une action par homographies de GL2 (R)+ sur H, donné pour α = a b
c d ∈
GL2 (R)+ et z ∈ H par
az + b
α.z = .
cz + d
Dans cette description
√
K∞ = SO2 (R) = FixSL2 (R) ( −1),
√
de sorte que l’isomorphisme SL2 (R)/SO2 (R) ≃ H est donné par g.SO2 (R) 7→ g. −1.
Soit B le sous-groupe de Borel de SL2 (R) des matrices triangulaires supérieures.
Au vu de la décomposition d’Iwasawa SL2 (R) = B SO2 (R) on peut préciser l’isomor-
phisme précédent :
1 −1
!
y 2 xy 2 √
−1 .SO2 (R) 7→ z = x + −1y.
0 y 2
2.1.2. Multiplication complexe des courbes elliptiques. – Soit E une courbe elliptique
sur C. On sait que E = C/Λ pour un réseau Λ de C. Un endomorphisme de E est
donné par la multiplication par un élément z ∈ C tel que zΓ ⊂ Γ. Si End(E) = Z,
on dit que E est sans multiplication complexe. C’est la situation générique, un terme
auquel on donnera un sens précis dans le cadre des variations de structures de Hodge à
la section 3.1.4. Si ce n’est pas le cas, End(E) est un ordre dans un corps quadratique
imaginaire F . Soit OF l’anneau des entiers de F , alors un ordre dans F est de la forme
OF,f = Z + f OF
pour un entier f ≥ 1. On note Pic(OF,f ) le groupe de Picard (i.e. le groupe de classes)
de OF,f . Quand End(E) = OF,f , on dit que E est à multiplication complexe par OF,f .
Pour plus de détails et certaines preuves le lecteur peut consulter [35] et [38] ch. XI.
Proposition 2.1. – L’ensemble ΣF,f des classes d’isomorphismes de courbes elliptiques
E telles que End(E) = OF,f est un Pic(OF,f )-torseur. Il est en particulier fini de
cardinal hf := |Pic(OF,f )|.
Une conséquence qui nous sera utile est donnée par le théorème de Brauer-Siegel
([23] ch. XVI).
Théorème 2.2. – Soit E une courbe elliptique à multiplication complexe par OF,f , alors
1
|Gal(Q/F ).E| = |Pic(OF,f )| = |disc(End(E))| 2 +o(1)
quand |disc(End(E))| → ∞.
Soit Λ un OF,f -module projectif de rang 1, alors E = C/Λ a multiplication com-
plexe par OF,f . Si Λ et Λ′ sont deux tels OF,f -modules projectifs de rang 1 alors
C/Λ ≃ C/Λ′ si et seulement si Λ et Λ′ ont la même classe dans Pic(OF,f ). Récipro-
quement soit E = C/Λ ayant multiplication complexe par OF,f , alors Λ = π1 (E, 0)
est un OF,f -module de rang 1 dont les endomorphismes sont exactement OF,f . Ceci
entraine que Λ est projectif de rang 1.
L’opération de Pic(OF,f ) sur ΣF,f est donné par
Λ.C/Λ′ = C/Λ ⊗OF,f Λ′ .
On dispose alors du théorème classique suivant :
Théorème 2.3. – Soit E à multiplication par OF,f .
(1) j(E) est un entier algébrique dans l’extension abélienne maximale de F non
ramifiée en dehors de f .
L’action de Gal(Q/F ) sur ΣF,f est donnée par un homomorphisme surjectif dit de
réciprocité r = rF,f : Gal(Q/F ) → Pic(OF,f ). Soit p un idéal premier non ramifié
dans OF,f et F (p) le Frobenius correspondant alors
r(F (p)) = [p]−1 .
Autrement dit
(C/Λ)F (p) = C/Λ ⊗OF,f p−1 .
Le lecteur pourra consulter le texte de Serre [35] pour la preuve de cet énoncé.
Il est utile d’avoir une interprétation adélique du morphisme de réciprocité via la
théorie du corps de classe. Soit AF,f l’anneau des adèles de F . On a un isomorphisme
F ∗ \A∗F,f /(Z
b ⊗ OF,f )∗ ≃ P ic(OF,f ).
et un morphisme
r : Gal(Q/F ) → F ∗ \A∗F,f /(Z
b ⊗ OF,f )∗
tel que r(F (p)) est l’idèle dont l’unique composante non triviale est l’inverse πp−1 de
l’uniformisante en p.
√
Lemme 2.4. – Soit F = Q[ −d] pour un entier positif d sans facteurs carrés. On
réalise ΣF,f comme un sous-ensemble de SL2 (Z)\H. Soit l = ll′ un nombre premier
totalement décomposé dans OF,f , l’action de [l] sur ΣF,f est donnée par
[l].SL2 (Z)x = SL2 (Z)gx .x,
pour un gx ∈ GL2 (Q)+ de déterminant l.
On rappelle que pour tout nombre premier l, on a la décomposition :
a a
0 1
SL2 (Z) ( 10 0l ) SL2 (Z) = SL2 (Z) ( 10 al ) SL2 (Z) −l 0 .
0≤a<l
Théorème 2.7 (Edixhoven [17]). – On suppose l’hypothèse de Riemann pour les corps
quadratiques imaginaires. Soit C une courbe algébrique irréductible dans C × C dont
les deux projections sont dominantes. On suppose que C contient un ensemble Zariski-
dense de points x = (x1 , x2 ) à multiplication complexe. Alors C = Y0 (N ) pour
un N ∈ N× .
(3) Il est facile de voir que l’orbite sous Tl de n’importe quel point est dense
dans C × C. On a en fait le résultat plus précis suivant que nous n’utiliserons pas
(voir [8], [7] pour une preuve et des généralisations en rang arbitraire).
En combinant (1), (2) et (3), on voit que les composantes de C sont spéciales.
Le point (1) est moins élémentaire que les autres arguments. C’est une conséquences
d’un théorème de Deligne et André sur les variations de structure de Hodge et d’un
résultat de Nori. Pour garder cette partie aussi élémentaire que possible nous expli-
quons dans la suite l’approche initiale d’Edixhoven qui a par ailleurs inspiré d’autres
développements ultérieurs.
On note Tln (l) l’opérateur de Hecke sur Y0 (l) = Γ0 (l)\H défini par la double classe
!
1 0
Γ0 (l) Γ0 (l).
0 ln
Un calcul simple ou une lecture détaillée du livre de Miyake [26] montre que
! !
1 0 a 1 a
Γ0 (l) Γ0 (l) = Γ0 (l) ,
0 ln 0≤a<ln
0 ln
de sorte que Tln (l) est une correspondance de degré ln et que pour tout entier n ≥ 1,
Tln (l) = (Tl (l))n .
Lemme 2.11. – Les noyaux des projections de GX vers SL2 (R) sont discrets.
Lemme 2.12. – Soit Γ = SL2 (Z) × SL2 (Z) et ΓX = GX ∩ Γ. Soit di le degré des
projections de C vers SL2 (Z)\H. L’indice de la i-ème projection pi (ΓX ) dans SL2 (Z)
est borné par di .
Le groupe GX est fermé et contient ΓX . L’hypothèse Z ⊂ Tlnc (l)Z pour tout entier
n assure que GX contient un élément de la forme
! !
nc 1 an 1 b n
l− 2 γ ×
0 lnc 0 lnc
avec 0 ≤ an < lnc , 0 ≤ bn < lnc et γ ∈ Γ = SL2 (Z) × SL2 (Z). Soit H le sous-groupe
de GX engendré par ΓX et ces éléments. Les deux projections de H ne sont pas
discrètes donc H n’est pas discret.
Fin de la preuve. – L’algèbre de Lie Lie(GX ) est non triviale d’après le lemme pré-
cédent et les deux projections pi (Lie(GX )) sont normalisées par pi (ΓX ) qui sont
Zariski-denses dans SL2 (R). On en déduit que pi (Lie(GX )) = Lie(SL2 (R)) pour i = 1
et i = 2. Comme SL2 (R) est connexe, GX se projette surjectivement sur les deux fac-
teurs SL2 (R). Le noyau de p1 : GX → SL2 (R), est discret normal dans SL2 (R)×{1} et
contient {±1} donc est égal à {±1}. Par le lemme de Goursat, GX est le graphe d’un
automorphisme σ de SL2 (R)/{±1}. Les automorphismes de SL2 (R)/{±1} sont inté-
rieurs. Comme pi (ΓX ) est d’indice fini dans SL2 (Z), σ provient d’un automorphisme
intérieur de SL2,Q . Le groupe des automorphismes intérieurs de SL2,Q est PGL2,Q .
D’après Hilbert 90, l’application GL2 (Q) → PGL2 (Q) est surjective donc σ est donné
par la conjugaison par un élément g ∈ GL2 (Q). Donc GX = {(h, ±ghg −1 ), h ∈
SL2 (R)}.
Soit x = (τ, hτ ) ∈ X. Soit T = StabSL2 (R) (τ ) ≃ SO2 (R). Alors
StabG0X (x) = {(t, gtg −1 ), t ∈ T } = {(t, hth−1 ), t ∈ T }.
Remarque 2.14. – Edixhoven donne l’exemple suivant qui justifie le passage à Y0 (l) ×
Y0 (l) dans la preuve. Il construit des courbes C ⊂ SL2 (Z)\H × SL2 (Z)\H tel que C ⊂
Tl C qui ne sont pas spéciales. Le problème vient de l’involution d’Atkin wl qui inter-
vient dans Tl mais pas dans Tl (l). Soit C une courbe telle que une composante Cl de
l’image inverse de C dans Y0 (l) × Y0 (l) soit invariante par wl × wl . Alors C ⊂ Tl C,
mais à priori il n’est pas nécessaire que Cl ⊂ Tl Cl . Soit Z le quotient de Y0 (l) × Y0 (l)
par l’involution wl ×wl . Le théorème de Bertini donne l’existence de familles continues
de courbes dans Z dont l’image inverse dans Y0 (l) × Y0 (l) sont irréductibles. Comme
il n’y a qu’un nombre dénombrable de sous-variétés spéciales dans Y0 (l) × Y0 (l) on
peut choisir une courbe dans Z dont l’image inverse C ′ dans Y0 (l) × Y0 (l) est ir-
réductible (et bien sur invariante par wl × wl .) On prend alors pour C son image
dans SL2 (Z)\H × SL2 (Z)\H. En terme de théorie des groupes, comme wl normalise
Γ0 (l), le groupe engendré par wl et l’image de ΓX peut être discret.
Il est aussi notable que le passage à Y0 (N ) qui correspond à un passage à un niveau
Iwahori pour une variété de Shimura générale (où la structure de l’algèbre de Hecke
est plus simple) joue un rôle important dans les arguments de Klingler et Yafaev [22]
pour la fin de la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann
généralisée.
Étant donné une sous-variété spéciale de type Ω, on note c(Ω) le nombre de facteurs
CM. Une sous-variété Z est dite fortement spéciale si c(Ω) = 0.
Il y a les étapes suivantes que l’on retrouve dans [40] et [22] pour une variété de
Shimura arbitraire.
3. Alternative Galois/ergodique.
Définition 2.18. – Soit M une variété algébrique et (Yn )n∈N une suite de sous-variétés
de M . On dit que (Yn )n∈N est générique dans M si pour toute sous-variété N de M
avec N 6= M , l’ensemble
{n ∈ N, Yn ⊂ N }
est de cardinal fini.
Nous introduirons aussi pour une variété de Shimura générale la notion de sous-
variétés T -spéciales. Dans notre situation, on fixe un sous-ensemble J de I et pour
tout i ∈ J on fixe un anneau de multiplication complexe Oi = Z + fi OKi dans
un corps quadratique imaginaire Ki . On peut classiquement associer un sous-tore
|J| |I|
T de PGL2,Q ⊂ PGL2,Q à ces données. Une sous-variété T -spéciale est une sous-
variété spéciale dont les facteurs CM sont indexés par les i ∈ J et les points CM
correspondants ont multiplication complexe par Oi . Pour J = ∅, TQ = {1} une
variété T -spéciale n’est rien d’autre qu’une variété fortement spéciale.
Il est facile alors de remplacer fortement spéciale par T -spéciale dans l’énoncé
précédent. Par ailleurs l’alternative Galois/Ergodique est aussi très simple dans ce
cas :
Proposition 2.21 (Edixhoven [18] prop. 4.2). – Soit r ≥ 3 un entier. Soit X une hy-
persurface de S telle que pour tout I ⊂ {1, . . . , r} de cardinal r − 1, la projection
pI : X → (SL2 (Z)\H)r−1 sur les facteurs indexés par I est dominante. On note dI le
degré de pI . Soit s ≤ r un entier et Tαl la correspondance de Hecke définie par
!s !r−s
lθ 0 1 0
αl = × ∈ (GL2 (Q)+ )r ,
0 1 0 1
pour un nombre premier l et un entier θ ≥ 1. Si l > max(deg(X), 3), alors Tαl .X est
irréductible.
Preuve. Cela résulte du fait que G et donc Gr sont engendré par ses l-Sylow. Un
sous-groupe d’indice au plus d < l de Gr contient tous les l-Sylow et donc est égal
à Gr .
On en déduit que P est irréductible. On a par ailleurs un diagramme commutatif
V → πr−1 X → Y (lθ )r
↓ ↓ ↓ .
α(V ) = V ′ → P → Y (lθ )r−1
Vu l’irréductibilité de P , on a α(V ) = V ′ = P . On en déduit que
StabGr−1 (V ′ ) = pr−1 (H) = StabGr−1 (P ) = Gr−1 .
Lemme 2.24. – Une sous variété V de S est spéciale si et seulement si les ensembles
minimaux I de V sont de cardinal |I| ≤ 2 et si pour toute projection minimale pI (V )
est spéciale dans CI .
On peut supposer que les sous-variétés de Σ sont toutes du même type Ω. Comme
X contient un ensemble Zariski dense de points spéciaux (donc définis sur Q) X est
défini sur Q. En remplaçant X par l’union de ses conjugués sous Gal(Q/Q) on peut
supposer que X est défini sur Q. On peut aussi supposer que X est irréductible sur Q.
On peut aussi supposer que les projections de X sur les facteurs de S sont dominantes.
On peut extraire de Σ une suite générique de sous-variétés de X (au sens de la
définition 2.18) par le procédé diagonal classique suivant. L’ensemble des sous-variétés
Y de X définies sur Q avec Y 6= X est dénombrable. Soit (Yn )n∈N une indexation
de l’ensemble des sous-variétés Y de X définies sur Q avec Y 6= X. Comme Σ est
Zariski dense dans X, pour tout n ∈ N il existe Zn ∈ Σ tel que Zn n’est pas contenu
Sn
dans i=1 Yi . Comme les Zn sont définis sur Q la suite (Zn )n∈N est générique dans X.
Si c(Ω) = 0, le théorème 2.17 et notre hypothèse assurent qu’il existe une suite Zn
de sous-variétés spéciales de X générique dans X telle que la suite de mesures associées
µZn converge faiblement vers la mesure µZ associée à une sous-variété spéciale Z.
Comme pour tout n le support Zn de µZn est contenu dans X qui est fermé, on voit
que Z ⊂ X. De plus Zn ⊂ Z pour n ≫ 0, donc Z contient un ensemble Zariski dense
dans X. Finalement X = Z est une sous-variété spéciale.
On suppose donc que s := c(Ω) > 0. En changeant au besoin l’ordre des facteurs,
on peut supposer que les sous-variétés Z dans Σ s’écrivent sous la forme
Z = {x1 } × · · · × {xs } × Z ′
avec Z ′ fortement spéciale dans Cr−s . On rappelle que si x ∈ C = SL2 (Z)\H est un
point CM, on note Ox son anneau de multiplication complexe et dx le discriminant
de Ox . On peut aussi supposer que dZ := max(dxi ) = dx1 .
Au vu de la discussion précédente le théorème est conséquence de la proposition
suivante :
Proposition 2.29. – On suppose que c(Ω) > 0. Alors X contient un ensemble Zariski
dense de sous-variétés spéciales de type Ω′ avec c(Ω′ ) < c(Ω).
Le théorème de Chebotarev effectif a pour conséquence le lemme suivant :
Lemme 2.30. – On admet l’hypothèse de Riemann généralisée pour les corps quadra-
tiques imaginaires. Pour dZ suffisamment grand , il existe un premier l décomposé
dans chaque Oxi tel que
deg(X) ≪ l ≪ (log dZ )3 .
Comme la première projection de X est dominante, l’ensemble des p1 Z pour Z
dans Σ est dense dans C. La proposition 2.16 assure alors que dZ n’est pas borné
quand Z varie dans Σ. Le lemme assure donc l’existence pour dZ assez grand d’un l
décomposé dans tout les Oxi tel que
max(3, deg(X)) < l ≪ (log dZ )3 .
Si X est contenu dans Tl X, la proposition 2.26 nous assure que X contient bien une
sous-variété spéciale Z ′ contenant Z telle que c(Ω′ ) < c(Ω).
On suppose donc qu’il existe une composante géométriquement irréductible X ′
de X qui n’est pas contenue dans Tl .X. Comme nous avons supposé que X est
irréductible sur Q et comme Tl est défini sur Q, l’intersection de X avec Tl X est
propre.
Lemme 2.31. – On suppose que X n’est pas contenu dans Tl X. Il existe une hyper-
surface H de (P1Q )r tel que
1. X n’est pas contenu dans H et Tl X ⊂ H.
2. deg(H) ≪ l2s .
Preuve. On note V la fermeture dans (P1C )r d’une sous-variété V de S. Ecrivons la
décomposition X
[X] = aI ǫI
|I|=r−dim(X)
r−dim(X) 1 r
de [X] dans CH ((P ) ). Alors
X
[Tl X] = (l + 1)s aI ǫI .
|I|=r−dim(X)
Comme l est décomposé dans chaque Oxi et comme Z ′ est géométriquement ir-
réductible sur Q, un conjugué par Galois de Z est contenu dans Tl X. Comme cette
intersection est rationnelle sur Q, Z ⊂ X ∩ H.
Lemme 2.32. – Soit Y une Q-composante de X ∩ H contenant Z. Si dZ est suffisam-
ment grand, la projection de Y sur le premier facteur est dominante.
3. Variétés de Shimura
Le but de cette partie est de présenter les objets de la théorie des variétés de
Shimura qui sont au centre de la conjecture d’André-Oort.
Soit n un entier. La A-structure de Hodge de Tate A(n) est défini comme le A-mo-
dule libre de rang 1
A(n) = (2iπ)n A ⊂ C
muni d’une structure de Hodge pure de type (−n, −n). On note A = A(0) la structure
de Hodge triviale.
Si V1 et V2 est une A-structure de Hodge de poids n1 et n2 , alors V1 ⊗ V2 est une
structure de Hodge de poids n1 + n2 . De même si V est une A-structure de Hodge
de poids n alors V ∨ := HomASH (V, A) est une structure de Hodge de poids −n. On
note V (n) = V ⊗ A(n).
Définition 3.3. – Une A-structure de Hodge V de poids n est dite polarisable si il existe
un homomorphisme de A-structures de Hodge
φ : V ⊗ V → A(−n)
tel que la forme bilinéaire
VR × VR → R
(v, w) 7→ (2iπ)n φ(v ⊗ h(i)w)
est symétrique et définie positive. Il revient au même de demander que φ soit non
dégénérée et que φ soit alternée si n est pair et symétrique si n est impair.
Example 3.4. – Soit X une variété algébrique projective lisse sur C, alors les groupes
de cohomologie de Betti H i (X, Z) sont des Z-structures de Hodge polarisables. On a
H i (X, Z)C = H i (X, C)
et pour p + q = i
H i (X, C)p,q = H q (X, ΩpX ).
Le cup produit H i (X, Z) ⊗ H j (X, Z) → H i+j (X, Z) et l’isomorphisme de Kunneth
M
H k (X × Y, Q) = H i (X, Q) ⊗ H j (Y, Q)
i+j=k
sont des morphismes de structures de Hodge. Le choix d’un plongement X dans Pn dé-
termine une polarisation sur la partie primitive de la cohomologie et la décomposition
de Lefschetz M
H i (X, Q) = c1 (L)j H i−2j (X, Q(−j))
j≥0
détermine une structure complexe sur VR . Dans cette situation X := VR /VZ est un tore
complexe. Soit φ : VZ ⊗ VZ → Z(1) une polarisation. Alors φ est une forme alternée
prenant des valeurs entières sur VZ . La théorie de Riemann permet alors d’associer à
un tel φ un fibré inversible ample Lφ sur X. Donc X est en fait une variété abélienne.
Remarque 3.6. – On voit de la même manière que la catégorie des variétés abéliennes
sur C à isogénie près est équivalente à la catégorie des Q-structures de Hodge polari-
sables de type (−1, 0), (0, −1) et que la catégorie des tores complexes est équivalentes
à la catégorie des Z-structures de Hodge de type (−1, 0), (0, −1).
Remarque 3.10. – (a) Les définitions impliquent que MT(V ) et Hg(V ) sont des
Q-groupes algébriques linéaires connexes.
(b) Si V est pure de poids n 6= 0 alors
hw : Gm,R → GL(VR )
(c) On a toujours Hg(V ) ⊂ SL(V ) et si V est pure de poids non nul alors MT(V )
est le produit presque direct de Hg(V ) et de Gm,Q 1V à l’intérieur de GL(V ).
Théorème 3.11. – Soit V une Q-structure de Hodge. Soient m, n deux entiers positifs
ou nuls. On note T m,n := V ⊗m ⊗ (V ∨ )⊗m . Soit T une Q structure de Hodge obtenue
comme somme directe de Q-structures de Hodge de la forme T mi ,ni . On dispose alors
d’une action induite de MT(V ) sur V . Soit W ⊂ T un Q-sous-espace vectoriel, alors
W est une Q-sous-structure de Hodge si et seulement si W est un MT(V )-sous-
module.
3.1.4. Variations de structures de Hodge. – Nous donnons ici des définitions de base
de la théorie des variations de structure de Hodge. Le lecteur peut consulter entre
autres [41] 17.3.1 ou [3] pour plus de détails et pour certaines preuves.
Soit S une variété complexe, on rappelle qu’une variation de Q-structures de Hodge
de poids n sur S est la donnée d’un triplet
V = ( V Q , F . , Q),
où V Q est un système local de Q-espaces vectoriels de dimension finie sur S, F . est
une filtration de V O := V Q ⊗Q O S par des sous-fibrés holomorphes définissant en
tout s ∈ S une Q-structure de Hodge V s de poids n ;
Q : V Q × V Q → Q(−n)S
est une forme bilinéaire localement constante non dégénérée qui induit en tout s ∈ S
une polarisation de la structure de Hodge V s .
Soit ∇ la connexion de Gauss-Manin. On demande de plus que la condition de
transversalité de Griffiths
∇ F p ⊂ Ω1S ⊗ OS F p−1
soit vérifiée.
Soit π : S̃ → S le revêtement universel de S. Soit s ∈ S et s̃ ∈ S̃ tels que π(s̃) = s.
On fixe une trivialisation
(10) π ∗ V Q ≃ S̃ × VQ
et on note
ρ : π1 (S, s) → GL(VQ )
la représentation de monodromie correspondante au système local V Q .
Définition 3.13. – Un point de S\Σ est appelé Hodge générique et S\Σ est le lieu
Hodge générique de S. Le groupe M est appelé groupe de Mumford-Tate générique de
la variation de structure de Hodge.
Théorème 3.14. – (a) Le groupe Hmon,s est un sous-groupe normal du groupe dérivé
M der .
(b) Si il existe t ∈ S tel que M Tt est un tore, alors
(11) Hmon,s = M der .
telle que
(2iπ)n φ(v ⊗ Cg .w)
soit (pour tout g ∈ G(R)) une forme bilinéaire symétrique définie positive sur VR .
(b) On voudrait que X ≃ G(R)/ZG (h) soit muni d’une structure de variété com-
plexe. On obtiendra en fait une structure d’espace symétrique hermitien sur X.
(c) Les Q-structures de Hodge paramétrées par X devraient varier holomorphique-
ment. On devrait obtenir ainsi plus précisément une variation de structures de Hodge
sur X.
3.2.2. Involutions de Cartan. – Soit GR un groupe algébrique connexe sur R. On note
g → g la conjugaison complexe sur G(C). Un involution θ de GR est une involution
de Cartan si
Gθ (R) := {g ∈ G(C)| g = θ(g)}
est compact.
On remarque que si G(R) est compact, l’identité de GR est une involution de Cartan
de GR .
Soit G → GL(VR ) une représentation fidèle de GR . Alors GR est réductif si et
seulement si on peut trouver une base de V telle que G soit stable par g 7→ (t g)−1 .
Dans cette situation la restriction de g 7→ (t g)−1 à G est une involution de Cartan
de GR .
Soit θ une involution de GR . Il existe une unique forme réelle GθR de GC telle que
la conjugaison complexe sur Gθ (C) soit donnée par g 7→ θ(g). Notons aussi que toute
forme réelle de GC est associée à une involution de GR par ce procédé. Avec cette
description, on voit que l’involution θ est de Cartan si et seulement si la forme réelle
associée GθR est la forme compacte de GC .
Lemme 3.17. – Soit GR un groupe algébrique connexe sur R. Si G(R) est compact,
alors toute représentation réelle de dimension finie
ρ : GR −→ GL(VR )
est munie d’une forme bilinéaire G(R)-invariante définie positive.
Réciproquement si GR admet une représentation fidèle de dimension finie munie
d’une forme bilinéaire G(R)-invariante définie positive, alors G(R) est compact.
Définition 3.21. – Soit (X, g) une variété riemannienne . On note Isom(X, g) (ou
Isom(X)) le groupe des isométries de X. On dit que (X, g) est un espace symétrique
si tout x ∈ X est un point fixe isolé d’une isométrie sx de Isom(X).
On suppose que G(R) est un groupe de type adjoint et que G(R) n’est pas compact.
Soit X = G(R)/K∞ , alors l’espace tangent à TX en 1G .K∞ est p. On a une action
à gauche de G(R) sur X et cette action induit une action dk : p → p de K∞ sur p
tangente en 1G K∞ à
K∞ × X → X
k.(gK∞ ) = kgK∞
On peut définir une métrique riemannienne g sur X en fixant une forme bilinéaire
g0 définie positive sur p telle que pour tout k ∈ K∞ , dk est une isométrie de p. Alors
g est l’unique métrique sur X coïncidant avec g0 sur p telle que G(R) agisse par
isométrie.
Les involutions de Cartan de G(R) et les décompositions de Cartan sont conjuguées
sous G(R). L’espace X s’interprète alors comme l’ensemble des décompositions de
Cartan de G(R). Pour x ∈ X, on note G(R) = K∞,x exp(px ) la décomposition de
Cartan associée. L’application Z 7→ −Z de px induit sur X une isométrie sx dont x
est un point fixe isolé. En particulier X est un espace symétrique de type non compact.
Il est classique que l’on obtient tous les espaces symétriques de type non compact par
ce procédé.
Théorème 3.24. – (a) Un espace symétrique hermitien de type non compact est de
la forme X = G(R)/K∞ pour un groupe GR de type adjoint et K∞ un sous-groupe
compact maximal de G(R). Si GR est simple alors l’espace symétrique X est hermitien
si et seulement si on a un isomorphisme
Z(K∞ ) ≃ U1 .
(b) Soit h : S → GR avec GR un groupe réductif non compact tel que
(D1) Lie(GC ) est une structure de Hodge de type (−1, 1), (0, 0), (1, −1).
(D2) int h(i) induit une involution de Cartan de Gad
R .
Soit X la G(R)-classe de conjugaison de h. Alors les composantes connexes de X
sont des espaces symétriques hermitiens. Tout espace symétrique hermitien est obtenu
de cette manière (même si on se restreint à des groupes GR de type adjoint).
(c) Dans cette situation, toute représentation GR → GL(VR ) induit une variation
de structures de Hodge sur X.
3.2.5. Rappels sur les diagrammes de Dynkin. – On commence par des rappels rapides
sur les systèmes de racines et les diagrammes de Dynkin. Soit GC un groupe semi-
simple sur C. Soit TC un tore maximal de GC . Soit BC un sous-groupe de Borel
contenant TC . On notera
X = X ∗ (TC ), Y = X∗ (TC )
et
XQ = X ⊗Z Q, YQ = Y ⊗Z Q.
Soit R le système de racine de (GC , TC ). Par définition
R = {α ∈ X ∗ (TC ), tel que α apparaît dans la représentation adjointe de GC }.
∨
Soit W R = NGC (TC )/ZG (TC ) le groupe de Weyl de R . Soit R le système de racine
∨
dual de R . On peut réaliser R comme le système de racines associé à un couple
(G∨ ∨ ∨ ∨ ∨
C , TC ) formé d’un groupe semi-simple GC et d’un tore maximal TC de GC . On
∨ ∨ ∨ ∨ ∨ ∨
dispose d’une bijection α 7→ α de R dans R . On a ( R ) ≃ R et (α ) = α
pour tout α ∈ R .
Il existe un produit scalaire W R -invariant
<., .> : X ∗ (TC ) × X∗ (TC ) → Z
qui nous permet d’identifier XQ et YQ . Par ailleurs W R ∨ ≃ W R et on a des isomor-
phismes canoniques X ∗ (TC ) = X∗ (TC∨ ) et X∗ (TC ) = X ∗ (TC∨ ).
∨
On note B = {α1 , . . . , αr } une base de racines positives de R , alors B =
∨
{α1∨ , . . . , αr∨ } est une base de R et on note ω1 , . . . , ωr l’ensemble des poids fon-
damentaux de R obtenu en prenant le dual de {α1∨ , . . . , αr∨ } pour le produit sca-
laire <., .>.
Le réseau des poids radiciels Q( R ) est le Z-module libre de rang maximal de XQ :
Q( R ) = Zα1 ⊕ Zα2 ⊕ · · · ⊕ Zαr .
∨
Le réseau des poids P ( R ) = Q( R ) est le Z-module libre de rang maximal
de XQ :
∨
P ( R ) = Q( R ) = Zω1 ⊕ Zω2 ⊕ · · · ⊕ Zωr .
On a une inclusion Q( R ) ⊂ P ( R ). Si GC est adjoint alors
X ∗ (TC ) = Q( R ),
et si GC est simplement connexe alors
X ∗ (TC ) = P ( R ).
Lemme 3.26. – Soit GC un groupe semi-simple de type adjoint sur C. Il y a une bi-
jection entre
(a) L’ensemble des couples (GR , X) avec GR une forme réelle non compacte de GC
et X une G(R)-classe de conjugaison d’un morphisme
h : S −→ GR
telle que
(D1) La représentation Lie(GC ) est de type (−1, 1), (0, 0), (1, −1).
(D2) int(h(i)) est une involution de Cartan de GR .
Un sous-groupe K de G(Af ) est net si tous ses éléments sont nets. Il suffit pour
∗
cela que pour un p le groupe (ιp (Q ) ∩ Λp )tors soit trivial. Cette notion est encore
indépendante de la représentation fidèle ρ. Si K est un sous-groupe compact ouvert
net de G(Af ) alors pour tout g ∈ G(Af ), gKg −1 est net. On en déduit que les réseaux
Γi ⊂ G(Q) de la proposition 3.27 sont nets.
Soit HQ ⊂ GQ un sous-groupe algébrique. Si K ⊂ G(Af ) est un sous-groupe net
alors H(Af ) ∩ K est un sous-groupe net de H(Af ). Si φ : G → H est un homomor-
phisme de groupes algébrique et K ⊂ G(Af ) est net alors φ(K) est un sous-groupe
net de H(Af ).
Enfin on peut pour des questions indépendantes du niveau (comme la conjecture
d’André-Oort) se ramener au cas net car si K ⊂ G(Af ) est un sous-groupe compact
ouvert, il existe une sous-groupe K ′ d’indice fini de K tel que K ′ soit net.
Proposition 3.28. – Soit (GQ , X) une donnée de Shimura avec GQ semi-simple de type
adjoint. Soit HQ un Q-sous-groupe algébrique de GQ . Supposons qu’il existe x ∈ X se
factorisant par HR . Alors HQ est réductif et
(i) Lie(HC ) est de type (1, −1), (0, 0), (−1, 1).
√
(ii) int(x( −1)) induit une involution de Cartan de HRad
Si HQ est sans Q-facteur R-anisotrope (i.e. HQ vérifie la condition de Deligne D3)
et si XH désigne la H(R)-classe de conjugaison de x, alors (H, XH ) est une sous-
donnée de Shimura de (GQ , X). C’est en particulier le cas si HQ est le groupe de
Mumford-Tate de x.
Notons tout d’abord le résultat suivant de Eskin, Mozes et Shah ([20], Lemme 5.1)
suivant.
Lemme 3.29. – Soit FQ un groupe réductif connexe. Les conditions suivantes sont équi-
valentes :
(C1 ) FQ n’est pas contenu dans un Q-sous-groupe parabolique propre de GQ .
(C2 ) Le centralisateur ZGQ (FQ ) de FQ dans GQ est Q-anisotrope.
(C3 ) Tout Q-sous-groupe de GQ contenant FQ est réductif.
Indiquons
√ la preuve de la proposition 3.28. Comme GR est adjoint, le centralisateur
de x( −1) dans G(R) est un compact maximal Kx de √G(R). Prenons pour FQ le
groupe de Mumford-Tate de x, alors ZGR (FR ) ⊂ ZGR (x( −1)) = Kx . On en déduit
que ZGQ (FQ ) est Q-anisotrope car son extension à R est R-anisotrope. Par définition
des groupes de Mumford-Tate FQ ⊂ HQ . L’équivalence des conditions (C2 ) et (C3 )
montre que HQ est réductif.
On constate que x vérifie (i) car Lie(HR ) est un sous espace de Lie(GR ) invariant
par S.
√
Comme C = x( −1) est de carré central dans H(R), il suffit d’après ([14] 1.1.15
c.f. proposition 3.19) de voir que GR admet une représentation réelle (V, ρ) fidèle
et C-polarisable. Il suffit de prendre V = Lie(GR ) pour la représentation adjointe et
la C-polarisation induite par la forme de Killing B(X, Y ) (de sorte que B(X, CY ) est
proportionnelle à une forme bilinéaire symétrique et définie positive).
Si HQ est de plus sans Q-facteurs R-anisotropes alors (HQ , XH ) vérifie les condi-
tions de Deligne (D1), (D2) et (D3) donc (HQ , XH ) est une sous-donnée de Shimura
de (GQ , X).
Supposons
√ finalement que HQ est le groupe de√ Mumford-Tate de x. Comme
int(x( −1)) est un involution de Cartan de HRad , x( −1) centralise tout les facteurs
R-compacts de HR . Si LQ est un Q-facteur de HQ ≃ LQ L′Q qui est R-compact alors
√
x( −1) centralise LR . Ecrivons la décomposition
Lie(LC ) = Lie(LC )−1,1 ⊕ Lie(LC )1,−1 ⊕ Lie(LC )0,0 .
√
Alors x( −1) agit à la fois trivialement et par multiplication par −1 = ii sur
Lie(LC )−1,1 . On en déduit que Lie(LC )−1,1 = {0} et donc aussi que Lie(LC )1,−1 = {0}.
Il résulte de cela que x(S) centralise LR et donc que x se factorise par L′R . Ceci contre-
dit la définition des groupes de Mumford-Tate.
3.3.2. Sous-variétés spéciales des variétés de Shimura. – Soit (G, X) une donnée de
Shimura. Soit K un sous-groupe compact ouvert de G(Af ). On fixe une composante
connexe X + de X. Soit K ⊂ G(Af ) un sous-groupe compact ouvert. En utilisant la
notation de la proposition 3.27 on définit la variété de Shimura
ar
(13) ShK (G, X) = G(Q)\[X × G(Af )/K] = Γi \X + .
i=1
+ +
Soit Γ := G(Q) ∩ K et S = Γ\X . Alors S est une composante irréductible
de ShK (G, X).
Nous aurons besoin de la définition des opérateurs de Hecke dans ce cadre (voir
par exemple [28] 1.6.1).
Définition 3.30. – Soient g ∈ G(Af ) et Kg = K ∩gKg −1 . La correspondance de Hecke
Tg sur ShK (G, X)(C) est définie par le diagramme
ShK (G, X)C ←π1 ShKg (G, X)C π2
→ ShK (G, X)C
où π1 est donné par l’inclusion Kg ⊂ K et π2 est l’application
[x, θ] → [x, θg].
Soit Z une sous-variété de ShK (G, X)C , on note Tg .Z le cycle π2∗ π1∗ Z de ShK (G, X)C .
On dit que Tg .Z est le translaté de Z par l’opérateur de Hecke Tg .
On suppose dans la suite de cette section que G = Gad est un groupe adjoint donc
que X + est une G(R)+ classe de conjugaison de morphismes de
S → GR .
Soit (H, XH ) une sous-donnée de Shimura. Si KH = K ∩ H(Af ), on dispose d’un
morphisme induit de variétés de Shimura
ψ : ShKH (H, XH )C −→ ShK (G, X)C .
On choisit alors un système de représentants RH,K de
H(Q)+ \H(Af )/KH ,
on a donc [
+
ShKH (H, XH )C = ∆λ \XH
λ∈RH,K
−1
avec ∆λ = H(Q)+ ∩ λKH λ .
Définition 3.31. – Avec les notations précédentes, une sous-variété de la forme
+
ψ(∆λ \XH ) est appelée sous-variété de type Shimura de ShK (G, X)(C). Une compo-
sante irréductible d’un translaté par un opérateur de Hecke d’une sous-variété de type
Shimura de ShK (G, X)(C) est appelée sous-variété spéciale ou sous-variété de type
de Hodge.
Preuve. Il existe une sous-donnée de Shimura (H, XH ) et λ ∈ G(Af ) tels que V est
l’image de XH × λK dans ShK (G, X)(C). On peut écrire λ = γβk avec γ ∈ G(Q)+ ,
β ∈ RG,K et k ∈ K. Soient Hγ = γ −1 Hγ et Xγ la Hγ (R)-classe de conjugaison
de γ −1 .x0 pour un x0 ∈ XH , (Hγ , Xγ ) est une sous-donnée de Shimura et V est
aussi l’image de Xγ × βK dans ShK (G, X)C . On en déduit que V est une composante
irréductible de
Tβ .ShK∩Hγ (Af ) (Hγ , Xγ )C .
Définition 3.33. – Un point x de S est dit Hodge générique si il n’est pas contenu
dans une sous-variété spéciale Z de S avec Z 6= S. Un point de X + est dit Hodge
générique si son image dans S est Hodge générique. On définit de même la notion de
points Hodge générique d’une composante connexe arbitraire de ShK (G, X). On vérifie
sans peine que cette notion coïncide sur X + avec celle donnée à la définition 3.13 une
fois que l’on utilise l’interprétation de X + en terme de variations de structures de
Hodge donnée au théorème 3.24. Par ailleurs on montre que si K est net, la variation
de structures de Hodge sur X + descend en une variation de structures de Hodge sur S.
On vérifie sans peine que la définition d’être Hodge générique pour un point x de S
rentre alors dans le cadre de la définition 3.13.
Lemme 3.34. – Soit V une sous-variété spéciale de S. Remarquer que S est l’image
de X + × {1} dans ShK (G, X). Il existe une sous-donnée de Shimura (H, XH )
de (G, X) telle que H est le groupe de Mumford-Tate générique de XH et tel que V
+ +
est l’image de XH × {1} dans S pour une composante XH de XH . En particulier V
est une sous-variété de Shimura.
3.3.3. Corps reflex des données de Shimura. – Soit (G, X) une donnée de Shimura.
Pour tout x ∈ X on note µx = xC µ le cocaractère de GC composé du cocaractère
principal µ : Gm,C → SC et de l’extension complexe xC : SC → GC de x.
Deligne ([14] 2.3.5) explique le calcul de E(G, X) pour G adjoint en terme de dia-
grammes de Dynkin. Des exemples explicites du calcul de E(G, X) dans des exemples
intéressants sont donnés par Milne ([25] 12.1–12.4).
Le calcul de E(T, {x}) pour une donnée de Shimura de type CM s’explique en
terme de type CM. Le lecteur intéressé par la complexité combinatoire de la question
peut consulter le texte de Dodson [16].
Au total ShKT (TQ , {h})C est un ensemble fini muni d’une action de Galois continue
de Gal(E/E). Il admet donc un modèle canonique sur E qui est un schéma fini sur E
que l’on notera ShKT (TQ , {h})E .
dans ShK (G, X) est formée de points spéciaux et on peut obtenir tous les points
spéciaux de cette manière (peut-être à la translation par un nombre fini d’opérateurs
de Hecke).
Définition 3.38. – Soit E = E(G, X) le corps reflex de (G, X). Un modèle canonique
de ShK (G, X)C est un modèle ShK (G, X)E de ShK (G, X)C sur E tel que pour toute
sous-donnée de Shimura (T, {x}) de (G, X), où T est un Q-tore algébrique, le mor-
phisme ShKT (T, {x})C → ShK (G, X)C se descend en un morphisme
η : GQ −→ GL(VQ )
w : GM,C −→ GC
est défini sur Q. Notons que cette condition est automatique si GQ est de type ad-
joint ou plus généralement si η se factorise par Gad
Q . Alors η définit une variation de
structures de Hodge polarisées (VSHP) sur X de fibré sous-jacent X × VQ .
(15) Mη = η(MT(X)).
La VSHP sur X induit une VSHP V η,Z sur ShK (G, X).
Lemme 3.43. – Supposons que Z reg contienne un point spécial non singulier. Le groupe
reg
de monodromie de V Z η,Z (composante connexe neutre de l’adhérence schématique
de ΠZ dans GL(VQ ) ) est η(Gder
Q ).
Théorème 3.44. – Soit H un sous-groupe de GLn (Z) engendré par un nombre fini
d’éléments. Soit H la clôture de Zariski de H dans GLn,Z . Si H(C) a un groupe fon-
damental fini la fermeture de H dans GLn (Z)b est ouverte dans la fermeture de H(Z)
b
dans GLn (Z).
Comme ΠZ est engendré par un nombre fini d’éléments et que le groupe fonda-
mental d’un groupe semi-simple sur C est fini on obtient le corollaire suivant qui nous
sera utile dans la section suivante.
3.4. Irréductibilité des images par les opérateurs de Hecke. – Le but de cette section
est de montrer le théorème suivant d’Edixhoven et Yafaev.
Soit (GQ , X) une donnée de Shimura avec GQ semi-simple de typeQ adjoint. Soit K
un sous-groupe compact ouvert net de G(Af ). On suppose que K = p Kp pour des
sous-groupes compacts ouverts Kp de G(Qp ). Cette condition n’est pas essentielle mais
notons qu’il existe toujours un sous-groupe d’indice fini K ′ de K qui est un produit
(prendre n’importe quelle groupe de congruence principal convenable). Soit X + une
composante connexe de X et S l’image de X + × {1} dans ShK (G, X).
Théorème 3.46 (Edixhoven-Yafaev [19] thm 5.1). – Soit Z une sous-variété irréductible
et Hodge générique de S contenant un point spécial non singulier. Il existe un entier
n (dépendant de Z) tel que pour tout q ∈ G(Q)+ dont l’image dans G(Ql ) est dans Kl
pour tout l divisant n la sous-variété Tq .Z de S est irréductible.
Rappelons la construction de l’opérateur de Hecke Tq de S pour un élément q
de G(Q). Soit Γq = Γ ∩ q −1 Γq et Sq = Γq \X + . On a deux applications
πi : Sq → S = Γ\X + .
La première application π1 correspond à l’inclusion Γg ⊂ Γ tandis que π2 se déduit
par passage au quotient de l’application
tq : X + → X + , x 7→ q.x.
Comme K est net, Γ est sans torsion et les πi sont des recouvrements étales. En
particulier les πi sont propres et plats et induisent des morphismes sur les groupes de
cycles et les groupes de Chow :
πi∗ : Chi (Sq ) → Chi (S)
et
πi∗ : Chi (Sq ) → Chi (S).
La correspondance Tq opérant sur le cycle Y est alors donné par
Tq .Y = π2∗ π1∗ Y.
Pour montrer l’irréductibilité de Tq .Z, il suffit donc de montrer l’irréductibilité
de π1∗ Z. Comme π1 est un recouvrement étale il en est de même de
π1 : Zqreg −→ Z reg .
Comme Zqreg est Zariski-dense dans Z, il suffit de montrer l’irréductibilité de Zqreg .
On reprend les notations de la section précédente, on a en particulier fixé une
représentation η : GQ → GL(VQ ) et un réseau VZ de VQ tel que η(K) ⊂ GL(VZ ⊗ Z). b
reg
On note ΠZ l’image de π1 (Z , s) par la représentation de monodromie ρZ associée
reg
à la Z-VSHP V Z η,Z sur Z
reg
.
Soit jZ l’inclusion de Z reg , Γ = π1 (S, s) est un un π1 (Z reg , s)-ensemble via jZ∗ :
π1 (Z reg , s) → π1 (S, s). Pour q ∈ G(Q)+ , le π1 (Z reg , s)-ensemble correspondant au
recouvrement π1 : Sq → S est Γ/Γq . Il suffit donc de montrer que π1 (Z reg , s) agit
transitivement sur Γ/Γq .
Le théorème de Nori 3.44 et son corollaire 3.45 assurent l’existence d’un n ∈ N tel
que les images de π1 (Z reg , s) et de Γ dans GL(VZ/mZ ) coïncident pour tout m premier
à n.
Lemme 3.47. – Il existe un entier m premier à n tel que Γq contient le noyau Γ(m)
de
ψm : Γ −→ GL(VZ/mZ ).
Définition 4.1. – (a) Un sous-groupe Γ ⊂ G(Q) est dit arithmétique si Γ est commen-
surable à G(Z). On montre en fait que cette notion est indépendante des choix de ρ
et du réseau VZ de VQ .
(b) Soit GR un groupe algébrique linéaire, un sous-groupe Γ ⊂ G(R) est dit arith-
métique si il existe une Q-forme GQ de GR telle que Γ ⊂ G(Q) soit un sous-groupe
arithmétique de G(Q).
(c) Soit GR un groupe semi-simple sans facteurs compacts, K∞ un sous-groupe
compact maximal de G(R) et X = G(R)/K∞ l’espace symétrique de type non
compact associé. Un sous-groupe arithmétique Γ de X est un sous-groupe arith-
métique du groupe des points rationnels H(Q) d’un groupe algébrique réductif HQ
tel que H(R)/Z(H)(R)KH ≃ X où KH désigne un sous-groupe compact maximal
Remarque 4.2. – Noter que dans cette dernière définition, le groupe HR peut avoir
des facteurs compacts. On peut sans perte de généralité supposer que HQ n’a pas
de facteur simple H1 sur Q tel que H1 (R) soit compact. Pour construire les réseaux
arithmétiques du demi-plan de Poincaré H, on part d’une algèbre de quaternion B sur
un corps totalement réel F telle que B est déployée en une unique place archimédienne
de F . Soit B ∗1 le groupe algébrique sur Q des unités de B de norme 1. Un réseau
arithmétique de B ∗1 est un réseau arithmétique de H et tout réseau arithmétique
de H s’obtient à partir d’un groupe HQ ayant même groupe adjoint que B ∗1 pour une
certaine algèbre de quaternion B du type précédent sur un corps de nombres totalement
réel.
Un groupe algébrique linéaire GQ tel que X ∗ (GQ ) = {1} sera dit de type F . Il
revient au même de dire que le centre de GQ ne contient pas un tore déployé.
4.2. Opérateurs de Hecke. – On suppose dans cette partie que GQ est un Q-groupe
algébrique semi-simple sans Q-facteurs simples Gi tels que Gi (R) soit compact. On
fixe un réseau arithmétique Γ ⊂ G(Q). On définit le commensurateur Comm(Γ) de Γ
dans G(R) par
Comm(Γ) = {g ∈ G(R), Γ et g −1 Γg sont commensurables }.
Comme Γ est arithmétique, Comm(Γ) contient G(Q) et en particulier Γ est d’indice
infini dans Comm(Γ). Ceci caractérise les réseaux arithmétiques de G(R) car d’après
un résultat de Margulis ([24], Ch. IX, thm. 6.5), un réseau irréductible Λ de G(R) est
arithmétique si et seulement si Λ est d’indice infini dans Comm(Λ).
Pour tout a ∈ Comm(Γ) on a une décomposition finie
deg(a)
a
(16) ΓaΓ = Γai
i=1
où
deg(a) = |Γ\ΓaΓ| = [Γ : Γ ∩ a−1 Γa].
Plus précisément si {α1 , . . . , αdeg(a) } désigne un système de représentants dans Γ
de Γ ∩ a−1 Γa\Γ alors
deg(a)
a
(17) ΓaΓ = Γaαi
i=1
Soit X un espace localement compact muni d’une action d’un groupe localement
compact H non compact. L’ensemble des mesures de probabilité de Borel qui sont
H-invariantes forment un ensemble convexe.
Définition 4.8. – Une mesure de probabilité µ ∈ P (X), H-invariante est dite ergo-
dique si une des conditions suivantes est vérifiée.
(a) Tout sous-ensemble A ⊂ X, mesurable et H-invariant vérifie µ(A) = 0 ou
µ(A) = 1.
(b)Toute fonction mesurable f sur X, constante sur les orbites de H dans X est
constante µ-presque partout. (i.e si pour presque tout x ∈ X (pour la mesure µ) et
tout h ∈ H, f (h.x) = f (x) alors f est constante µ-presque partout)
(c) La mesure µ est un point du bord de l’ensemble convexe des mesures de proba-
bilité de Borel qui sont H-invariantes.
On dit aussi que l’action de H est µ-mélangeante si pour toute suite (hn )n∈N de H
tel que hn → ∞ (i.e. telle que pour tout compact K ⊂ X, {n ∈ N, hn ∈ K} est fini)
et pour tout sous-ensemble mesurable E, F de X
µ(A ∩ hn B) → µ(A)µ(B).
Une action µ-mélangeante est ergodique pour µ.
Il est classique que toute mesure H-invariante sur X est une moyenne de mesures
H-invariantes ergodiques. Le théorème suivant dit de décomposition ergodique permet
en général de ramener l’étude des mesures H-invariantes sur X à celles qui sont
ergodiques.
Théorème 4.9. – Il existe un espace Z tel que pour toute mesure H-invariante µ sur X
il existe une mesure ν sur Z et une famille
R mesurable {µz }z∈Z de mesure H-inva-
riantes ergodiques
R sur X Rtels
R que µ = Z µz dν. Par définition pour toute fonction
f ∈ L1 (X, µ), X f dµ = Z X f dµz dν(z).
L’espace Z est l’ensemble des points extrémaux de l’espace convexe des me-
sures H-invariantes. De plus deux mesures H-invariantes ergodiques distinctes µ1
et µ2 sur X sont mutuellement singulières : Il existe un sous-ensemble Ω de X tel
que µ1 (Ω) = 1 et tel que µ2 (Ω) = 0.
4.4. Théorie ergodique sur les espaces homogènes Γ\G. – Soit G un groupe de Lie.
Un réseau Γ de G est un sous-groupe discret de G de covolume fini pour la mesure
G-invariante. Le réseau est dit uniforme si Ω = Γ\G est compact. Dans cette situation
tout sous-groupe de Lie F de G agit (à droite) sur Γ\G et le but de la théorie ergodique
dans cette situation est de comprendre les orbites de F et de classifier les mesures
F -invariantes. Une orbite ΓxF est dite périodique si il existe une mesure de probabilité
µ ∈ P (Ω), F -invariante de support ΓxF . Noter que les orbites périodiques de F sont
fermées dans Ω (Raghunathan thm. 1.13 [33]).
Une classe naturelle de mesures de probabilité H-invariantes sur Ω est donnée par
les mesures de probabilité L-invariantes sur une orbite ΓxL, périodique pour un sous-
groupe de Lie L de G contenant F . Une telle mesure sera dite homogène ou algébrique.
Une mesure µ sur Ω est donc homogène ou algébrique si son support Supp(µ) est une
orbite fermée de son sous-groupe d’invariance Λ(µ).
Pour un sous-groupe de Lie F arbitraire de G la détermination des mesures F -in-
variantes ergodiques ou celle des orbites fermées de F sont des problèmes non résolus.
Dans les applications que nous avons en vue, G = G(R)+ pour un groupe algébrique
GQ semi-simple sans Q-facteurs simples Gi avec Gi (R) compact, Γ est un réseau arith-
métique de G(Q). Toutes ces hypothèses seront en vigueur à partir de maintenant.
Le cas où F = T (R) pour un tore déployé maximal est l’un des plus intéressants et
des progrès notables ont étés obtenus par Lindentrauss et Einsiedler dans les années
récentes.
Quand F est engendré par des unipotents la théorie est essentiellement complète
grâce aux travaux de Ratner que nous décrivons maintenant.
Les deux énoncés suivants sont fondamentaux et sont dus à Ratner. Le premier est
le théorème dit de classification des mesures [34]. Le second est un énoncé topologique
qui classifie les adhérences d’orbites de F .
Théorème 4.10. – Soit F un sous-groupe fermé connexe de G engendré par ses sous-
groupes unipotents à un paramètre. Alors toute mesure de probabilité F -invariante et
ergodique pour l’action de F est homogène.
Théorème 4.11. – Soit F un sous-groupe fermé connexe de G engendré par ses sous-
groupes unipotents à un paramètre. Pour tout x ∈ Γ\G on note xF l’adhérence de xF .
Il existe un sous-groupe fermé connexe F ′ de G contenant F tel que xF est une orbite
périodique xF ′ de F ′ .
Définition 4.12. – Un groupe algébrique connexe H sur Q est dit de type H si son
radical résoluble est unipotent et si Hs = H/Ru (H) est produit presque direct de
groupes Q-simples Hi tels que Hi (R) est non compact.
Soit F ⊂ G(R)+ un sous-groupe de Lie fermé connexe. Nous dirons que F est de
type K (de type H dans [29]) si :
3.1) F ∩ Γ est un réseau de F .
En particulier F ∩ Γ\F est fermé dans Γ\G(R)+ ; soit µF sa mesure invariante
normalisée.
3.2) Le sous-groupe L(F ) engendré par les sous-groupes unipotents à un paramètre
de G contenus dans F opère ergodiquement sur F ∩ Γ\F par rapport à µF .
On note Q K (Ω) le sous-ensemble de P (Ω) formé des mesures telles que le sous-
groupe L(Λ(µ)) agit ergodiquement par rapport à µ. On note aussi Q K ,e (Ω) le sous-
ensemble de Q K (Ω) formé des mesures dont le support contient Γe ∈ Ω. Il résulte des
définitions que si F est de type K alors µF ∈ Q K ,e (Ω).
Montrons tout d’abord qu’un groupe vérifiant l’hypothèse ergodique du lemme est
de type H . Soit en effet HQ un groupe de type F , donc :
HQ = N ⋊ (T.Hs )
où N est unipotent, T est un tore (anisotrope), Hs est semi-simple et le produit T.Hs
est quasi-direct. Alors L(H) = N (R) ⋊ L(Hs ). On a un morphisme dominant
π : H −→ T ′
pour un tore T ′ isogène à T . Comme Γ ⊂ H(R)+ est un sous-groupe arithmé-
tique, π(Γ) = ΓT ′ est discret dans T ′ (R)+ . Les orbites de L(H) s’envoient sur des
points de ΓT ′ \T ′ (R)+ . Par hypothèse, il existe une orbite sous L(H) qui est dense
dans Γ\H(R)+ . Comme π est dominant on en déduit que T ′ (et par suite T ) est
trivial.
Si Hs a un facteur Hi Q-simple qui est R-anisotrope, alors on a de même un
morphisme surjectf
Γ\H(R)+ −→ Γi \Hi′ (R)+
avec Hi′ isogène à Hi , l’action de L(H) à droite étant triviale. L’image Γi de Γ est
contenue dans un sous-groupe arithmétique ([5], cor. 7.3) donc est finie. Ceci contredit
l’ergodicité.
Pour l’implication inverse, supposons H de type H . Si H est semi-simple le lemme
(4.15) est vérifié dans ([10], Lemme 2.3).
En général H = N ⋊ Hs et tout sous-groupe arithmétique de H(R)+ contient un
sous-groupe d’indice fini de la forme ΓN ⋊ Γs ([5] cor. 7.13). Comme les revêtements
finis ne changent pas les propriétés ergodiques, on est ramené à vérifier que le produit
semi-direct N.L(Hs ) opère ergodiquement sur ΓN \N ×Γs \Hs . La démonstration facile
de ce fait est laissée au lecteur.
Soit (G, X) une donnée de Shimura. On suppose (sans perte de généralités) que G
est semi-simple de type adjoint. Soit K un sous-groupe compact ouvert de G(Af ).
On fixe une composante connexe X + de X. Soit K ⊂ G(Af ) un sous-groupe compact
ouvert.
On note Γ := G(Q)+ ∩ K et S = Γ\X + qui est une composante irréductible de la
variété de Shimura ShK (G, X).
Soit V une sous-variété spéciale de S. Il existe alors une sous-donnée de Shimura
+
(H, XH ) de (G, X) telle que V est l’image de XH × {1} dans S pour une compo-
+
sante XH de XH . D’après le lemme 3.34, on peut supposer que HQ est le groupe
de Mumford-Tate générique de XH . On fera toujours ce choix dans la suite de sorte
que V détermine HQ à conjugaison par un élément γ ∈ Γ près.
On peut munir V d’une mesure de probabilité canonique µV . Pour tout x ∈ X +
on dispose d’une application
πx : Γ\G(R)+ −→ S = Γ\X +
Γg 7→ Γg.x.
Comme G est adjoint, le groupe HQ est de type F . Il suffit en effet de vérifier que le
centre connexe T de H est un tore Q-anisotrope. On montre le fait plus fort que TR est
R-anisotrope autrement dit que T (R) est compact. Soit en effet xH : S → HR ⊂ √ GR un
élément de XH . Alors T (R) est contenu dans le centralisateur dans G(R) de xH ( −1).
Comme ce centralisateur est un compact maximal de G(R) (car G est adjoint) on en
déduit bien que T (R) est compact.
D’après le résultat de Borel (théorème 4.4), ΓH := H(R)+ ∩ Γ est un réseau arith-
métique de H(Q). Par définition il existe une mesure de probabilité H(R)+ -invariante
µH sur
ΓH \H(R)+ ≃ Γ\ΓH(R)+ ⊂ Γ\G(R)+ .
+
Pour tout xH ∈ XH on a V = πxH (ΓH \H(R)+ ) et la mesure de probabilité µV =
+
(πxH )∗ µH est indépendante du choix de xH ∈ XH . On dira que µV est la mesure
canonique de V . Si P (S) désigne l’ensemble des mesures de probabilité de Borel
sur S alors µV ∈ P (S) et Supp(µV ) = V . Si H est un tore, alors V est un point
spécial et µV une mesure de Dirac de support V .
On cherche à étudier pour une suite Vn de sous-variétés spéciales de S la conver-
gence faible de la suite de mesures µn = µVn associée. On ne peut espérer un résultat
général car les points spéciaux de S sont denses dans S et la suite de mesures associées
à une suite de points spéciaux de S peut avoir un comportement arbitraire. On dira
qu’une sous-variété spéciale V de S est fortement spéciale si le sous-groupe HQ de GQ
est semi-simple. Notons que HQ n’est déterminé par V qu’à conjugaison près dans Γ
mais que la notion d’être fortement spéciale ne dépend pas de ce choix.
Le résultat principal que nous avons en vue est dû à Clozel et à l’auteur de ces
notes [10].
Proposition 5.4. – Il existe un ensemble compact C de Γ\G(R)+ tel que pour tout
sous-groupe unipotent à un paramètre W = (ut )t∈R et tout g ∈ G(R)+ , si
Γ\ΓgW ∩ C = ∅
alors il existe un Q-sous-groupe parabolique propre P de GQ tel que
gW g −1 ⊂ P (R).
Lemme 5.5. – Soient FQ un Q-sous-groupe semi-simple de type H (i.e tel que F (R)+ ∈
K ) et g ∈ G(Q)+ tels que
Γ\ΓgF (R)+ ∩ C = ∅.
Il existe alors un Q-sous-groupe parabolique propre P de GQ tel que FQ ⊂ P .
Comme l’ensemble des h ∈ F (R)+ tels que ghW h−1 g −1 ⊂ P0 (R) est un sous-ensemble
de Zariski de F (R)+ de mesure positive, par connexité de F (R)+ on en déduit que
pour tout h ∈ F (R)+
ghW h−1 g −1 ⊂ P0R .
Comme W n’est contenu dans aucun sous-groupe normal de L on en déduit que
gLg −1 ⊂ P0R .
Soit P = g −1 P0 g, on a L ⊂ PR donc
FQ = M T (L) ⊂ P.
Ceci termine la preuve du lemme car P est un Q-parabolique propre.
Lemme 5.6. – Il existe un compact C ′ de Γ\X + tel que si Z est une sous-variété
fortement spéciale de S alors
(18) Z ∩ C ′ 6= ∅.
Preuve. Soit Ω un compact de G(R)+ contenant l’origine e comme point intérieur.
On note
C1 = C.Ω = {cω, c ∈ C, ω ∈ Ω},
c’est encore un compact de Γ\G(R)+ . Pour tout x ∈ X + , on note comme précédem-
ment πx l’application associée de Γ\G(R)+ vers Γ\X + . On fixe x0 ∈ X + et on note
C ′ = πx0 (C1 ). On remarque que pour tout ω ∈ Ω, si on note xω = ω.x0 alors
πxω (C) ⊂ C ′ .
Soit Z un sous-variété fortement spéciale de S. Il existe donc une sous-donnée de
Shimura (F, XF ) de (G, X) avec FQ semi simple telle que Z soit l’image de XF+ × {1}
dans S.
Soit x ∈ XF+ de sorte que XF+ = F (R)+ .x. Comme G(Q)+ est dense dans G(R)+ ,
il existe ω ∈ Ω et γ ∈ G(Q)+ tels que x = γω.x0 . Soit FγQ = γ −1 FQ γ. On a alors
XF+ = F (R)+ γ.xω et
Z = πxω (Γ\ΓγFγ (R)+ ).
Si Z ∩ C ′ = ∅ alors à fortiori Z ∩ πxω (C) = ∅ et finalement
Γ\ΓγFγ (R)+ ∩ C = ∅.
Par le lemme 5.5, on en déduit que FγQ ⊂ P pour un Q-sous-groupe parabolique
propre P .
Ceci est en fait impossible par définition des sous-variétés fortement spéciales.
√ En
effet soit xF ∈ XF , alors le centralisateur ZGR (FR ) est contenu dans ZGR (xF ( −1))
qui est un compact maximal de G(R) (on rappelle que G est adjoint). On en déduit
à fortiori que ZGQ (FQ ) est Q-anisotrope. D’après le lemme 3.29, FQ n’est pas contenu
dans un sous-groupe parabolique propre.
A l’aide du lemme 5.6, on peut finir la preuve du théorème 5.1 comme dans le cas
S compact. On fixe en effet un domaine fondamental F de X + pour l’action de Γ.
On peut supposer comme dans le cas S compact que le point xn ∈ XHn est dans F
pour tout n. Le lemme 5.6 assure en fait que l’on peut choisir en fait xn ∈ XHn dans
un compact de F .
Des généralisations du théorème 5.1 sont données dans [39] et dans [40]. Décrivons
brièvement ce dernier résultat qui joue un rôle dans la preuve de la conjecture d’André-
Oort sous l’hypothèse de Riemann généralisée.
Définition 5.7. – Soit (G, X) une donnée de Shimura avec GQ de type adjoint. Soit T
un Q-tore algébrique dans GQ . Une sous-donnée de Shimura (H, XH ) de (G, X) est
dite T -spéciale si T est la composante connexe du centre du groupe de Mumford-Tate
générique H ′ de XH . On peut sans perte de généralité supposer que H = H ′ . Alors
H = T Hder . Soit S comme précédemment. Une sous-variété T -spéciale de S est une
sous-variété de Shimura de S que l’on peut définir à partir d’une sous-donnée de
Shimura T -spéciale. Si T est triviale, une sous-variété T -spéciale est juste une sous
variété fortement spéciale.
Théorème 5.8. – Soit T un tore dans GQ . Soit Zn une suite de sous-variétés T -spé-
ciales de S. Soit µn la suite de mesures associée. Il existe une sous-suite µnk et une
sous-variété T -spéciale Z tels que µnk → µZ . De plus Znk ⊂ Z pour tout k.
Références
[1] Y. André – « Mumford-Tate groups of mixed Hodge structures and the theorem of
the fixed part », Compositio Math. 82 (1992), p. 1–24.
[2] W. L. J. Baily & A. Borel – « Compactification of arithmetic quotients of bounded
symmetric domains », Ann. of Math. 84 (1966), p. 442–528.
[3] J. Bertin & C. Peters – « Variations de structures de Hodge, variétés de Calabi-Yau
et symétrie miroir », in Introduction à la théorie de Hodge, Panor. Synthèses, vol. 3,
Soc. Math. France, Paris, 1996, p. 169–256.
[4] A. Borel – « Density properties for certain subgroups of semi-simple groups without
compact components », Ann. of Math. 72 (1960), p. 179–188.
[5] , Introduction aux groupes arithmétiques, Publications de l’Institut de Mathé-
matique de l’Université de Strasbourg, XV. Actualités Scientifiques et Industrielles, vol.
1341, Hermann, Paris, 1969.
[6] , Linear algebraic groups, second éd., Graduate Texts in Math., vol. 126, Sprin-
ger, New York, 1991.
[7] L. Clozel, H. Oh & E. Ullmo – « Hecke operators and equidistribution of Hecke
points », Invent. math. 144 (2001), p. 327–351.
[8] L. Clozel & E. Ullmo – « équidistribution des points de Hecke », in Contributions
to automorphic forms, geometry, and number theory, Johns Hopkins Univ. Press, Bal-
timore, MD, 2004, p. 193–254.
[9] , « équidistribution de mesures algébriques », Compos. Math. 141 (2005),
p. 1255–1309.
[32] V. Platonov & A. Rapinchuk – Algebraic groups and number theory, Pure and
Applied Mathematics, vol. 139, Academic Press, Inc., Boston, MA, 1994.
[33] M. S. Raghunathan – Discrete subgroups of Lie groups, Ergebn. Math. Grenzg.,
vol. 68, Springer, New York-Heidelberg, 1972.
[34] M. Ratner – « On Raghunathan’s measure conjecture », Ann. of Math. 134 (1991),
p. 545–607.
[35] J-P. Serre – « Complex multiplication », in Algebraic Number Theory (Proc. Instruc-
tional Conf., Brighton, 1965), Thompson, Washington, D.C., 1967, p. 292–296.
[36] , « Quelques applications du théorème de densité de Chebotarev », Publ. Math.
IHÉS 54 (1981), p. 323–401.
[37] N. A. Shah – « Uniformly distributed orbits of certain flows on homogeneous spaces »,
Math. Ann. 289 (1991), p. 315–334.
[38] J. H. Silverman – The arithmetic of elliptic curves, Graduate Texts in Math., vol.
106, Springer, New York, 1986.
[39] E. Ullmo – « Equidistribution de sous-variétés spéciales. II », J. reine angew. Math.
606 (2007), p. 193–216.
[40] E. Ullmo & A. Yafaev – « Galois orbits and equidistribution of special subvarieties :
towards the André-Oort conjecture », Ann. of Math. 180 (2014), p. 823–865.
[41] C. Voisin – Théorie de Hodge et géométrie algébrique complexe, Cours Spécialisés,
vol. 10, Soc. Math. France, Paris, 2002.
Emmanuel Ullmo, Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures
sur Yvette, France • E-mail : ullmo@ihes.fr
by
Andrei Yafaev
Abstract. – In this paper we give an overview of the proofs of the Manin-Mumford and
the André-Oort (assuming the Generalised Riemann Hypothesis) conjectures based
on a combination of Galois-theoretic, Geometric and Ergodic techniques.
Résumé (Points spéciaux et intersections dans les variétés abéliennes et les variétés de Shi-
mura)
Dans ce texte nous présentons les idées centrales des preuves des conjectures de
Manin-Mumford et d’André-Oort (admettant l’Hypothèse de Riemann Généralisée)
basées sur la combinaison des techniques galoisiennes, géométriques et ergodiques.
1. Introduction
These notes are expanded versions of the lectures given at the ‘États de la recherche’
conference held at CIRM, Luminy in May 2011. The conference was devoted to the
recent developments on the André-Oort and Zilber-Pink conjectures. My lectures
were given jointly with Emmanuel Ullmo and our aim was to present, in a reasonable
amount of detail, the proof of the André-Oort conjecture (assuming the Generalized
Riemann Hypothesis or GRH for short) which combines Galois-theoretic and Ergodic
techniques. These notes partly rely on Ullmo’s notes (see [25]) in this volume which
provide the necessary background.
Furthermore, Ullmo’s text [26] gives a good introduction to the abstract formula-
tion of the Zilber-Pink conjectures and we use his terminology and notations.
The main goal of these notes is to give an overview of the strategies of the proofs.
For technical details we refer to the original papers [28] and [14].
Statements such as the André-Oort and the Zilber-Pink conjectures can be formu-
lated most generally in the context of mixed Shimura varieties. For this we refer to
Ullmo’s text [26].
In these notes, we focus on the cases of Abelian and pure Shimura varieties. We
start with some abstract preliminaries on Equidistribution, in particular, we make
precise what we mean by equidistribution in our context.
We then proceed to explain the implementation of our strategy in the case of
Abelian varieties (the Manin-Mumford conjecture). The proof follows the same lines
as the Shimura case but each ingredient is much easier to formulate and to prove, and
the assumption of the GRH is not needed in this case.
Finally, we sketch the proof of the André-Oort conjecture assuming the GRH using
a strategy which combines Galois-theoretic techniques with Geometric techniques and
Equidistribution. We would like to point out here that a proof under GRH following
the same lines, but avoiding the equidistribution altogether (and using some group-
theoretic considerations instead) was carried out by Daw (see [4]).
Quite recently, Jonathan Pila and Umberto Zannier came up with a new approach
to the Manin-Mumford and André-Oort conjectures which uses ideas and results from
the theory of o-minimality and gives a hope to prove the André-Oort conjecture uncon-
ditionally. It yielded a number of unconditional results on the André-Oort conjecture
(see [15]. [16], [17] and [6]) culminating in the unconditional proof of the André-Oort
conjecture for all Shimura varieties of Abelian type (see [23] and references therein).
It should also be pointed out, that a new proof of the André-Oort conjecture under
GRH using the Pila-Zannier strategy is now available by combining lower bounds
for Galois orbits of special points ([29] or [22]) under GRH, with the hyperbolic Ax-
Lindemann-Weierstrass conjecture proven in [13] and upper bounds on heights of
pre-special points proven in [5] by Daw and Orr. An overview of Pila-Zannier’s ap-
proach as well as necessary background on o-minimality can be found in Scanlon’s
notes [20] in this volume. Another good reference for this approach is Daw’s survey
[3] (this survey is closer in spirit to these notes).
Acknowledgements
The author is extremely grateful to the organizers of the conference for inviting
him to give these lectures and to CIRM for its hospitality. During the conference the
author benefited from numerous discussions with leading experts in the field. In par-
ticular, the strategy for proving the hyperbolic Ax-Lindemann-Weierstass conjecture
was initiated there.
The author is very grateful to the referees and to Marc Hindry for pointing out
numerous inaccuracies and suggesting improvements.
2. Preliminaries on Equidistribution
Definition 2.1. – We say that a sequence (µn ) of elements of P (X) is weakly conver-
gent to µ ∈ P (X) if for all f ∈ C(X)
Z Z
µn (f ) = f dµn −→ µ(f ) = f dµ as n −→ ∞.
X X
We write
µn −→ µ.
Proposition 2.5. – Suppose that (Zn ) and all its subsequences are equidistributed
S in the
sense of Definition 2.3. Then components of the Zariski closure of n Zn are special.
S
Proof. – Let Y be component of the Zariski closure of n Zn . Replace (Zn ) by the
subsequence of Zn s contained in Y . Let ZY be the smallest special subvariety of X
containing Y (such a ZY exists by definition of a special structure). The set of proper
special subvarieties of ZY is countable and we number them as (Zn′ ).
Sk
For any k ≥ 1, let Znk be an element of (Zn ) not contained in i=1 Zk′ . Such a
choice is clearly possible by the Zariski density and by construction (Znk ) is strict
relative to ZY . By the equidistribution property there exists a special subvariety
Z ⊂ Y containing infinitely many Znk s which implies that Z = Y = ZY and hence
Y is special.
In fact, a stronger statement than the (abstract) André-Oort conjecture (in cases
where it makes sense) is the so-called Equidistribution conjecture which is the follow-
ing.
∆xn −→ µX .
There are few cases of Shimura varieties for which this conjecture is known. It is
only known for modular curves in full generality (Duke, [9]). Zhang (see [30]) proved
the Equidistribution conjecture for some quaternionic Shimura varieties but only for
sequences satisfying additional assumptions.
We refer to Ullmo’s text [24] for a thorough account of the Equidistribution ap-
proach to the Manin-Mumford and the André-Oort type of questions.
Theorem 4.1 (Weyl’s criterion). – Let X be a compact metric space and let C(X) be
the space of continuous functions on X. Let φn ∈ C(X) be a sequence such that
their linear combinations are dense in C(X) (C(X) is endowed with the usual norm
||f || = supx∈X |f (x)|).
Then µn −→ µ if and only if for all m ∈ N,
µn (φm ) −→ µ(φm ).
Proposition 4.2. – Let X = Zn \Rn . For (k1 , . . . , kn ) ∈ Zn , define the associated char-
acter χ = χk1 ,...,kn of X by
n
X
χk1 ,...,kn ((x1 , . . . , xn )) = exp(2iπ kj xj ).
j=1
Proof. – This is a consequence of the Weyl criterion stated above and the theory of
Fourier series.
Proof. – For details we refer to [18], Section 4.1. The proof relies on the criterion 4.2
stated above.
We will use this theorem in the proof of Manin-Mumford in the following form.
4.2. Galois orbits and the alternative. – In this section we give lower bounds for Galois
orbits of torsion points on an Abelian variety defined over a number field in terms of
a positive power of the order of the point. This, as we will see, uses results of Serre’s
on Galois representations on the torsion of Abelian varieties. Note that, although it
uses much more advanced results, this is really analogous to the action of Gal(Q/Q)
on torsion points of C∗ (roots of unity). The usual cyclotomic theory immediately
yields a lower bound for the Galois orbit of a root of unity in terms of, for example,
the square root of the order.
We have the following theorem of Serre’s giving lower bounds for Galois orbits of
torsion points on Abelian varieties.
Proof. – Part 1 is a hard theorem of Serre’s stating that the image of the Galois
representation on Tl A contains an open subgroup Ul of Z∗l for all l and furthermore
that the index |Z∗l /Ul | is bounded by a constant independent of l.
If l 6= p, then p ∈ Z∗l and pc is in the image of Galois for some c. For this, one
can consult Serre ([21], Lettre à Ken Ribet) or handwritten notes of Serre’s course at
College de France by Eva Bayer available on her webpage.
Let us prove that (1) implies (2). Let x be a torsion point of A. By (1), there
is a constant c > 0 such that for any integer m coprime with n, we have [mc ]x ∈
Gal(K/K) · x. In particular, we have
φ(n)
|Gal(K/K) · x| ≥ |{xc : x ∈ (Z/nZ)∗ }| = .
|{x ∈ (Z/nZ)∗ : xc = 1}|
We know that φ(n) ≫ n1−ǫ , therefore it is enough to give an upper bound for the
cardinal of the set x ∈ (Z/nZ)∗ such that xc = 1. Write
r
Y
n= pki i
i=1
It is now easy to explain the alternative in this case. To do this we need the following
lemma, which is an effective version of Poincaré’s lemma.
Theorem 4.7 (Bertrand, see appendix to [18]). – There exists a constant C(A) such
that, for any Abelian subvariety B of A, there exists an Abelian subvariety B ′ such
that
A = B + B′
and |B ∩ B ′ | < C(A)
Theorem 4.8 (Lower bound for degrees of Galois orbits). – There exists a constant
C(A, K) such that for any special subvariety Z = x + B with B defined over K and
x ∈ B ′ , one has
deg(Gal(K/K) · Z) > C(A, K)ord(x)1/2 .
4.3. End of the proof. – Let L be an ample line bundle on A induced by a polarization
(that we fix once and for all). The degrees will be calculated with respect to this line
bundle. We have the following (see lemme 6 of [12]):
n2 dim(X)
deg([n]X) = deg(X).
|Stab(X) ∩ ker[n]|
[d]X ⊂ X.
Then X is special.
4.4. Induction in the Abelian case: proof of Manin-Mumford. – We can now finish the
proof of Manin-Mumford by induction. Let (Zn ) be a sequence of special subvarieties.
Write Zn = xn + Bn where xn ∈ Bn′ . We can, and do, assume that the Zn s are
S
equidimensional. Let Y be an irreducible component of the closure of n Zn . We
replace Zn by the subsequence of the Zn s contained in Y and we choose a number
field K such that A, Y and all Abelian subvarieties are defined over K (one can
4
achieve the last condition by making an extension of degree 3(2 dim A) ).
If dn := ord(xn ) is bounded, then (Zn ) and all its subsequences are equidistributed
and hence Y is special.
Suppose this is not the case. Let p be a prime not dividing dn and let d = pc(A,K)
(where c(A, K) is the constant from Theorem 4.6, (1)). Let Y 1 = Y ∩ [d]Y .
If dim Y 1 = dim Y , then, since Y is irreducible, Y1 = [d]Y and hence [d]Y ⊂ Y .
Then Y is special by the geometric criterion 4.11.
Suppose dim(Y 1 ) < dim(Y ). Note that Y , [d]Y and hence Y 1 are defined over K.
By Lemme 3.3 of [18], Zn ⊂ Y 1 (this is a more-or-less direct consequence of The-
orem 4.6). We replace Y 1 by a K-irreducible component that contains Zn . Let g be
the dimension of A. By Theorem 4.10,
And so, by Bézout’s theorem (in the form Lemme 3.4 of [18]), we have
deg(Y1 ) ≪ d2g .
d1/2 m c
n ≪ deg(Gal(K/K) · Zn ) ≤ deg(Y ) ≪ d .
By the Prime Number Theorem, we can choose a prime p not dividing dn such
that d = pc(A,K) is of the order (log(dn ))c(A,K) . This gives a contradiction.
Hence we end up in case (1).
By this procedure we construct a sequence (Zn′ ) such that Zn ⊂ Zn′ ⊂ Y for all n
large enough, and dim Zn′ > dim Zn . We reiterate the same process with this sequence
(Zn′ ). This concludes the proof.
5. Shimura case: lower bounds for Galois orbits and the alternative
We now move onto the case of Shimura varieties (the André-Oort conjecture). All
the relevant definitions concerning Shimura varieties and their special subvarieties
can be found in Ullmo’s notes [25] (especially Chapter 3) but we recall some of them
for the sake of completeness. The reader is assumed to be familiar with the notions
of Shimura datum, Shimura variety, special point, reflex field, Hecke correspondence,
Mumford-Tate group and generic Mumford-Tate group.
The strategy is formally the same as in the case of Abelian varieties. It is the
one outlined in Section 3: using lower bounds for degrees of Galois orbits of special
subvarieties and a geometric criterion involving Hecke correspondences, one produces
a set of special subvarieties that has the Equidistribution property. The Generalized
Riemann Hypothesis is used twice: once to obtain lower bounds for Galois orbits and
the second time to choose a Hecke correspondence of suitably bounded degree in the
course of the induction.
5.1. Degrees of the Galois orbits. – Our aim in this section is to give lower bounds
for degrees of the Galois orbits of special subvarieties and characterize sequences of
special subvarieties whose Galois degree is uniformly bounded. This lies at the heart
of the proof and this is the content of the paper [28]. We only sketch the main ideas of
the proof. The details are extremely technical and interested reader is referred to [28].
We need to obtain lower bounds for the degrees of Galois orbits of special sub-
varieties in terms of certain invariants attached to Shimura data defining special
subvarieties in question.
Consider a Shimura datum (G, X) and a compact open subgroup K of G(Af ). We
assume (this causes no loss of generality) G to be semisimple of adjoint type and we
work with the connected component
S = Γ\X +
which is the image of X + × {1} in ShK (G, X) where X + is a fixed connected Q compo-
nent of X while Γ is G(Q)+ ∩ K. We assume that K is neat and that K = p Kp with
Kp compact open subgroups of G(Qp ). This amounts to replacing K by a subgroup
of finite index and causes no loss of generality. Let us fix a number field F over which
S admits a canonical model.
A special subvariety V of S is a component of the image of the Shimura vari-
ety ShK∩H(Af ) (H, XH ) where (H, XH ) is a Shimura subdatum with H the generic
Mumford-Tate group on XH . We usually identify V with this component (i.e., we for-
get about the map from ShK∩H(Af ) (H, XH ) to ShK (G, X)). We refer to Section 3.3.2
of [25] for a detailed discussion of special subvarieties. Let us point out here that the
requirement that H be the generic Mumford-Tate group on XH is a normalisation.
Notice that multiplying H by a subtorus of the center of its centralizer does not change
the geometric object (special subvariety). This is analogous to the normalization we
used in the case of Abelian varieties: a special subvariety x + B was normalized by
requiring that x ∈ B ∩ B ′ (with B ′ as in the Theorem 4.7). This gave meaning to
saying that the order of x remains bounded when x+B ranges through a set of special
subvarieties.
In the Shimura case, our normalization will allow us to give meaning to saying that
the connected center remains the same.
Let H der be the derived subgroup of H and T the connected center of H. Let F be
a number field containing the reflex field E(G, X). The notion of degree we use is the
following. For notions of the Baily-Borel compactification and Baily-Borel line bundle
we refer to [1].
Definition 5.1 (Degree of a Galois orbit of a special subvariety.)
Let V be an irreducible subvariety of S defined over Q. Let S be the Baily-Borel
compactification of S. We define deg(Gal(F /F ) · V ) to be the degree of the Zariski
closure in S of the subvariety Gal(F /F ) · V of S calculated with respect to the Baily-
Borel bundle L on S.
Just like in the previous section, the degree of a reducible subvariety, is by definition
the sum of the degrees of its components. Let us define KT := K ∩ T (Af ) and KTm
m
to be the maximal compact
Q open subgroup Q of Tm(Af ). The groups KT and KT are
direct products K = p KT,p and KT,p = p KT,p . For almost all primes p, one has
m
KT,p = KT,p (this is because KT and KTm are adelically open and KT,p ⊂ KT,p m
).
m
We let i(T ) be the number of primes such that KT,p 6= KT,p . We also let LT be the
splitting field of T and dT the absolute value of the discriminant of LT . The degree
of LT over Q is bounded independently of (H, XH ).
Theorem 5.2. – Assume the Generalized Riemann Hypothesis (GRH) for CM fields.
Fix an integer R > 0. There exist constants C > 0, B > 0 and µ > 0 such that the
following holds.
Let V ⊂ S be a special subvariety defined by a Shimura datum (H, XH ) and T be
the connected center of H. Let dT , KT , KTm and i(T ) be as defined above. Let F be a
field of degree at most R over Q and containing LT .
Then
deg(Gal(F /F ) · V ) > C · B i(T ) |KTm /KT |dµT .
Remark 5.3. – It is very important to emphasize here that the constant C depends
only on (G, X), K and R. It does not depend on (H, XH ) in any way.
Another remark is that this lower bound is actually stronger than the one obtained
in Theorem 2.9 of [28]. There, only the bound in a power of log(dT ) is obtained.
However, the bound in small power of dT can be obtained by adapting the methods of
[29] and [22]. This of course assumes the GRH.
It should be observed that this lower bound has two important terms. The first is
the term B i(T ) |KTm /KT | which is obtained without the use of the GRH. The second
term is dµT and this term is obtained under GRH. It is very desirable to have an
unconditional bound in connection with Pila’s strategy (at least for sequences of
special points).
We would like to point out here that Tsimerman, using recent results on the
Colmez’s conjecture on the Faltings heights of CM Abelian varieties, obtained uncon-
ditional lower bounds for Galois orbits of CM points on Shimura varieties of Abelian
type (see [23]). However, this result does not directly imply Theorem 5.2, even for
subvarieties of A g .
To see this, consider the following example. Let B be a quaternion algebra over
a totally real field F of degree n > 1 and assume that B splits exactly one real
place of F . Let G = ResF/Q B ∗ . Then (G, H) (where H is the upper-half plane) is
a Shimura datum of Abelian type. However it does not define a special subvariety
of some A g . To construct a subvariety of A g , one follows Deligne’s construction of
“modèles étranges” (see Section 6 of [7]) which consists of enlarging the center√of G
in order to obtain a symplectic embedding. Let d ≥ 1 be an integer and Z = F ( −d)
the corresponding imaginary quadratic extension of F . Deligne considers the group
G′ defined as
G′ = Z ∗ × G/F ∗
where F ∗ is embedded in Z ∗ ×G via f 7→ (f, f −1 ). Then the Shimura datum (G′ , H) is
a subdatum of a certain symplectic Shimura datum and thus defines a special subva-
riety of some A g .
Let Fm be a sequence of totally real number fields of degree n > 1 and Bm a
sequence of quaternion algebras over Fm split at exactly one place of Fm . Fix d ≥ 1
and consider the sequence (Zm ) of special (non-strongly) subvarieties of A g (g =
4n) obtained by Deligne’s construction as outlined above. The reciprocity attached
to Zm is not given by a CM type and hence Tsimerman’s argument is not applicable.
It should be noticed that it is still possible to obtain appropriate lower bounds for
Galois orbits in this example by appealing to results of Daw (see [4]).
We now briefly outline the steps in the proof of Theorem 5.2. Let KH := K ∩H(Af )
m
and let us define KH := KTm KH . This is a compact open subgroup of H(Af )
m
containing KQ H . One needs to alter the group KH a little bit: replace it with
m m
(KH,3 ∩ K3 ) p6=3 KH,p to make it neat (where K3 is the congruence subgroup of
level three). This only changes the constants by an integer depending on dim(G)
only. The morphism
π : ShKH (H, XH ) −→ ShKH
m (H, XH )
m
is finite of degree |KH /KH | = |KTm /KT |. Notice that the finite group KH m
/KH =
m m
KT /KT acts on ShKH (H, XH ) and π is the quotient map. We let V := π(V ). Our
first aim is to understand and quantify the action of Gal(F /F ) on π −1 V m . The Galois
action is described by a so-called reciprocity morphism. The definition is extremely
technical and we refer an interested reader to Section
Q 2.1 of [28]. What is relevant to
us is the following. There exists a subgroup U = p Up of KTm , where each Up is an
m
open subgroup of KT,p of uniformly (i.e., depending only on (G, X)) bounded index,
such that the following holds. Let V be an irreducible component of π −1 (σV m ). Then
Gal(F /F ) · V is contained in U · V where U is the image of U in KTm /KT . It should
also be noted that, as the Baily-Borel line bundle is KTm /KT -equivariant, for any
α ∈ KTm /KT ,
deg(αV ) = deg(V ).
One then proves the following lemma which realizes the ‘splitting’ of the Galois orbit
into two pieces.
One shows that the first term (the degree of (Gal(F /F ) · V ) ∩ π −1 V m ) is bounded
below by a uniform constant times the size of U . Recall that
Y
KTm /KT = m
KT,p /KT,p
p
m m
and KT,p /KT,p is non-trivial only for the i(T ) primes such that KT,p 6= KT,p . As the
m
index of Up in KT,p is uniformly bounded, say by, B we see that the size of U is at
least B i(T ) |KTm /KT |. This accounts for the first piece.
We do not give details regarding the second piece. This uses the GRH in the form
of the Effective Chebotarev Theorem (see [25], Section 2.1.3). Details can be found
in Section 6 of [29].
5.2. The alternative. – We now consider a sequence (Zn ) of special subvarieties defined
by Shimura data (Hn , Xn ). Our aim is to work out the conditions on (Hn , Xn ) under
which the Galois orbits of the Zn have bounded degrees. We fix once and for all a
faithful representation
ρ : G −→ GLn
defined over Q.
Fix a non-trivial subtorus T ⊂ G with T (R) compact. A sequence of special sub-
varieties (Zn ) defined by Shimura data (Hn , Xn ) is called T -special if for each n, one
has Hn = T Hnder . This definition is analogous to sequences of special subvarieties of
Abelian varieties of the form xn + Bn where the xn have bounded order.
In this section we show that sequences (Zn ) with bounded Galois degree split into
a finite number of T -special subsequences. We let, as before, (Hn , Xn ) be the Shimura
datum defining Zn and Tn the connected center of Hn .
Let F be a number field over which S admits a canonical model and let Zn be a
sequence of special subvarieties with deg(Gal(F /F ) · Zn ) bounded. Using the lower
bound from Theorem 5.2, we first see that dTn is bounded, hence the splitting field
Ln of Tn can be assumed to be constant, equal to a field L.
By considering the representations of the tori Tn induced by ρ, one then sees that
the tori Tn lie in finitely many GLn (Q)-conjugacy classes. We can therefore assume
that the tori Tn lie in one GLn (Q)-conjugacy class.
deg(Gal(Q/F ) · Zn ) < C.
Then there exists a finite set of subtori {T1 , . . . , Tr } of G such that each Zn is
Ti -special for some i.
µnk −→ µZ
We can now outline the proof of the André-Oort conjecture assuming the GRH.
In order to complete the proof, we need two more major ingredients. They are a
geometric criterion involving Hecke correspondences and a result about the existence
of suitable Hecke correspondences.
Let us recall the general situation. We have a Shimura variety
S S and a subvariety
Z containing a sequence (Zn ) of special subvarieties such that n Zn is Zariski dense
in Z. We denote by (Hn , Xn ) the Shimura datum defining Zn . We let Tn be the
connected center of Hn . We choose a number field F such that S admits a canonical
model over F and furthermore, Z is defined over F .
From the preceding section it follows that, if deg Gal(Q/F ) · Zn are bounded, then
Z is special and we are done. We therefore assume that the degrees of the Galois
orbits of the Zn are unbounded.
We let Ln be the splitting field of Tn and dn the absolute value of its discriminant.
To prove that Z is special, it is enough to show that, for all n ≫ 0, Zn is contained
in a special subvariety Zn′ ⊂ Z with dim(Zn′ ) > dim(Zn ).
This will be done by an induction, similar to the induction in the Abelian case as
in Section 4.4.
6.1. The geometric criterion. – Recall that in the Abelian case, the geometric criterion
stated that, a subvariety invariant under certain non-trivial translations by integers
is special. In the Shimura case the analog of the translation by an integer is a suitable
Hecke correspondence.
We say that a subvariety Z of S is Hodge generic if Z is not contained in any proper
special subvariety. Section 3.4 of Ullmo’s notes [25] contains the following statement.
Let Z be a Hodge generic subvariety of S containing a smooth special point. Let q be
in G(Q) which is in Kp for all p except for p = l for a certain prime l large enough
(depending on Z) and such that Tq -orbits are dense and Z ⊂ Tq Z, then Z = S and
hence Z is special.
This criterion is used to prove the André-Oort conjecture in the case of curves,
however, it is unusable in the higher dimensional cases. The dependence of l on Z is
very non-effective and we will see at the end of this section why this statement fails
without the assumption ‘l large enough’. In the case where S = Cn (see Section 2.2.4
and 2.2.5 of [25]), one can establish the dependence of l on the degree of Z. In the
general case such an effective result seems to be beyond reach (and may simply not
exist). There is however a refined version of the criterion which is used in the proof
of the André-Oort conjecture under GRH in [14]. We present it in this section. For
details the reader is referred to Section 7 of [14].
Let (G, X) be a Shimura datum. By a non-strongly special subdatum we mean a
Shimura subdatum (H, XH ) such that H = T H der with T a non-trivial subtorus.
Theorem 6.1 (Geometric criterion). – Let (G, X) be a Shimura datum with G semisim-
ple of adjoint type and let K be a neat compact open subgroup of G(Af ) which is a
product.
Let V be a non-strongly special subvariety of S contained in a Hodge-generic sub-
variety Y of S. Let T be the connected center of the group defining V .
Let l be a prime number splitting T and let m be an element of T (Ql ).
Suppose that Y satisfies the conditions
(1) Y ⊂ Tm Y .
(2) for every k1 and k2 in Kl the image of k1 mk2 in G(Ql ) generates an unbounded
(for the l-adic topology) subgroup of G(Ql ).
Then Y contains a special subvariety V ′ containing V properly.
Proof. – We only present a sketch of the proof and omit all technicalities. For technical
details, we refer to [14].
We refer to Ullmo’s notes [25], Section 3.3.6 for the notion of monodromy. Fix
a smooth Hodge generic point x ∈ Y and fix VZ a lattice in V = Qn such that
K ⊂ GL(VZb ). Let
ρm : π1 (Y sm , x) −→ GL(VZ )
be the monodromy representation and let Γ′ be its image. Recall ([25], Lemme 3.43)
that Γ′ is Zariski dense in (the image of) G.
We let Kl′ be the closure of Γ′ in G(Ql ). By [25], Corollaire 3.45, the group Kl′ is a
compact open subgroup of Kl . Let Shl (G, X) be the pro-l Shimura covering. This is
the projective limit over compact open subgroups of G(Alf ). Notice that G(Ql ) acts
on Shl (G, X). There is a component Ye of the preimage of Y in Shl (G, X) which is
stable by Kl′ .
The condition Y ⊂ Tm Y implies that Ye is also stable by k1 mk2 for some
k1 , k2 ∈ Kl .
Hence Y is stable by the group Ul generated by Kl′ and k1 mk2 . By assumption,
this group is unbounded.
One then shows that there is a component V ′ of the closure of the orbit of Ul · V
which is a special subvariety V ′ containing V properly.
The main difficulty now is to choose an m in T (Ql ) such that for any k1 and k2
in Kl , the element k1 mk2 generates an unbounded subgroup of G(Ql ). The idea is to
replace the group Kl by a smaller one but whose index we can still control. We will
replace Kl with a suitable Iwahori subgroup.
We are not going into details about Iwahori subgroups: they may be found in
Section 8.1 of [14]. Instead we just list the relevant properties. Let Il be an Iwahori
subgroup in good position with respect to T . Then the following holds.
In this section we state a theorem that provides suitable candidates for the elements
m ∈ G(Ql ) to be used in the application of the geometric criterion 6.1. The two
important properties the element m has to have are
1. for any k1 and k2 in Kl , the element k1 mk2 generates an unbounded subgroup,
2. and the degree of Tm is bounded by a uniform power of l.
The notations are as in the previous section. We have the following.
The proof of the theorem is very technical and is omitted. The interested reader
may consult Section 8 of [14].
We now have all the ingredients at hand to give the final argument. Again the reader
is invited to compare the proof we present here to the Abelian case. We consider a
Shimura datum (G, X) and K a compact open subgroup of G(Af ). Without loss
of generality, Qwe assume that G is semisimple of adjoint type, K is neat and is a
product K = p Kp of compact open subgroups Kp of G(Qp ). We also fix a faithful
representation ρ : G −→ GLn . Fix an integer R > 0.
Let V be a special subvariety defined by (H, XH ) with H = T H der . Let, for sim-
plicity of notations, αV := B i(T ) |KTm /KT | with B as in the Theorem 5.2, let L be the
splitting field of T and let dL be the absolute value of its discriminant. Let S be a
connected component of ShK (G, X). We let F be a number field over which S admits
a canonical model, containing the reflex field E(H, XH ) and such that [F : Q] < R.
Recall the lower bound for the degree of the Galois orbit of V (see Theorem 5.2):
| deg(Gal(F /F ) · V )| > CαV dµL
for some uniform constant C.
The induction is based on the following theorem.
Theorem 8.1. – Let Y be a Hodge generic subvariety of ShK (G, X) defined over F .
We suppose that Y contains a non-strongly special subvariety V defined by a Shimura
datum (H, XH ). We let T be the connected center of H.
Suppose that there exists a prime l such that Kl is a maximal compact open subgroup
m
of G(Ql ), the torus TQl is split and that KT,l = KT,l . We assume that the prime l
also satisfies the inequality:
r r
l(k+2f )2 deg(Y )2 < CαV dµL
where r = dim(Y ) − dim(V ) > 0.
Then Y contains a special subvariety V ′ containing V properly.
The proof of this theorem is done by a downward induction on r. For details, the
reader is referred to the proof of Theorem 9.2.1 of [14].
Let Y be a subvariety of S containing a Zariski dense sequence (Zn ) of special
subvarieties defined by Shimura subdata (Hn , Xn ). Assume that Y is defined and
irreducible over F . We write αn for αZn and dn for dLn where Ln is the splitting field
of the connected center of Hn . After replacing ShK (G, X) with the smallest special
subvariety containing Y , we assume that Y is Hodge generic.
If αn dn is bounded, then the sequence (Zn ) is equidistributed and Y is special.
Hence we suppose that αn dn is unbounded.
In view of the previous theorem, the André-Oort conjecture will follow at once
from the following:
Theorem 8.2. – Assume the Generalized Riemann Hypothesis for CM fields.
For any n ≫ 0, there exists a prime l satisfying the following:
m
1. TnQl is split and KT,l = KT,l
r r
2. l(k+2f )2 deg(Z)2 < Cαn dµn .
Proof. – Recall that αn = B i(Tn ) |KTmn /KTn |. One has the following inequality:
αn ≥ (Bc)i(Tn ) i(Tn )!,
where c is a constant independent of (Hn , Xn ).
This is a consequence of the fact that, for a prime p unramified in Ln and such
that KTmn ,p 6= KTn ,p , one has
|KTmn ,p /KTn ,p | ≥ cp.
To prove the existence of a prime l satisfying (1) and (2), we need to show that
the number of primes split in L and satisfying (2) is larger than in := i(Tn ). This is
where the effective Chebotarev theorem comes in.
Suppose that in is unbounded. Then, classical inequalitites (such as the Stirling
formula) imply:
αn > (B ′ in )in ,
where B ′ is uniform.
For x > 0, define πLn (x) to be the number of primes p such that p splits completely
in Ln and p ≤ x. The Effective Chebotarev theorem gives
√
πLn (x) ≫ x
when x is larger than some absolute constant and (log dn )3 .
C µ 1/(k+2f )2r
By taking x ≫ ( deg(Z) 2r αn dn ) and using the inequality αn > (B ′ in )in ,
one easily concludes that πLn (x) > in when x is large enough. Hence we find a prime
satisfying the conditions of 8.2.
Assume now that in is bounded. Then an easy calculation shows again that
πL (x) > in when x is large enough.
References
[1] W. L. J. Baily & A. Borel – “Compactification of arithmetic quotients of bounded
symmetric domains”, Ann. of Math. 84 (1966), p. 442–528.
[2] L. Clozel & E. Ullmo – “Équidistribution de sous-variétés spéciales”, Ann. of Math.
161 (2005), p. 1571–1588.
[3] C. Daw – “The André-Oort conjecture via o-minimality”, in O-minimality and dio-
phantine geometry, London Math. Soc. Lecture Note Ser., vol. 421, Cambridge Univ.
Press, Cambridge, 2015, p. 129–158.
[4] , “Degrees of strongly special subvarieties and the André-Oort conjecture”,
J. reine angew. Math. 721 (2016), p. 81–108.
[5] C. Daw & M. Orr – “Heights of pre-special points of Shimura varieties”, Math. Ann.
365 (2016), p. 1305–1357.
[6] C. Daw & A. Yafaev – “An unconditional proof of the André-Oort conjecture for
Hilbert modular surfaces”, Manuscripta Math. 135 (2011), p. 263–271.
[7] P. Deligne – Travaux de Shimura, Séminaire Bourbaki, vol. 1970/1971, exposé no 389,
Lecture Notes in Math., vol. 244, Springer, Berlin, 1971.
[8] M. Demazure & A. Grothendieck (eds.) – Schémas en groupes. III: Structure
des schémas en groupes réductifs, Séminaire de Géométrie Algébrique du Bois Marie
1962/64 (SGA 3), Lecture Notes in Math., vol. 153, Springer, Berlin-New York, 1970.
[9] W. Duke – “Hyperbolic distribution problems and half-integral weight Maass forms”,
Invent. math. 92 (1988), p. 73–90.
[10] B. Edixhoven – “Special points on the product of two modular curves”, Compositio
Math. 114 (1998), p. 315–328.
[11] P. Gille & L. Moret-Bailly – “Actions algébriques de groupes arithmétiques”, in
Torsors, étale homotopy and applications to rational points, London Math. Soc. Lecture
Note Ser., vol. 405, Cambridge Univ. Press, Cambridge, 2013, p. 231–249.
[12] M. Hindry – “Autour d’une conjecture de Serge Lang”, Invent. math. 94 (1988), p. 575–
603.
[13] B. Klingler, E. Ullmo & A. Yafaev – “The hyperbolic Ax-Lindemann-Weierstrass
conjecture”, Publ. Math. IHÉS 123 (2016), p. 333–360.
[14] B. Klingler & A. Yafaev – “The André-Oort conjecture”, Ann. of Math. 180 (2014),
p. 867–925.
Andrei Yafaev, University College London Department of Mathematics Gower street WC1E 6BT
London United Kingdom • E-mail : yafaev@math.ucl.ac.uk
O-MINIMALITY AS AN APPROACH
TO THE ANDRÉ-OORT CONJECTURE
by
Thomas Scanlon
1. Introduction
In the paper [56] Pila gave the first unconditional proof of the André-Oort conjec-
ture for mixed Shimura varieties expressible as products of curves. This fact on its
own is a remarkable development, but the method of proof, coming as it does from the
theory of o-minimality, constitutes a major breakthrough. Zannier had proposed that
a theorem of Pila and Wilkie on counting rational points in definable sets in combina-
tion with suitable estimates on sizes of Galois orbits could be used to prove theorems
in the vein of the André-Oort conjecture, and, indeed, in joint work with Pila [62]
he implemented this strategy to reprove the Manin-Mumford conjecture. Subsequent
work by many authors [30, 45, 44, 43, 49, 58, 15] has borne out the promise of this
strategy and the pace of the continuing developments suggests that the project has
not been played out.
These notes are based on a pair or lecture series I delivered in May 2011, one in
Luminy to an assembled group of experts on the André-Oort conjecture with the
aim of expositing the applications of the Pila-Wilkie counting theorem to diophantine
geometric problems and then a second lecture series in Lyon to model theory students
participating in a special Maloa (Mathematical Logic and its Applications) semester
with the goal of explaining in detail the counting theorem itself. I have prepared two
other accounts of these theorems [70, 71] to which the reader is referred for gentler
introductions. In this paper, I will follow the proofs of the original papers fairly
closely resisting the temptation to “simplify” those arguments. I do not claim any of
the results explicated in this paper as my own, though, of course, any errors I may
have inadvertently introduced are mine. The principal innovation is to have assembled
in one place the key steps in these proofs.
The subject has progressed during the three years since the bulk of this paper was
written. Most notably, Tsimerman has completed an unconditional proof of the André-
Oort conjecture for A g , the coarse moduli space of principally polarized abelian
varieties of dimension g, using the Pila-Zannier method [78]. The present text retains
the structure and emphases of its 2012 version, but we conclude with a short section
describing the current state of the art.
This paper is organized as follows. In Section 2 we outline the Pila-Zannier strat-
egy. We follow with Section 3 in which we review the basic theory of o-minimality.
In Section 4, the technical heart of this paper, we expose in detail the Pila-Wilkie
counting theorem. Finally, in Section 5 we present some of the details of the proofs
of the diophantine geometric theorems proven with these methods.
Many people have assisted me in writing these notes. I thank in particular Jonathan
Pila and Umberto Zannier for their detailed comments on earlier drafts. I thank
Matthias Aschenbrenner, Philipp Habegger, and Emmanuel Ullmo for enlightening
discussions. I thank the anonymous referees for their close reading and for suggesting
innumerable improvements.
special points under the covering map be the set of algebraic points in X of degree at
most d over Q for some fixed natural number d.
Once we have found the desired analytic covering map, the problem of describing
the set of special points on the algebraic subvariety Y ⊆ X may be converted to
the problem of calculating the set of algebraic points of degree ≤ d on the analytic
variety Y := π −1 Y . On the face of it, such a move converts a difficult problem to an
intractable one as there is very little in general that one can say about the algebraic
points on an analytic variety and the known theorems about the rational points on
algebraic varieties are amongst the deepest in all of mathematics. To exploit this
translation from special points on an algebraic variety to rational (or algebraic of
bounded degree) points on an analytic variety we use the theory of definability in
o-minimal structures. The covering map π : X → X(C) is almost never definable in a
logically tame structure in any sense, but if we were to restrict π to an appropriate
fundamental domain D ⊆ X then the whole situation is often definable in an o-minimal
expansion of the real numbers.
In the cases we have been considering, o-minimal definability takes on a very con-
crete form. Using real and imaginary parts we identify C with R2 , and hence, CN with
R2N . By a semialgebraic set we mean a subset of R2N defined by a finite boolean com-
bination of conditions of the form f (x1 , . . . , x2n ) ≥ 0 where f is a polynomial with
real coefficients. In the cases we have been considering, the fundamental domain D
may be taken to be semialgebraic. Indeed, when X is a complex abelian variety, then
the natural choice for D would be [0, 1)2g . In the case of the covering of the affine line
by the j-function, the usual fundamental domain,
−1 1
D := {z ∈ C : ≤ Re(z) < and |z| ≥ 1},
2 2
is easily seen to be semialgebraic. We say that a function is restricted analytic if it is
the restriction of a real analytic function on some open set to a compact box. By an
explicitly definable function we mean the restriction to a semialgebraic domain of a
function built as a composition of polynomials, restricted analytic functions, and the
real exponential function. The covering maps we have been considering are explicitly
definable. In the case of the covering of an abelian variety π : Cg → X(C) since π is
globally analytic and the fundamental domain D is contained in a compact box, one
sees that the restriction of π to D is already the restriction of a restricted analytic
function to a semialgebraic set. For the j-function, one sees from the q-expansion of j,
that the restriction of j to D may be realized as the restriction to a semialgebraic set
of the composite of a restricted analytic function with a function built from restricted
analytic functions and the real exponential function.
At this point we may invoke the Pila-Wilkie counting theorem (or one of its refine-
ments) to say something about the distribution of algebraic points on Y e := D ∩ Y =
−1
(π ↾ D) Y (C). The counting theorem says that after accounting for rational points
which might lie on semialgebraic sets, there are subpolynomially many rational points
on a definable set. Let us be a little more precise.
a
For a rational number b written in lowest terms we define the (multiplicative)
height as follows:
(
a 0 if a = 0
H( ) :=
b max{|a|, |b|} otherwise.
n
For an n-tuple x = (x1 , . . . , xn ) ∈ Q we define
H(x) := max{H(xi ) : i ≤ N }.
Given a set X ⊆ Rn and a number t ≥ 1 we define
X(Q, t) := {x ∈ Qn ∩ X : H(x) ≤ t}
and
N (X, t) := #X(Q, t).
Finally, we define the algebraic part of X, X alg , to be the union of all connected,
positive dimensional semialgebraic subsets of X. The Pila-Wilkie counting theorem
asserts that for any ε > 0 we have N (X \ X alg , t) = O(tε ). Various refinements of
this theorem are known in which, for example, the set X may be allowed to vary in a
family, the exceptional set may be taken to be smaller than the full algebraic part, and
one can count points of some bounded degree over the rationals rather than merely
rational points. We shall delay our discussion of these refinements until Section 4.
Applying the Pila-Wilkie counting theorem (or its refinement for algebraic points
of bounded degree) to our definable set Y, e we see that there are few, meaning sub-
polynomially many, points on Y e which are preimages of special points unless Y e alg is
large. It is possible for the algebraic part to be large. For example, in the case where
X is an abelian variety, if Y ⊆ X is an algebraic subgroup, then Y is a linear sub-
space of Cg . As such, Y e alg = Y
e (as long as dim(Y ) > 0). To continue the argument
one must show that this is essentially the only way for Y e alg to be large. Such re-
sults are formalized as what we call Ax-Lindemann-Weierstraß theorems, since they
generalize the classical theorem of Lindemann and Weierstraß that if α1 , . . . , αn are
Q-linearly independent algebraic numbers, then eα1 , . . . , eαn are algebraically inde-
pendent, via statements in line with Ax’s formal version of Schanuel’s conjecture that
if α1 , . . . , αn ∈ tC[[t]] are C-linearly independent power series with zero constant term,
then the field C(α1 , . . . , αn , exp(α1 ), . . . , exp(αn )) has transcendence degree at least
n + 1 over C.
Finally, one concludes these arguments by playing a lower bound on the size of the
Galois orbit of a special point against the upper bounds coming from the counting
theorem. That is, we find a field of definition k for Y and X, some number ε > 0,
a constant C and some natural number valued measure of complexity of a special
point c(ζ) so that [k(ζ) : k] > Cc(ζ)ε for all special points ζ. For example, in the case
that X is an abelian variety one could measure the complexity of a torsion point by
its order for which such lower bounds on the degree of a torsion point are known.
The trick is to relate the complexity of a special point to the height of a point in D
mapping to it by π. In the case of torsion points, these quantities are nearly identical,
but in general there may be a polynomial distortion. In any case, since every Galois
conjugate (over k) of a special point on Y must also lie on Y , the existence of a Zariski
dense set of special points on Y would imply that there are more rational (or algebraic
of bounded degree) points on Y e than the counting theorem would allow unless the
e is large. From an appropriate Ax-Lindemann-Weierstraß theorem
algebraic part of Y
we then conclude that some special relations hold on Y. e Possibly after passing to a
quotient, we then conclude that Y must be special.
While the argument outlined above contains many lacuna and elides some essential
subtleties, it does accurately reflect the general lines of the o-minimal approach to
the André-Oort problems. We shall return to these arguments supplying some details
in Section 5.
3. O-minimality
O-minimality was isolated by van den Dries [17] as the requisite condition to prove
the basic structural results of semialgebraic geometry and then by Steinhorn and
Pillay (partially in collaboration with Knight) [63, 37, 64] in its logical form. The
reader should consult the book by van den Dries [19] for a fuller account of o-minimal
geometry and the notes for Wilkie’s Bourbaki seminar [86] for a discussion of the range
of geometric theories to which o-minimality applies. In this section, we shall take a
middle route, focusing on a specific o-minimal structure, namely the expansion of the
ordered field of real numbers by restricted analytic functions and the real exponential
function, while recounting some of the general theorems in o-minimality, especially the
cell decomposition theorem, and discussing what it would mean to consider o-minimal
structures on nonstandard models. This last point may be a significant departure from
most expository articles on o-minimality aimed for a general mathematical audience
in that part of the characteristically logical nature of the subject will be revealed.
An o-minimal structure is a totally ordered structure (in the sense of first-order
logic) all of whose definable, with parameters, subsets are finite unions of points and
intervals. The notions of structure in the sense of first-order logic and definability
may very well be somewhat unfamiliar to the reader. Since the idea of definability is
central to the Pila-Zannier strategy, we shall discuss it in depth. On the other hand,
since the general principles of first-order logic and the admittedly stultifying details of
the constructions of terms, formulae, languages, interpretations, et cetera are spelled
out in innumerable textbooks on this subject, we shall content ourselves now with a
short summary specialized to our applications.
3.1. A review of first-order logic. – In specifying a first-order structure one must indi-
cate both a language and an interpretation of this language.
Remark 3.2. – We have been intentionally vague in saying that a language is given
by the data listed above. The tuple h C , R , F , ni is sometimes called a signature or
a vocabulary and the language is the set of formulae constructed from the signature.
Such niceties are of little concern to us here, but the reader may encounter these
distinctions in the literature.
Remark 3.3. – We have emphasized that the elements of the sets giving the language
are symbols. Since in our intended applications these symbols will transparently cor-
respond to actual functions and relations, one might reasonably conclude that such a
distinction is merely scholastic, but it is precisely this move in separating syntax from
semantics which grounds mathematical logic. In our applications, we shall deduce
properties of the sets defined via the standard interpretations of the symbols from
results proven about nonstandard interpretations.
The structures we shall consider all arise from expansions of the ordered field of
the real numbers.
Example 3.5. – The real numbers as an ordered field, often denoted as R, is the struc-
ture whose underlying universe is the set of real numbers, interprets the single relation
symbol < as the usual ordering relation (so that n(<) = 2), has a constant symbol r
for each r ∈ R with rR = r, has two function symbols + and ·, each of arity 2, inter-
preted by the usual addition and multiplication functions, respectively, and one more
function symbol − with n(−) = 1 to be interpreted as the additive inverse operation.
Example 3.6. – We may regard the ring C (R, R) of continuous real valued functions
on R as an L -structure in the language of Example 3.5 by interpreting the symbols
+, ·, and − in the usual way, each constant r ∈ R as the corresponding constant
function, and < by the partial order f < g ⇐⇒ (∀x ∈ R)f (x) < g(x).
More precisely, for any L -structure M, sets of the following kind are the basic definable
sets.
– Given a pair of terms t and s built from the variables x1 , . . . , xn , the set
(t = s)(M) := {(a1 , . . . , an ) ∈ M n : tM (a) = sM (a)}
is a basic definable set.
– Given a basic relation symbol R of arity m and t1 , . . . , tm terms built from the
variables x1 , . . . , xn , then the set
(R(t1 , . . . , tm ))(M) := {(a1 , . . . , an ) ∈ M n : (tM M
1 (a), . . . , tm (a)) ∈ R(M)}
The class of the quantifier-free definable sets is obtained from the basic definable
sets by closing under finite boolean operations. Likewise, the quantifier-free formulae
are obtained from the atomic formulae by closing under finite boolean operations.
To obtain all of the definable sets, we close off the class of definable sets under the
operations of coordinate projections and finite boolean combinations. At the level of
syntax, coordinate projections correspond to existential quantifiers. That is, if the set
X ⊆ M n+1 is defined by the formula φ(x1 , . . . , xn+1 ) and π : M n+1 → M n is the
projection map (x1 , . . . , xn+1 ) 7→ (x1 , . . . , xn ), then the image of X under π is defined
by the formula (∃xn+1 )φ.
Remark 3.8. – What distinguishes first-order logic from other forms of symbolic logic
is that quantification is permitted only over the elements of the structure. That is,
one is not permitted to form a formula using syntax like “for every subset X of the
structure . . . ” or “there is a finite sequence of elements such that . . . ”. Consequently,
many sets which are obviously “definable” in the sense that in a natural mathematical
language one may specify the set through a rigorous definition are not definable sets.
For example, in the structure R the set of rational numbers is not definable.
Remark 3.9. – Our definition of definable set gives the notion of a set definable with-
out parameters. In the basic example we have been considering, namely R, since
every element of the structure is already named by a constant, there is no distinction
between this concept of definability and the more general notion of parametrically
definable sets though we shall encounter situations requiring this extension. Given a
structure M in some language L we may expand M to a structure in a larger language
having a constant symbol for each element of M . A set is parametrically definable if
it is definable in this expanded language. We often drop the word “parametrically”.
Remark 3.12. – It makes sense to consider formulae with no free variables, also called
sentences. Reading the definition of the interpretation of a formula, we see that if
φ is a formula with no free variables and M is an L -structure, then φ(M ) should be
considered as a subset of M 0 , a singleton, and is thus either empty or all of M 0 . We
say that φ is true in M or that M models φ, written M |= φ, if φ(M ) 6= ∅. For a set
Σ of sentences, we write M |= Σ to mean that for every φ ∈ Σ we have M |= φ.
Various proofs of the compactness theorems are available. For example, it follows
from Gödel’s Completeness Theorem (N.B.: not the Incompleteness Theorem) [27].
Algebraists may be familiar with Łoś’s proof using ultraproducts [38].
For the sake of illustration, we show how the compactness theorem may be used
to show that finiteness across a class of models implies boundedness.
Proposition 3.14. – Let T be a theory in some language L , that is, a set of L -sen-
tences, and φ(x; y) an L -formula. Suppose that for every model M of T and every
parameter b from M , the definable set
φ(M; b) := {a ∈ M : M |= φ(a; b)}
is finite. Then there is a natural number N depending only on φ and T so that every
such set has size at most N .
′
Proof. – Consider an expansion L of the language L by new constant symbols {ci :
′
i ∈ N} ∪ {b} and the set of L sentences
T ′ := T ∪ {φ(ci , b) : i ∈ N} ∪ {ci 6= cj : i < j}
If there were no bound N as in the statement of the proposition, then each finite
subset of T ′ would have a model as if T0 ⊆ T ′ were finite then it would mention new
constants from some finite set {b} ∪ {ci : i < N } (for some N ) and by hypothesis
there is some M0 |= T with an element b for which φ(M0 , b) has size at least N .
Hence, by the compactness theorem there would be some model M |= T ′ which is, as
an L -structure, a model of T , but as cM
i 6= cj for i 6= j and {ci : i ∈ N} ⊆ φ(M, b),
M M
we see that φ(M, b) is infinite contradicting the hypothesis that every set defined by
an instance of φ is finite.
Remark 3.15. – Of course, if in Proposition 3.14 we assumed only that for some fixed
structure M every definable set of the form φ(M, b) were finite, then we could not
conclude that the cardinality of these sets is bounded. It is essential that the finiteness
of the definable sets of the form φ(M, b) be known for all models of the theory.
We shall also see the compactness theorem used to produce nonstandard models,
that is given an infinite structure M we shall find a different structure N which satisfies
exactly the same sentences.
Example 3.17. – Tarski’s theorem that every definable set in R is semialgebraic holds
in every real closed field, that is, in every ordered field for which one-variable polyno-
mials enjoy the intermediate value property: for each one-variable polynomial P (x),
if a < b and P (a) < 0 < P (b), then there is some c ∈ (a, b) with P (c) = 0. Indeed,
every real closed field is elementarily equivalent to R.
Proof. – Let X be a set of cardinality strictly greater than the cardinality of M. Let
′
L be the expansion of L by new constants {cx : x ∈ X} and consider the theory
We shall end our review of basic model theory here though we shall return to
the compactness theorem with the proof of the Pila-Wilkie counting theorem, Theo-
rem 4.6, in Section 4.
3.2. Basic theory of o-minimality. – Let us recall the notion of o-minimality with a
formal definition.
Definition 3.19. – Let L be some language having a binary relation symbol < and
possibly other distinguished relation, function and constant symbols. We say that
an L -structure R = (R, <, . . .) is o-minimal if <R is a total order on R and every
definable (with parameters) subset of R is a finite union of singletons and intervals.
Remark 3.20. – Since we shall only consider structures in which the interpretation
of < defines a total order, we shall drop the superscript and write < rather than <R
for the total order itself on R.
Remark 3.21. – By an interval in a totally ordered set (R, <) we mean a set of the
form (−∞, a) := {x ∈ R : x < a}, (a, b) := {x ∈ R : a < x < b}, (b, ∞) := {x ∈
R : b < x}, or (−∞, ∞) := R for some elements a and b of R with a < b. It is not
enough to ask that the set be convex. For example, the set {x ∈ Q : 0 < x < π} of
rational points in the real interval (0, π) is not an interval in (Q, <).
Remark 3.22. – One might define a structure (R, <, . . .) to be strongly o-minimal
if for any elementarily equivalent structure (R′ , <, . . .) ≡ (R, <, . . .) the structure
(R′ , <, . . .) is also o-minimal. It is a nontrivial theorem, due to Knight, Pillay and
Steinhorn [37], that if one assumes that the ordering < is dense, then strong o-
minimality is equivalent to o-minimality.
In the direct applications of o-minimality considered in this paper, the o-minimal
structures will be expansions of the ordered field of real numbers. However, somewhat
more general structures, namely elementary extensions of the real numbers, will ap-
pear in the proof of the Pila-Wilkie counting theorem. Thus, while the reader would
correctly apprehend the intended geometric consequences of o-minimality by restrict-
ing attention to real geometry, we cannot impose such a restriction without severely
limiting the scope of the arguments.
Let us consider some examples of o-minimal structures on the real numbers.
Theorem 3.23 (Tarski). – The ordered field of real numbers, R := (R, <, +, ·, −), is
o-minimal.
O-minimality had not been defined at the time of Tarski’s work on real geometry,
but Theorem 3.23 is an immediate corollary of his quantifier elimination theorem for
real closed fields: in R every definable set may be defined by a formula without any
quantifiers. In one variable, the basic definable sets have the form {x ∈ R : f (x) = 0}
or {x ∈ R : f (x) > 0} for some polynomial f ∈ R[x]. The zero set of a polynomial
is either all of R if f is the zero polynomial or is finite. By continuity of f and the
completeness of R, sets of the second kind are finite unions of open intervals having
as their endpoints ±∞ and some of the zeros of f .
Theorem 3.24 (Wilkie [84]). – The ordered field of real numbers given together with the
real exponential function
Rexp := (R, <, +, ·, exp)
is o-minimal.
As one might expect, the proof of Theorem 3.24 is substantially more difficult than
that of Theorem 3.23. From examples constructed by Osgood one knows that there
are sets definable in Rexp using existential quantifiers but which cannot be defined
using only quantifier-free formulae [7]. For example, consider the following set.
{(y1 , y2 , y3 ) ∈ R3 : (∃x1 ∈ R)(∃x2 ∈ R) [y1 = x1 & y2 = x1 x2
& y3 = x1 x2 ex2 & x21 + x22 ≤ 1]}.
However, further quantifiers are not necessary. That is, Wilkie established that the
theory of Rexp is model complete: every definable set may be defined by a formula of
the form (∃y1 ) . . . (∃yn )φ where no quantifiers appear in the formula φ.
The proof of Theorem 3.24 passes through a study of Pfaffian functions and is
based in crucial respects on earlier work of Khovanski [32] on so-called few-nomials.
By a Pfaffian chain we mean a finite sequence f1 , . . . , fm of functions fi : R → R so
that for each i there is some polynomial P (t, y1 , . . . , yi ) ∈ R[t, y1 , . . . , yi ] so that the
function fi satisfies the differential equation fi′ (t) = P (t, f1 (t), . . . , fi (t)). A function is
Pfaffian if it belongs to some Pfaffian chain. The differential equation y ′ = y satisfied
by the exponential function expresses it as a Pfaffian function. As we noted in the
previous paragraph, Theorem 3.24 is deep; to do justice to it would lead us too far
afield.
A key result used in the proof of Theorem 3.24 is the o-minimality of the theory of
the ordered field of real numbers with the restricted exponential function, that is, of
the structure (R, <, +, ·, exp ↾ [0, 1]). More generally, the theory of the ordered field
of real numbers with all restricted analytic functions is o-minimal.
Definition 3.25. – By a restricted analytic function we mean a function f : [0, 1]n → R
for which there is some open neighborhood U ⊇ [0, 1]n and a real analytic function
fe : U → R with f = fe ↾ [0, 1]n .
Remark 3.26. – One might instead define a restricted analytic function to be any
function on a compact box which extends to a real analytic function in some neigh-
borhood. One could represent any such function as the composite of a restricted
analytic function in the sense of Definition 3.25 with a linear change of variables.
Theorem 3.27 (van den Dries [18] via Gabrielov [22]). – The structure
Ran = (R, <, +, ·, {f }f :[0,1]n →R restricted analytic )
is o-minimal.
Remark 3.28. – Strictly speaking, if f : [0, 1]n → R is restricted analytic, then when
we regard f as an n-ary function symbol, its interpretation in Ran should be a function
whose domain is all of Rn . Since in practice we only care about the interpretation
of f on the box [0, 1]n we are at liberty to define its interpretation outside the box as
we see fit and we shall impose the condition that on arguments outside of the box, f
takes the value 0.
The counterexample to quantifier elimination for Rexp mentioned above also pro-
vides a counterexample to quantifier elimination for Ran . However, as a Euclidean
counterpart to their work on p-adic analytic geometry (from which they deduced some
remarkable theorems on the rationality of some Poincaré series attached to p-adic an-
alytic functions) Denef and van den Dries [16] proved Theorem 3.27 as a consequence
of a quantifier elimination theorem for a variant of Ran given together with a division
operation. Deviating slightly from their formalism in which the universe of the struc-
ture is the interval [0, 1] rather than the full set of real numbers, we would allow one
new binary function D : R2 → R defined by
(
x
y if 0 ≤ xy ≤ 1,
D(x, y) :=
0 otherwise.
Clearly, the function D is already definable, but by including it as a basic function
symbol, we allow for more complicated terms. For example, if f (x), g(z1 , . . . , zn ) and
g(z1 ,...,zn )
h(z1 , . . . , zn ) are restricted analytic functions, then the function f ( h(z1 ,...,zn )
) is repre-
sented by a term whereas without the D-function its natural definition would require
a quantifier. In this expanded language, Denef and van den Dries prove quantifier
elimination by interweaving two different steps: using the Weierstraß preparation and
division theorems to reduce questions about the sign of analytic functions to the cor-
responding question about some associated polynomials and then applying Tarski’s
elimination of quantifiers theorem for real closed fields, they show how to eliminate an
existential quantifier from an existential formula in the language of Ran (without D)
at the cost of introducing some applications of D and then they show how to remove
the applications of D at the cost of introducing existential quantifiers. It would seem
that these steps might cancel each other, but the induction is organized so that the
formulae become simpler with each iteration. Once the quantifier elimination theorem
has been established, o-minimality follows from the Weierstraß division theorem.
Combining the structures Ran and Rexp we obtain Ran,exp , the expansion of the
ordered field of real numbers by all restricted analytic functions and the global real
exponential function. By work of van den Dries and Miller [21], this structure, too,
is o-minimal. The o-minimality of Ran,exp admits other proofs. For example, in work
generalizing Wilkie’s on the exponential function, Speissegger showed that the ex-
pansion of any o-minimal structure on the real numbers by Pfaffian functions is still
o-minimal [74]. Inspired by Écalle’s theory of transseries, van den Dries, Macintyre and
Marker [20] constructed nonstandard models of Ran,exp via logarithmic-exponential
series.
Other o-minimal expansions of the field of real numbers exist. For example, in
work of Rolin, Speissegger and Wilkie [68] it is shown that o-minimal structures may
be constructed from certain classes of quasianalytic functions. Moreover, in the same
paper it is shown that there is no maximal o-minimal structure on the real numbers.
Here, a maximal o-minimal structure on R would have been an o-minimal expansion
R of R having the property that for any other o-minimal expansion R of R all of the
definable sets in R (and its cartesian powers) are already definable sets in R . It is
shown in [68] that it is possible to find two functions f : R → R and g : R → R so that
the two structures (R, <, +, ·, f ) and (R, <, +, ·, g) are o-minimal, but the structure
(R, <, +, ·, f, g) is not o-minimal. In particular, there is no o-minimal expansion of R
in which both f and g are definable.
The known applications of o-minimality to diophantine geometric problems use
Ran,exp and to my knowledge there are no natural problems for which the o-minimality
of some of these more exotic structures may be relevant, but nothing rules out the
possibility.
Simply from the definition of o-minimality, knowing that a given structure is o-
minimal can have striking consequences. For example, under various natural hypothe-
ses, if
B := {a ∈ Rn : |a| ≤ 1}
and f : B → B is a real analytic function with a fixed point at the origin, then there
is a function Φ : B × [1, ∞) → B definable in Ran,exp so that for a ∈ B and n ∈ Z+
one has Φ(a, n) = f ◦n (a). It then follows that for such an f if Y ⊆ B is a real analytic
subvariety and a ∈ B, then either the f -orbit of a is eventually constrained to lie in Y
or it meets Y in only finitely many points since the set {z ∈ [1, ∞) : Φ(a, z) ∈ Y } is
a finite union of points and intervals so that if {n ∈ Z+ : f ◦n (a) ∈ Y } is infinite, it
contains all numbers beyond some point [69].
While the immediate deductions from the definition of o-minimality may be inter-
esting, the real strength of the condition of o-minimality is that from a hypothesis
about the simplicity of the structure of definable subsets of the line one may deduce
strong regularity properties of the definable sets in any dimension.
The fundamental theorem of o-minimality, the cell decomposition theorem, will ap-
pear both explicitly and implicitly throughout our account of the Pila-Wilkie counting
theorem.
Convention 3.29. – To avoid some technical issues, we shall insist that every o-
minimal structure we consider be an expansion of an ordered field. While there can
be good reasons to drop this hypothesis, as, for example, tropical geometry may be
regarded as the study of definablity in the structure (R, <, +, 0) of the real numbers
considered as an ordered abelian group, some of the basic results in o-minimality
require qualification when stated for weaker structures. Treating our o-minimal
structure (R, <, +, ·, . . .) as a topological space with respect to the order topology,
it makes sense to speak of the continuity of a definable function. Using the field
structure and the usual definition of the derivative as a limit of ratios of partial
differences, one sees that it makes sense to speak of the derivative of a definable
function.
Before we delve into the details of the cell decomposition theorem, let us observe
a very easy, but powerful, result about families of higher dimensional definable sets
in an o-minimal field: the existence of definable choice, or Skolem, functions.
With Definition 3.31 in place, we may state the cell decomposition theorem.
Remark 3.33. – Theorem 3.32 admits various refinements. For example, if the se-
quence of sets Y1 , . . . , Ym varies in a definable family, then the cell decompositions
may also be chosen uniformly from some definable family. In the course of the proof
of Theorem 3.32 one shows that every definable function is almost everywhere differ-
entiable. It follows that in Theorem 3.32 for any given degree k of smoothness, one
may choose the definable functions involved in the definition of the cells to be C k .
It is not true in all generality that the functions may be taken to be C ∞ . However,
each of the structures we have discussed, R, Rexp , Ran and Ran,exp , has analytic cell
decomposition by which we mean that the functions used to define the cells may be
taken to be real analytic. The key step in proving analytic cell decomposition for these
structures is to prove that every definable function f : R → R is analytic at all but
finitely many points and that, moreover, if f varies in a definable family, then the
number of points at which it is not analytic may be bounded uniformly across the
family.
As we noted above, the most difficult part of the proof of Theorem 3.34 is to es-
tablish the piecewise monotonicity and continuity of univariate definable functions.
One argues by noting that various conditions, for example, continuity or f , are de-
finable so that if the lemma were false, then by o-minimality there would be open
intervals on which the undesirable property, e.g., discontinuity, obtains. Of course, it
is possible for a function to be everywhere discontinuous on an interval, but through
further considerations of definability one shows that such a condition is impossible
for a function definable in an o-minimal structure. Piecewise continuity (or even suf-
ficient smoothness) in dimension n > 1 follows from a fairly routine application of
cell decomposition in dimension n (which one must prove from Theorem 3.34 and
Theorem 3.32 in dimension < n and the monotonicity theorem).
Let us consider the inductive step from dimension n to n + 1 for Theorem 3.32. For
the sake of illustration, let us work with a single definable set Y ⊆ Rn+1 . We may
regard as Y as a family of definable subsets of R indexed by Rn . That is, for b ∈ Rn
let
Yb := {a ∈ R : hb, ai ∈ Y }.
By o-minimality, the boundary of each set Yb , ∂Yb , is finite. Thus, we have (partially
defined) definable functions fi : Rn → R (for i ∈ Z+ ) given by
b 7→ the ith element of ∂Yb
and g : Rn → R given by b 7→ max ∂Yb . From the dimension n case of Theorem 3.34
we know that g and the fi ’s are piecewise continuous. The key to this step of the
proof is to show that there is a finite bound on the cardinality of ∂Yb independent
of b. This is achieved by showing that for almost every b (meaning, outside the union
of finitely many lower dimensional cells) there is a neighborhood of b over which Y is
the disjoint union of the graphs of finitely many continuous functions. As in the proof
of piecewise continuity, one argues that if this result were false, then there would be
an open ball U in Rn so that this property would fail for every b ∈ U . With some
work, one then derives a contradiction.
It is hard to overstate the importance of the cell decomposition theorem, especially
for studying the geometry of sets definable in o-minimal structures. For example, it
follows that if (R, <, +, ×, −, . . .) is an o-minimal expansion of the ordered field of
real numbers, Y ⊆ Rn+m is a definable subset of Rn+m regarded as a definable family
of definable subsets of Rn via
Yb := {a ∈ Rn : ha, bi ∈ Y }
then there are only finitely many homemorphism types represented in this family and
for each such Yb the singular homology groups, for instance, are all finitely generated.
(Why? Cell decompose Rn+m subjacent to Y . This cell decomposition induces uni-
form cell decompositions of the fibers and one can read off the homeomorphism type
and algebraic topological invariants from a combinatorial description of the cell de-
composition.) Working in Rexp one recovers, qualitatively, a theorem of Khovanski on
bounding the number of connected components of systems of solutions of fewnomials,
that is systems of equations in a fixed number variables which range over R+ having
a fixed number of monomials but for which the coefficients and exponents are allowed
to vary.
We may deduce a simple topological characterization of finite definable sets in any
number of variables.
Proposition 3.1 has the curious consequence that finiteness is definable for definable
sets in o-minimal structures. More precisely, we have the following corollary.
Corollary 3.35. – Let T be an o-minimal theory extending the theory of real closed
fields in some language L = L (<, +, ·, −, 0, 1, . . .) and φ(x; y) be an L -formula in
the variables x = (x1 , . . . , xm ) and y = (y1 , . . . , yn ) for some natural numbers m and
n. Then there is a formula ϑ(y) so that in any model R |= T letting X = φ(M ) ⊆
M m × M n be the set defined by φ, the set F := {b ∈ Rn : Xb is finite } is defined
by ϑ.
Combining Corollary 3.35 with Proposition 3.14, we deduce that in any o-minimal
structure, if one has a uniformly definable family of finite sets, then there is a uniform
bound on the size of the sets in that family.
Let us isolate a specific consequence of the cell decomposition theorem required
in the sequel: for those o-minimal structures admitting analytic cell decomposition,
every definable set may be covered, up to finitely many points, by the images of
nonconstant, definable, real analytic functions on (−1, 1).
Remark 3.37. – We shall use Lemma 3.36 only when X is semialgebraic, in which case
we may take the real analytic curves γ : (−1, 1) → X to be semialgebraic.
In this section, we shall discuss the Pila-Wilkie counting theorem in some detail
breaking up the discussion into parts. We begin with a general presentation of the
theorem and an outline of its proof. We then embark on a more detailed account of
the parametrization theorem whereby it is shown that every bounded definable set
may be covered by the images of a small number of balls under maps with small
derivatives. We then discuss some results in diophantine approximation to the effect
that the rational points on sets admitting such parametrizations are contained in a
small number of hypersurfaces. Finally, we explain how to combine these results to
deduce the counting theorem and some of its refinements.
Our proof sketch follows the methods from [61] rather closely, especially with re-
gards to the parametrization theorem. The diophantine estimates required for this
theorem appear in a sequence of papers beginning with a paper of Bombieri and
Pila [8] and continuing in works of Pila [51, 52, 53]. A precursor to the general count-
ing theorem for rational points in definable sets appears in the work of Wilkie [85] on
diophantine properties of definable sets.
4.1. An overview of the counting theorem. – Let us begin by recalling what we mean
by counting rational points. To do so we first recall the notion of the height of a
rational number and then extend the height function to finite tuples.
Definition 4.2. – Let X ⊆ Rn be any set and t ∈ R+ a positive real number. We define
X(Q, t) := {x ∈ X ∩ Qn : H(x) ≤ t}. Note that X(Q, t) is always a finite set. We
define the counting function associated to X by N (X, t) := #X(Q, t).
Definition 4.4. – Given a set X ⊆ Rn we define the algebraic part of X, written X alg ,
to be the union of all infinite, connected semialgebraic subsets Y ⊆ X of X. The
transcendental part of X is X tr := X \ X alg .
Remark 4.5. – It need not be the case that the algebraic part of a definable set is
itself definable. For example the following set is definable in Rexp .
X := {hx, y, zi ∈ R3 : x > 0 & xy = z}.
However, its algebraic part consists of those triples hx, y, zi for which y is rational.
Indeed, for each rational number r, the curve
{hx, r, zi : xr = z}
is clearly semialgebraic, infinite and connected. To see that every point in X alg is
contained in such a curve, one should invoke a functional version of the Gelfond-
Schneider theorem.
Theorem 4.8. – For every k ∈ Z+ every definable set X ⊆ (0, 1)n admits a strong
k-parametrization.
Remark 4.9. – Theorem 4.8 is inspired by similar results of Yomdin [89, 88] (extended
by Gromov [28]) about parametrizations in real algebraic geometry. Strictly speaking,
the Gromov-Yomdin theorems are not applicable since we will remove the algebraic
part of a definable set before counting the rational points, but as with many arguments
in o-minimality, the proof methods in the semialgebraic case extend to the general
o-minimal setting.
On the face of it, such a result for definable subsets of Rn is an easy consequence
of the cell decomposition theorem. Indeed, since by the cell decomposition theorem
we may express X as a finite union of cells, it suffices to consider the case that X is
itself a cell defined by C k definable functions. From the description of cells, it is easy
to see how to express such a bounded cell as the image of a ball under a function with
bounded derivatives. Decomposing the domain into finitely many pieces and making
a change of variables, we may arrange that the bound for these derivatives is one.
However, in Section 4.3 we shall establish a version of this parametrization theo-
rem for every o-minimal structure. We then deduce from the compactness theorem
a uniform version which has nontrivial content even when we restrict to o-minimal
expansions of the real numbers.
To achieve the counting theorem, we prove a general result about rational points
on sets parametrized by functions with small derivatives.
Theorem 4.10. – Given m < n, and d ∈ Z+ there is a positive integer k and positive
constants ε = ε(m, n, d) and C = C(m, n, d) so that if φ : (0, 1)m → Rn is a C k
function with image X satisfying |φ(α) (x)| ≤ 1 for all multi-indices α with |α| ≤ k,
then for any t ≥ 1 the set X(Q, t) is contained in the union of at most Ctε (not
necessarily irreducible) hypersurfaces of degree d. Moreover, ε(m, n, d) → 0 as d → ∞.
On its own, Theorem 4.10 has nothing to do with o-minimal structures. However,
we shall obtain Theorem 4.6 by applying Theorem 4.10 to the functions parametrizing
the definable set X provided by Theorem 4.8.
4.2. Reductions in the parametrization theorem. – Let us now establish some basic
reductions and then explain how Theorem 4.6 follows from Theorems 4.8 and 4.10.
As we noted above, if we knew Theorem 4.8 only for subsets of Rn , then the result
would be of very little value, but because it will be proven for definable sets in any
o-minimal field, a uniform version follows. Let us prove now this formal implication.
In the following proposition, and, indeed, throughout the rest of this section, we
work in a general o-minimal structure (R, <, +, ·, −, 0, 1, . . .) expanding a real closed
field. In particular, the underlying real closed field R need not be isomorphic to R.
Proposition 4.11. – Theorem 4.8 implies that if {Xb }b∈B is a definable family of de-
finable subsets of (0, 1)n and k ∈ Z+ then there are finitely many definable families of
definable functions
{φi,b : (0, 1)ℓi → (0, 1)n }b∈B
so that for each b ∈ B for some choice of I, {φi,b }i∈I is a strong k-parametrization
of Xb .
– b∈B
– for each finite sequence of formulae ϑj (x1 , . . . , xℓj , y1 , . . . , ym ; z1 , . . . , zsj ) (with
j ≤ N ) the assertion (∀c1,1 ) · · · (∀c1,s1 ) · · · (∀cN,1 ) · · · (∀cN,sN ) the sets defined
by ϑ1 (x, y; c1 ), . . . , ϑN (x, y; cN ) do not give a strong k-parametrization of b.
Of course, the expressions in the last item for Σ are not explicitly presented as
formal sentences. However, it is a routine matter to formalize such conditions as that
a given formula defines the graph of a function, that the derivatives of that function
up to some given finite order are bounded by 1 and that Xb is the union of the images
of these functions.
Let us check that Σ is satisfiable.
Given any finite subset of Σ we would have to consider only finitely may formulae
of the form ϑ(x1 , . . . , xℓ , y1 , . . . , yn , z1 , . . . , zs ).
Let us note that given ϑ(x1 , . . . , xℓ , y1 , . . . , yn , z1 , . . . , zs ) from the family of defin-
able sets {Θb }b∈Rs , where Θc = {hx, yi ∈ Rℓ+n : R |= ϑ(x, y, c)} we may define the
set
C := {c ∈ Rs : Θc is the graph of a function with domain (0, 1)ℓ }.
4.3. The parametrization theorem in more detail. – Let us now spell out some of the
details of the proof of Theorem 4.8.
We wish to establish B(k) for all k and we do so in steps. The key to bootstrapping
the order of smoothness is a very elementary lemma about precomposing with the
squaring function. While I shall omit many of the technical details from the proofs of
various lemmata required for the proof of Theorem 4.8, since the proof of this lemma
is so clean I cannot resist repeating it.
In the sequel, we shall say that a function f of one variable is weakly increasing if
x ≤ y ⇒ f (x) ≤ f (y) while f is weakly decreasing if x ≤ y ⇒ f (x) ≥ f (y).
where each ρi,j (x) ∈ Z[x] is a polynomial with integer coefficients and ρj,j = 2j xj .
Clearly, each ρi,j is strongly bounded on (0, 1) and by hypothesis each f (i) is strongly
bounded with the possible exception of f (k) . The class of strongly bounded func-
tions forms a ring. Hence, to finish the proof of this lemma, we need only show that
2k xk f (k) (x2 ) is strongly bounded.
Take c ∈ Z+ so that |f (k−1) (x)| < c for all x ∈ (0, 1). I claim that |f (k) (x)| ≤ 4c/x
for all x ∈ (0, 1). Assume for the moment that this claim is false. Let x∗ ∈ (0, 1) satisfy
∗
|f (k) (x∗ )| > 4c/x∗ . By the mean value theorem there would be a point ξ ∈ [ x2 , x∗ ]
so that f (k−1) (x∗ ) − f (k−1) (x∗ /2) = f (k) (ξ) · (x∗ − x∗ /2). We have assumed that
|f (k) | is weakly decreasing. Thus, |f (k) (ξ)| ≥ |f (k) (x∗ )| > 4c/x∗ . Combining these
observations we see:
2c ≥ |f (k−1) (x∗ ) − f (k−1) (x∗ /2)|
> (4c/x∗ )|x∗ − x∗ /2|
= 2c.
This contradiction establishes the claim. Hence,
|2k xk f (k) (x2 )| ≤ 2k xk 4c/x ≤ 2k+2 cxk−1 ≤ 2k+1 c
for x ∈ (0, 1).
Using Lemma 4.20 one proves B(k), that every strongly bounded one variable
function admits a k-reparametrization either by polynomials or for which the
reparametrized function is a polynomial.
The proof of Lemma 4.21 is also elementary, but requires more bookkeeping than
does Lemma 4.20. Allow me simply to indicate the main ideas. One works by induction
on k with the case of k = 1 following easily from the cell decomposition and mono-
tonicity theorems: we decompose (0, 1) into finitely many intervals (a, b) on which f is
strictly monotone (or constant) and |f ′ (x)| ≤ 1 or |f ′ (x)| > 1. If |f ′ (x)| ≤ 1 on (a, b),
then φ(x) := a + (b − a)x parametrizes (a, b) and |(f ◦ φ)′ (x)| < 1. If |f ′ (x)| > 1, then
we see that o-minimality together with boundedness shows that c := limx→a+ f (x)
and d := limx→b− f (x) exist. If we define φ(x) := f −1 (c + (d − c)x), then |(f ◦ φ)′ | < 1.
In the inductive case, we use the inductive hypothesis together with the cell decompo-
sition and monotonicity theorems to arrange that the composites of f with the various
k-reparametrization functions have monotone (k + 1)st derivatives on each interval in
the decomposition. Reversing the parametrization of the intervals if need be, we may
assume that Lemma 4.20 applies and thereby obtain a (k + 1)-parametrization by
precomposing with the squaring function.
With B(k) established for all k, namely that if F : (0, 1) → M is a definable func-
tion, then there is a k-reparametrization of F so that for each φ in the reparametriza-
tion either φ or F ◦ φ is a polynomial, we have the base case for Theorem 4.19. On
the other hand, the base case for Theorem 4.8, namely (∀k)P (1, k): Every strongly
bounded definable set X ⊆ M admits a k-parametrization, is an immediate conse-
quence of o-minimality.
To complete the proof, one argues through strong induction showing that
(∀k)(∀i ≤ n)R(m, i, k) → (∀k)P (n + 1, k) and that (∀k)(∀i ≤ n)P (i, k) →
(∀k)R(m, n, k). That is, one shows that the reparametrization theorem in di-
mension n implies the parametrization theorem in dimension n + 1 which thereby
implies the reparametrization theorem in dimension n + 1.
Deducing the parametrization theorem in dimension n + 1 from the reparametriza-
tion and parametrization theorems in dimension n is straightforward, once one has
established the technical, though elementary, fact that if one knows how to find
k-reparametrizations of functions into R, then one can find k-reparametrizations for
functions into Rm for any m.
Using the cell decomposition theorem, one reduces to the case of finding a
k-parametrization for a cell, X. The case of X = (f, g)Y , that is, X is an interval over
the ℓ-cell Y in n-space, is slightly more difficult than the case of X being the graph
of a strongly bounded function on some cell. By the inductive hypothesis, we can
find a k-parametrization of Y and then for each function φ in that parametrization
we can find reparametrizations of hf ◦ φ, g ◦ φi. Taking the functions
(x1 , . . . , xℓ , xℓ+1 ) 7→ hφ(x1 , . . . , xℓ+1 ), f ◦ φ ◦ ψ(x1 , . . . , xℓ ) + xℓ+1 g ◦ φ ◦ ψ(x1 , . . . , xℓ )i
as φ ranges through the functions in a k-parametrization on Y and ψ ranges through
the functions in a k-reparametrization of hf ◦ φ, g ◦ φi gives the desired k-parametriza-
tion of X.
The more difficult step is to prove the reparametrization theorem in dimension
n + 1. Using cell decomposition and induction, one reduces to the problem of finding
a k-reparametrization of some strongly bounded definable function f : (0, 1)n+1 → R.
Treating the (n + 1)st variable as a parameter, we may regard f as a definable
family {fu : (0, 1)n → R}u∈R of strongly bounded functions of n variables de-
fined by fu (x1 , . . . , xn ) := f (x1 , . . . , xn , u). By induction and a compactness ar-
gument like that for Proposition 4.11, one shows that there is a uniform family
of k-reparametrizations φu : (0, 1)n → (0, 1)n of fu . Returning to the original function
f , we have a something like a reparametrization of f given by φe : (x1 , . . . , xn , xn+1 ) 7→
(φxn+1 (x1 , . . . , xn ), xn+1 ), in the sense that the partial derivatives of f ◦ φe of order up
to k with respect to x1 , . . . , xn are strongly bounded. Our work is to increase the order
of strong boundedness with respect to the last variable. Ideas from o-minimality are
used throughout, including some we have already seen (existence of Skolem functions,
cell decomposition, compactness to deduce uniformities) and one of a different char-
acter: o-minimality implies strong regularity properties of limits. The specific result
used is the following lemma.
Lemma 4.22. – Let {Ft }t∈(0,1) be a definable family of strongly bounded functions Ft :
X → R. Suppose that each Ft is C k and that the derivatives of Ft of order up to
and including k are strongly bounded. Then the rule F0 (x) := limt→0+ Ft (x) defines a
function of class C k−1 all of whose derivatives up to order k − 1 are strongly bounded.
The key observation for the proof Lemma 4.22 is that for any x ∈ X, the function
t 7→ Ft (x) is a strongly bounded one-variable function so that by the monotonicity
For us, it the limiting behaviors of these quantities which are relevant.
With m and n fixed, as d → ∞ we have
m!dn 1
b(m, n, d) = ( ) m (1 + o(1)),
n!
1 m!
B(m, n, d) = ( )(m+1)/m dn(m+1)/m (1 + o(1)),
(m + 1)(m − 1)! n!
1
V (n, d) = dn+1 (1 + o(1)).
(n + 1)(n − 1)!
In particular that if we define
dD(n, d)
ε(m, n, d) :=
B(m, n, d)
then provided m < n, we have limd→∞ ε(m, n, d) = 0.
Let us note a very easy but useful linear algebraic proposition.
Remark 4.29. – The converse to Proposition 4.28 holds as well: If there is a nonzero
polynomial f ∈ R[x1 , . . . , xn ] of total degree at most d which vanishes on every
element of the set S, then for every S0 ⊆ S of cardinality D(n, d) the determinant of
the matrix (Qµ ) as Q ranges through S0 and µ ranges through the multi-indices with
P
|µ| ≤ d vanishes. Indeed, writing f = cα xα we see that the vector (cα ) witnesses a
linear dependence amongst the columns of this matrix.
With the next lemma we show that points on the image of a set parametrized
by a function with small derivatives must be very close to lying on an algebraic
hypersurface.
In the midst of the proof we use an elementary fact that while the determinant of a
sum of linear maps cannot be computed in terms of the determinants of the individual
maps, it can be expressed using exterior products. (I thank Emmanuel Breuillard for
drawing my attention to the papers [1] and [67] in which formulae for determinants
of sums are worked out explicitly.) Recall that if L : V → V is a linear map from an
n-dimensional vector space back to itself, then Λn (L) = (det(L)) idΛn V . Suppose now
that ψi : V → V (for i ≤ r) is a finite sequence of linear maps on this vector space,
then
Xr X
(1) Λn ( ψi ) = ψτ1 ∧ · · · ∧ ψτn .
i=1 τ ∈{1,...,r}n
Taking into account the ranks of each of the maps ψi , we see that the term corre-
sponding to τ is nonzero only if #{i : τi = j} ≤ rank(ψj ) for each j ≤ r.
To read Equation 1 in terms of determinants of matrices one should fix a basis
P (i)
e1 , . . . , en of V , and write ψi (ej ) = aj,k ek to obtain the following expression.
r
X X
(i) (τ )
(2) det( (aj,k )) = det((aj,kj )).
i=1 τ ∈{1,...,r}n
for each j ≤ b the matrix R(j) has rank at most L(m, j) as the space of homogeneous
polynomials of degree j in m variables has dimension L(m, j).
From Equation 3 we see that
X (τ )
det(f (Qµi )) = det((Ri,µi )).
τ ∈{0,...,b+1}D
#{ℓ : τℓ =j}≤L(m,j)
for all j≤b
Taking the constants we have considered thusfar and multiplying by (b + 1)n , for
instance, we obtain the desired result.
Combining Propositions 4.28 and 4.30 we prove that the rational points in the
image of a strong k-parametrization are constrained to a small number of algebraic
hypersurfaces.
4.5. Completing the proof of the counting theorem and its refinements. – We conclude
the discussion of the Pila-Wilkie counting theorem. In this section, we finish its proof
by combining Theorems 4.8 and 4.31.
To carry out the induction to prove Theorem 4.6, it is better to prove a uniform
version.
Theorem 4.32. – Let {Xb }b∈B be a definable family of definable subsets of Rn in some
o-minimal expansion of the real field and let ε > 0 be any real number. Then there
is a definable family of sets {Yb }b∈B and a constant C depending just on ε and the
family so that for every b ∈ B we have Yb ⊆ Xbalg and N (Xb \ Yb , t) ≤ Ctε for t ≥ 1
Let us note what we may conclude by combining Proposition 4.11 with Theo-
rem 4.31.
Proposition 4.33. – Given a definable family {Xb }b∈B of definable subsets of (0, 1)n
each of dimension strictly less than n and ε > 0 there is a number d ∈ Z+ and
a constant C depending only on ε and the family so that for each b ∈ B the set
Xb (Q, t) is contained in the union of Ctε hypersurfaces of degree d.
Proof. – Let us prove Theorem 4.32 by induction n and then on the fiber dimension
of {Xb }b∈B .
Through some elementary considerations of the invariance of the height function
under additive and multiplicative inverses, one sees that it suffices to consider the
case that Xb ⊆ (0, 1)n .
Using uniform cell decomposition, one sees that it suffices to consider the case that
each Xb is a cell. Considering projections and cell decompositions again, one sees that
it suffices to consider the case that Xb = Γ(fb )Zb , the graph of a definable continuous
function fb : Zb → (0, 1) where Zb ⊆ Rn−1 is an open cell.
By Theorem 4.31 there is a number d ∈ Z+ and a constant C depending just on
the family and on ε so that for each b ∈ B and t ≥ 1 the set Xb (Q, t) is contained in
ε
the union of Ct 2 hypersurfaces of degree d.
The family of hypersurfaces of degree d is naturally a definable family itself
{Hc }c∈B ′ (parametrized by PD(n,d)−1 (R), for example).
Let us note that if Xb is contained in some hypersurface, then Xb = Xbalg as
necessarily fb would be the restriction of an algebraic function to an open set. Thus,
we may assume that for each hypersurface Hc the intersection Hc ∩ Xb has dimension
strictly smaller than dim(Xb ). Thus, by induction there is some constant C ′ and a
definable family of definable sets
{Yb,c ⊆ (Hc ∩ Xb )alg }b,c
S
for which N ((Hc ∩ Xb ) \ Yb,c , t) ≤ C ′ t 2 . Define Yeb := Yb,c , then Yeb ⊆ Xbalg , is
ε
ε ε
definable, and N (Xb \ Yb , t) ≤ (Ct 2 )(C ′ t 2 ) = (CC ′ )tε , as required.
Definition 4.34. – Let H : Qalg → R be the multiplicative height function on the alge-
braic numbers. We extend H to n-tuples by H(x1 , . . . , xn ) := max{H(xi ) : i ≤ n}.
For a positive integer k and set X ⊆ Rn , we define
X(k, t) := {(x1 , . . . , xn ) ∈ X : [Q(xi ) : Q] ≤ k & H(xi ) ≤ t for each i ≤ n}
and N (X, k, t) := #X(k, t).
Remark 4.35. – In line with our earlier notation, X(1, t) = X(Q, t).
The direct generalization of Theorem 4.6 to bounding N (X, k, t) holds. That is, Pila
has shown [55] that for any o-minimally definable set X ⊆ Rn , positive number ε > 0,
and positive integer k, there is a constant C = C(X, k, ε) for which the inequality
N (X tr , k, t) ≤ Ctε holds. The proof of this version of the counting theorem passes
through an analysis of algebraic blocks.
As we have seen in the proof of Theorem 4.6, the rational points on definable
sets may be confined to a small number of algebraic hypersurfaces. In the course of
proving the extension of the counting theorem to algebraic points, one shows that
the algebraic points of fixed degree may be confined to few blocks by mixing the
earlier result on rational points with considerations of how algebraic points may be
understood in terms of rational points on some associated definable set.
There are examples of sets X definable in Ran for which N (X tr , t) grows faster
than every polynomial in log(t). Indeed, it is not hard to achieve this with restricted
analytic functions f : [0, 1] → R by constructing highly lacunary power series so
that f takes rational values at many rational arguments. On the other hand, no such
sets definable in Rexp are known to exist, and Wilkie conjectures that, in fact, for
any set X ⊆ Rn definable in Rexp (or more generally, in RPfaff , the expansion of R
by all Pfaffian functions) there are constants C and K so that for t ≫ 1 one has
N (X tr , t) ≤ C(log(t))K . This conjecture has been proven for curves in the plane by
Pila [54], under some additional hypotheses for surfaces by Jones and Thomas [31],
and for algebraic points in surfaces definable in Rexp by Butler [10], but remains open
in higher dimension. The definable sets which arise in the diophantine geometric ap-
plications of the counting theorem are for the most part not definable in RPfaff , but
they are defined using functions which do satisfy differential equations. As the known
restricted analytic functions giving many rational points are differentially transcen-
dental, one might speculate that a generalization of Wilkie’s conjecture might hold
for sets definable in o-minimal expansions of the real field by functions satisfying a
more general class of differential equations than merely Pfaffian equations, but I am
loth to formulate this speculation as a conjecture. If one knew such bounds, then one
would need only prove weaker Galois theoretic lower bounds in order to apply the
counting theorem to diophantine problems.
To prove Theorem 5.1 we shall employ some standard reductions; some of which
will appear in other arguments, but some of which lack natural analogs outside the
context of abelian varieties.
First, we have already assumed A to be defined over a number field. It follows from
Lagrange interpolation that since all of the torsion points are algebraic, the variety X
must be defined over a number field as well. Thus, we may assume that both A and
X are defined over k. Secondly, we may assume that the stabilizer of X in A is trivial.
Indeed, if S = StabA (X) is the stabilizer of X in A, π : A → A/S is the quotient
map, and X = π(X) is the image of X under π, then A/S is an abelian variety, X(C)
meets (A/S)(C)tor in a Zariski dense set, the stabilizer of X is trivial, and if X were
a translate by a torsion point of an abelian subvariety, then X = π −1 X would also
be a translate by a torsion point of an abelian subvariety of A. For the last reduction
we recall the notion of the special locus, or what is sometimes called the Ueno locus.
Let us define the special locus at the level of its C-valued points
SpL(X)(C) : {a ∈ X(C) : a + B ⊆ X
for some positive dimensional algebraic subgroup B ≤ A}.
While we have defined SpL(X) as a set of points, it is, in fact, a closed subvariety
of X. The proof of this fact follows by a fairly easy induction on dim(X) provided
that one proves a stronger uniform version to the effect that if X is allowed to vary in
a constructible family of subvarieties of A, then SpL(X) also varies in a constructible
family of subvarieties and that, moreover, for X irreducible and positive dimensional,
SpL(X) = X if and only if the stabilizer of X is positive dimensional. Given such a
constructible family {Xb }b∈B of subvarieties of A, via a base change if necessary, one
reduces to the case that each Xb is irreducible and then considers a further family
{(a + Xb ) ∩ Xb }(a,b)∈A×B . Apply induction and the observation that if c ∈ SpL(Xb )
and Xb has a finite stabilizer, then there is some a ∈ A with c ∈ SpL(Xb ∩ (a + Xb ))
to complete the argument.
With the introduction of the special locus, we have our third reduction: it suffices
to show that there are only finitely many torsion points in X \ SpL(X). We shall now
convert this to an analytic problem. Let π : Cg → A(C) express the compact complex
Lie group A(C) as a quotient of Cg by some lattice Λ ≤ Cg . As a real vector space,
we have Cg = R ⊗ Λ. Using a basis of Λ as an R-basis of Cg , we regard Cg as R2g so
that π : R2g → A(C) is a real analytic function. While this choice of real coordinates
differs from the usual presentation of C in terms of real and imaginary parts, since
we can move from one to the other by a real linear change of variables, the question
of whether some subset of Cg is semialgebraic does not depend upon our choice of
coordinates. Of course, the map π : R2g → A(C) is not o-minimally definable, but if
we restrict it to the fundamental domain D := [0, 1)2g , which is semialgebraic, then
because π ↾ [0, 1]2g is the restriction of a globally analytic function to a compact box,
the resulting function π e := π ↾ [0, 1)2g is definable in Ran .
With respect to our choice of real coordinates, the torsion points in A(C) are in
bijection with Q2g ∩ D via π e. Let X := π e−1 (X(C)) and let S := π e−1 (SpL(X)). Our
More than one proof of Proposition 5.2 is available to us: one based on differential
algebra, as explicated by Marker [41], and a second proof using o-minimality, including
a second application of Theorem 4.6. One expects the differential algebraic arguments
to generalize, but to date, it is only the o-minimal approach which has been applied
successfully to compute the algebraic parts of the definable sets arising in the other
applications of this method. For all such arguments, one begins by arguing that the
algebraic part may be computed by considering the complex algebraic part rather
than the real algebraic part. More precisely, we have the following lemma.
Then Y ca = Y ra .
Remark 5.4. – In saying that γ : (−1, 1) → Y (C) is real analytic and semialgebraic,
we are regarding Cn with its real structure, thus, as R2n , whereas when we say that γ :
∆ → Y (C) is complex analytic and complex algebraic, we treat Cn as n-dimensional.
Let us now complete the characterization of Xalg . First, we observe that S ⊆ Xalg
as the preimage of a translate of an abelian variety contained in X is the intersection
with D of an affine space entirely contained in π −1 X(C).
For the other inclusion, we observe that if a ∈ Xalg , then π(a) ∈ SpL(X). Indeed,
by Lemma 5.3 we may find γ : ∆ → X a nonconstant complex analytic and algebraic
map with γ(0) = a. Let β := π ◦ γ : ∆ → X(C). Taking K to be the field of meromor-
phic functions on ∆, we may regard γ as a K-valued point of Te A and β as a K-valued
point of X. Differentiating the equation β = π(γ), we see that ∂ logA (β) = ∂(γ). By al-
gebraicity of γ we have tr. degC (C(γ)) = 1 while tr. degC (C(β)) ≤ dim(X) < dim(A).
Hence, the elliptic transcendence theorem of Brownawell and Kubota implies that
there is some proper algebraic group B < A with β ∈ π(a) + B(K). As β is noncon-
stant, dim(B) > 0. Minimizing dim(B), translating and applying the transcendence
theorem again with A replaced by B, we see that β is generic in π(a) + B. Since
β ∈ X(K), we conclude that π(a) + B ⊆ X so that π(a) ∈ SpL(X) as claimed.
To finish the proof of Theorem 5.1 we shall invoke a theorem of Masser [42] on the
Galois action on torsion points.
Theorem 5.7 (Masser). – Let A be an abelian variety over a number field k. Then there
are constants C = C(A, k) and η = η(A, k) so that for any torsion point ξ ∈ A(k alg )
of exact order n one has
[k(ξ) : k] ≥ Cnη .
Remark 5.8. – Masser’s theorem gives much more precise information on the
constants C and η and holds even for families of abelian varieties over some
fixed number field. The coarse bounds suffice for our applications.
Let us make one final observation before finishing the proof. If x ∈ Q2g ∩ D, then
H(x) and the order of x in the group (R/Z)2g , or, what is the same thing, the order
of π(x) in A(C), which we shall write as o(π(x)), are related by
H(x) ≤ o(π(x)) ≤ H(x)2g .
Indeed, if we write
p1 p2g
x= ,...,
q1 q2g
pi
where 0 ≤ pi ≤ qi are integers with qi in lowest terms, then (as long as x 6= 0)
H(x) = max{qi : 1 ≤ i ≤ 2g}
while
o(π(x)) = lcm({qi : 1 ≤ i ≤ 2g}.
We finish the proof now. Let C and η be the constants from Theorem 5.7. Let C ′ be
the constant from Theorem 4.6 with ε = η2 so that N (Xtr , t) ≤ C ′ tε . If X(C) \ SpL(X)
contained infinitely many torsion points, then one could find such a torsion point ξ of
2
exact order n > (C ′ /C) η . As X and SpL(X) are defined over k, if σ ∈ Gal(k alg /k),
then σ(ξ) ∈ X(C)\SpL(X) as well. Taking into account the inequality H(x) ≤ o(π(x))
for x ∈ D and the fact that π induces a bijection between Q2g ∩ Xtr and the set of
torsion points in X(C)\SpL(X), we see from Theorem 5.7 that N (Xtr , n) ≥ Cnη while
η
Theorem 4.6 gives N (Xtr , n) ≤ C ′ n 2 From our choice of n, these two inequalities are
inconsistent.
5.2. Pila’s André-Oort theorem. – Overall, Pila’s proof of the André-Oort conjecture
for products of curves follows the strategy of the Pila-Zannier reproof of the Manin-
Mumford conjecture with some notable changes. First, to obtain the definability of
the relevant analytic covering maps, we must work in Ran,exp ; restricted analytic
functions do not suffice. Secondly, the lower bounds on the sizes of Galois orbits are
obtained from Siegel’s theorem on the class number of quadratic imaginary fields.
The requisite bounds for general Shimura varieties are not yet known uncondition-
ally, though Tsimerman has produced such bounds for the coarse moduli spaces of
principally polarized abelian varieties of any dimension [78]. Finally, a differential al-
gebraic transcendence theorem analogous to the Ax-Lindemann-Weierstraß theorem
is not known for the j-function. Consequently, the characterization of the algebraic
part of definable sets arising as pullbacks of algebraic varieties requires a different
argument based on o-minimality. It bears noting that the proof of Proposition 5.2
in [62] employs similar considerations rather than the differential algebraic methods
we used.
Pila’s theorem is often cited as an unconditional version of the André-Oort con-
jecture in the case where the ambient Shimura variety is AnC regarded as the nth
Cartesian power of the j-line. However, he proves a stronger theorem, namely that
some cases of Pink’s generalized André-Oort + Manin-Mumford conjecture [65] hold
for varieties expressible as products of modular curves, elliptic curves defined over a
number field, and powers of the multiplicative group. Let us give a precise formulation
before we begin its proof. We begin by defining the special points.
Let us say now what we would mean by a special subvariety of a product of affine
lines and algebraic groups.
Theorem 5.11 (Pila). – Let N ∈ N be a natural number and A an algebraic group over
a number field which is expressible as a product of elliptic curves and a Cartesian
power of the multiplicative group. If Y ⊆ X := AN × A is an irreducible subvariety
for which the set
{a ∈ Y (C) : a ∈ (AN × A)(C) is a special point }
is Zariski dense in Y , then Y is a special subvariety.
As with the proof of the Manin-Mumford conjecture, we shall prove Theorem 5.11
by fixing an o-minimally definable analytic covering of π : X → AN (C) × A(C) for
which the special points come from arithmetically simple points in D and then consider
the set of such points on X := π −1 (X(C)).
Of course, the j-function is not o-minimally definable as a function on all of the
upper half-space
h := {z ∈ C : Im(z) > 0}
but if one restricts j to a fundamental domain, say, the standard fundamental domain
−1 1
D := {z ∈ C : ≤ Re(z) < and |z| ≥ 1},
2 2
then the resulting function is definable in Ran,exp (relative to the usual presentation
of C via real and imaginary parts). Indeed, it is well known that j(z) = J(exp(2πiz))
where J is a meromorphic function on the open unit disk with a simple pole at the
origin whose first few terms are given by
1
J(q) = + 744 + 196884q + 21493760q 2 + 864299970q 3 + · · ·
q
The map z 7→ exp(2πiz) restricted to D is o-minimally definable as
z 7→ exp(−2π Im(z))(cos(2π Re(z)) + i sin(2π Re(z)).
While the trigonometric functions over the full real line are not definable in Ran,exp ,
since the real part of z is bounded between −1 1
2 and 2 on D, only the restrictions of
sine and cosine to a compact interval are required, and these are clearly restricted
analytic. The image of D under z 7→ exp(2πiz) is contained in Bexp(−√3π) (0), the disk
√
of radius exp(− 3π) about the origin, thus, we may express j ↾ D as
j(z) = (J ↾ Bexp(−√3π) (0))(exp(2πiz)).
The restriction of J to Bexp(−√3π (0) is the quotient of a restricted analytic function
by a polynomial, and is thus definable in Ran,exp , showing that the restriction of j
to D is definable.
From the analytic theory of elliptic curves, we know that the elliptic curve
Ej(τ ) (C) = C/(Z + Zτ )
has complex multiplication if and only if [Q(τ ) : Q] = 2. Thus the prespecial points
in D, by which we mean the points in D which map to special points by our given
analytic covering map, namely the j-function, are the quadratic imaginary numbers
in D.
As we have already discussed when considering the Manin-Mumford conjecture,
if B is a connected commutative algebraic group over C, then its universal covering
space is Cg , where g = dim(G). More specifically, if B is an abelian variety, then
by restricting the covering map to a fundamental domain and taking a basis of the
kernel as a basis for Cg as an R-vector space, the we may think of this covering map
as π : [0, 1)2g → B(C) where π is the restriction to a semialgebraic set of a restricted
analytic function and is therefore definable in Ran . In this case, the prespecial points,
namely the points mapping to torsion points, are the rational points in the domain
of π. When B = Gm is the multiplicative group, then our covering map π : C →
Gm (C) is given by z 7→ exp(2πiz). As noted above, by restricting this map to the
fundamental domain
{z ∈ C : 0 ≤ Re(z) < 1}
the complex exponential map becomes definable in Ran,exp .
Using these various analytic covering maps as the coordinates of a single covering
map we obtain an analytic covering map π e → X(C) where X
e :X e = hN × Cg with
g = dim A and then by restricting to a fundamental domain X, we obtain an o-
minimally definable covering map π : X → X(C) for which the prespecial points
in the coordinates corresponding to A1 are the quadratic imaginary numbers and
in the other coordinates are (some of) the rational points relative to the choice of
real coordinates noted above. We have thus converted the problem of describing the
special points in Y (C) to that of describing the prespecial points in Y := π −1 Y (C).
As with the Manin-Mumford conjecture, we define a special locus for Y and then
reduce to showing that there are only finitely many special points in Y not contained
in its special locus. However, unlike the case of abelian varieties, our proof that the
special locus is constructible uses the analytic covering in an essential way. The key
observation is that the (weakly) special subvarieties come from geodesic analytic sub-
varieties of X.
The map π e:X e → X(C) expresses X(C) as a quotient of X by an arithmetic group.
The domain X e is a homogenous space for the group G(R) := PSL2 (R)N ×G2g (R) and,
a
again relative to our choice of real coordinates, we may regard X(C) as Γ\X e where
Γ = H(Z) for a certain algebraic subgroup of G. Here the group H is a product of
the algebraic groups PSL2 for each A1 factor of X, G2a for each elliptic factor, and
Ga × {0} for each multiplicative group factor.
If Y ⊆ X were a special variety and Y e were a component of π e−1 Y (C), then Ye
N
would be a product of an analytic subvariety of h defined by equations of the form
zi = γzj or zk = ξ for some γ ∈ PSL2 (Q) or prespecial point ξ and an affine subspace
of Cg (which relative to the real coordinates comes from one defined over Q).
weakly special subvarieties of Y . On the face of it, this is a countable union of algebraic
varieties. However, after reducing to the case that Y is not contained in a proper
geodesic subvariety of hN × Cg and Y is not special, we show that Yalg = π −1 SpL(Y )
and that SpL(Y ) is a proper subvariety of Y . This fact may be regarded as an analog of
the Ax-Lindemann-Weierstraß theorem, but its proof has resisted differential algebraic
treatments and occupies three sections of [56].
One obtains this characterization of the algebraic part of Y in stages.
e be a component of π −1 Y (C) which meets X in a set of full dimension.
First, let Y
We argue that if Z ⊆ Y e is a (positive dimensional) maximal algebraic subvariety
e then Z is contained in a geodesic subvariety X
of Y, e which is contained in Y. e Sec-
ondly, invoking Lemma 5.3 we conclude that Yalg is covered by geodesic subvarieties.
Finally, using the compactness theorem and the fact that there are only countably
many shapes of geodesic varieties, we show that π(Yalg ) = SpL(Y ) is a proper closed
subvariety of Y .
Let us explain how the first step works. Translating by an element of H(Z) if need
be, we may assume that Z(C)∩X is Zariski dense in Z. We then consider two definable
sets
BZ := {γ ∈ H(R) : dim(γZ ∩ X) = dim Z}
and
e = dim(Z)}.
CZ := {γ ∈ H(R) : dim(γZ ∩ X ∩ Y)
The set CZ is definable in Ran,exp while BZ is semialgebraic, but they share many
integral points in common. Indeed, if Γ := {γ ∈ H(Z) : γ Y e = Y},
e then Γ ∩ BZ = Γ ∩
e
CZ . Using the fact that Y is a component of a positive dimensional H(Z)-periodic set
and some easy estimates on the number of translates of X which meet Z in a dense set,
one shows that number of points in BZ ∩ Γ of height up to t outstrips the Pila-Wilkie
bounds. Thus, CZ must contain an infinite, connected semialgebraic set S. It must be
the case that S stabilizes Z for otherwise, for any s0 ∈ S Z ( s−1 e
0 · S · Z ⊆ Y violating
the maximality of Z as we have observed that the semialgebraic part of a complex
analytic variety is equal to its complex algebraic part. Thus, Z is a homogeneous space
for a positive dimensional semialgebraic group. Using a description of the algebraic
subgroups of G, one shows that some weakly geodesic relation holds on Z. Through
further considerations of the structure of H, it follows that, in fact, a geodesic relation
holds on Z. The analysis continues in much the same way as in the proof of the
Manin-Mumford conjecture. It is shown that either a geodesic relation holds on all
e or that the algebraic part of Y
of Y e is contained in an analytic set of strictly smaller
dimension. In the case that a geodesic relation holds on Y, e one passes to a quotient
while in the latter case, we have reached the desired conclusion.
Remark 5.13. – This basic strategy for determining the algebraic part of the pullback
of a subvariety Y (C) under an analytic covering map π : X → X(C) expressing a
variety X(C) as a quotient Γ\X of a homogeneous space X works more generally. By
comparing the word metric in Γ to the Euclidean metric in X, Ullmo and Yafaev [82]
have shown that if X(C) = Γ\X is a Shimura variety for which Γ is co-compact, then
for any algebraic variety Y ⊆ X, the maximal algebraic subvarieties of π −1 (Y (C)) are
geodesic. Pila and Tsimerman have proven the Ax-Lindemann-Weierstraß theorem
for A g [59]. A general treatment of this problem is given by Klingler, Ullmo and
Yafaev [35].
Remark 5.14. – In later work, Pila and Habegger [30] showed that if one were to
define the special locus of a subvariety Y ⊆ An to be the union of all of the positive
dimensional weakly special subvarieties of Y , then as in the case of abelian varieties,
the special locus is actually a closed subvariety.
One concludes the proof of Theorem 5.11 almost exactly as with the proof of
the Manin-Mumford conjecture, with the minor change that the lower bound on the
Galois orbits of special points is obtained from Siegel’s theorem on the class number of
quadratic imaginary fields rather than Masser’s theorem on torsion points on abelian
varieties.
Lemma 5.15. – There is a constant C so that for any prespecial ξ ∈ X one has
1
[k(π(ξ)) : k] ≥ CH(ξ) 2 .
Remark 5.17. – We have stated Theorem 5.16 in the striking form (which appears
in [45]) that the abscissas are restricted to be 2 and 3. The proof works equally well
for any two constant abscissas provided that the points are linearly independent
p on
the generic
p fiber. (We leave it to the reader to verify that the points [2 : 2(2 − λ) : 1]
and [3 : 6(3 − λ) : 1] are indeed linearly independent generically.) With additional
work (as shown in [43]) the restriction to constant abscissas may be dropped.
Remark 5.18. – Stoll has given a direct proof of Theorem 5.16, showing the stronger
result that there are no exceptional λ [75].
is finite.
The varieties X[N ] are special in the sense that they are subgroup schemes of X
and because dim(C) + dim(X[N ]) = 1 + 1 < 3 = dim(X), one expects C ∩ X[N ] to be
empty. The conjectures of Zilber-Pink type (note that I did not say “the Zilber-Pink
conjecture” as the experts have yet to settle on a final formulation) assert that if X is
a special variety and Y ⊆ X is a subvariety of dimension d not contained in a proper
special subvariery of X, then the set
[
Y ∩ Z
Z⊆X special
codimX (Z)<d
One obtains the lower bounds on the size of Galois orbits of torsion points through
two theorems. First, as a consequence of work of David [14] and of Masser [42] on the
Galois action on
p the torsion points onpabelian varieties we may bound the order of
the points [2 : 2(2 − λ) : 1] and [3 : 6(3 − λ) : 1] by a function of the height of λ
and the degree of λ over Q.
Lemma
p 5.19. – There ispa constant C so that for any algebraic number λ if [2 :
2(2 − λ) : 1] or [3 : 6(3 − λ) : 1] is torsion point of exact order n on the el-
liptic curve Eλ defined as a subvariety of P2 by the equation zy 2 = x(x − z)(x − λz),
then n ≤ c[Q(λ) : Q]2 (1 + h(λ)).
Combining
p Lemmata 5.19 and p 5.20, we see that there is a constant D so that if
either [2 : 2(2 − λ) : 1] or [3 : 6(3 − λ) : 1] is torsion of exact order n on Eλ , then
1
[Q(λ) : Q] ≥ Dn 2 .
We use this conclusion to complete the argument. If there were infinitely many
torsion points on C, then we could find such torsion points ξ of arbitrarily high order
n. Any Galois conjugate of ξ would also have order n and lie on C, but from our above
1
observation we know that ξ has at least Dn 2 conjugates. The height of pπ −1 (ξ) (and of
each conjugate) is at most n. By uniform finiteness in the o-minimal structure Ran,exp
we see that there is a uniform finite bound B on the size of the sets π −1 C(C)∩(D×{a})
1
as a ranges through p(X). Thus, there are at least (D/B)n 2 points in C of height at
most n, contradicting our hypothesis that there are infinitely many torsion points
on C and thereby completing our sketch of the proof of Theorem 5.16.
One might ask whether a variant of the Masser-Zannier theorem holds for higher
dimensional families of abelian varieties. Habegger took up precisely that challenge
for the Weierstraß family of elliptic curves. For a pair of numbers (a, b), the equation
zy 2 = x3 + az 2 x + bz 3
cuts out an elliptic curve E(a,b) in P2 provided that 4a3 + 27b2 6= 0. From dimension
considerations, one sees that one must specify at least three abscissa values in order
to expect there to be only finitely many specializations for which all the points are
torsion. Habegger proves that this is in fact the case for the points with abscissa 1, 2
and 3 [29].
Theorem 5.21 (Habegger). – There are only finitely many pairs of complex numbers
(a, b) with 8a3 + 27b2 6= 0 for which the following three points are all torsion in E(a,b) :
√ √ √
[1 : 1 + a + b : 1], [2 : 8 + 2a + b : 1], and [3 : 27 + 3a + b : 1].
While the proof of Theorem 5.21 follows a similar strategy to that of Theorem 5.16,
there are some notable novelties. First, while Masser and Zannier could make do with
Pila’s theorem on counting rational points in subanalytic surfaces [52], the definable
sets implicated by Theorem 5.21 are complex surfaces, and, hence, four dimensional as
definable sets. Thus, the counting theorem for more general o-minimally definable sets
makes an essential appearance. Secondly, the transcendence results on theta functions
used to show that the definable sets appearing in the proof of Theorem 5.16 have
trivial algebraic parts are not strong enough to prove the corresponding theorem in
this case. Indeed, some related transcendence theorems of Bertrand [5] are used to
prove that certain curves have trivial algebraic parts. The counting theorem is then
applied in the refined form about the algebraic points being confined to blocks.
5.4. Unlikely intersections in Shimura varieties. – Several theorems along the lines of
the Zilber-Pink conjectures have been proven using the methods we have outlined.
Of these, the one having the most distinctive character is a theorem of Habegger and
Pila [30] on unlikely intersections in An .
Remark 5.23. – The hypothesis that the curve is asymmetric is used in the proof, but
does not appear to be necessary.
The proof of Theorem 5.24 passes through an analysis of the monodromy of the
j-function. This theorem is used to show that it cannot happen that the preimage
of C(C) is contained in a weakly geodesic subvariety of hn . Thus the intersection of
the preimage of C(C) with any weakly geodesic variety is necessarily finite.
A second remarkable feature of the proof of Theorem 5.22 is that the refined count-
ing theorem on the number of blocks containing the algebraic points is required since
the definable sets in question naturally have the structure of homogeneous spaces for
algebraic groups and therefore are equal to their own algebraic parts.
Using similar methods, Pila and Tsimerman have generalized both the Ax-
Lindemann-Weierstraß theorem and Theorem 5.24 with an Ax-Schanuel-style
theorem for the j-function [60]. In fact, generalizing an earlier result of Pila [57]
strengthening the hyperbolic Ax-Lindemann-Weierstraß theorem to include a tran-
scendence statement for the derivatives of j, the hyperbolic Ax-Schanuel theorem
also takes into account the derivatives of the j-function.
5.5. Further results and prospects. – Other theorems in the vein of the Zilber-Pink
conjectures have been proven using the Pila-Zannier strategy. Shortly after the strat-
egy became widely known, several results were obtained. Peterzil and Starchenko
reproved the Manin-Mumford conjecture for semiabelian varieties using essentially
the methods we have described [49]. Daw and Yafaev proved the André-Oort conjec-
ture for Hilbert modular surfaces [15] and Pila and Tsimerman proved the André-Oort
conjecture for the moduli space of principally polarized abelian surfaces [58].
It is not unreasonable to hope that these methods may be extended to give an un-
conditional proof of the André-Oort conjecture for all Shimura varieties, and, in fact,
the strategy has been carried out for, arguably, the most important class of Shimura
varieties: the coarse moduli spaces A g of principally polarized abelian varieties of
dimension g for g ∈ Z+ .
Peterzil and Starchenko established definability in Ran,exp of the relevant covering
maps. Pila and Tsimerman proved the Ax-Lindemann-Weierstraß theorem for A g
in [59], noting at the time that the André-Oort conjecture for A g had thereby been
reduced to the problem of proving suitable lower bounds on the size of Galois orbits
of special points. Tsimerman completed the proof [78] by making use of the aver-
age Colmez conjecture proven by two separate groups of mathematicians, Andreatta,
Goren, Howard and Madapusi-Pera [2], and Yuan and Zhang [90].
There are no obvious obstructions to extending this method to prove the André-
Oort conjecture for general Shimura varieties. Ullmo presented a detailed proof schema
for the André-Oort conjecture in [79]. He shows that once one has established the o-
minimal definability of the covering maps and the Ax-Lindemann-Weierstraß theorem,
then a weak form of the André-Oort conjecture follows. That is, if S is a Shimura
has shown that unless Y is a point, it must take the form S ′ × Y ′ where S ′ and S ′′ are
Shimura varieties, dim S ′ > 0, S ′ × S ′′ ֒→ S is a weakly special subvariety of S, and
Y ′ ⊆ S ′′ is a subvariety of S ′′ . One might expect that by passing to a quotient or to
a smaller ambient Shimura variety, the argument could be completed by induction.
However, there are some complications in implementing this strategy. First, the pre-
sentation of S ′ × S ′′ as a product may be incompatible with the structure of S as a
Shimura variety. Secondly, one cannot simply replace S with S0 , the smallest Shimura
subvariety of S containing Y , because it may happen that S0 ∩ Σ decomposes into
infinitely many generalized Hecke orbits in S0 . Orr deals successfully with the first
difficulty, but the second obstruction remains.
Generalizing both the André-Oort and André-Pink conjectures, Gao has imple-
mented the Pila-Zannier strategy for mixed Shimura varieties [23]. Specifically, he has
established the Ax-Lindemann-Weierstraß theorem for mixed Shimura varieties [26]
and has shown that the generalization of the André-Oort conjecture for mixed Shimura
varieties follows from the existence of suitable lower bounds on the size of Galois or-
bits of special points on the associated pure Shimura varieties [24]. Specializing to the
case of universal abelian schemes over fine moduli spaces, Gao proves a generalization
of Orr’s theorem describing those subvarieties which meet a generalized Hecke orbit
in a Zariski dense set [25].
Even after this flurry of activity, there remain many cases of the Zilber-Pink con-
jecture to which the Pila-Zannier strategy should apply. Methods from o-minimal ge-
ometry have become important tools in diophantine geometry. I expect that in time
several further theorems towards the Zilber-Pink conjectures and related problems
will be proven following these ideas.
References
[1] S. A. Amitsur – “On the characteristic polynomial of a sum of matrices”, Linear and
Multilinear Algebra 8 (1979/80), p. 177–182.
[2] F. Andreatta, E. Z. Goren, B. Howard & K. Madapusi-Pera – “Faltings heights
of abelian varieties with complex multiplication”, preprint arXiv:1508.00178.
[3] J. Ax – “On Schanuel’s conjectures”, Ann. of Math. 93 (1971), p. 252–268.
[4] A. Baker – “Linear forms in the logarithms of algebraic numbers. I, II, III”, Mathe-
matika 13 (1966), 204-216; ibid. 14 (1967), 102-107; ibid. 14 (1967), p. 220–228.
[5] D. Bertrand – “Extensions de D-modules et groupes de Galois différentiels”, in p-
adic analysis (Trento, 1989), Lecture Notes in Math., vol. 1454, Springer, Berlin, 1990,
p. 125–141.
[6] D. Bertrand & A. Pillay – “A Lindemann-Weierstrass theorem for semi-abelian
varieties over function fields”, J. Amer. Math. Soc. 23 (2010), p. 491–533.
[7] E. Bierstone & P. D. Milman – “Semianalytic and subanalytic sets”, Publ. Math.
IHÉS 67 (1988), p. 5–42.
[8] E. Bombieri & J. Pila – “The number of integral points on arcs and ovals”, Duke
Math. J. 59 (1989), p. 337–357.
[29] P. Habegger – “Torsion points on elliptic curves in Weierstrass form”, Ann. Sc. Norm.
Super. Pisa Cl. Sci. 12 (2013), p. 687–715.
[30] P. Habegger & J. Pila – “Some unlikely intersections beyond André-Oort”, Compos.
Math. 148 (2012), p. 1–27.
[31] G. O. Jones & M. E. M. Thomas – “The density of algebraic points on certain
Pfaffian surfaces”, Q. J. Math. 63 (2012), p. 637–651.
[32] A. G. Khovanskiı̆ – Fewnomials, Translations of Mathematical Monographs, vol. 88,
Amer. Math. Soc., Providence, RI, 1991.
[33] J. Kirby – “Corrigendum to “A Schanuel condition for Weierstrass equations” ”, J. Sym-
bolic Logic 70 (2005), p. 1023.
[34] , “A Schanuel condition for Weierstrass equations”, J. Symbolic Logic 70 (2005),
p. 631–638.
[35] B. Klinger, E. Ullmo & A. Yafaev – “The hyperbolic Ax-Lindemann-Weierstraß
conjecture”, Publ. math. de l’IHÉS 123 (2016), p. 333–360.
[36] B. Klingler & A. Yafaev – “The André-Oort conjecture”, Ann. of Math. 180 (2014),
p. 867–925.
[37] J. F. Knight, A. Pillay & C. Steinhorn – “Definable sets in ordered structures.
II”, Trans. Amer. Math. Soc. 295 (1986), p. 593–605.
[38] J. Ł oś – “The algebraic treatment of the methodology of elementary deductive sys-
tems”, Studia Logica 2 (1955), p. 151–212.
[39] S. Lang – Number theory. III, Encyclopaedia of Math. Sciences, vol. 60, Springer,
Berlin, 1991.
[40] F. Lindemann – “Ueber die Zahl π”, Math. Ann. 20 (1882), p. 213–225.
[41] D. Marker – “Model theory for algebra and algebraic geometry”, lectures at Orsay
http://homepages.math.uic.edu/~marker/orsay/, 2010.
[42] D. W. Masser – “Small values of the quadratic part of the Néron-Tate height on an
abelian variety”, Compositio Math. 53 (1984), p. 153–170.
[43] D. W. Masser & U. Zannier – “Torsion anomalous points and families of elliptic
curves”, Amer. J. Math. 132 (2010), p. 1677–1691.
[44] , “Torsion points on families of squares of elliptic curves”, Math. Ann. 352 (2012),
p. 453–484.
[45] D. Masser & U. Zannier – “Torsion anomalous points and families of elliptic curves”,
C. R. Math. Acad. Sci. Paris 346 (2008), p. 491–494.
[46] M. Orr – “La conjecture d’André-Pink : Orbites de Hecke et sous-variétés faiblement
spéciales”, thèse de doctorat, Université Paris-Sud, 2013.
[47] , “Families of abelian varieties with many isogenous fibres”, J. reine angew. Math.
705 (2015), p. 211–231.
[48] Y. Peterzil & S. Starchenko – “Uniform definability of the Weierstrass ℘ functions
and generalized tori of dimension one”, Selecta Math. (N.S.) 10 (2004), p. 525–550.
[49] , “Around Pila-Zannier: the semiabelian case”, preprint, 2009.
[50] , “Definability of restricted theta functions and families of abelian varieties”,
Duke Math. J. 162 (2013), p. 731–765.
[51] J. Pila – “Density of integral and rational points on varieties”, Astérisque 228 (1995),
p. 4, 183–187, Columbia University Number Theory Seminar (New York, 1992).
by
Philipp Habegger
0. Introduction
The main emphasis of this article is on attaining height upper bounds in the con-
text of Boris Zilber and Richard Pink’s conjectures. These open problems are often
subsumed under the name of Zilber-Pink Conjecture. In the first section we briefly
recount the development of the previous years while concentrating on situation in
the algebraic torus. In Sections 2 through 10 we state and prove an effective and
completely explicit version of the Bounded Height Conjecture, proved originally by
the author [31]. We use, among other things, a recent result of Sturmfels and Tevelev
from Tropical Geometry.
The first appendix gives a short overview of known results in the abelian case
of abelian varieties. The second appendix contains a few height bounds in Shimura
varieties.
In 1999, Bombieri, Masser, and Zannier proved the following result for curves inside
the algebraic torus Gnm . By coset we mean the translate of an algebraic subgroup of
the ambient group variety.
The adjective uniformly refers to the fact that the bound for the height does not
depend on the algebraic subgroup. It may and will depend on the curve C. Algebraic
subgroups of the algebraic torus Gnm are classified by subgroups of Zn , see Chapter 3.2
[7]. The difficulty in proving Bombieri, Masser, and Zannier’s theorem arises from the
fact that Gnm has infinitely many connected algebraic subgroups of codimension 2.
Typically, C contains infinitely many points that are on a proper algebraic sub-
group. After combining the height upper bound from Theorem 1 with a height lower
bound due to Amoroso and David [1] in the spirit of Lehmer’s problem, the authors
obtained the following finiteness statement.
Theorem 2 (Bombieri, Masser, and Zannier [9]). – Let C be as in Theorem 1. There are
only finitely many points on C that are contained in an algebraic subgroup of codi-
mension at least 2.
Points considered in this conjecture are in the intersection of a variety and a sub-
group whose codimension is too small to expect non-empty intersection. Such inter-
sections are deemed unlikely but are certainly not impossible. In fact, Zilber’s full
conjecture governs also subvarieties of X that are contained in a surprisingly small
algebraic subgroup. It is also expected to hold for the wider class of semi-abelian
varieties, which includes algebraic tori and abelian varieties. Finally, Pink [49, 48] has
proposed a related conjecture for mixed Shimura varieties which implies the André-
Oort Conjecture. It also contains Conjecture 1 above; many conjectures in this setting
are sometimes called Zilber-Pink Conjecture.
Example. – We exemplify the situation on the example of a line in G3m . The line is
parametrized by
(1.1) (αt + α′ , βt + β ′ , γt + γ ′ )
with α, β, γ, α′ , β ′ , γ ′ ∈ Q fixed. To guarantee that our line is not contained in a
proper coset of G3m we ask that
α′ β ′ γ ′
αβγ 6= 0 and , , are pair-wise distinct.
α β γ
Theorem 1 implies that there is a constant B with the following property. Suppose
t ∈ Q such that no coordinate of (1.1) vanishes and such that there exist (a, b, c) ∈ Z3
with
(1.2) (αt + α′ )a (βt + β ′ )b (γt + γ ′ )c = 1
then the height of t is at most B.
The exponent vector (a, b, c) is allowed to vary in (1.2). It determines a proper
algebraic subgroup of G3m . Conversely, any such subgroup arises in this way.
In order to obtain finiteness of the set of t as in the second result of Bombieri,
Masser, and Zannier we must impose a second condition. More precisely, there are
only finitely many t with (1.2) such that there is (a′ , b′ , c′ ) ∈ Z3 linearly independent
of (a, b, c) with
′ ′ ′
(αt + α′ )a (βt + β ′ )b (γt + γ ′ )c = 1.
The two monomial equations determined by (a, b, c) and (a′ , b′ , c′ ) define an alge-
braic subgroup of G3m of codimension 2.
Bombieri, Masser, and Zannier [9] remarked that any curve contained in a proper
coset invariably leads to unbounded height. So this condition cannot be dropped from
their theorem. On the other hand, it remained unclear if the restriction was necessary
in order to achieve finiteness in the situation of unlikely intersections. The authors
posed the following question.
First progress was made in 2006 when the same group of authors obtained a partial
answer by making a detour to surfaces if n = 5.
The construction for S used by the three authors works for n > 5 too and always
yields a surface in some Gnm . However, recovering (3) for n > 5 would require a height
bound on the intersection of S with algebraic subgroups of dimension greater than
one. Thus Theorem 4 is no longer applicable.
One interesting aspect of Theorem 3 is that its proof is effective, provided an effec-
tive height bound in Theorem 4 is available. The author [29] proved a generalization
of Theorem 4 that is effective and completely explicit. The height bound for the points
considered in Theorem 4 depended on n and the degree and height of X.
In 2008, and using a different approach, Maurin gave a positive answer to Ques-
tion 1 for all n.
Theorem 5 (Maurin [39]). – Let C be an irreducible algebraic curve inside Gnm and
defined over Q. Suppose that C is not contained in a proper algebraic subgroup. There
are only finitely many points on C that are contained in an algebraic subgroup of
codimension at least 2.
Maurin first proves that the height is bounded from above. But his method differed
substantially from the one used in the proofs of Theorems 1 and 3. It relied on
generalization of Vojta’s inequality by Rémond [52] which accounts for the varying
algebraic subgroups. The original Vojta inequality appeared prominently in a proof
of Faltings’ Theorem, the Mordell Conjecture.
Maurin’s Theorem holds for curves defined over Q. But its statement makes no
reference to algebraic numbers. Having it at their disposal Bombieri, Masser, and
Zannier applied specialization techniques to obtain the following result.
For curves this theorem implies Conjecture 1. It also resolves, in the case of
curves, the related Torsion Finiteness Conjecture stated by Bombieri, Masser, and
Zannier [11].
In the mean time, progress was being made on boundedness of height for surfaces
by Bombieri, Masser, and Zannier. Their result requires the definition of a Zariski
open subset X oa of an irreducible closed subvariety X ⊂ Gnm , where boundedness of
height is expected to hold. We will give a proper definition further down near (2.1).
Roughly speaking, one must remove from X subvarieties that lie in an exceptionally
small coset. Deducing Zariski openness from the definition requires work.
If C is a curve then C oa = C if and only if C is not contained in a proper coset.
Otherwise, we will have C oa = ∅. So Theorem 1 can be reformulated succinctly as
follows. Say C ⊂ Gnm is an irreducible algebraic curve defined over Q. Then any point
on C oa contained in a proper algebraic subgroup has height bounded from above
uniformly.
Theorem 7 (Bombieri, Masser, and Zannier [12]). – Let P be a plane inside Gnm and
defined over Q. Then P oa is Zariski open in P . The height of points on P oa that
are contained in a algebraic subgroup of codimension at least 2 is bounded from above
uniformly.
This height bound is now sufficiently general to prove height bounds on surfaces
arising from the strategy devised by Bombieri, Masser, and Zannier in their proof of
Theorem 3. In joint work with this group, the author gave a new proof of Maurin’s
Theorem [8]. All arguments in this proof were effective except for the step invoking
Theorem 9 for a surface.
The purpose of this article is to provide an effective and fully explicit version of
Theorem 9. We will state the revelant result in the next section. In combination with
the methods presented in [8] we obtain an effective version of Maurin’s Theorem.
In more recent work, Maurin obtained a height bound when the algebraic subgroups
in question have codimension at least 1 + dim X but are enlarged by a subgroup of
finite type.
After writing this paper, but before it went to press, Bays and the author [5] used
a height inequality of Rémond [51] to prove a weak version of Conjecture 1 for a class
of surfaces X for which X oa = ∅.
To attack the full conjecture when X oa = ∅ requires more powerful height upper
bounds. One interesting advance in this direction was made by Amoroso, Masser, and
Zannier [2].
Finally, we remark that the direct analog of the height bounds in Theorems 1,
4 or 9 fail in the additive group Gna . Indeed, any point in Gna generates by scalar
multiplication a one dimensional subgroup. So being contain in a one dimensional
subgroup does not pose a restriction. However, a weak height bound exists when re-
stricting to a certain class of algebraic subgroups of Gnm ×Gna . This was demonstrated
by Bainbridge, Möller, and the author [4] with applications to algebraically primitive
Teichmüller curves in the moduli space of genus 3 curves.
Acknowledgments. – I would like to thank Eric Katz for pointing me towards Sturm-
fels and Tevelev’s work. I am also grateful to Jenia Tevelev for answering tropically
related questions and to Sam Payne for providing useful comments regarding the ex-
ample in Section 8. Finally, it is my pleasure to thank Gaël Rémond and Emmanuel
Ullmo for organizing the 2011 workshop at the CIRM in Luminy and providing a
stimulating atmosphere for a broad range of researchers.
where the union is over all algebraic subgroups H of Gnm that have codimension at
least s. We remark that all algebraic subgroups of Gnm are defined over Q.
Our main result is the following explicit version of the Bounded Height Theorem.
In Section 3.2 we describe the choice of height function used in the next result; it
is sometimes called the absolute logarithmic Weil height with l2 -norm at the infinite
places.
Theorem 12. – Let n ≥ 1 and let X ⊂ Gnm be an irreducible closed subvariety defined
2
over Q of dimension r and say s ≥ 0 is an integer. We set C = (600n7 (2n)n )r .
There exists a Zariski closed subset Z ⊂ X with the following properties.
(i) We have X oa,[s] ⊂ X \ Z.
(ii) Each irreducible component V of Z satisfies
deg(V ) ≤ (2deg(X))C
and
h(V ) ≤ (2deg(X))C (1 + h(X)).
The number of irreducible components of Z is at most (2deg(X))C .
[s]
(iii) If p ∈ (X \ Z)(Q) ∩ (Gnm ) , then
h(p) ≤ (2deg(X))C (1 + h(X)).
The general proof strategy is similar to the one used by the author to prove the
original Bounded Height Conjecture. For example, Ax’s Theorem [3] still plays a
pivotal role. Although there is one significant different. The first proof relied ultimately
on a compactness argument to bound from below a certain intersection number. This
ruled out an effective or even explicit result. In the current proof we use instead a
recent result of Sturmfels and Tevelev [62] from Tropical Geometry and an effective
version of Łojasiewicz’s inequality by Rémond [55] to make everything explicit.
Going the other way, we obtain a curious corollary on the tropical variety T (X) ⊂
Qn of an irreducible closed subvariety of Gnm defined over C. The proof and a review
of the tropical vocabulary are in Section 8. It suffices to say here that T (X) is a
finite union of rational polyhedral cones of dimension dim X. We let T (X) denote
the topological closure of T (X) inside Rn . The following corollary shows that the
configuration of cones determining T (X) satisfy a rationality condition with respect
to linear maps to Rdim X . It will not play a role in the proof of Theorem 12.
completely explicit and given in terms of the height of X, the degree of X, and n
where only c2 (ϕ) is allowed to depend on ϕ. Second, the lower bound
∆(ϕ)
(2.2) h(ϕ(p)) ≥ c1 |ϕ| h(p) − c2 (ϕ)
|ϕ|r
holds for all algebraic points p in a Zariski open and dense subset of X (which de-
pends on ϕ). Moreover, the complement of said Zariski open set can be effectively
determined. This means that we can bound the height and degree of each irreducible
component as well as their number in terms of X and ϕ. Much of the work involved
in deducing this inequality goes into making all estimates explicit.
We observe that if ϕ(p) is the unit element, then the left-hand side of (2.2) vanishes.
If ϕ is surjective, then the kernel of ϕ is an algebraic subgroup of codimension r.
Moreover, any algebraic subgroup of codimension r arises as such a kernel. So if p is
inside the Zariski open subset and if ∆(ϕ) > 0 we obtain
c2 (ϕ) 1 |ϕ|r
(2.3) h(p) ≤ .
c1 |ϕ| ∆(ϕ)
This is indeed a height upper bound. But it is not clear if it implies a uniform
height upper bound: the right-hand side seems to depend heavily on ϕ. Even worse,
the Zariski open set on which it holds also depends on ϕ.
Step II. – In the second step we get a hold on the degree ∆(ϕ) of ϕ| . This is an
X
integer and it cannot be negative. It vanishes if and only if all fibers of ϕ| : X → Grm
X
have positive dimension. Each such fibers arises as the intersection of X with the
translate of an algebraic subgroup of codimension r. So if ∆(ϕ) = 0 we find that X is
covered by anomalous subvarieties, so X oa,[r] = ∅. In this case, Theorem 12 is void.
So we may assume without loss of generality that ∆(ϕ) > 0 for all surjective ϕ.
Next we transform this non-vanishing statement into a sufficiently strong and ex-
plicit lower bound in terms of ϕ. This was also a key step in the first proof of the
Bounded Height Conjecture. The main tool there was Ax’s Theorem combined with
a compactness argument. In the current approach we will still need Ax’s Theorem.
But the compactness argument is replaced by a result in Tropical Geometry in our
Section 8. The tropical variety associated to X is a finite union of r-dimensional
polyhedral cones. This data can be determined effectively in terms of X. The trop-
ical variety associated to the kernel of ϕ is quite simply a vector subspace of Qn of
dimension n − r. Determining ∆(ϕ) essentially amounts to intersecting the tropical
variety of X with a generic translate of this vector subspace and counting the points
on the tropical intersection with correct multiplicities. The Theorem of Sturmfels
and Tevelev enables us to determine these multiplicities. This leads to a lower bound
for ∆(ϕ) in terms of a certain polynomial in the entries of ϕ. Ax’s Theorem is used
to show that this polynomial does not vanish when evaluated on real n × r matrices
of maximal rank. This information in conjunction with a compactness argument is
enough to provide a qualitative lower bound for this polynomial. Using an explicit ver-
sion of Łojasiewicz’s inequality due to Rémond [55] we can transform this qualitative
bound into a quantitative one. The overall effect will be
(2.4) ∆(ϕ) ≥ c3 |ϕ|r
with c3 > 0 explicit and independent of ϕ, at least for ϕ not too close to a matrix
of rank less than r. From this inequality we see that the factor |ϕ|r /∆(ϕ) in (2.3) is
harmless.
Step III. – There remains the issue that ϕ depends on the algebraic subgroup of Gnm .
Recall that c2 (ϕ) and the Zariski open set on which inequality (2.2) holds both depend
on ϕ. In order to ensure that our height inequality remains valid for all possible
algebraic subgroups we would have to restrict to the intersection of infinitely many
Zariski open sets. This is not a wise idea. Luckily, this problem can be resolved using
a rather simple trick found in Section 9. We relax the condition on ϕ. Instead of
asking that ϕ(p) is the unit element and hence forcing the left-hand side of (2.2) to
vanish, we instead only want h(ϕ(p)) to be bounded above linearly in terms of h(p).
The constant involved will depend only on n. This can be achieved by replacing the
matrix whose kernel defines the algebraic subgroup containing p by a sufficiently good
approximation. The payoff is that we may choose ϕ from a fixed finite set depending
only on X. So we will only need to take a finite intersection to apply (2.2). Moreover,
the constant c2 (ϕ) in this inequality becomes harmless. The right-hand side of (2.2)
involves |ϕ|r+1 /∆(ϕ). Compared with (2.4) we get an extra factor |ϕ|. This factor will
be used to defeat the factor in front of h(p) appearing in the upper bound for h(ϕ(p)).
Amalgamating steps 1, 2 and 3 yields the Generically Bounded Height Theorem
stated below as Theorem 14. Roughly speaking, it states that if X oa,[r] 6= ∅, then there
[r]
is a non-empty Zariski open subset U of X on which any point lying in (Gnm ) has
height bounded from above. The bound for the height of p is given explicitly and so
are bounds for height, degree, and number of the irreducible components of X \ U .
Step IV. – The fourth and final step deals with passing from the unspecified U
to X oa,[r] itself. The idea here is to work with the irreducible components of X \ U
and apply induction on the dimension. This step is carried out in Section 10. The
cost of this descent argument becomes apparent when one compares the bounds in
Theorem 14 and in our main result, Theorem 12.
3. Notation
3.1. Generalities. – This section serves as a reference for general notation used
throughout the whole article.
We use N to denote the positive integers {1, 2, 3, . . .} and N0 for the non-negative
integers N ∪ {0}.
Let R be a commutative unitary ring and p = (p1 , . . . , pn ) a tuple of elements
in R. If α = (α1 , . . . , αn ) ∈ Nn0 , we set pα = pα αn
1 · · · pn where our convention is
0
3.2. Heights of an Algebraic Point. – We now spend some time defining the height of
algebraic numbers and also algebraic points in projective space.
Let K be a number field. We let MK denote the set of places of K. Let v ∈ MK .
We will identify v with an absolute value on K which when restricted to Q is | · |p for
some rational prime p or the complex absolute on Q. We call v finite if it satisfies the
ultrametric triangle inequality and we call v infinite if it does not.
If v is a finite place we let Kv denote a completion of K with respect to v and let
σv be the embedding K ֒→ Kv . We also fix Cv , a completion of an algebraic closure
of Kv , together with an embedding K ֒→ Cv , which by abuse of notation we also call
σv . We write | · |v for the v-adic absolute value on Cv .
An infinite place v corresponds to an embedding of K into R or C; in the latter
case the embedding is only determined up-to complex conjugation. We take Kv = R
or Kv = C and σv , accordingly. Moreover, we always set Cv = C in the infinite case.
We sometimes abbreviate | · | = | · |v for the standard absolute value on C;
By abuse of notation we let Qv denote Qv|Q .
If p = (p0 , . . . , pn ) ∈ Cn+1
v , we set
( P
n
( i=0 |pi |2 )1/2 : if v is infinite,
|p|v =
max0≤i≤n |pi |v : if v is finite.
Using the open immersion from Section 3.2 we obtain a height function Gnm (Q) →
[0, ∞); for which we use the same letter h. In addition to this height function with
l2 -norm at infinite places we will use the height function
hs : Gnm (Q) → [0, ∞)
with the sup-norm at infinite places, cf. Chapter 1.5 [7]. This height has the advantage
that it plays along nicely with the group law on Gnm (Q). For example, in the case n = 1
and if p, q ∈ Gm (Q) then hs (pk ) = |k|hs (p) for all k ∈ Z and hs (pq) ≤ hs (p) + hs (q).
Both statements follow from the definition of hs and for the first one needs the product
formula if k < 0. If p = (p1 , . . . , pn ) ∈ Gnm (Q), then
(3.2) max{hs (p1 ), . . . , hs (pn )} ≤ hs (p) ≤ hs (p1 ) + · · · + hs (pn )
is also a consequence of the definition. We conclude that hs (pu ) ≤ nkukhs (p) with
k · k the sup-norm on Rn . Finally, hs (p) ≤ h(p) because the sup-norm is always at
most the l2 -norm and h(p) ≤ 21 log(n + 1) + hs (p) from a standard norm inequality.
Moreover, if k ∈ N0 then hs (pk ) = khs (p). In the following, these inequalities and
statements will be refered to as basic height properties.
Say V is a finite direct sum of various Q[X]a and Q[Y]b and Q[X, Y](a,b) with
a, b ∈ Z. Then ι as described above defines an isomorphism of V with some power
of Q. If P ∈ V we define h(P ) = h(ι(P )). Moreover, if the coefficients of ι(P ) are
in K we set |P |v = |ι(P )|v for any place v of K. Then we obtain a height function,
also denoted by h, defined on non-zero elements of V .
We also need a height function defined on MatM,N (Q), the vector space of M × N
matrices with algebraic coefficients. Let A ∈ MatM,N (K) where K is a finite extension
of Q. If 1 ≤ t ≤ rk(A) is an integer and if v is an infinite place of K we define the
local height of A as
1 X
hv,t (A) = log | det A′ |2v
2 ′ A
where the sum runs over all t × t submatrices A′ of A. If v is a finite place of K we
define the local height as
hv,t (A) = log max
′
| det A′ |v
A
′
again the A run over all t × t submatrices of A. The height of A is then
1 X
ht (A) = [Kv : Qv ]hv,t (A).
[K : Q] v
The following lemma provides a useful inequality concerning local heights of ma-
trices.
Lemma 3.1. – Let A and K be as above and B a matrix with N rows and coefficients
in K. Then hv,t (AB) ≤ hv,t (A) + hv,t (B) for all integers 1 ≤ t ≤ rk(AB) and all
places v of K.
Proof. – This is a direct consequence of the Cauchy-Binet formula together with the
Cauchy-Schwarz inequality for infinite v and the ultrametric triangle inequality for
finite v.
M
We proceed by defining the height of an N -dimensional vector subspace V ⊂ Q .
Indeed, let A ∈ MatM,N (K) be a matrix whose column constitute a basis of V .
We define hAr (V ) = hN (A). Then hAr (V ) is independent of the choice of basis, cf.
Chapter 2.8 [7].
Remark 3.2. – This height behaves well with certain constructions typical for vector
M′
spaces. If V ⊂ QM and W ⊂ Q are two vector subspaces. Then the subspace
′
V × W ⊂ QM +M satisfies
Using the notation introduced up until now we are able to define the height of a
vector subspace V of finite direct sums of various Q[X]a and Q[Y]b and Q[X, Y](a,b)
with a, b ∈ N0 . Indeed, we set hAr (V ) = hAr (ι(V )).
Let X ⊂ Pn be an irreducible closed subvariety defined over Q with homogeneous
ideal I ⊂ Q[X]. The arithmetic and geometric Hilbert functions of X are defined as
respectively.
Let Z ⊂ Pn × Pm be an irreducible closed subvariety defined over Q with biho-
mogeneous ideal I ⊂ Q[X, Y]. The arithmetic and geometric Hilbert functions of Z
are defined as
respectively.
3.3. Height of a Projective Variety. – We will briefly describe the definition of the
height of an irreducible closed subvariety X ⊂ Pn defined over Q as it is given by
Philippon [43].
Say d = (d0 , . . . , dr ) ∈ Nr+1 . In this section we use Vi to denote an Ni = n+d di
i
-tu-
ple of independent variables Ui0 , . . . , Ui,Ni −1 . Each packet Vi corresponds to coeffi-
cients of a homogeneous polynomial in n + 1 variables of degree di .
Let f ∈ K[V0 , . . . , Vr ] \ {0} be homogeneous of degree degVi (f ) in the variables
Vi for 0 ≤ i ≤ r.
If v is a finite place of K we define mv (f ) to be the logarithm of maximum of the
absolute values of coefficients of f with respect to v.
Say v is an infinite place of K and σ = σv : K → C a corresponding embedding.
We set
Z Xr NXi −1
1
mv (f ) = log |σ(f )(u0 , . . . , ur )|dµ0 (u0 ) · · · dµr (ur )+ degVi (f )
SN0 ×···×SNr i=0 j=1
2j
where SNi is the unit sphere in CNi on which µi is the measure, invariant under the
unitary group, of total mass 1.
This value is independent of d0 , . . . , dr , the choice of number field K, and the choice
of fX,d . This height is sometimes called the Faltings height [14].
From (3.6) we deduce h(X) ≥ 0.
Recall that we have fixed an open immersion Gnm ֒→ Pn . If X ⊂ Gnm is an irre-
ducible closed subvariety defined over Q, then deg(X) and h(X) are defined to be the
degree and height of the Zariski closure of X in Pn , respectively. Similarly, the height
of a point in Gnm (Q) is the height of its image in Pn (Q).
Next we define the Veronese maps. Let a ∈ N and let X e be the n+a -tuple (X eγ )
a
n+1
where γ runs through all vectors in N0 with |γ|1 = a. We define the twisted
Veronese homomorphism
e → K[X]
va∗ : K[X]
by setting va∗ (Xeγ ) = a 1/2 Xγ ; of course, v ∗ is only defined if K contains all roots
γ a
a 1/2
γ . The choice of the square root will be irrelevant in our applications. By abuse
of notation we also let va∗ denote the restriction K[X] e k → K[X]ak .
n+a
The Vernose homomorphism va∗ induces a closed immersion va : Pn → P( a )−1
n+a r+b
of varieties. If b ∈ N, then the product v : Pn × Pr → P( a )−1 × P( b )−1 is also
ab
a closed immersion.
By abuse of notation, va∗ will also denote the induced homomorphisms between
n+a
Picard groups of P( a )−1 and of Pn . Indeed, these two groups are canonically iso-
∗
morphic to Z and the induced homomorphism is multiplication by a. We also use vab
to denote the homomorphism between the corresponding Picard groups.
Lemma 4.1. – We have H(1, 1; Z) = deg(Z) and H(a, b; Z) ≤ max{a, b}dim Z deg(Z)
for a, b ∈ N.
Proof. – For this lemma we write π1′ and π2′ for the first and second projection
n+a r+b
on P( a )−1 × P( b )−1 , respectively. By definition and since [vab (Z)] = vab∗ ([Z])
we have
X dim Z ∗ ∗
H(1, 1; vab (Z)) = (π1′ O (1)i π2′ O (1)j vab∗ [Z])
i
i+j=dim Z
X dim Z
∗ ′∗ ∗ ′∗
= (vab π1 O (1)i vab π2 O (1)j [Z])
i
i+j=dim Z
∗
where we used the projection formula. We note π1′ ◦ vab = va ◦ π1 and vab ∗ ′
π1 O (1) =
′ ∗ ∗ ∗ ∗ ∗ ⊗a ∗ ′∗
(π1 ◦ vab ) O (1) = (va ◦ π1 ) O (1) = π1 va O (1) = π1 O (1) . Similarly, vab π2 O (1) =
π2∗ O (1)⊗b . The lemma follows.
4.2. The Arithmetic Hilbert Function. – In this subsection we bound from above the
arithmetic Hilbert function of an irreducible closed subvariety X ⊂ Pn defined over Q.
We begin by citing a result of David and Philippon [24].
Say V is a subvariety of projective space defined over a field K. If σ : K → L is
an embedding of K into another field L, then Vσ denotes the induced subvariety of
projective space defined over L.
N
Lemma 4.6. – Let V be a non-trival vector subspace of Q . If ε > 0 there is a linear
N
form l on Q which does not vanish completely on V such that
X [Kv : Qv ] dim
X V −1 X
i
|σ(l)(p)|v hAr (V ) 1 1
log sup ≤− + +ε
[K : Q] p∈Vσv (Cv ) |p|v dim V dim V i=1 j=1
2j
v∈MK
for a number field K ⊂ Q containing the coefficients of l and all of the finitely many
algebraic numbers appearing in this proof.
P There is aλ homogeneous P ∈ Q[X] of degree k with l = ι(P ). We write P =
|λ|1 =k Pλ X .
Let f = fX,(1,...,1,k) ∈ K[V0 , . . . , Vr ] be a Chow form of X. In the notation of
Section 3.3, Vr is an N -tuple of variables corresponding each to a monomial of degree
k in n + 1 variables. Let ρ(f ) ∈ K[V0 , . . . , Vr−1 ] be the form obtained by specializing
the variables Vr to equal the corresponding coefficients of P .
Let v ∈ MK and say σ = σv : K → Cv is the embedding choosen in Subsection 3.2.
We assume first that v is infinite. By Lemma 4.1 [45] there is a measure Ω of total
mass deg(X) on Xσ (C) with
Z
|σ(P )(p)|
(4.4) mv (ρ(f )) − mv (f ) = log Ω(p).
Xσ (C) |p|k
Let p = (p0 , . . . , pn ) ∈ Cn+1 such that [p0 : · · · : pn ] ∈ Xσ (C). For λ ∈ Nn+1 0 with
k 1/2 λ N
|λ|1 = k we set qλ = σ( λ )p and q = (qλ )λ ∈ C . Then q ∈ Vσ (C). Moreover,
we have
X X −1/2 !
λ k
σ(P )(p) = σ(Pλ )p = σ(Pλ )σ qλ = q T · σ(ι(P )) = σ(l)(q).
λ
|λ|1 =k |λ|1 =k
We evaluate
X k X
|p|2k = |pλ |2 = |qλ |2 = |q|2
λ
|λ|1 =k |λ|1 =k
We multiply (4.5) and (4.7) with [Kv : Qv ]/[K : Q] and the take the sum over all
v ∈ MK . Using the definition of h(X) given in (3.7) we obtain
X [Kv : Qv ] X [Kv : Qv ] |σ(l)(q)|v
−kh(X)+ mv (ρ(f )) ≤ deg(X) log sup .
[K : Q] [K : Q] q∈Vσv (Cv ) |q|v
v∈MK v∈MK
P [Kv :Qv ]
Recall that v∈MK [K:Q] mv (ρ(f )) ≥ 0 by (3.6). Using (4.3) we bound the right-
hand side to get
H g (k;X)−1 i
H a (k; X) 1 X X 1
(4.8) deg(X) ≤ kh(X) + + ε deg(X).
H g (k; X) H g (k; X) 2j
i=1 j=1
Remark 5.1. – We claim that ker f ∩ (ker f )⊥ = 0. Indeed, if v lies in this intersection,
then 0 = h0, f (v ′ )i = hf (v), f (v ′ )i′ = hv, v ′ i for all v ′ ∈ V . So v = 0 because of
condition (iii) in the definition of h·, ·i.
Lemma 5.1. – Let K and τ be as above and assume V, W, V ′ , and W ′ are finite dimen-
sional vector spaces over K, each one equipped with a τ -inner product. If f : V → W
and f ′ : V ′ → W ′ are isometries, then so is f ⊗ f ′ : V ⊗ V ′ → W ⊗ W ′ .
Proof. – We write h·, ·i for any inner product in this proof. The lemma formally
follows from (ker f )⊥ ⊗ (ker f ′ )⊥ = (ker f ⊗ f ′ )⊥ which we P now show. To prove the
inclusion “⊂” we let v ∈ (ker f )⊥ , v ′ ∈ (ker f ′ )⊥ , and u = i ui ⊗ u′i ∈ ker f ⊗ f ′ .
P P
So hv ⊗ v ′ , ui = i hvP ⊗ v ′ , ui ⊗ u′i i = i hv, ui ihv ′ , u′i i. But f and f ′ are isometries,
therefore hv⊗v ′ , ui = i hf (v)⊗f ′ (v ′ ), f (ui )⊗f ′ (u′i )i = hf (v)⊗f ′ (v ′ ), (f ⊗f ′ )(u)i = 0.
It follows that v ⊗v ′ ∈ (ker f ⊗f ′ )⊥ since u was arbitrary. The desired inclusion holds.
Now dim(ker f )⊥ ⊗ (ker f ′ )⊥ = (dim V − dim ker f )(dim V ′ − dim ker f ′ ). More-
over, dim(ker f ⊗ f ′ )⊥ = dim V ⊗ V ′ − dim ker f ⊗ f = dim f (V ) ⊗ f ′ (V ′ ) =
dim f (V ) dim f ′ (V ′ ). We conclude that (ker f )⊥ ⊗ (ker f ′ )⊥ and (ker f ⊗ f ′ )⊥ have
equal dimension, so they coincide.
If b ∈ N0 , then we may identify K[X, Y](a,b) with K[X]a ⊗ K[Y]b . Thus we obtain
a τ -inner product on K[X, Y](a,b) .
Proof. – Surjectivity holds because elements in the target are bihomogeneous of bide-
gree (k, k).
For brevity we set N = (n + 1)(r + 1). Let P, Q ∈ K[U]k and P ∈ (ker s∗ )⊥ , we
P P
must show hs∗ (P ), s∗ (Q)i = hP, Qi. We write P = γ Pγ Uγ and Q = γ Qγ Uγ ,
where here and below the sum is over all γ ∈ NN0 with |γ|1 = k.
We call γ, γ0 ∈ NN 0 with |γ|1 = |γ0 |1 = k equivalent, and write γ ∼ γ0 , if and
only if s∗ (Uγ ) = s∗ (Uγ0 ). Let R ⊂ NN
0 be a set of representatives of the equivalence
classes.
Say γ ∼ γ0 . Then P ∈ (ker s∗ )⊥ implies hP, Uγ i = hP, Uγ0 i, so
−1 −1
k k
(5.2) Pγ = Pγ 0 .
γ γ0
P P P
We have hs∗ (P ), s∗ (Q)i = γ0 ∈R h
∗ γ
γ∼γ0 Pγ s (U ),
∗ γ
γ∼γ0 Qγ s (U )i because
∗ γ ∗ γ0
s (U ) and s (U ) are orthogonal if γ 6∼ γ0 . Equality (5.2) gives
(5.3)
! !
X X X
∗ ∗
hs (P ), s (Q)i = Pγ τ (Qγ ) hs∗ (Uγ0 ), s∗ (Uγ0 )i
γ0 ∈R γ∼γ0 γ∼γ0
! !
X k −1 X k X
= Pγ 0 τ (Qγ ) hs∗ (Uγ0 ), s∗ (Uγ0 )i.
γ0 γ∼γ
γ γ∼γ0
γ0 ∈R 0
′
Say s∗ (Uγ0 ) = Xδ Yδ with δ ∈ Nn+1 0 , δ ∈ Nr+1
0 , and |δ|1 = |δ ′ |1 = k. By definition
′ ′ −1 k −1
we have hs∗ (Uγ0 ), s∗ (Uγ0 )i = hXδ , Xδ ihYδ , Yδ i = kδ δ′ . On exanding both
P P P k
sides of s∗ (( ij Uij )k ) = ( ij Xi Yj )k and comparing coefficients we find γ∼γ0 γ =
P ∗ γ
k k k
δ δ ′ . Therefore, γ∼γ0 γ hs (U 0 ), s∗ (Uγ0 )i = 1 and (5.3) implies
X X k −1
hs∗ (P ), s∗ (Q)i = Pγ0 τ (Qγ ).
γ∼γ
γ0
γ0 ∈R 0
We can state an analog result for the Veronese homomorphism. The proof goes
along similar lines.
Y aδγ /2
e δ ) = Xα(δ)
va∗ (X
γ
γ
So ! !
−1 Y a−δγ /2 −1 Y a−δ0γ /2
k k
Pδ τ = Pδ 0 τ
δ γ
γ δ0 γ
γ
and because τ acts trivially on roots of positive integers we obtain
−1 Y −δγ /2 −1 Y −δ0γ /2
k a k a
(5.4) Pδ = Pδ0 .
δ γ
γ δ 0 γ
γ
after applying (5.4). The definition of the inner product shows that hva∗ (P ), va∗ (Q)i
equals
X −1 X Y δγ ! X Y aδγ /2
!
Pδ 0 ak k a
τ (Qδ ) .
k Q a δ0γ /2 α(δ0 ) δ γ γ γ
δ0 ∈R δ0 γ γ δ∼δ0 γ δ∼δ0
k P k
P
a 1/2 e a
Pn ak
We evaluate both sides of va∗ γ γ X γ = γ X
γ
γ
= ( i=0 Xi )
P
k Q
a δγ ak
and compare coefficients to deduce δ∼δ0 δ γ γ = α(δ 0)
. Hence
!
X Pδ 0 X Y aδγ /2 X Pδ τ (Qδ )
hva∗ (P ), va∗ (Q)i = Q aδ0γ /2 τ (Qδ ) = k
k
γ
γ δ
δ0 ∈R δ0 γ γ δ∼δ0 δ
where the second inequality follows from (5.4). But the right-hand side is just hP, Qi
by definition.
Let a, b ∈ N and let Ye be the r+b -tuple (Yeγ ) where γ runs through all elements
b
in Nr+1
0 with |γ|1 = b. A consequence Lemmas 5.1 and 5.3 is that the linear map
∗
vab e Y]
= va∗ ⊗ vb∗ : K[X, e (k,k) → K[X, Y]ak,bk
e k ⊗ K[Y]
is a surjective isometry; we identified K[X] e k = K[X,
e Y]
e (k,k) and K[X]ak ⊗
K[Y]bk = K[X, Y](ak,bk) .
The next lemma is an application to an irreducible closed subvariety Z ⊂ Pn × Pr
defined over Q. We recall that s is the Segre morphism defined in Subsection 4.1.
Proof. – Let I ⊂ Q[X, Y] be the ideal of Z and J ⊂ Q[U] the ideal of s(Z). Then
(5.5) s∗ −1 (I(k,k) ) = Jk .
Remark 5.2 gives us a τ -inner product h·, ·i on Q[X, Y](k,k) and Q[U]k with τ the
identity on Q.
Let us remark that ker s∗ ⊂ Jk by (5.5). This implies (ker s∗ )⊥ ⊃ Jk⊥ and hence
Qi ∈ (ker s∗ )⊥ . We claim
(5.6) s∗ (Jk⊥ ) = I(k,k)
⊥
.
Indeed, if P ∈ I(k,k) then there is Q ∈ Jk with s∗ (Q) = P . Therefore, hs∗ (Qi ), P i =
hQi , Qi = 0 for all i because s∗ is an isometry by Lemma 5.2. Hence s∗ (Qi ) ∈ I(k,k) ⊥
because P was arbitrary. This shows that the left side of (5.6) is contained in the right
side. Equality (5.5) implies dim Jk = dim ker s∗ + dim I(k,k) . Moreover, dim ker s∗ =
dim Q[U]k − dim Q[X, Y](k,k) since s∗ is surjective. It follows that Jk⊥ and I(k,k)
⊥
have
∗ ⊥ ∗ ∗ ⊥
equal dimension. But ker s ∩ Jk ⊂ ker s ∩ (ker s ) = 0 by the comment shortly
after (5.1). So s∗ |Jk⊥ is injective and hence dim s∗ (Jk⊥ ) = dim I(k,k)
⊥
. This settles our
claim (5.6) and the equality involving the geometric Hilbert function in the assertion.
We also remark that C and A have equal rank t.
Let K ⊂ Q be a finite normal extension of Q containing all of the finitely many
algebraic numbers which are involved in the proof below. Let v ∈ MK .
Say v is infinite and let σ = σv : K → C be an associated embedding. Since K is
normal over Q there is an automorphism η of K with σ(η(x)) = σ(x) for all x ∈ K.
By the Cauchy-Binet formula we have
T T
exp 2hv,t (A) = det(σ(A) σ(A)) = det[σ(ι(Qi )) σ(ι(Qj ))]1≤i,j≤t
T
= σ(det[ι(Qi ) η(ι(Qj ))]ij ).
All coefficients involved in ι are totally real algebraic numbers; hence invariant under
η. We obtain exp 2hv,t (A) = σ(det[hQi , η(Qj )i]ij ). Together with the Cauchy-Binet
formula we also get
T T
exp 2hv,t (C) = det(σ(C) σ(C)) = det[σ(ι(s∗ (Qi ))) σ(ι(s∗ (Qj )))]ij
T
= σ(det[ι(s∗ (Qi )) η(ι(s∗ (Qj )))]ij ) = σ(det[hs∗ (Qi ), s∗ (η(Qj ))i]ij ).
But s∗ is an isometry so exp 2hv,t (C) = σ(det[hQi , η(Qj )i]ij ), hence
(5.7) hv,t (C) = hv,t (A).
Now say v is finite. If B is a matrix with m rows and 1 ≤ i1 < · · · < it ≤ m are
integers, we let Bi1 ...it denote the submatrix of B consisting of the rows i1 , . . . , it . We
fix i1 , . . . , it with | det Ci1 ...it |v = exp hv,t (C). For 1 ≤ i ≤ t we may find polynomials
Qe i ∈ K[U]k whose terms are also terms of Qi with the following property. The rows
i1 , . . . , it of Ce = [ι(s∗ (Q
e 1 )), . . . , ι(s∗ (Q
e t ))] equal the corresponding rows of C and all
other rows are 0. The Cauchy-Binet formula implies det(C T C) e = det(Ci ...i )2 .
1 t
e = det[hs∗ Qi , s∗ Q
On the other hand, we have det(C T C) e j i]ij = det[hQi , Q
e j i]ij
∗ Te T e e e e t )].
because s is an isometry. So det(C C) = det(A A) with A = [ι(Q1 ), . . . , ι(Q
Now we apply the Cauchy-Binet formula to evaluate
X
e =
det(AT A) ei′ ...i′ ).
det(Ai′ ...i′ ) det(A1 t 1 t
i′1 <···<i′t
Proof. – Let I be the ideal of Z ⊂ Pn × Pr and let J be the ideal of the closed
n+a r+b
subvariety vab (Z) ⊂ P( a )−1 × P( b )−1 . Following the convention that vab
∗
denotes
the restriction of the Veronese homomorphism to polynomials of fixed bidegree, we
have
∗ −1
vab (I(ak,bk) ) = J(k,k) .
We mainly follow the lines of the proof of Lemma 5.4. Remark 5.2 gives us a τ -inner
∗
product h·, ·i on source and target of vab with τ the identity on Q. Let us fix a basis
⊥
{Q1 , . . . , Qt } of J(k,k) with t = H g (k, k; vab (Z)). We also introduce matrices
A = [ι(Q1 ), . . . ι(Qt )] ∈ Mat (n+a)−1+k (r+b)−1+k (Q) and
( a k )( b k ),t
∗ ∗
C = [ι(vab (Q1 )), . . . , ι(vab (Qt ))] ∈ Mat(n+ak)(r+bk),t (Q).
ak bk
∗ ⊥ ∗ ⊥ ∗ ⊥
We have J(k,k) ⊃ so
ker vab , ⊂
J(k,k) and hence Qi ∈ (ker vab
(ker vab ) ) .
∗
As in the proof of Lemma 5.4 we use the fact that vab is an isometry, cf. Lemma 5.3,
to deduce
∗ ⊥ ⊥
vab (J(k,k) ) = I(ak,bk)
as well as the second claim of the current lemma and also that C has rank t.
Again we let K be a finite normal extension of Q which contains all algebraic
numbers which follow. Let v ∈ MK .
Say v is infinite. Just as in Lemma 5.4 we have
hv,t (C) = hv,t (A);
∗
in order to show this we need to use the fact that vab is an isometry but also that its
coefficients are totally real numbers. Now say v is finite. Using a similar argument as
in Lemma 5.4 we find
hv,t (C) ≤ hv,t (A).
As in the proof of Lemma 5.4, we conclude (5.10) from these inequalities.
For our application a slightly modified version of the previous proposition will be
of central importance.
(iii) We have
κd+1
κh(p) ≤ 25 dnh(q) + 215 max{n4 r, n2 r3 } max 1, (h(Z) + deg(Z)).
∆0
Hence
pc0 |p|a |q|b
λ(v) = log + log c v vc .
F0 (p, q) v |(p0 , . . . , pn )|v
If v is finite, then |(pc0 , . . . , pcn )|v = |p|cv and if v is infinite we may estimate |p|2c
v =
Pn
( i=0 |pi |2v )c ≤ (n + 1)c |(pc0 , . . . , pcn )|2v .
Now we sum over all places of K weighted with the appropriate local degress to
obtain
X [Kv : Qv ] X [Kv : Qv ] pc0
λ(v) ≤ log
[K : Q] [K : Q] F0 (p, q) v
v∈MK v∈MK
X [Kv : Qv ] X [Kv : Qv ] c
+ log |p|a−c b
v |q|v + log(n + 1).
[K : Q] [K : Q] 2
v∈MK v infinite
The first term on the right side of the inequality is zero by the product formula.
The second term is (a − Pc)h(p) + bh(q) by the definition of our height. The final term
is c/2 log(n + 1) since v infinite [Kv : Qv ] = [K : Q]. We use (6.4) to bound the left
side of the inequality from below. This completes the proof.
6.2. Dimension Inequalities. – For brevity we set R = Q[X, Y]. Let I ⊂ R be the
ideal of Z ⊂ Pn × Pr .
By our convention, stated in Section 3.1, Q is a subfield of C. We now take τ to
be complex conjugation restricted to Q. It acts trivially on square roots of positive
integers. So it satifies the restrictions imposed in Remark 5.2
In the following sections, h·, ·i is the τ -inner product as in said remark on vector
spaces of polynomials with coefficients in Q.
Remark 6.1. – Suppose F ∈ I(a,b) . Since τ is the restriction of complex conjugation,
the inner product hF, F i vanishes if and only if F = 0. Therefore, we have I(a,b) ∩
⊥
I(a,b) = 0.
Until the end of this section we treat D, E, k ∈ N as parameters. They will be
chosen later on. We set
⊥
(6.5) WDEk = {(F0 , . . . , Fn ) ∈ (I(k,Ek) )n+1 ; XiDk F0 − X0Dk Fi ∈ I for 1 ≤ i ≤ n}.
Any F = (F0 , . . . , Fn ) ∈ WDEk satisfies the hypothesis of Lemma 6.1 with (a, b) =
(k, Ek) and c = Dk.
Our general strategy is a classical step in many proofs in diophantine approxi-
mation. We shall find a non-zero element of small height in WDEk . We carry out
this strategy by applying an absolute version of Siegel’s Lemma due to Zhang. Said
element will then be used to in Lemma 6.1.
Of course, we can only find non-zero elements in WDEk if this vector space is
non-trivial. Our first task will be to bound the dimension of WDEk from below.
Lemma 6.2. – We have dim WDEk ≥ (n + 1) H g (k, Ek; Z) − n H g ((D + 1)k, Ek; Z).
We will use the bounds developed in Section 4.1 to estimate the dimension of WDEk
in terms of the bidegree ∆0 . Recall that d = dim Z.
Proof. – We begin by showing (6.6). We use (6.1) to estimate values of the Hilbert
polynomial. It suffices to show the inequality in
X d i
1 d D+1 ∆0
(6.7) H(D + 1, E; Z) − ∆0 = ∆i ≤ .
Ed i=1
i E 2n
6.3. Bounding the Height of WDEk . – In order to apply Siegel’s Lemma to WDEk we
must also bound its height from above. It turns out to be easier to work with a vector
′
space WDEk closely related to WDEk which we proceed to define.
For each i ∈ {0, . . . , n} we set
⊥
Vi = {XiDk F ; F ∈ I(k,Ek) } ⊂ R((D+1)k,Ek)
⊥
and note that dim Vi = dim I(k,Ek) = H g (k, Ek; Z). We also define
n Yn
G′1 G′n o
′
WDEk = (G1 , G′1 , . . . , Gn , G′n ) ∈ V0 × Vi ; Gi − G′i ∈ I for 1 ≤ i ≤ n, Dk = · · · = Dk .
i=1
X1 Xn
′
There is a homomorphism Ψ : WDEk → WDEk defined by
′
′ ′ G1 G1 G2 Gn
(6.10) (G1 , G1 , . . . , Gn , Gn ) 7→ , , , . . . , Dk .
X1Dk X0Dk X0Dk X0
It is readily checked to be injective. Moreover it has a right-inverse given by
(F0 , . . . , Fn ) 7→ (F1 X0Dk , F0 X1Dk , F2 X0Dk , F0 X2Dk , . . . , Fn X0Dk , F0 XnDk ).
′
So Ψ is an isomorphism and dim WDEk = dim WDEk .
′
We proceed by bounding the height of WDEk . One way to do this is to write our
vector space as an intersection
′
WDEk = W1 ∩ W2 ∩ W3
and bound the height of each Wi separately. Schmidt’s Theorem (3.4) then provides
′
a bound for the height of WDEk .
Explicitly, we set
n
Y
W1 = V0 × Vi ,
i=1
W2 = {(G1 , G′1 , . . . , Gn , G′n ) ∈ R((D+1)k,Ek)
2n
; Gi − G′i ∈ I for 1 ≤ i ≤ n}, and
W3 = {(G1 , G′1 , . . . , Gn , G′n ) ∈ 2n
R((D+1)k,Ek) ; X1Dk G′i = XiDk G′1 for 1 ≤ i ≤ n}.
Below we will proceed slightly differently and replace W3 by a different vector space
to improve on the height bound.
⊥
A preliminary step in bounding the heights of the Wj is to relate the height of I(a,b)
with the value of the arithmetic Hilbert function at (a, b). Later is just the height
of I(a,b) . The connection is a simple as one could hope for.
We recall that h·, ·i is defined using the restriction of complex conjugation
to Q ⊂ C.
⊥
Lemma 6.4. – We have hAr (I(a,b) ) = H a (a, b; Z) for all a, b ∈ N.
⊥
Proof. – We fix a basis {Q1 , . . . , Qt } of I(a,b) . A polynomial P lies in I(a,b) if and only if
T ⊥
hP, Qi i = ι(P ) · τ (ι(Qi )) = 0 for all 1 ≤ i ≤ t. So ι(I(a,b) ) is the kernel of the matrix
⊥
A with s columns given by τ (ι(Qi )). By (3.5) the height ht (A) is hAr (ι(I(a,b) )) =
⊥
hAr (I(a,b) ). On the other hand, ht (A) = ht (τ (A)). The columns of τ (A) come from a
basis of I(a,b) since τ (τ (ι(Qi ))) = ι(Qi ). Hence ht (τ (A)) = hAr (I(a,b) ) = H a (a, b; Z)
and the proof is complete.
Say v is finite place and let p be the rational prime with |p|v < 1. Statement (3.1)
gives
1/2 −1/2 (
k (D + 1)k ((D + 1)k)(n+1)/2 if p ≤ (D + 1)k,
≤
α α′ 1 otherwise.
v
From the description of the entries of B given around (6.12) we deduce that
(
t n+1
2 log((D + 1)k) : if p ≤ (D + 1)k,
hv,t (B) ≤
1 : else wise.
Now for arbitrary v we have hv,t (BA) ≤ hv,t (B) + hv,t (A) by Lemma 3.1. We
multiply the local heights with the corresponding local degrees and sum over all
places of K to obtain
tk nt
ht (BA) ≤ (n + 1) + log((n + (D + 1)k)(n + k)) + rt log(r + Ek)
2 2
n+1
+t π((D + 1)k) log((D + 1)k) + ht (A),
2
where π((D+1)k) denotes the number of rational primes at most (D+1)k. It is known
that π((D + 1)k) log((D + 1)k) ≤ 2(D + 1)k, see for example the work of Rosser and
Schönfeld [58]. Using basic inequalities such as n + 1 ≤ 2n and log k ≤ k we estimate
tk nt
ht (BA) ≤ (n + 1) + log((n + (D + 1)k)(n + k)) + rt log(r + Ek)
2 2
+ (n + 1)(D + 1)tk + ht (A)
nt
≤ ntk + log(6n2 Dk 2 ) + rt log(2rEk) + 4nDtk + ht (A)
2
√
≤ nt log( 6nDk) + rt log(2rEk) + 5nDtk + ht (A)
√
≤ nt log( 6nD) + ntk + rt log(2rE) + rtk + 5nDtk + ht (A).
Proof. – For brevity set t = H g ((D + 1)k, Ek; Z) and let P1 , . . . , Pt denote a basis
⊥
of I((D+1)k,Ek) .
⊥⊥
Since I((D+1)k,Ek) = I((D+1)k,Ek) we may write W2 as
Let A ∈ MatN,t (Q) be the matrix whose columns are ι(τ (P1 )), . . . , ι(τ (Pt )); here
r+Ek
N = n+(D+1)k
n r . Then ι(W2 ) is the kernel of the rank nt matrix
AT −AT 0
..
B= . ∈ Matnt,2nN (Q).
0 AT −AT
Let K ⊂ Q be a number field containing the finitely many algebraic numbers which
appear in this proof and let v ∈ MK .
If v is infinite and σ = σv : K → C the Cauchy-Binet formula implies
T
exp 2hv,nt (B) = det(σ(B)σ(B) ). We obtain a block-diagonal matrix
T
2σ(A) σ(A) 0
T ..
σ(B)σ(B) = . .
T
0 2σ(A) σ(A)
T T
In total there are n blocks and so det(σ(B)σ(B) ) = 2nt det(σ(A) σ(A))n . If we
apply the Cauchy-Binet formula again we arrive at
nt
(6.13) hv,nt (B) = nhv,t (A) + log 2.
2
Say v is finite. We fix a t × t submatrix A′ of AT with | det A′ |v maximal. In
particular, det A′ 6= 0. It follows that hv,t (A′−1 AT ) = hv,t (AT ) − log | det A′ |v = 0. We
observe that the entries of A′−1 AT are v-integers. Consider the rank nt matrix
(6.14)
A′−1 0 A′−1 AT −A′−1 AT 0
.. ..
C= . B =
. .
0 A′−1 0 A′−1 AT −A′−1 AT
| {z }
n blocks
We have hv,nt (C) ≤ 0. The block matrix in the middle of (6.14) has determinant
(det A′ )−n . This shows the equality in
hv,nt (B) − n log | det A′ |v = hv,nt (C) ≤ 0.
We obtain
(6.15) hv,nt (B) ≤ nhv,t (A).
We multiply (6.13) and (6.15) with [Kv : Qv ]/[K : Q] and sum over all places to
obtain
nt
hnt (B) ≤ nht (A) + log 2.
2
⊥
Now ht (A) is the height of ι(I((D+1)k,Ek) ); indeed, applying the automorphism τ
does not change the height. So ht (A) = H a ((D + 1)k, Ek; Z) by Lemma 6.4. The
lemma follows because (3.5) implies hAr (W2 ) = hnt (B).
We will not bound the height of W3 directly. Rather we construct a larger space
′
of controlled height which, together with W1 and W2 , still cuts out WDEk .
Lemma 6.7. – There exists a vector subspace W3′ of R((D+1)k,Ek) such that
′
WDEk = W1 ∩ W2 ∩ W3′
and
hAr (W3′ ) ≤ 20n max{n, r}2 max{D, E} H g (k, Ek; Z)k.
(D+1)k+n
Ek+r
Proof. – For brevity we set M = dim R((D+1)k,Ek) = n r . By the defi-
2nM
nition of W3 we see that ι(W3 ) ⊂ Q is cut out by nM linear equations; for each
monomial in R((D+1)k,Ek) we need n equations. And each linear equation comes from
one of the n equations
XiDk G′1 − X1Dk G′i = 0.
With respect to the usual basis, a typical linear equations has coefficients
(6.16)
1/2 1/2
(D + 1)k (D + 1)k
and − with α, α′ ∈ Nn+1
0 , |α| = |α′ | = (D + 1)k.
α α′
Among these nM linear equations we can find t ≤ dim WDEk linearly independent
′
ones such that if ι(W3′ ) is their common kernel then WDEk = W1 ∩ W2 ∩ W3′ . Let A be
a t × 2nM matrix whose rows are precisely these chosen linear equations. Hence the
kernel of A is ι(W3′ ) and each row has at most two non-zero entries of the form (6.16).
Let K ⊂ Q be a number field containing the finitely many algebraic numbers which
appear in this proof and let v ∈ MK .
Say v is infinite. The absolute value of the multinomials in (6.16) is at most
(n + 1)(D+1)k/2 . Let A′ be a t × t submatrix of A. By the discussion above we obtain
| det A′ |v ≤ (2(n + 1)(D+1)k/2 )t
from the Leibniz formula for the determinant. Now the number of possible t × t
submatrices of A is
t t
2nM (D + 1)k + n Ek + r
≤ (2nM )t = (2n)t
t n r
≤ (2n)t ((D + 1)k + n)nt (Ek + r)rt .
We need explicit bounds for the arithmetic Hilbert function H a (ak, bk; Z) for large
values of k. Our tools are Proposition 4.1 and Zhang’s inequality for the essential
minimum for a subvariety of Pn . We recall that s and vab denote the Segre and
Veronese morphism, respectively. Also, degree and height of a subvariety of Pn ×Pr is
the degree and height of its embedding into Pnr+n+r under the Segre morphism,
respectively.
dense in s(vab (Z)). We get µess (s(vab (Z))) ≤ max{a, b}(µess (s(Z)) + ε) for all ε > 0.
Letting ε go to zero gives
(6.18) µess (s(vab (Z))) ≤ max{a, b}µess (s(Z)).
Zhang’s inequality [69] states
h(X) h(X)
(6.19) ≤ µess (X) ≤
(1 + dim X)deg(X) deg(X)
for a subvariety of any projective space X defined over Q.
We use his inequality to bound µess (s(vab (Z))) from below and µess (s(Z)) from
above. On recalling the convention h(s(Z)) = h(Z) and deg(s(Z)) = deg(Z), inequal-
ity (6.18) implies
(6.20)
h(vab (Z)) h(Z)
≤ µess (s(vab (Z))) ≤ max{a, b}µess (s(Z)) ≤ max{a, b} ;
(1 + d)deg(vab (Z)) deg(Z)
we note dim s(vab (Z)) = d. Lemmas 4.1 and 4.2 give deg(vab (Z)) = H(1, 1; vab (Z)) =
H(a, b; Z) ≤ max{a, b}d deg(Z). The current lemma follows from (6.20).
Proof. – By Lemma 5.5 we deduce H a (ak, bk; Z) ≤ H a (k, k; vab (Z)). For brevity,
we set X = s(vab (Z)) ⊂ Pnr+n+r and use Lemma 5.4 to estimate H a (k, k; vab (Z)) ≤
H a (k; X). Hence
Hence
(6.23)
d+1 d+k 1 d+k
H a (ak, bk; X) ≤ (d+1) max{a, b} h(Z) k+ deg(X) log H g (k; X).
d 2 d
log H g (k; X) ≤ d log(e max{a, b}k 2 ) ≤ 2d log(e max{a, b}k) ≤ 2d max{a, b}k.
We apply this and the bound for deg(X) from above to (6.23) and obtain
d+1 d+k d+1 d+k
H a (ak, bk; X) ≤ (d + 1) max{a, b} h(Z) k + d max{a, b} deg(Z) k.
d d
The lemma follows since d + 1 ≤ 2d ≤ 2r.
′
We now bound the height of WDEk from above explicitly in terms of h(Z), deg(Z),
and the parameters D, E, and k.
′
Proof. – A theorem of Schmidt, cf. (3.4) in Remark 3.4, implies hAr (WDEk ) ≤
hAr (W1 ) + hAr (W2 ) + hAr (W3′ ). Adding the bounds provided by the previous lemma
leads to the desired inequality.
6.4. Proof of Propositions 6.1 and 6.2. – We continue working with the notation intro-
duced in the preceeding subsections. We recall that κ(Z) was defined in (6.2).
We will need some preparatory estimates.
The next lemma bounds the value of Ψ, defined near (6.10), from above.
Qn
Lemma 6.13. – Let G = (G1 , G′1 , . . . , Gn , G′n ) ∈ i=1 V0 × Vi be non-zero, then
h(Ψ(G)) ≤ h(G) + ( D+1
2 log(n + 1) + n + 1)k.
Proof. – By the convention introduced in Section 3.2, the height of G is the height
of ι(G).
Tracing through the definition of ι we see that each coordinate of ι(Ψ(G)) is some
coordinate of ι(G) times a factor of the form
(6.28)
1/2 −1/2
(D + 1)k k
with α, α′ ∈ Nn+10 and |α|1 = (D + 1)k, |α′ |1 = k.
α α′
Let K ⊂ Q be a number field containing all algebraic numbers which appear below
and let v ∈ MK .
Say v is infinite. Then the absolute value of the expression (6.28) with respect to v
is bounded by (n + 1)(D+1)k/2 . It follows that
(D + 1)k
(6.29) log |Ψ(G)|v ≤ log |G|v + log(n + 1).
2
Now say if v is finite and let p be the rational prime with |p|v < 1. The v-adic
absolute value of (6.28) is at most k (n+1)/2 if p ≤ k and at most 1 if p > k, cf. (3.1).
It follows that
(
n+1
2 log k if p ≤ k,
(6.30) log |Ψ(G)|v ≤ log |G|v +
0 otherwise.
Multiplying the expressions (6.29) and (6.30) with the corresponding local degrees
and taking the sum over all places gives
D+1 n+1
h(Ψ(G)) ≤ h(G) + k log(n + 1) + π(k) log k
2 2
here, as in the proof of Lemma 6.5, π(k) denotes the number of rational primes at
most k. We recall π(k) log k ≤ 2k which completes the proof.
The following absolute version of Siegel’s Lemma follows from work of Zhang. Roy
and Thunder [59] proved a variant of the absolute Siegel Lemma which could also be
used at this point.
′ ′
Lemma 6.14. – Suppose dim WDEk ≥ 2. There exists a non-zero G ∈ WDEk such that
′
hAr (WDEk ) ′
h(G) ≤ ′ + log dim WDEk .
dim WDEk
Proof. – This is a consequence of David and Philippon’s lemme 4.7 [24] which is based
Pd−1 Ps
on a result of Zhang. We note that s=1 t=1 1/t ≤ d log d by (4.9). The artificial
′
hypothesis dim WDEk ≥ 2 allows us to avoid the ε in the reference.
This variant of Siegel’s Lemma is needed in the next lemma.
Lemma 6.15. – We assume
D+1 1
≤ κ(Z)
E 4dn
and
k ≥ max{[17nd!ed ∆d−1
0 ], deg(Z)}.
There exists a non-zero F ∈ WDEk such that
d+1
1 max {1, κ(Z)}
h(F ) ≤ 400n max{n, r}2 (h(Z) + deg(Z)) + 5ddeg(Z).
Ek ∆0
′
Proof. – Recall that Ψ given by (6.10) defines an isomorphism between WDEk and
WDEk .
Let us assume that k is as in the hypothesis. Then k ≥ 16nd!ed ∆d−1
0 and so
1 kd 1 kd
− 4ned ∆d−1
0 k d−1 ≥ .
2 d! 4 d!
Lemma 6.3 implies
′ 1 kd
dim WDEk = dim WDEk ≥ ∆0 E d ;
4 d!
′
this implies dim WDEk ≥ 2 by our choice of k.
A calculation involving (6.9) shows d+k
d ≤ 2k d /d! since k ≥ d!ed . So
′ 1 d+k
dim WDEk ≥ ∆0 E d .
8 d
′
Because of Lemmas 6.14 and 6.11 there exists a non-zero G ∈ WDEk with
′
hAr (WDEk ) ′
h(G) ≤ ′ + log dim WDEk
dim WDEk
max{D + 1, E}d+1 ′
≤ 400n max{n, r}2 (h(Z) + deg(Z))k + log dim WDEk .
∆0 E d
′
We need to bound dim WDEk = dim WDEk from above in order to get a handle on
′
the logarithm. Indeed, by definition (6.5) we have dim WDEk ≤ (n+1) H g (k, Ek; Z) ≤
2n H g (k, Ek; Z). Just as around (6.25) in the proof of Lemma 6.10 we have
d d+k
H g (k, Ek; Z) ≤ E deg(Z) ≤ 2E d deg(Z)k d /d!,
d
so
′
log dim WDEk ≤ log(4nE d deg(Z)k d ) ≤ d log(4nEdeg(Z)k).
We obtain
d log(4nEdeg(Z)k) d log(4n) d log E d log deg(Z) d log k
= + + +
Ek Ek Ek Ek Ek
≤ 1 + 1 + d + d ≤ 4d
from k ≥ 16dn and k ≥ deg(Z). Thus
log dim WDEk ≤ 4dEk.
We set F = Ψ(G) 6= 0. Its height is bounded from above by Lemma 6.13, indeed
D+1
h(F ) ≤ h(G) + log(n + 1) + n + 1 k ≤ h(G) + 3nDk
2
max{D + 1, E}d+1
≤ 400n max{n, r}2 (h(Z) + deg(Z))k + 4dEk + 3nDk.
∆0 E d
We use the bound (D + 1)/E ≤ κ(Z)/(4dn) ≤ κ(Z) to estimate
1 max{1, κ(Z)}d+1
h(F ) ≤ 400n max{n, r}2 (h(Z) + deg(Z)) + 4d + κ(Z).
Ek ∆0
Lemma (6.12) implies 4d + κ(Z) ≤ 5ddeg(Z) and the current lemma follows.
Proof of Proposition 6.1. – In order to prove the proposition we may assume that X0
does not vanish identically on Z. Indeed, otherwise we are in case (i).
Let us assume for the moment that κ < 17dn. For Q ≥ 1 there are integers x, y ∈ Z
with 1 ≤ y ≤ Q such that |yκ/(8dn) − x| ≤ Q−1 ; this follows easily from Dirichlet’s
Box Principle as employed on the first page of Cassels’ book [16].
We take Q = max{1, 16dn/κ}. Then |x/y| ≤ κ/(8dn) + 1/(yQ) ≤ κ/(8dn) +
κ/(16dn) ≤ κ/(4dn) and |x/y| ≥ κ/(8dn)−1/(yQ) ≥ κ/(8dn)−κ/(16dn) = κ/(16dn).
Finally, x ≥ 1; indeed, otherwise we would have yκ/(8dn) − x ≥ κ/(8dn) > Q−1 and
this is a contradiction.
We set D = 4x − 1 and E = 4y. Hence D, E are positive integers with
κ D+1 κ
(6.31) D ≥ 3, E ≤ 4 max{1, 16dn/κ}, and ≤ ≤ .
16dn E 4dn
If κ ≥ 17dn, we set D = [κ/(4dn)]−1 and E = 1. So they also satisfy all inequalities
in (6.31).
(n+1)(r+1) −1/2
If v is finite, there is γ0 ∈ N0 with |Q|v = γa0 Qγ0 . We have
v
a −1 γ0 ∗ γ0 ∗
γ0 Q γ0 = hQ, U i = hP, s (U )i since s is an isometry. This inner product
a −1 a −1 n+1 r+1
equals α β Pαβ with α ∈ N0 and β ∈ N0 and where Pαβ is a coefficient
of P . Hence
−1/2 1/2 −1 −1 −1/2
a a a a a a
|Q|v = Qγ0 = Pαβ ≤ |P |v .
γ0 γ0 α β α β v
v v
Together with (3.1) we have
(
a(n+r+2)/2 if p ≤ a,
(6.33) |Q|v ≤ |P |v ·
1 otherwise,
where p is the rational prime with |p|v < 1.
Recall that τ is complex conjugation restricted to Q. If v is infinite and σ = σv ,
then there is an automorphism η of K such that σ ◦ η = τ ◦ σ. We have |Q|2v =
T
ι(σ(Q)) · τ (ι(σ(Q))) = σ(hQ, η(Q)i). But Q ∈ ker s∗ ⊥ and s∗ is an isometry, so
|Q|2v = σ(hs∗ (Q), s∗ (η(Q))i) = σ(hs∗ Q, η(s∗ Q)i) = σ(hP, η(P )i) = |P |2v . Therefore,
(6.34) |Q|v = |P |v .
We multiply the logarithm of (6.33) and (6.34) with [Kv : Qv ]/[K : Q] and sum
over all places of K to obtain
n+r+2
h(Q) ≤ h(P ) + π(a) log a
2
where, as usual, π(a) is the number of rational primes at most a. The lemma follows
from π(a) log a ≤ 2a, an inequality we have already used twice.
We now prove Proposition 6.2.
For brevity set β(Z) = h(Z) + deg(Z).
Let a, b, and F be as in Proposition 6.1; we note that b = a since κ ≥ 17dn by
hypothesis.
Say (p, q) is as in the proposition. If some projective coordinate of p vanishes or if
p is not isolated in π1 |−1
Z (p), then we are in case (i). So let us assume the contrary.
If F (p, q) 6= 0 then we are in case (ii) of Proposition 6.1. The height bound for h(p)
implies
κd+1
κh(p) ≤ 25 dnh(q) + 214 n2 r max{n, r}2 β(Z) + 28 nr2 deg(Z)
∆0 (Z)
d+1
5 14 2 2 κ
≤ 2 dnh(q) + 2 n r max{n, r} + 1 β(Z).
∆0 (Z)
The inequality in part (iii) now follows easily.
It remains to treat the case F (p, q) = 0. Then F will determine the obstruction
variety V as follows. Let Ve1 , . . . , VeN be the irreducible components of the intersection
of Z with the zero set of F . Of course, these are independent of (p, q). Then dim Vei =
d − 1 because F does not vanish identically on Z. We may omit those Vi for which
−1
π1 |Vei has degree zero since (p, q) is isolated in π1 |Z (p). Let us set Vi = π1 (Vei ). Our
point (p, q) is contained in some Vei . By dimension theory of varieties, cf. Exercise
II.3.22 [34]oor Theorem 7, Chapter I.3 [61], Vi has dimension d − 1 and π1 | e : Vei →
Vi
Vi is generically finite.
We apply Lemma 6.16 to obtain Q ∈ Q[U]a with s∗ (Q) = F and
(6.35) h(Q) ≤ h(F ) + (n + r + 2)a.
The images s(Vei ) are irreducible components of the intersection of s(Z) with
the zero-set of Q. By Bézout’s Theorem, cf. Example 8.4.6 [26], we estimate
PN e PN e
i=1 deg(Vi ) = i=1 deg(s(Vi )) ≤ adeg(s(Z)) = adeg(Z).
By Lemma 4.1 we have ∆d−1 (Vei ) ≤ deg(Vei ) for 1 ≤ i ≤ N . The projection formula
implies
(6.36) deg(Vi ) = deg(π1 (Vei )) ≤ ∆d−1 (Vei ) ≤ deg(Vei )
so
N
X N
X
deg(Vi ) ≤ deg(Vei ) ≤ adeg(Z)
i=1 i=1
The bound for a from Proposition 6.1 leads to the bound (6.3).
It remains to bound each h(Vi ) from above. For brevity we set V = Vi and Ve = Vei
for some valid i.
Let K ⊂ Q be a number field containing all of the finitely many algebraic numbers
that appear in the proof below and let v ∈ MK .
If v is infinite, then the Cauchy-Schwarz inequality implies |σv (Q)(x)| ≤
deg(Q)
|ι(Q)|v |x|v for all x ∈ C(n+1)(r+1) . Therefore,
X [Kv : Qv ] nr+n+r
X 1
mv (Q) ≤ h(Q) + deg(Q) .
[K : Q] j=1
2j
v∈MK
where the bound for h(Q) came from (6.35). Since s(Ve ) is an irreducible component
of s(Z) ∩ W we have
h(Ve ) = h(s(Ve )) ≤ ah(Z) + h(W )deg(Z) + cadeg(Z)
ϕ|
X ←−−−− X −−−−X
→ Grm
(7.1)
y y
ϕ
X ←−−−− X −−−−→ Pr
π1 |X ϕ π2 |X ϕ
of morphisms.
ϕ
The purpose of this section is to bound degree and height of X in terms of X
and ϕ. We will later apply these bounds together with the height estimates from the
ϕ
previous section to eventually prove Theorem 12. Recall that the degree of X is by
ϕ
definition the degree of s(X ) ⊂ Pnr+n+r where s is the Segre morphism. The height
ϕ ϕ ϕ
of X is the height of s(X ) as a subvariety of Pnr+n+r . Moreover, ∆i (X ) are the
bidegrees introduced in Section 6.
We also use k · k to denote the sup-norm of any matrix with real coefficients.
Homomorphisms Gnm → Grm can be identified with n × r matrices in integer coef-
ficients. Therefore, kϕk is well-defined. It is non-zero if and only if ϕ is non-constant.
Lemma 7.1. – If ϕ is non-constant, then
ϕ
(7.2) deg(X ) ≤ (4nkϕk)r deg(X),
ϕ
(7.3) ∆i (X ) ≤ (4n)r kϕkr−i deg(X) for all 0 ≤ i ≤ r, and
ϕ r
(7.4) deg(ϕ| ) = ∆0 (X ) ≤ (4nkϕk) deg(X).
X
Proof. – We essentially follow the argument given in Lemma 3.3 [31]. The l2 -norm
on Matn,r (R) was used in the reference, but here we work with the sup-norm. There
ϕ
it is shown that X is an irreducible component of (X × Pr ) ∩ Y where Y is the set
of common zeros of bihomogeneous polynomials whose bidegrees are at most (D, 1)
with D ≤ nkϕk.
By Philippon’s version of Bézout’s Theorem, Proposition 3.3 [41], we bound
ϕ
H(D, 1; X ) ≤ H(D, 1; X × Pr )
X2r
2r i 2r−i
(7.5) = (π1∗ O (1) π2∗ O (1) [X × Pr ])Di .
i=0
i
Commutativity of intersection products and the projection formula imply
i 2r−i 2r−i i
(π1∗ O (1) π2∗ O (1) [X × Pr ]) = O (1) π2∗ (π1∗ O (1) [X × Pr ]) .
If i > r = dim X, then the intersection number on the right vanishes. On the other
hand, if 2r − i > r then it vanishes too because
i 2r−i i 2r−i
(π1∗ O (1) π2∗ O (1) [X × Pr ]) = O (1) π1∗ (π2 ∗ O (1) [X × Pr ]) .
ϕ
Proof. – Positivity of ∆0 (X ) follows from Lemma 7.1. By the projection formula we
ϕ ϕ ϕ
have ∆r (X ) = deg(π1 |X ϕ )( O (1)r [π1 (X )]). Recall that X ⊂ Pn × Pr is the Zariski
ϕ
closure of the graph ϕ| : X → Grm . This implies deg(π1 |X ϕ ) = 1 and π1 (X ) = X.
X
ϕ
So ∆r (X ) = deg(X) ≥ 1.
ϕ
The upper bound for κ = κ(X ) follows from Lemma 6.12 and (7.4).
ϕ ϕ ϕ
To get the lower bound fix 1 ≤ i ≤ r with ∆i (X ) > 0 and κ = (∆0 (X )/∆i (X ))1/i .
Then (7.3) and (7.4) give
ϕ
!1/i !1/i
∆0 (X ) deg(ϕ| ) deg(ϕ| )
X X
κ= ϕ ≥ kϕk r r
≥ kϕk ,
∆i (X ) (4n) kϕk deg(X) (4n)r kϕkr deg(X)
In Section 3.2 we introduced a height function hs : Gnm (Q) → [0, ∞) with sup-norm
at the infinite places.
ϕ
We now bound the height of X .
ϕ
deg(X)
Lemma 7.3. – If ϕ 6= 0, then h(X ) ≤ (4n)n+2 kϕkr+1 h(X) + kϕk .
Proof. – For any p ∈ Gnm (Q) we have hs (ϕ(p)) ≤ nrkϕkhs (p) by the discussion
around (3.2). Therefore, h(ϕ(p)) ≤ 12 log(n + 1) + nrkϕkhs (p) ≤ n + nrkϕkh(p) from
the comparison estimates between the two heights. Let ε > 0. We may find a Zariski
dense set of p ∈ X(Q) with h(p) ≤ µess (X) + ε. Recall that s is the Segre morphism.
We have h(s(p, ϕ(p))) = h(p) + h(ϕ(p)) ≥ h(p), so
h(s(p, ϕ(p))) ≤ µess (X) + ε + n + nrkϕkh(p) ≤ n + (1 + nrkϕk)(µess (X) + ε).
ϕ
The resulting set of points (p, ϕ(p)) lies Zariski dense in X . So
ϕ
µess (s(X )) ≤ n + 2nrkϕk(µess (X) + ε)
and letting ε tend to zero gives
ϕ
(7.6) µess (s(X )) ≤ n + 2nrkϕkµess (X).
We use once more Zhang’s inequality (6.19) to compare essential minimum with
the height and degree of a variety. More precisely, we have
ϕ
ess ϕ h(X ) h(X)
µ (s(X )) ≥ ϕ and µess (X) ≤ .
(1 + r)deg(X ) deg(X)
Combining these two with (7.6) gives
ϕ
h(X ) h(X)
ϕ ≤ n + 2nrkϕk
(1 + r)deg(X ) deg(X)
and so
ϕ
ϕ ϕ deg(X )
h(X ) ≤ n2 deg(X ) + 2n3 kϕk h(X)
deg(X)
ϕ
after using r ≤ n − 1. Lemma 7.1 implies deg(X ) ≤ (4nkϕk)r deg(X) and this
completes the proof.
Recall that n and r are positive integers. As usual, we identify elements of Matr,n (Z)
with homomorphisms of algebraic groups Gnm → Grm . If ϕ is such a matrix and
X ⊂ Gnm is an irreducible closed subvariety defined over C of dimension r, then
deg(ϕ| ) is the degree of the restriction ϕ| : X → Grm . In this section we use
X X
techniques from Tropical Geometry to evaluate deg(ϕ| ) in terms of ϕ and the tropical
X
variety of X, to be defined further down in (8.1).
Although a ϕ ∈ Matr,n (Q) need not determine a homomorphism of algebraic
groups we can make sense of deg(ϕ| ) by killing denominators, cf. Lemma 3.1(iii)
X
[31]. The degree turns out to be homogeneous in the sense that
deg(λϕ| ) = |λ|r deg(ϕ| )
X X
for all ϕ ∈ Matr,n (Q) and λ ∈ Q.
Let s be an integer with r ≤ s ≤ n. Let ε > 0, then ϕ0 ∈ Mats,n (R) is called
ε-regular if for any ϕ ∈ Mats,n (R) with rank(ϕ) < s we have kϕ0 − ϕk ≥ ε. In other
words, the distance of ϕ0 to the set of matrices of non-full rank is at least ε.
Let Πrs denote the set of r × s matrices which represent projections Qs → Qr onto
r distinct coordinates of Qs .
The closure of T (X) in Rn coincides with the so-called Bieri-Groves set of X, see
the work of Einsiedler, Kapranov, and Lind [25] for a proof. It follows from Einsiedler,
Kapranov, and Lind’s Theorem 2.2.5 that T (X) is a rational polyhedral set, i.e., it
is a finite union of rational convex polyhedral. Moreover, it is pure of dimension r
which means that its maximal polyhedra have dimension r.
In our particular situation, the variety X is defined over C. We claim that T (X) is
a cone. Indeed, X is cut out by finitely many polynomials f ∈ C[X1 , . . . , Xn ]. Each
coordinate of a point x ∈ X(K) is a puiseux series in a variable T , say, and f (x) = 0.
For any rational ν > 0 we substitute T for T ν ∈ K in x and obtain x(T ν ). Moreover,
f (x(T ν )) = 0 and therefore x(T ν ) ∈ X(K). As ord(x(T ν )) = νord(x) we conclude
that ν T (X) ⊂ T (X).
Therefore, T (X) is a cone, as claimed and it follows that T (X) is a finite union
of sets
{(x1 , . . . , xn ) ∈ Qn ; ai1 x1 + · · · + ain xn ≥ 0 for 1 ≤ i ≤ n}
with aij ∈ Z; cf. Convention 1.3 [25].
We call v ∈ T (X) regular if some neighborhood v in T (X) coincides with the
neighborhood of a vector subspace of Qn . In this case the vector subspace is uniquely
0
determined and we denote it by Lv . We define T (X) ⊂ T (X) to be the set of
0
regular points. It follows that dim Lv = dim X for v ∈ T (X). We define the set
0
Σ(X) = {Lv ; v ∈ T (X)},
it is finite as T (X) is given by a finite set systems of linear inequalities.
Remark 8.1. – We have T (Gnm ) = Qn , this is clear from our characterization (8.1).
0
Hence T (Gnm ) = Qn too. If v ∈ Qn , then mGnm (v) = 1 by Corollary 3.15 [62].
Our main tool from Tropical Geometry is a special case of a result of Sturmfels
and Tevelev [62]. It allows us to determine deg(ϕ| ) for varying ϕ (and fixed X).
X
In the formulation below we regard ϕ ∈ Matr,n (Z) simultaneously as a homomor-
phism Gnm → Grm and a linear map Qn → Qr .
By Remark 2.1 [62] tropicalization commutes with ϕ since
(8.2) T (ϕ(X)) = ϕ( T (X)).
Proof. – This follows from Theorem 3.12 [62]. We remark that ϕ| : X → Grm is
X
generically finite since it is dominant and dim X = r. Moreover, mGnm (w) = 1 for all
w ∈ Qn by Remark 8.1.
Remark 8.2. – Let v be as in the sum (8.3) and v ′ ∈ Lv ∩ Zn with ϕ(v ′ ) = 0. Then
0
v + λv ′ ∈ T (X) for λ ∈ Q sufficiently small. Since ϕ|−1 T (X)
(w) is finite we must
′
have v = 0. Hence ϕ|Lv ∩Zn is injective and therefore ϕ(Lv ∩ Zn ) has rank equal
to dim Lv = dim X = r. In particular, ϕ(Lv ∩ Zn ) has finite index in Zr , and the sum
above is well-defined.
A similar argument shows that if the sum in (8.3) contains terms corresponding to
two different v and v ′ , then Lv 6= Lv′ .
In order to get explicit estimates from this theorem we need to get a grip on Σ(X)
and the multiplicity function for a given X.
We recall that deg(X) is the degree of the Zariski closure of X in Pn .
0
Lemma 8.1. – Let v ∈ T (X), then mX (v) ≤ deg(X).
Proof. – Let Y be the Zariski closure of ϕ(X) in Grm . By (8.2) the set T (Y ) contains
the image of a neighborhood of v in Lv . Hence dim Y = dim T (Y ) = r and we
conclude that Y = Grm . Therefore, ϕ| is dominant.
X
0
Since mX is locally constant on T (X) it suffices to prove the inequality for some
′ 0
v ∈ T (X) sufficiently close to v. We note also that Lv = Lv′ has dimension r.
Let ϕ ∈ Matr,n (Z) be a projection onto r distinct coordinates with ϕ|Lv bijective.
We want to apply Theorem 13 to ϕ and an appropriate w ∈ Qr which we proceed
to choose. The fiber ϕ|−1
Lv (w) is finite by our choice of ϕ regardless of w. We recall
that T (X) is contained in a finite union of vector subspaces of Qn . Hence for v ′ ∈
0
Lv ∩ T (X) sufficiently close to v such that w = ϕ(v ′ ) avoids a finite number of
proper vector subspaces of Qr we may suppose that ϕ|−1 T (X)
(w) satifies the conditions
of the theorem. Now (8.3) implies deg(ϕ| ) ≥ mX (v)[Zr : ϕ(Lv ∩ Zn )] ≥ mX (v).
X
An application of Bézout’s Theorem leads to deg(ϕ| ) ≤ deg(X) and the lemma
X
follows.
3
Lemma 8.2. – We have #Σ(X) ≤ 25n deg(X)(r+1)(n−r) and if L ∈ Σ(X) there is
ψ ∈ Matn−r,n (Z) with L = ker ψ ⊂ Qn and kψk ≤ 2ndeg(X).
Lemma 8.3. – For L ∈ Σ(X) there is BL ∈ Matn,r (Z) whose columns v1 , . . . , vr are a
basis for L ∩ Zn with kv1 k · · · kvr k ≤ 2n r!n2n deg(X)n−r .
Proof. – Lemma 8.2 supplies us with ψ ∈ Matn−r,n (Z) of rank r such that
ker ψ = L ⊂ Qn and kψk ≤ 2ndeg(X). By Corollary 2.9.9 Qr [7] there are independent
v1′ , . . . , vr′ ∈ Zn with ψ(v1′ ) = · · · = ψ(vr′ ) = 0 and k=1 kvk′ k ≤ n(n−r)/2 kψkn−r .
We note that our reference works with the multiplicative projective height. Since our
coefficients are integers, we may compare this height to the sup-norm k · k. This is
possible since we suppose, as we may, that the entries of each vk′ are coprime. After
permuting the vk′ we may suppose kv1′ k ≤ · · · ≤ kvr′ k. By a result of Mahler there is
a basis (v1 , . . . , vk ) of ker ψ with kvk k ≤ kkvk′ k, cf. Lemma 8 in Chapter V.4 [17].
Qr
We conclude k=1 kvk k ≤ r!n(n−r)/2 kψkn−r ≤ 2n r!n2n deg(X)n−r as desired.
In the following proposition we work with a BL provided by the previous lemma.
8.2. Ax’s Theorem and Degree Lower Bounds. – The following proposition is a special
case of the author’s Proposition 7.3 [31]. Its proof relies on Ax’s Theorem [3].
Lemma 8.4. – Let us assume part (i) of Proposition 8.3 does not hold for X. If ϕ0 ∈
Mats,n (R) has rank s, then there exist L ∈ Σ(X) and π ∈ Πrs with
det(πϕ0 BL ) 6= 0.
Proof. – Let U ⊂ Mats,n (R) be the neighborhood of ϕ0 from Proposition 8.3. Let ϕ ∈
U ∩ Mats,n (Q) and λ ∈ N with λϕ ∈ Mats,n (Z).
We have maxπ∈Πrs deg(λπϕ| ) = λr maxπ∈Πrs deg(πϕ| ) ≥ λr ε. On the other
X X
hand, Proposition 8.2(i) implies
deg(λπϕ| ) ≤ deg(X)#Σ(X) max | det(λπϕBL )|
X L∈Σ(X)
r
= deg(X)λ #Σ(X) max | det(πϕBL )|
L∈Σ(X)
Proof. – For ϕ0 as in the hypothesis, Lemma 8.4 implies that we are in alternative
(i) of Proposition 8.3. Let H be the algebraic subgroup mentioned there. We fix a
surjective homomorphism ϕ′ : Gnm → Gm n−dim H
with kernel H.
Say n − dim H ≥ r. Then we compose ϕ′ with the projection onto the first r
n−dim H
coordinates of Gm and obtain a surjective homomorphism ϕ : Gnm → Grm . Each
fiber of ϕ| has dimension at least max{1, s + dim H − n + 1}. By dimension theory
X
of varieties the Zariski closure of ϕ(X) has dimension at most dim X − max{1, s +
dim H − n + 1} < dim X. If we consider ϕ as a matrix in Matr,n (Q), then it has rank
r. Moreover, by (8.2) we have ϕ( T (X)) 6= Qr .
Now let us assume n − dim H < r. We remark that
s + dim H − n + 1 ≥ r + dim H − n + 1 > 1.
r−(n−dim H)
We take the product of ϕ′ with some homomorphism Gnm → Gm in general
position to obtain a surjective homomorphism ϕ : Gnm → Grm . By dimension theory,
the fibers of ϕ| have dimension at least
X
Example. – The previous corollary shows that the collection of Q-vector spaces {Lv }
associated to X satisfy a certain rationality condition. Indeed, it can be reformulated
as follows. Let Lv be the closure of Lv in Rn or equivalently, the vector subspace
of Rn generated by Lv . If there exists a vector subspace V0 ⊂ Rn of dimension n − r
with
Lv ∩ V0 6= 0 for all v
then there exists a vector subspace V ⊂ Qn of dimension n − r with
Lv ∩ V 6= 0 for all v.
We exhibit four 2-dimensional vector subspaces in Q4 that do not satisfy this
rationality condition. The four bases
(1, 0, 1, 0), (0, −2, 0, 1) ,
(1, −1, 0, 0), (0, 0, 1, 1) ,
(0, 1, 0, 0), (0, 0, 1, 0) , and
(1, 0, 0, 0), (0, 0, 0, 1)
determine four planes L1 , L2 , L3 , and L4 in Q4 , respectively.
Say V ⊂ Q4 is an arbitrary 2-dimensional vector subspace of Q4 . One can verify
that V ∩ Li = 0 for some i ∈ {1, 2, 3, 4}.
On the other hand, each Li meets the vector subspace of R4 with basis
√ √
(0, 2, 1, 0), (− 2, 0, 0, 1)
non-trivially.
In particular, Σ(X) 6= {L1 , L2 , L3 , L4 } for all irreducible surfaces X ⊂ G4m . Sam
Payne has pointed out to the author that this also follows from the fact that the
tropicalization of a variety is connected in codimension one. Indeed, the pairwise
intersection of the Li is trivial.
Let Mij be independent variables for 1 ≤ i ≤ s and 1 ≤ j ≤ n. They are entries of
the s × n matrix M = (Mij ). We define the polynomial
X X
DX = det(πM BL )2 ∈ Z[Mij ].
π∈Πrs L∈Σ(X)
Lemma 8.4 tells us that if X is not as in alternative (i) of Proposition 8.3 then
(8.5) ϕ0 ∈ Mats,n (R) with DX (ϕ0 ) = 0 implies rank(ϕ0 ) < s.
This polynomial is closely related to the degree map ϕ 7→ deg(ϕ| ). It has the
X
advantage that it can be evaluated for ϕ with real entries. Recall that deg(ϕ| ) has
X
no straightforward interpretation for irrational ϕ.
Since we can contain the vanishing locus of DX we will obtain an explicit lower
bound for its values. To do this we must first bound the degree and coefficients of DX .
For a polynomial P in any number of variables and integer coefficients we let kP k
denote the largest absolute value of any coefficient.
2
Next we use the bound for kDX k given by Lemma 8.5(ii); using nn ≤ 2n we find
2
n2 (2r)sn −20n3 (sn+1)(2r)sn sn
DX (ϕ) ≥ 2−12rs deg(X)−(sn+1)(2r) (r+3)(n−r)
δ.
−1
The exponent of 2 is
3 2 2
12rs2 n2 (2r)sn + 20n3 (sn + 1)(2r)sn ≤ (12 + 20)n5 (2n)n ≤ 50n5 (2n)n
2
where we used s, r ≤ n and n ≥ 2. We conclude
5 2
(2n)n sn
(8.7) DX (ϕ) ≥ 2−50n deg(X)−(sn+1)(2r) (r+3)(n−r)
δ.
By definition of DX there exist L ∈ Σ(X) and π ∈ Πrs with
DX (ϕ) ≤ #Πrs #Σ(X) det(πϕBL )2 .
Lemma 8.2 gives
3 3
DX (ϕ) ≤ 2s 25n deg(X)(r+1)(n−r) det(πϕBL )2 ≤ 210n deg(X)(r+1)(n−r) det(πϕBL )2 .
Together with (8.7) we conclude
5 2
(2n)n sn
(8.8) det(πϕBL )2 ≥ 2−100n deg(X)−(r+1)(n−r)−(sn+1)(2r) (r+3)(n−r)
δ.
Say λ ∈ N such that λϕ ∈ Matr,n (Z). We apply Proposition 8.2(ii) to get
deg(λπϕ| ) ≥ | det(λπϕBL )| = λr | det(πϕBL )|.
X
Since deg(λπϕ| ) = λr deg(πϕ| ) we have deg(πϕ| ) ≥ | det(πϕBL )|. The proposi-
X X X
tion now follow from (8.8) and δ 1/2 ≥ δ.
[s]
Say p ∈ (Gnm ) . Our approach is to find a surjective homomorphism Gnm → Gsm
from a finite set that maps p to a point of height bounded linearly in h(p). Recall
that we identify elements of Mats,n (Z) with homomorphisms Gnm → Gsm .
[s]
Lemma 9.1. – Suppose 1 ≤ s ≤ n and let Q ≥ 2s! be a real number. If p ∈ (Gnm )
there exists ψ ∈ Mats,n (Z) with
1
kπψk ≥ Q for all π ∈ Πrs , kψk < Q + 1, h(ψ(p)) ≤ log(n + 1) + (sn)h(p),
2
and such that ψ/Q is 1/(2s!)-regular.
2 5 2
(2n)n
where κ = κ(Z). Using the crude bound (8n)r ≤ (8n)n ≤ 24n ≤ 22n together
2
−54n5 (2n)n −χ
with (9.2) we obtain κ ≥ 2 Qdeg(X) . On inserting our choice of Q we
get
5 2
(2n)n
(9.3) κ ≥ 246n .
2
Lemma 7.1 and (8n)r ≤ 24n enable us to bound
2
(9.4) ∆0 = ∆0 (Z) ≤ (4n)r (2Q)r deg(X) ≤ (8n)r Qr deg(X) ≤ 24n Qr deg(X).
Degree and height of Z are bounded by Lemmas 7.1 and 7.3. We have
2
deg(Z) ≤ (8n)r Qr deg(X) ≤ 24n Qr deg(X)
2
and from (8n)n+2 ≤ 2(n+3)(n+2) ≤ 212n also
deg(X) 2 deg(X)
h(Z) ≤ (8n)n+2 Qr+1 h(X) + ≤ 212n Qr+1 h(X) + .
Q Q
Combining degree and height bounds yields
2 2deg(X) 2
h(Z) + deg(Z) ≤ 212n Qr+1 h(X) + ≤ 212n Qr+1 (1 + h(X))
Q
since Q ≥ 2deg(X).
It is not difficult to verify κ ≥ 17n2 ≥ 17rn. So the hypothesis on κ in Proposi-
tion 6.2 applied to Z is satisfied. We let V1 , . . . , VN denote the non-empty intersections
with Gnm of the obstruction varieties given by this proposition.
Say k0 = max{17n3r r!∆0 (Z)r−1 , deg(Z)} is as in Proposition 6.2. We recall (9.4),
the bound for deg(Z), and r ≤ n − 1 to obtain
3 2
(9.5) k0 ≤ max{25+2n n!24n Qr(r−1) deg(X)r−1 , 24n Qr deg(X)}
3
≤ 212n max{Qr(r−1) deg(X)r−1 , Qr deg(X)}
3 2
≤ 212n Qr deg(X)r .
PN
Now i=1 deg(Vi ) ≤ k0 deg(Z), so
N
X 2 3 2
deg(Vi ) ≤ 24n Qr deg(X)k0 ≤ 216n Qr +r
deg(X)r+1 .
i=1
the height bound in part (ii) holds with U = X. So let us assume s ≤ n − 1. Then
1 ≤ r ≤ n − 1 and the theorem follows from the previous proposition.
and
7 2 7 2
(i) (2n)n )i (2n)n )i
(10.7) h(Vj1 ,...,ji ) ≤ 2(600n deg(X)(6n (1 + h(X)),
(i) (i−1)
(10.8) Vj1 ,...,ji ⊂ Vj1 ,...,ji−1 if i ≥ 1.
For i = 0 we take V (0) = X. Clearly, (10.5), (10.6), and (10.7) are satisfied. So we
(i−1)
suppose i ≥ 1 and that Vj1 ,...,ji−1 has been constructed.
(i−1) (i−1)
If Vj1 ,...,ji−1 is as in alternative (i) of Proposition 8.1 then we set Nj1 ,...,ji−1 = 0 and
(i−1)
the construction stops. If i = r + 1, i.e., if Vj1 ,...,ji−1 is a point, then the constructions
stops as well.
(i−1)
Otherwise, we apply Proposition 9.1 to Vj1 ,...,ji−1 and set
(i) (i)
Vj1 ,...,ji−1 ,1 , . . . , V (i−1)
j1 ,...,ji−1 ,Nj
1 ,...,ji−1
(i−1)
to be the subvarieties V1 , . . . , VN constructed there with Nj1 ,...,ji−1 = N .
Properties (10.5) and (10.8) follow immediately from this proposition. It remains
to prove degree and height bounds; this is done by an elementary calculation.
We begin by verifying (10.6). To do this, we keep (10.2) in mind. By Proposition 9.1,
the left-hand side of (10.6) is at most
7 2 7 2 7 2 2 2 2
(2n)n (i−1) (2n)n (2n)n +(300n7 (2n)n )i−1 n7 (2n)n 7
(2n)n )i
2200n deg(Vj1 ,...,ji−1 )n ≤ 2200n deg(X)(n
on using the induction hypothesis. Elementary estimates and i ≥ 1 give
2 2 2 2
200n7 (2n)n + (300n7 (2n)n )i−1 n7 (2n)n ≤ (300n7 (2n)n )i .
So (10.6) follows.
Now we shall bound the height. We recall (10.3), so
7 2 7 2
(i) (2n)n (i−1) (2n)n (i−1)
h(Vj1 ,...,ji ) ≤ 2300n deg(Vj1 ,...,ji−1 )5n (1 + h(Vj1 ,...,ji−1 ))
by Proposition 9.1. We insert both degree and height bounds from the induction
(i)
hypothesis to find that h(Vj1 ,...,ji ) is at most
7 2 2 2 2
(2n)n +(300n7 (2n)n )i−1 5n7 (2n)n +(600n7 (2n)n )i−1
2300n
7 2 2 2
(2n)n )i−1 5n7 (2n)n +(6n7 (2n)n )i−1
× deg(X)(n (1 + h(X)).
Basic estimates and i ≥ 1 lead to
2 2 2 2 2
300n7 (2n)n + (300n7 (2n)n )i−1 5n7 (2n)n + (600n7 (2n)n )i−1 ≤ (600n7 (2n)n )i
as well as
2 2 2 2
(n7 (2n)n )i−1 5n7 (2n)n + (6n7 (2n)n )i−1 ≤ (6n7 (2n)n )i .
Hence claim (10.7) holds true.
We define
r
[ [ (i)
Z= Vj1 ,...,ji .
i=0 V (i) as in alt. (i)
j1 ,...,ji
of Proposition 8.1
It is a Zariski closed subset of X. This will be the Zariski closed set refered to in the
assertion.
We have X = Z if and only if V (0) appears in the union above. The degree and
height bound for the irreducible components of Z follows from (10.6) and (10.7).
We now verify that the bound for the number of irreducible components of Z is
correct. If V (0) = X is an irreducible component of Z, then our bound certainly holds.
(i)
Otherwise, an irreducible component is of the form Vj1 ,...,ji for some 1 ≤ i ≤ r. For
(i−1)
fixed i and j1 , . . . , ji−1 , the number of possible ji is at most Nj1 ,...,ji−1 . This quantity
is bounded from above by (10.6). Recalling (10.4) we find that for fixed i there are at
most
7 2 2 2 2
(2n)n +···+(300n7 (2n)n )i 7
(2n)n +···+(n7 (2n)n )i
2300n deg(X)n
7 2 7 2
(2n)n )r (2n)n )r
≤ 2r(300n deg(X)r(n
(i)
possible Vj1 ,...,ji . To get a bound for all possible irreducible components we must sum
over 1 ≤ i ≤ r. This gives us the bound
7 2 7 2 7 2 7 2
(2n)n )r (2n)n )r (2n)n )r (2n)n )r
r2r(300n deg(X)r(n ≤ 2r+r(300n deg(X)r(n .
2 2
Part (ii) of the theorem follows since r + r(300n7 (2n)n )r ≤ (600n7 (2n)n )r and
2 2
r(n7 (2n)n )r ≤ (2n7 (2n)n )r .
We claim that X oa,[s] ⊂ X \ Z. This will imply part (i) of the theorem. So suppose
p ∈ Z(Q). By definition of Z there are i, j1 , . . . , ji and an algebraic subgroup H ⊂ Gnm
(i)
such that dimp Vj1 ,...,ji ∩ pH ≥ max{1, s + dim H − n + 1}. Certainly, this local
dimension is at most dimp X ∩ pH. So p 6∈ X oa,[s] and our claim is established.
[s]
Suppose p ∈ (X \ Z)(Q) with p ∈ (Gnm ) . It remains to bound h(p) as in (iii) of
the theorem.
By construction X = V (0) . We may choose 0 ≤ i ≤ r maximal, such that there are
(i)
indices j1 , . . . , ji with p ∈ Vj1 ,...,ji (Q). We split up into two cases.
(i)
First, let us assume i = r. This case is easy, since Vj1 ,...,ji = {p} holds by (10.5).
Now h(p) is the height of the variety {p}, so the desired height bound follows from
(10.7).
(i)
Now, we suppose 0 ≤ i ≤ r − 1. We remark that p 6∈ Z(Q) implies that Vj1 ,...,ji is
not as in alternative (i) of Proposition 8.1. In particular, Proposition 9.1 gives a height
bound for p providing it does not lie on
(i+1) (i+1)
Vj1 ,...,ji ,1 ∪ · · · ∪ V (i) .
j1 ,...,ji ,Nj
1 ,...,ji
But p cannot lie in this union because of the maximality of i. Recalling (10.1) gives
us
7 n2 (i) 6 n2 (i)
h(p) ≤ 2200n (2n) deg(Vj1 ,...,ji )n (2n) (1 + h(Vj1 ,...,ji )).
Our degree bound (10.6) and height bound (10.7) give
7 2 2 2 2 2 2 2
(2n)n +(300n7 (2n)n )i n6 (2n)n +(600n7 (2n)n )i 7
(2n)n )i n6 (2n)n +(6n7 (2n)n )i
2200n deg(X)(n (1 + h(X))
Appendix A
The Case of Abelian Varieties
An abelian variety A defined over Q together with an ample symmetric line bun-
dle determines a height function called the Néron-Tate or canonical height. It is a
quadratic form and vanishes precisely on the torsion points of A. We refer to Chap-
ter 9 of Bombieri and Gubler’s book [7] for the necessary background.
The history of height upper bounds on subvarieties of abelian varieties runs parallel
to the history of height bounds on the algebraic torus. But we will only give a brief
account of what is known in the projective case and also of known cases of the Zilber-
Pink Conjecture for A.
An initial result was obtained by Viada [63] who proved the following analog of
Theorem 1.
Theorem 15 (Viada [63]). – Let A = E g where E is an elliptic curve defined over Q
and suppose that we have fixed a symmetric and line bundle, and thus a Néron-Tate
height, on A(Q). Let C ⊂ A be an irreducible algebraic curve that is not contained in
the translate of a proper algebraic subgroup of A. Then the height of points on C that
are contained in a proper algebraic subgroup is bounded from above uniformly.
Rémond [53] gave a systematic approach for passing from height upper bounds in
the spirit of Theorem 15 to finiteness result using Lehmer-type and relative Lehmer-
type height lower bounds. These inequalities remain conjectural for many abelian
varieties. For example, no sufficiently strong Lehmer-type height inequality is known
on a power of an elliptic curve without complex multiplication, or CM, to tackle
the abelian analog of Theorem 2 using Rémond’s approach. Viada [63] did obtain
a finiteness result akin to Theorem 2 when the elliptic curve in question has CM;
she mentioned to the author that her method also applies to products of CM elliptic
curves. In this setting the sufficiently strong Lehmer-type height lower bounds are
available thanks to work of David and Hindry [23].
The analog of Maurin’s Theorem for curves inside a power of an elliptic curve was
already obtained in 2003 by Rémond and Viada [57]. Again the elliptic curve was
assumed to have CM. As Maurin’s Theorem, Rémond and Viada’s Theorem relies
on Rémond’s Generalized Vojta Inequality [52]. Ratazzi [50] extended the Rémond-
Viada Theorem to when A is a power of a simple abelian variety with CM. This was
generalized by Carrizosa [15] to all abelian varieties with CM.
Advances made primarily by Galateau [27, 28] on Bogomolov-type height lower
bounds have had a important effect on the finiteness problems. His results hold for
a wide class of abelian varieties, including abelian surfaces and arbitrary powers of
elliptic curves. Viada [64] used them to prove a variant of Maurin’s Theorem for
curves inside a power of an arbitrary elliptic curve, see also [67]. Here the subgroups
are thickened using the Néron-Tate height and the method applies also to products
of elliptic curves.
Zannier devised a strategy that involves the Point Counting Theorem of Pila-Wilkie
[46] to give a new proof of the Manin-Mumford Conjecture in collaboration with Pila
[47]. Pila and the author show that a variant of the Point Counting Theorem can also
be used to attack problems of Zilber-Pink type [?]. We relied on a lower bound for
the Néron-Tate height due to Masser [38] for general abelian varieties that are defined
over Q. It yielded Zilber’s Conjecture in the case of a curve in an abelian variety when
everything is defined over Q.
Partial results for subvarieties of arbitrary dimension in an abelian variety are
known as well. Here the definition of X oa for a subvariety X ⊂ A is verbatim to the
toric case. The union A[s] of all algebraic subgroups of A of codimension at least s also
makes perfect sense. For example, the author proved [30] the full analog of Theorem 9.
That is, the Néron-Tate height is uniformly bounded from above on X oa (Q)∩A[dim X] .
Viada proved [66] that one cannot expect a reasonable result on boundedness of
height in the power of an elliptic curve if X oa is empty. She also compared several
variants of Conjecture 1 that involve thickened subgroups [65, 67] in general abelian
varieties. Joint work of Checcoli, Veneziano, and Viada [19] treats an effective variant
of the Zilber-Pink Conjecture for subvarieties of codimension 2 in the power of a
elliptic curve with CM. They also give effective and explicit bounds [20] in the non-
CM case with applications to effective cases of the Mordell Conjecture. Checcoli and
Viada [21] consider a related problem and attain effective results in certain abelian
varieties with CM. Hubschmid and Viada [35] prove a variant of Bombieri, Masser,
and Zannier’s Torsion Finiteness Conjecture for codimension 2 subvarieties of a power
of an elliptic curve without CM.
Rémond’s Generalized Vojta Inequality is powerful enough to treat, along with
varying algebraic subgroups, the division closure of a finite rank subgroup Γ ⊂ A(Q).
Indeed, he considers points on X contained in
A[s] + Γ = {h + γ; h ∈ A[s] and γ ∈ Γ}.
Theorem 16 (Rémond [56], cf. [54]). – Let A be an abelian variety defined over Q and
suppose we have fixed a Néron-Tate height on A. Let Γ ⊂ A(Q) be the division closure
of a finitely generated subgroup of A. Moreover, let X ⊂ A be an irreducible closed
subvariety defined over Q. Then the height of points in X oa (Q) ∩ (A[1+dim X] + Γ) is
bounded from above uniformly.
Maurin’s Theorem 10 is the toric version of this result. Pila and the author [?] used
Rémond’s result to prove the Zilber-Pink Conjecture for subvarieties of A that satisfy
X oa 6= ∅.
Appendix B
Height Bounds in Shimura Varieties
Theorem 17 (Colmez [22]). – There exists absolute constants c1 > 0 and c2 ≥ 0 with
the following property. If j is a singular moduli whose discriminant ∆ is a fundamental
discriminant, then
h(j) ≥ c1 (log |∆|) − c2 .
Polynomial upper bounds in the discriminant are available using classical estimates
in analytic number theory. Pila and the author proved the following inequality.
Lemma B.1 (Lemma 4.3 [33]). – For any ε > 0 there exists a constant c > 0 with the
following property. If j is a singular moduli with discriminant ∆, then
h(j) ≤ c|∆|ε .
If the Generalized Riemann Hypothesis (GRH) is true, then one may replace |∆|ε
in this upper bound by log |∆|. We refer to Section 4 [32] for an even better conditional
estimate.
The special subvarieties of the product Y (1)2 are known. Points whose coordinates
are both singular moduli are precisely the special points and Y (1)2 itself is the only
two-dimensional special subvariety. Among the special curves we find the vertical and
horizontal lines where the fixed coordinate is a singular moduli. The remain ones are
Y0 (N ) ⊂ Y (1)2 and given by the zero-sets of the classical N th modular transformation
polynomial for N ∈ N. A complex point on such a special curve corresponds to a pair
of elliptic curves that are linked by an isogeny of degree N with cyclic kernel.
If C ⊂ Y (1)2 is not a special curve then the author proved [32] that there is a
constant c > 0 such that C ∩ Y0 (p) contains a point of height at least c log p for all
S
primes p ≥ c−1 . Hence not even C ∩ N ≥1 Y0 (N ) has bounded height.
As there can be no such thing as a Bounded Height Conjecture in the Shimura
setting we must content ourselves with something less. In the particular case of curves
in Y (1)2 the author formulated the following conjecture.
If S ⊂ Y (1)2 is an irreducible curve defined over Q then we let degQ S denote
the degree of the union of all conjugates of S over Q. We observe that any point
p ∈ Y (1)2 is contained in a uniquely determined minimal special subvariety S (p) ⊂
Y (1)2 . For example, if p = (j, ∗) is a special point, then S (p) = {p} and degQ S (p) =
[Q(p) : Q] ≥ [Q(j) : Q]. If ε > 0 then, by the Siegel-Brauer Theorem, [Q(j) : Q] grows
at least of the order |∆|1/2−ε where ∆ is the discriminant of the singular moduli j.
Conjecture (Weakly Bounded Height Conjecture for Y (1)2 [32])
Let C ⊂ Y (1)2 be an irreducible algebraic curve defined over Q that is not spe-
cial. There exists a constant c > 0 with the following property. Suppose p ∈ C and
dim S (p) ≤ 1, then
(B.1) h(p) ≤ c log(1 + degQ S).
By Corollary 1.2(ii) [32] the GRH implies this conjecture for a class of curves satis-
fying a geometric restriction in addition to being non-special. Part (i) of this corollary
implies that we can still obtain a logarithmic height bound (B.1) without assuming
the GRH if we restrict to points satisfying S (p) = Y0 (N ) for some N ∈ N. GRH is
used solely to obtain an upper for the height of a singular moduli that is logarithmic
in terms of its discriminant. But as we have seen in Lemma B.1, polynomials upper
bounds with arbitrarily small exponent hold unconditionally.
The following, even weaker, bounded height conjecture could bail us out should
the GRH default.
Conjecture (Super Weakly Bounded Height Conjecture for Y (1)2 )
Let ε > 0 and let C ⊂ Y (1)2 be an irreducible algebraic curve defined over Q that is
not special. There exists a constant c > 0 with the following property. Suppose p ∈ C
and dim S (p) ≤ 1, then
h(p) ≤ c(degQ S)ε .
References
[1] F. Amoroso & S. David – “Le problème de Lehmer en dimension supérieure”, J. reine
angew. Math. 513 (1999), p. 145–179.
[2] F. Amoroso, D. Masser & U. Zannier – “Bounded height in pencils of finitely
generated subgroups”, preprint arXiv:1509.04963.
[3] J. Ax – “Some topics in differential algebraic geometry. I. Analytic subgroups of alge-
braic groups”, Amer. J. Math. 94 (1972), p. 1195–1204.
[4] M. Bainbridge, P. Habegger & M. Möller – “Teichmüller curves in genus three
and just likely intersections in”, Publ. Math. IHÉS 124 (2016), p. 1–98.
[5] M. Bays & P. Habegger – “A note on divisible points of curves”, Trans. Amer. Math.
Soc. 367 (2015), p. 1313–1328.
[6] D. Bertrand – “Upper bounds for (geometric) Hilbert functions”, in Introduction to
algebraic independence theory, Lecture Notes in Math., vol. 1752, Springer, Berlin, 2001,
p. 143–148.
[7] E. Bombieri & W. Gubler – Heights in Diophantine geometry, New Mathematical
Monographs, vol. 4, Cambridge Univ. Press, Cambridge, 2006.
[8] E. Bombieri, P. Habegger, D. Masser & U. Zannier – “A note on Maurin’s
theorem”, Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 21 (2010), p. 251–260.
[9] E. Bombieri, D. Masser & U. Zannier – “Intersecting a curve with algebraic sub-
groups of multiplicative groups”, Int. Math. Res. Not. 1999 (1999), p. 1119–1140.
[10] , “Intersecting curves and algebraic subgroups: conjectures and more results”,
Trans. Amer. Math. Soc. 358 (2006), p. 2247–2257.
[11] , “Anomalous subvarieties—structure theorems and applications”, Int. Math.
Res. Not. 2007 (2007), Art. ID rnm057, 33.
[12] , “Intersecting a plane with algebraic subgroups of multiplicative groups”, Ann.
Sc. Norm. Super. Pisa Cl. Sci. 7 (2008), p. 51–80.
[13] , “On unlikely intersections of complex varieties with tori”, Acta Arith. 133
(2008), p. 309–323.
[14] J.-B. Bost, H. Gillet & C. Soulé – “Heights of projective varieties and positive
Green forms”, J. Amer. Math. Soc. 7 (1994), p. 903–1027.
[15] M. a. Carrizosa – “Petits points et multiplication complexe”, Int. Math. Res. Not.
2009 (2009), p. 3016–3097.
[16] J. W. S. Cassels – An introduction to Diophantine approximation, Cambridge Tracts
in Mathematics and Mathematical Physics, No. 45, Cambridge Univ. Press, New York,
1957.
Philipp Habegger, Department of Mathematics and Computer Science, Spiegelgasse 1, 4051 Basel,
Switzerland • E-mail : philipp.habegger@unibas.ch
par
Gaël Rémond
Résumé. – Nous proposons une présentation unifiée des différents énoncés de minora-
tions de hauteur qui trouvent leur source dans le problème de Lehmer. Elle englobe les
versions sur les tores multiplicatifs, les variétés abéliennes, les variantes dites relatives
ainsi que le problème de Bogomolov effectif. Cette approche suggère une conjecture
dont la formulation est nouvelle même dans le cadre classique des nombres algé-
briques. Nous examinons ensuite comment ces minorations de hauteur s’appliquent
à la conjecture de Zilber-Pink : quitte à retirer un ensembe exceptionnel convenable,
l’intersection considérée vérifie une propriété de Northcott et il suffit donc de borner
la hauteur pour montrer la finitude.
Abstract (Generalizations of the Lehmer problem and applications to the Zilber-Pink conjec-
ture)
After a classical introduction to heights, we discuss various generalisations of
Lehmer’s problem. The framework is that of normalized heights on abelian varieties
and tori. We include the study of obstruction indices, relative at the same time to
an arbitrary ground field and to an algebraic subgroup. We introduce the notion of
a Lehmer group to unify our statements. Usual examples correspond to the trivial
group (classical Lehmer’s problem), the torsion group (relative Lehmer’s problem)
or the whole group of algebraic points (effective Bogomolov’s problem) but we show
that also all finite rank subgroups are of interest, even in the one-dimensional case.
We then discuss the applications of such height lower bounds to the Zilber-Pink
conjecture. We show how all the variants quoted can be used to provide a crucial
step toward the conjecture: once one knows (by other methods) that the height of
the intersection under consideration is bounded, the Lehmer-like bounds allow to get
finiteness.
1. Introduction
Dans un premier temps (partie 2), nous proposons une introduction à la notion de
hauteur. Celle-ci est tout à fait classique et ne prétend à aucune originalité. Le lecteur
ayant déjà manipulé des hauteurs peut la sauter sans remords tandis que le novice
devrait y trouver de quoi suivre le reste du texte (les autres prérequis se limitent, à
quelques exceptions près, à des connaissances de base en géométrie algébrique et sur
les variétés abéliennes).
Ensuite, nous présentons en partie 3 le classique problème de Lehmer sur la hauteur
des nombres algébriques puis toute une famille de généralisations à diverses hauteurs
normalisées. La formulation est nouvelle : basée sur un groupe Γ, elle englobe dans
une seule définition les problèmes de Lehmer en dimension supérieure (où Γ est trivial
ou égal au groupe des points de torsion) ainsi que le problème de Bogomolov effectif
(lorsque Γ est le groupe de tous les points algébriques). Nous montrons aussi que
toute conjecture absolue entraîne automatiquement une version plus fine, relative à
un sous-groupe algébrique (voir théorème 3.7).
Enfin nous examinons (partie 4) comment ces généralisations s’appliquent à la
conjecture de Zilber-Pink (précisément le cas constant sur une variété abélienne ou
un tore). En effet, même si le problème de Lehmer est toujours ouvert sous toutes
ses formes, nous connaissons dans de nombreux cas des versions faibles, généralisant
le théorème de Dobrowolski, quelquefois dites à ε près (ici nous dirons que Γ est un
groupe de Dobrowolski, voir définition 3.1). De plus, comme l’ont constaté les premiers
Bombieri, Masser et Zannier [12] sur les tores, ces versions faibles suffisent pour les
applications à la conjecture de Zilber-Pink. Nous décrivons ceci en deux temps : d’une
part une version Lehmer (Γ de type fini) et d’autre part une version Bogomolov (Γ les
points algébriques) qui débouche sur des énoncés de type Zilber-Pink plus Bogomolov.
Dans les deux cas, ces applications ne donnent que la moitié de la réponse puisque l’on
ne traite que les points de hauteur bornée ; il faut indépendamment montrer que la
hauteur est bornée sur les ensembles considérés, mais ceci fait l’objet du cours de Ph.
Habegger. Les résultats que nous démontrons dans cette partie sont essentiellement
déjà connus mais nous en présentons de nouvelles démonstrations et nous traitons de
la manière la plus proche possible les deux cas abélien et torique.
En appendice, nous avons regroupé quelques énoncés techniques qui servent dans
plusieurs démonstrations des parties 3 et 4, particulièrement au paragraphe c de la
partie 4. En épilogue, nous mentionnons quelques progrès réalisés entre l’écriture de
ce texte et sa publication.
b. Conventions. – Dans la plus grande partie du texte, nous nons placerons dans la
situation suivante.
Dans le cas torique (2), les choix usuels sont Ā = Pn et Ā = (P1 )n . Comme nous
le verrons le choix d’une compactification n’aura pas d’influence sur nos énoncés ;
on peut donc se restreindre à l’un de ces deux exemples. Toutefois nous sommes
amenés dans les preuves à faire des éclatements et donc à faire intervenir d’autres
compactifications.
Le cadre naturel de notre étude est très probablement celui des variétés semi-
abéliennes, englobant (1) et (2), mais, en raison de diverses complications et en l’ab-
sence presque complète de résultats, nous repoussons un (rapide) examen du cas
général à la dernière partie de ce texte.
Afin d’unifier au maximum les cas (1) et (2), nous utilisons toujours une notation
additive sur A. Ainsi dans le cas torique 0 désignera le point (1, . . . , 1) et mx le point
(xm m
1 , . . . , xn ) si x = (x1 , . . . , xn ) et m ∈ Z. De la même façon, nous ne parlerons
pas de sous-variété abélienne dans le cas (1) ou de sous-tore dans le cas (2) mais
uniformément de sous-groupe algébrique connexe ou de sous-variété semi-abélienne.
Nous écrirons aussi souvent s = 2 dans le cas (1) et s = 1 dans le cas (2) de sorte que,
par exemple, A a N s dim A points de N -torsion et la hauteur normalisée est homogène
de degré s sur A. Enfin nous utiliserons la notation g = dim A même si g = n dans le
cas (2).
L’autre convention importante concerne le corps de base : nous travaillerons ma-
joritairement sur une clôture algébrique fixée k̄ de k. Pour cette raison nous nous
autorisons à écrire x ∈ A en lieu et place de x ∈ A(k̄) et, lorsque nous parlons
d’une sous-variété V de A, nous faisons toujours référence à une sous-variété de A
sur k̄ c’est-à-dire précisément un sous-schéma fermé intègre V de Ak̄ = A × Speck̄.
Speck
Lorsque V provient d’un sous-schéma fermé de AL = A × SpecL (notion cruciale
Speck
pour le problème de Lehmer) pour un sous-corps k ⊂ L ⊂ k̄, nous dirons que V est
définie sur L.
Nous supprimons également la référence à k̄ dans les notations suivantes : Γ ⊂ A si-
gnifie Γ ⊂ A(k̄) ; End(A) désigne toujours End(Ak̄ ) et, plus généralement, si A′ est un
autre groupe algébrique commutatif, Hom(A, A′ ) représente le groupe des morphismes
de groupes algébriques Ak̄ → A′k̄ .
Enfin, de par la nature même du problème de Lehmer, le texte regorge de
constantes. Elles dépendent généralement de (A, Ā, L ) et souvent du choix du groupe
Γ considéré mais pas des points ou sous-variétés α, x, V . . . introduits ensuite (ceci
sera précisé à chaque fois). Comme nous ne calculons quasiment aucune de ces
constantes, nous employons souvent la lettre générique c (toujours un réel strictement
positif) pour diverses quantités non significatives. En revanche, les constantes plus
individualisées, comme c0 , cΓ (ε), . . . ne changent pas, elles, de valeur au fil du temps.
2. Hauteur
a. Sur les nombres algébriques. – Nous introduisons la hauteur logarithmique abso-
lue de Weil qui est une fonction h : Q → R+ qui sert à « mesurer » les nombres
algébriques. Elle est très facile à définir sur Q : pour a, b ∈ Z premiers entre eux
avec b 6= 0, on pose
h(a/b) = log max(|a|, |b|).
Nous décrivons maintenant trois façons de définir l’extension à Q de cette fonction.
1. Procédé limite. On définit tout d’abord une hauteur naïve de la façon suivante.
Pd
Si α ∈ Q on note µα = i=0 ai X i son polynôme minimal dans Z[X] (avec ad > 0)
et l’on pose :
1
hnaïve (α) = log max |ai |.
d 0≤i≤d
La hauteur de Weil s’obtient par la formule :
1
h(α) = lim hnaïve (αn ).
n→+∞ n
Il faut bien sûr vérifier que la limite existe (nous le verrons plus bas) ce qui est l’in-
convénient d’utiliser cette approche comme définition. L’avantage est que ce procédé
est celui qui servira dans la suite pour obtenir des hauteurs normalisées plus sophis-
tiquées, comme la hauteur de Néron-Tate. Si l’on admet l’existence de la limite, on
voit immédiatement sur la définition que h(αn ) = nh(α) pour n ∈ N et même, en
utilisant hnaïve (α−1 ) = hnaïve (α), on trouve h(αn ) = |n|h(α) pour n ∈ Z et α 6= 0.
Par suite on note aussi que si α est une racine de l’unité alors h(α) = 0.
2. Mesure de Mahler. La deuxième définition possible, la plus facile à énoncer, se
rattache à la mesure de Mahler. Pour α ∈ Q on utilise son polynôme minimal µα
comme ci-dessus et l’on note α1 , . . . , αd les racines de µα (les conjugués de α). On
pose alors !
Yd
1
h(α) = log ad max(1, |αi |) .
d i=1
Avec cette définition la quantité exp(dh(α)) s’appelle la mesure de Mahler de µα . Par
la formule de Jensen, on trouve aussi :
Z
1 1
h(α) = log |µα (e2iπt )|dt.
d 0
Pd
Si l’on majore dans cette formule |µα (e2iπt )| ≤ i=0 |ai | ≤ (d + 1) max0≤i≤d |ai |,
on trouve h(α) ≤ hnaïve (α) + log(d+1)
d . D’un autre côté, d’après les relations entre
coefficients et racines, on a
X Y
(∗) aj = ad (−αi )
Card(I)=d−j i∈I
En particulier nous avons |h(α) − hnaïve (α)| ≤ log 2, ce qui permet d’affirmer que h
hérite de hnaïve la propriété fondamentale de Northcott : il n’y a qu’un nombre fini de
nombres algébriques de degré et de hauteur bornés. Ceci était clair pour hnaïve puisque
l’on se ramenait à un ensemble fini de polynômes minimaux.
3. Place par place. La définition la plus utile en pratique mais sans doute la moins
parlante des trois utilise la notion de places d’un corps de nombres. Une place v
est une classe d’équivalence de valeurs absolues non triviales sur le corps et ici nous
choisissons toujours comme représentante la valeur absolue qui étend l’une des valeurs
absolues usuelles de Q ce qui peut se traduire par le fait que pour chaque nombre
premier p la quantité |p|v doit prendre l’une des trois valeurs p, 1 ou 1/p. Dans le
premier cas, la valeur absolue est dite archimédienne et la place est dite infinie. Dans
les deux autres cas, la valeur absolue est ultramétrique et la place finie. Si v est une
place d’un corps K, on note Kv le complété de K en v et Qv le complété de Q en la
place de Q induite par v (Qv est R ou un corps p-adique).
Maintenant, si α ∈ Q, on choisit un corps de nombres K qui contient α et l’on
pose
X [Kv : Qv ]
h(α) = log max(1, |α|v )
v
[K : Q]
où la somme parcourt toutes les places de K. On vérifie que la sommation a un sens car
tous les termes sauf un nombre fini sont nuls (si α 6= 0 on a |α|v 6= 1 seulement pour
un nombre fini de places) et les propriétés d’extensions de valeurs absolues montrent
que la formule ne dépend pas du choix du corps K. Il est également clair sur cette
définition que h(αn ) = nh(α) pour n ∈ N.
Vérifions maintenant que les définitions 2 et 3 coï ncident. Tout d’abord si v est
une place ultramétrique d’un corps contenant les αi on constate que
X Y d
Y
max (−αi ) = max(1, |αi |v )
0≤j≤d
Card(I)=d−j i∈I i=1
v
(la majoration ≤ est claire et, dans l’autre sens, l’une des sommes a un unique terme
dominant de valeur absolue le membre de droite). Comme les aj sont premiers entre
eux, (∗) montre que le membre de gauche ci-dessus vaut 1/|ad |v . En utilisant la formule
du produit pour ad on constate alors que la hauteur définie via la mesure de Mahler
s’écrit
d
1 XX
log max(1, |αi |p )
d p i=1
où la première somme porte sur les places de Q et où pour chaque telle place p on a
choisi une extension de |·|p à un corps contenant les αi . Il est alors possible d’identifier
terme à terme cette somme à la définition place par place avec le corps K = Q(α) car
les nombres |αi |p sont exactement les |α|v où v parcourt les places au-dessus de p, à
condition de répéter [Kv : Qv ] fois le nombre |α|v .
Faisons enfin le lien avec la première approche. Comme les deux autres coïncident,
nous savons à la fois que |hnaïve (α) − h(α)| ≤ log 2 et que h(αn ) = nh(α) pour n ∈ N.
Nous en déduisons immédiatement |(1/n)hnaïve (αn ) − h(α)| ≤ (log 2)/n pour n ≥ 1
et ceci prouve bien que la suite hnaïve (αn )/n a une limite qui est h(α). Les trois
approches donnent donc bien la même notion et toutes les propriétés mentionnées
valent donc pour cette unique hauteur de Weil.
Avant de passer à des hauteurs plus sophistiquées sur les variétés et groupes algé-
briques, nous donnons quelques propriétés supplémentaires de la hauteur de Weil. En
premier lieu, nous démontrons le théorème de Kronecker.
×
Lemme 2.1. – Soit α ∈ Q . On a h(α) = 0 si et seulement si α est une racine de
l’unité.
Démonstration. – Un sens a déjà été vu. Supposons ici que h(α) = 0. Alors tous les
nombres αn , n ∈ N, sont de hauteur nulle et de degré inférieur ou égal à celui de α.
Par la propriété de Northcott, il n’y a qu’un nombre fini de tels nombres donc il existe
en particulier des entiers naturels m < n tels que αm = αn . Par suite αn−m = 1.
Toujours à partir de la propriété de Northcott, nous pouvons démontrer une pro-
priété plus forte.
× ×
Lemme 2.2. – La hauteur h : Q → R+ se factorise en une norme Q ⊗Z R → R+ .
Démonstration. – L’inégalité triangulaire résultera de la formule h(αβ) ≤ h(α)+h(β)
pour α, β ∈ Q déduite de la définition 3. Lorsque ξ est une racine de l’unité h(αξ) =
×
h(α) pour tout α ∈ Q. Par suite, h se factorise à travers le quotient de Q par le
×
groupe des racines de l’unité, qui n’est autre que Q ⊗Z Q. L’application obtenue est
×
une norme sur ce Q-espace vectoriel qui s’étend en une semi-norme | · | sur Q ⊗ R
Pn ×
(de manière unique). Si | i=1 αi ⊗ xi | = 0 avec α1 , . . . , αn ∈ Q multiplicativement
indépendants et x1 , . . . , xn ∈ R, considérons pour N ∈ N l’entier Ni ∈ Z le plus
proche de N xi . Il vient
n
! n n
X X 1X
h αi ⊗ Ni ≤ αi ⊗ (Ni − N xi ) ≤ h(αi ).
i=1 i=1
2 i=1
Pn × Qn
Les nombres uN = i=1 αi ⊗ Ni qui s’écrivent dans Q plutôt uN = i=1 αiNi
appartiennent tous au corps de nombres Q(α1 , . . . , αn ) et leur hauteur est bornée in-
dépendamment de N . La propriété de Northcott entraîne la finitude de leur ensemble.
Par construction ceci n’est possible que si les xi sont tous nuls et cela montre bien
que | · | est une norme.
Notons encore ici que si α n’est pas un entier algébrique alors ad ≥ 2 dans les
notations ci-dessus donc, sur la définition 2, on constate h(α) ≥ (log 2)/d. D’un autre
côté, si α est le nombre 21/d de degré d, alors h(α) = (log 2)/d. Le problème de
Lehmer (voir partie suivante) est de savoir s’il existe des nombres de hauteur non
nulle beaucoup plus petite que cela (plus petite que c/d où c est une constante).
pour m < 0. Avec L = O (1, . . . , 1), la hauteur normalisée obtenue sur Gnm est la
somme des hauteurs de Weil des coordonnées. De ce fait, le lemme 2.2 implique
que ĥ L induit une norme sur A(k̄) ⊗ R. Dans certaines situations, nous serons amenés
à nous restreindre à ce cas plus agréable.
Sur une variété semi-abélienne qui n’est ni une variété abélienne ni un tore, la
situation est plus compliquée : les morphismes [m] : A → A (m ≥ 0) s’étendent sur
une compactification équivariante Ā mais il n’y a pas de faisceau ample L sur Ā tel
⊗q
que [m]∗ L soit de la forme L (pour m ≥ 2). Au mieux on peut trouver L ample
⊗m ⊗m2
avec L = L lin ⊗ L quad où [m]∗ L lin ≃ L lin et [m]∗ L quad ≃ L quad pour m ≥ 0. Il faut
donc normaliser séparément les deux hauteurs et poser ĥ L = ĥ L lin + ĥ L quad (voir par
exemple la description de [18]). Ceci est suffisant en général (par exemple pour avoir
ĥ L (x) = 0 ⇐⇒ x ∈ Ators ) mais la hauteur obtenue n’est pas réellement normalisée
1/2
(pour un bon choix de Ā la fonction qui induit une norme est ĥ L lin + ĥ L quad ). Dans
le cas intermédiaire où A est le produit d’un tore A1 et d’une variété abélienne A2
(avec une compactification produit et une polarisation produit), la hauteur n’est pas
normalisée par rapport aux endomorphismes [m]A = [m]A1 × [m]A2 mais elle l’est
relativement aux [m2 ]A1 × [m]A2 pour m ≥ 0
Dans le reste du texte, toutes les hauteurs sont normalisées et sont simplement
notées h.
Conjecture 3.1. – Il existe un réel c > 0 tel que, pour tout nombre algébrique non nul
α qui n’est pas une racine de l’unité, on a [Q(α) : Q]h(α) ≥ c.
Depuis que Lehmer a soulevé la question en 1933 [35], elle résiste à toutes les
attaques, malgré de nombreux travaux. Il n’entre pas dans nos objectifs ici d’en dresser
une liste complète ou même représentative mais nous pouvons citer l’élégant résultat
de Smyth en 1971 [52] : si α est un nombre algébrique non nul non réciproque (ceci
signifie que α−1 ne fait pas partie des conjugués de α) alors [Q(α) : Q]h(α) ≥ [Q(θ) :
Q]h(θ) > 0 où θ est une racine de X 3 − X − 1. Rappelons aussi que, beaucoup plus
élémentairement, on montre [Q(α) : Q]h(α) ≥ log 2 si α n’est pas un entier algébrique.
En vertu de la relation h(α−1 ) = h(α), la même minoration vaut dès que α (non nul)
n’est pas une unité algébrique.
Pour les applications que nous visons, le résultat le plus important dans la direction
de la conjecture 3.1 s’avère être celui de Dobrowolski en 1979 [23].
Théorème 3.2. – Pour tout réel ε > 0, il existe un réel c(ε) > 0 tel que, pour
tout nombre algébrique non nul α qui n’est pas une racine de l’unité, on a
[Q(α) : Q]1+ε h(α) ≥ c(ε).
La forme que nous citons correspond à une version affaiblie de l’énoncé de Dobro-
wolski. La version forte comporte des facteurs logarithmiques : par exemple si α 6∈ Q
n’est pas une racine de l’unité
1
[Q(α) : Q](log[Q(α) : Q])3 h(α) > (log log[Q(α) : Q])3
4
où la valeur explicite de la constante 1/4 est due à Voutier [56]. De la même façon, dans
la suite, lorsque nous donnerons une minoration avec un exposant 1 + ε, il existera en
fait une forme plus précise avec des facteurs logarithmiques ; nous ne nous y attardons
pas car ce raffinement ne modifie pas les applications à la conjecture de Zilber-Pink.
Nous souhaitons maintenant considérer toute une série de généralisations de la
conjecture 3.1, particulièrement lorsqu’un résultat partiel généralisant le théorème 3.2
peut être établi. Pour ce faire, il convient tout d’abord de rattacher la situation de la
conjecture 3.1 au groupe multiplicatif Gm . En effet, nous reconnaissons :
– dans les nombres algébriques non nuls, les points de Gm (Q) ;
– dans les racines de l’unité, les points de torsion de Gm (Q) ;
– dans la hauteur h, une hauteur normalisée sur Gm (Q).
La première étape consiste donc à remplacer Gm par un autre groupe algébrique.
Dans ce cadre, on sait démontrer un analogue satisfaisant du théorème 3.2 pour :
les courbes elliptiques à multiplications complexes (Laurent 1983 [33]), le tore Gnm
(Amoroso-David 1999 [2]), les variétés abéliennes à multiplications complexes (David-
Hindry 2000 [20]). On obtient ensuite de nouvelles variations de la conjecture 3.1 en
substituant au point α de notre groupe algébrique A une sous-variété V de A. Dans
ce cas, selon que l’on mesure le degré de V de façon arithmétique ou géométrique, on
aboutit à un problème de Lehmer pour les variétés (voir Amoroso-David 2001 [3]) ou
au problème de Bogomolov effectif (voir détails plus bas). Une autre direction de gé-
néralisation, particulièrement importante ici, se trouve dans la littérature sous le nom
de problème de Lehmer relatif : il s’agit de remplacer le corps de base par le corps de
rationalité des points de torsion. Dans ce cadre, les résultats suscités de Dobrowolski,
Laurent, Amoroso-David 1999 et David-Hindry se sont vus respectivement généralisés
par Amoroso-Zannier 2000 [7], Ratazzi 2004 [46], Delsinne 2009 [22] et Carrizosa 2009
[17]. Enfin ceci suggère encore de nouvelles extensions que nous introduisons plus bas.
Dans ce texte, plutôt que d’énoncer une liste de résultats, nous avons choisi de
donner une présentation aussi unifiée que possible de toutes les variantes dans une
seule définition. Ainsi, au paragraphe suivant, nous introduisons toutes les notations
nécessaires avant de formuler le problème général puis de revenir aux cas particuliers
correspondant à la description ci-dessus.
b. Groupes de Lehmer. – Nous nous plaçons dans le cadre des notations 1.1 et nous
notons h la hauteur normalisée sur A associée. Rappelons que A remplace A(k̄) ou
Ak̄ dans les notations x ∈ A ou End(A).
Nous considérons un sous-groupe Γ de A et nous lui associons :
Dans ces trois cas, l’on sait démontrer un analogue du théorème 3.2.
Théorème 3.3. – Si A est le tore Gnm ou une variété abélienne à multiplications com-
plexes alors les groupes {0}, Ators et A sont (faiblement) de Dobrowolski.
Démonstration. – Pour le tore voir respectivement [3, 22, 4]. Pour une variété abé-
lienne CM voir [20, 17, 26]. Voir aussi le paragraphe suivant pour l’équivalence entre
notre formalisme et celui de certains de ces articles.
Naturellement, un problème plus réaliste serait de montrer qu’un tel groupe est
de Dobrowolski sous les hypothèses du théorème 3.3. Par exemple, comme cas (très)
particulier apparemment inconnu, ceci contient l’assertion suivante : il existe un réel
c > 0 tel que pour tout n ∈ 2N si x ∈ Qab (21/n )× n’est pas contenu dans le groupe
engendré par 21/n et les racines de l’unité alors h(x) ≥ c (à n fixé ceci découle de [7]).
De cette façon, l’emploi de l’un ou l’autre indice ne change pas nos définitions
(seules les constantes non spécifiées cΓ ou cΓ (ε) peuvent être modifiées). En revanche,
si l’on utilise la majoration triviale
ωL (V ) ≤ (deg L Gal(k̄/L)V )1/(dim A−dim V ) ,
on constate que les énoncés obtenus en remplaçant l’indice d’obstruction par le degré
sont plus faibles.
Voyons maintenant que le fait d’être de Lehmer ou de Dobrowolski ne dépend bien
que du groupe Γ (comme sous-groupe de A) et non des choix de Ā, L ou k faits
pour énoncer la définition. Comme ci-dessus ces choix influent uniquement sur les
constantes, en vertu du fait suivant.
′
Lemme 3.2. – Si deux choix (Ā, L , k) et (Ā′ , L , k ′ ) correspondent au même groupe
algébrique Ak̄ , il existe un réel c > 0 tel que pour toute sous-variété V de A on a
c−1 µess
L
(V ) ≤ µess
L
′ (V ) ≤ cµ
ess
L
(V ) et c−1 ωKΓ , L (V ) ≤ ωKΓ′ , L ′ (V ) ≤ cωKΓ , L (V ).
que les fonctions hauteur normalisée x 7→ h(x) et degré Z 7→ deg L Z sont multi-
pliées par des fonctions bornées (à valeurs dans un invervalle de la forme [c−1 , c]).
′
Dans le cas abélien, comme L et L sont amples sur Ā = Ā′ , il existe un entier
⊗m ′⊗−1 ⊗−1 ′⊗m
naturel non nul m tel que les faisceaux L ⊗ L et L ⊗ L soient en-
gendrés par leurs sections globales. Par suite, des hauteurs quelconques associées à
ces faisceaux sont minorées et les hauteurs normalisées sont donc positives, ce qui
donne m−1 h(x) ≤ h′ (x) ≤ mh(x) pour x ∈ A. De la même façon, cette propriété des
faisceaux entraîne m− dim Z deg L Z ≤ deg L ′ Z ≤ mdim Z deg L Z pour tout Z fermé
équidimensionnel de A. Dans le cas torique, la même idée se complique lorsque les
compactifications Ā et Ā′ diffèrent. On utilise un éclatement commun X, par exemple
l’adhérence du graphe de l’immersion diagonale A → Ā×Ā′ , muni des deux projections
π : X → Ā et π : X → Ā′ qui sont des isomorphismes au-dessus de A. On compare
′
alors les faisceaux π ∗ L et π ′∗ L (non nécessairement amples). Par amplitude de L , il
′⊗−1 ⊗m ′⊗−1 ⊗m
existe m ∈ N\{0} tel que π∗ (π ′∗ L )⊗ L ≃ π∗ (π ′∗ L ⊗π ∗ L ) soit engendré
′∗ ′⊗−1 ∗ ⊗m
par ses sections globales. Posons M = π L ⊗π L . Comme π ∗ π∗ M → M
est un isomorphisme sur l’ouvert A de X, on en déduit que les sections de Γ(X, M )
engendrent M |A . Ceci suffit pour montrer que toute hauteur associée à M est mi-
′ ⊗m · dim Y
norée sur A ainsi que (π ′∗ L )· dim Y · Y ≤ (π ∗ L ) · Y pour tout fermé Y de X
qui rencontre A. On conclut ensuite de même.
In fine nous avons alors ωL (V ′ )1+ε µess (V ′ ) ≥ cΓ (ε) ce qui montre que f (Γ) est de
Dobrowolski.
Remarquons que si Γ est saturé alors f (Γ) ne dépend pas de f . En effet, si f ′ est
une autre isogénie N f ′ (Γ) = f gf ′ (Γ) ⊂ f · EndA · Γ ⊂ f (Γ) donc f ′ (Γ) ⊂ f (Γ)sat =
f (Γsat ) = f (Γ).
Au vu des définitions, on constate immédiatement que, si Γ et Γ′ sont deux sous-
groupes de A tels que Γ ⊂ Γ′ ⊂ Γsat et si Γ′ est de Lehmer ou de Dobrowolski, alors il
en va de même de Γ (car Γ′sat = Γsat et KΓ ⊂ KΓ′ ). En particulier pour démontrer la
conjecture 3.4, on pourrait supposer toujours Γ saturé. De la même façon, les résultats
pour Γ = {0} découlent de ceux pour Γ = Ators et auraient pu être omis de notre
présentation ; toutefois les preuves sont plus simples pour Γ = {0} et il n’est pas exclu
que, de même, la conjecture soit plus abordable dans un premier temps pour certains
−n
groupes non saturés (par exemple dans Gm , le groupe engendré par les 23 plutôt
que son saturé engendré par tous les 21/n ).
Nous utiliserons dans la partie suivante une autre remarque élémentaire : si Γ
est de Dobrowolski alors pour tout ε > 0 on a aussi ωKΓ (V )1+ε µess (V ) ≥ cΓ (ε)
pour tout fermé équidimensionnel V dont au moins une composante est Γ-transverse
(en effet si V1 , . . . , Vs sont les composantes de V alors µess (V ) = max1≤i≤s µess (Vi )
et ωKΓ (Vi ) ≤ ωKΓ (V ) pour 1 ≤ i ≤ s).
Voici à présent la justification de la terminologie de EΓ -torsion.
avons ψ(γ) = −δ et ψ induit une isogénie B ′ → Imψ. Par suite, il existe χ ∈ EndA
envoyant −δ sur un multiple N γ de γ (N ∈ N \ {0}). Ainsi N γ = −χ(δ) ∈ EndA · Γ
et γ ∈ Γsat .
Une variation possible sur les définitions consiste à faire dépendre la hauteur de Γ.
Pour cela, nous posons :
µess ess
Γ (V ) = inf{µ (γ + V ) | γ ∈ Γsat }
Lemme 3.5. – Si Γ est de Dobrowolski et saturé alors pour tout ε > 0 et toute sous-
variété Γ-transverse V on a ωKΓ (V )1+ε µess
Γ (V ) ≥ cΓ (ε).
Dans les trois cas du théorème 3.3, cette propriété est connue même lorsque la variété
abélienne n’est pas à multiplications complexes (dans les deux premiers cas, c’est
le théorème de Zhang, dans le troisième cela découle par exemple des estimations
de [21]). Elle est également vraie pour tout groupe Γ de rang fini saturé comme
conséquence du théorème de Poonen [44].
Terminons par deux énoncés de réduction. Le premier permet de passer des points
aux variétés.
Proposition 3.5. – Soit Γ un sous-groupe de rang fini. On suppose que pour tout ε >
0 il existe un réel c0Γ (ε) > 0 tel que, pour tout point Γ-transverse x ∈ A, on a
ωKΓ (x)1+ε h(x) ≥ c0Γ (ε). Alors Γ est de Dobrowolski.
Cette proposition justifie par exemple d’avoir utilisé dans le théorème 3.3 le résultat
de Carrizosa [17] qui minore seulement la hauteur des points. Elle permet aussi de
réduire à ce cas la conjecture 3.4.
Pour établir cet énoncé, nous passons par un lemme qui sert également à mon-
trer l’équivalence des deux formulations de la conjecture de Zilber-Pink (voir partie
suivante).
Lemme 3.6. – Soit Γ un sous-groupe de rang fini de A. Il existe un groupe algébrique
A′ (qui est un sous-groupe d’une puissance de A) et un point 0-transverse γ ∈ A′
de sorte que, pour g ∈ A, on a g ∈ Γsat si et seulement s’il existe N ∈ N \ {0}
et ϕ ∈ Hom(A′ , A) tels que N g = ϕ(γ).
Démonstration. – Choisissons des éléments γ1 , . . . , γn de Γ dont les images engendrent
le Q-espace vectoriel Γ ⊗ Q et formons le point γ ′ = (γ1 , . . . , γn ) de An . Notons
ξ = (ξ1 , . . . , ξn ) un point de torsion de An et A′ un sous-groupe algébrique connexe
de An tels que γ ′ ∈ ξ + A′ et de sorte que dim A′ soit minimale pour cette pro-
priété. Posons γ = γ ′ − ξ et montrons que ce point convient. Par minimalité de A′ ,
il est 0-transverse
Pn dans A′ . Si g ∈ Γ il existe N ′ ∈ N \ {0} et a′1 , . . . , a′n ∈ Z tels
′ ′
que N g = i=1 ai γi . En Pmultipliant N ′ et les a′i par un entier bien choisi nous
n Pn
pouvons écrire aussi N g = i=1 ai (γi − ξi ). L’application (x1 , . . . , xn ) 7→ i=1 ai xi
décrit un morphisme ψ : An → A et donc ϕ = ψ|A′ vérifie N g = ϕ(γ). Si main-
Pt
tenant g ∈ Γsat nous pouvons écrire M g = j=1 χj (gj ) avec t, M ∈ N \ {0},
χj ∈ End(A) et gj ∈ Γ. Par ce qui précède N gj = ϕj (γ) pour N ∈ N \ {0}
Pt
et ϕj ∈ Hom(A′ , A) donc, avec ϕ = j=1 χj ◦ ϕj , nous avons bien M N g = ϕ(γ).
Pour la réciproque, il suffit de montrer Hom(A′ , A)γ ⊂ Γsat . Or, quitte à multi-
plier par un entier, un morphisme A′ → A s’étend en An → A et l’on a clairement
Hom(An , A) · (γ1 , . . . , γn ) = End(A) · γ1 + · · · + End(A) · γn ⊂ End(A) · Γ ⊂ Γsat .
L’indication sur la forme de A′ sert surtout à préciser sa nature : si A est un tore,
A aussi ; si A est une variété abélienne à multiplications complexes, A′ aussi etc.
′
Corollaire 3.1. – Sous les hypothèses du lemme, une sous-variété V de A est Γ-trans-
verse si et seulement si la sous-variété V × {γ} de A × A′ est 0-transverse.
Démonstration. – Cela résulte de la proposition 4.2 beaucoup plus précise que nous
démontrerons plus bas.
En utilisant le même lemme, nous pouvons aussi ramener le cas des groupes de
rang fini aux points de torsion, mais seulement pour la propriété de Lehmer.
Proposition 3.6. – On suppose que, pour tout sous-groupe algébrique connexe A′′ d’une
puissance de A, le sous-groupe A′′tors de A′′ est de Lehmer. Alors tout sous-groupe de
rang fini de A est de Lehmer.
Démonstration. – Soit Γ un sous-groupe de rang fini non nul de A. Nous lui appli-
quons le lemme 3.6 pour obtenir un couple (A′ , γ). Posons A′′ = A × A′ et choi-
sissons des hauteurs normalisées h′′ = h + h′ . Comme le rang de Γ est non nul,
h′ (γ) 6= 0. Fixons ensuite un point Γ-transverse x ∈ A et Z un fermé équidimen-
sionnel de A défini sur KΓ contenant x et tel que ωKΓ (x) = (deg Z)1/(dim A−dim Z) .
Notons encore Ktors le corps KAtors qui est aussi KA′′tors . D’après le lemme 3.6,
le corps KΓ est contenu dans le corps de rationalité des points de division de γ.
Par conséquent, il existe un entier D ≥ 1 tel que, pour tout multiple entier N
de D et tout γ ′ avec N γ ′ = γ, le fermé Z est défini sur Ktors (γ ′ ). Fixons en-
1/s 1/s
suite un rationnel dans l’intervalle [ 12 hh(x) ′ (γ) , 2 h(x)
h′ (γ) ] que l’on écrit M/N
avec M, N ∈ N et N multiple de D pour assurer la propriété ci-dessus. Soit enfin
x′ ∈ A tel que M x′ = x. Par hypothèse, A′′tors est de Lehmer donc on peut écrire
h′′ (x′ , γ ′ ) ≥ cωKtors (x′ , γ ′ )−1 car (x′ , γ ′ ) est 0-transverse en vertu du corollaire 3.1. Le
choix de M/N montre h′′ (x′ , γ ′ ) = h(x′ )+h′ (γ ′ ) = M −s h(x)+N −s h′ (γ) ≤ 3N −s h′ (γ)
puis cN s ≤ ωKtors (x′ , γ ′ ) en modifiant la valeur de c > 0. Pour évaluer l’indice
d’obstruction, écrivons (x′ , γ ′ ) ∈ [M ]−1 Z × {γ ′ }. Comme ce dernier fermé est dé-
fini sur Ktors (γ ′ ) on a
1
ωKtors (x′ , γ ′ ) ≤ [Ktors (γ ′ ) : Ktors ] deg([M ]−1 Z × {γ ′ }) dim A′′ −dim Z
1
′ dim A′′ −dim Z
≤ N s dim A M s(dim A−dim Z) deg Z
s dim
dim A−dim Z
A′′ −dim Z
s M
≤ N ωKΓ (x) .
N
s
Nous trouvons donc que M N ωKΓ (x) est minoré par une constante et, à nouveau
par le choix de M/N , il en va de même de h(x)ωKΓ (x). En utilisant l’analogue de la
proposition 3.5 où l’on remplace ε par 0, nous avons montré que Γ est de Lehmer.
d. Minoration relative à une variété de Γ-torsion. – En suivant Carrizosa [16, 15, 17],
nous introduisons un indice d’obstruction relatif. Soient pour cela un corps L avec k ⊂
L ⊂ k̄ et H une sous-variété de A définie sur L. Pour V sous-variété de H on pose :
n deg Z 1/(dim H−dim Z)
H L
ωL (V ) = min
deg L H
o
| Z fermé équidimensionnel défini sur L, V ⊂ Z ⊂ H .
Le résultat de Carrizosa est le premier à faire intervenir un tel indice et elle a montré
son utilité pour l’application à la conjecture de Zilber-Pink. L’intérêt est d’obtenir
une minoration du minimum essentiel des variétés V qui ne sont ni Γ-transverse ni
de Γ-torsion en utilisant l’indice relatif à la plus petite sous-variété de Γ-torsion H
contenant V tout en conservant une dépendance explicite et fine en deg H.
Ici nous montrons comme un tel résultat (pour les groupes saturés) se déduit tou-
jours de la propriété plus faible d’être de Dobrowolski. Un énoncé allant dans ce sens,
dans le cas particulier Γ = A et pour A = E g puissance d’une courbe elliptique, se
trouve dans [54] (avec le degré au lieu de l’indice d’obstruction).
Théorème 3.7. – Soit Γ un sous-groupe saturé de Dobrowolski. Pour tout ε > 0 il existe
un réel c′Γ (ε) > 0 tel que si V est une sous-variété de A qui n’est pas de Γ-torsion et
si H est la plus petite sous-variété de Γ-torsion contenant V alors
H
ωKΓ
(V )1+ε (deg H)sε µess (V ) ≥ c′Γ (ε).
Nous commençons par établir un énoncé qui correspond essentiellement à une ver-
sion faible du théorème où la constante dépend de H.
Lemme 3.7. – Soient Γ un sous-groupe de Dobrowolski saturé de A et f : A → A′
un morphisme surjectif de groupes algébriques. Pour tout ε > 0 il existe un réel
cΓ,f (ε) > 0 tel que si V ′ est une sous-variété f (Γ)-transverse de A′ alors
ωKΓ (V ′ )1+ε µess (V ′ ) ≥ cΓ,f (ε).
Le lemme dit en particulier que f (Γ) est de Dobrowolski mais il dit un peu plus
car le corps KΓ peut contenir strictement Kf (Γ) .
Démonstration. – Quitte à remplacer A par un groupe isogène (voir lemme 3.3) on
peut supposer A = A′ × A′′ et que f est la première projection. Le groupe Γ étant sa-
turé, il s’écrit Γ = Γ′ ×Γ′′ avec Γ′ = f (Γ). On associe à V ′ ⊂ A′ la variété V = V ′ ×A′′ .
Si V ⊂ γ+B alors B contient {0}×A′′ donc B = B ′ ×A′′ d’où γ + B = (γ ′ + B ′ ) × A′′
avec γ ′ ∈ Γ′ . Ceci montre que si V ′ est Γ′ -transverse alors V est Γ-transverse. Mainte-
nant, quitte à choisir une compactification produit et une polarisation produit sur A
de sorte que h(x, y) = h′ (x) + h′′ (y), on voit que µess (V ) = µess (V ′ ) car les points de
hauteur nulle sont denses dans A′′ . Soit ensuite Z ′ défini sur KΓ et contenant V ′ tel
′ ′
que ωKΓ (V ′ ) = (deg Z ′ )1/(dim A −dim Z ) . Posons Z = Z ′ × A′′ . On a dim A − dim Z =
dim Z
dim A′ − dim Z ′ puis deg Z = dim Z ′ (deg Z ′ )(deg A′′ ) tandis que Z est défini sur KΓ
et contient V . Par suite, ωKΓ (V ) ≤ (deg Z)1/(dim A−dim Z) ≤ cωKΓ (V ′ ) pour un réel c
indépendant de V . Il vient ωKΓ (V ′ )1+ε µess (V ′ ) ≥ c−1−ε ωKΓ (V )1+ε µess (V ) qui permet
de conclure.
Proposition 3.8. – Pour tout (A, L ) comme précédemment il existe une famille finie
F de morphismes surjectifs f : A → A′ (pour divers A′ ) et un réel c > 0 tels que,
pour tout sous-groupe algébrique connexe B de A, il existe f ∈ F de sorte que f|B
soit une isogénie de degré au moins c deg L B.
Lemme 3.8. – Soit (A, L ) comme précédemment. Il existe un réel λ > 0 tel que pour
tout sous-groupe algébrique connexe B de A on peut trouver un sous-groupe algébrique
connexe B ⊥ de A vérifiant : B + B ⊥ = A, B ∩ B ⊥ fini et, pour tous x ∈ B et y ∈ B ⊥ ,
on a h(x) + h(y) ≤ λh(x + y).
Démonstration. – Dans le cas où A est une variété abélienne, une construction clas-
sique (voir [42, p. 173] ou [9, p. 211]) donne un résultat plus précis : soit ι l’injection
B ֒→ A et φ L : A → Â l’isogénie associée à L ; on pose B ⊥ = Ker0 (ι̂ ◦ φ L ). Soient
encore j : B ⊥ ֒→ A l’inclusion, add : A × A → A l’addition et P le faisceau de Poin-
⊗−1 ⊗−1
caré sur A × Â. On sait [42, p. 78] que (idA × φ L )∗ P ≃ add∗ L ⊗ p∗1 L ⊗ p∗2 L
∗
donc (ι × j)∗ add L ≃ (ι × φ L ◦ j)∗ P ⊗ ι∗ L ⊗ j ∗ L . Par les propriétés de P , on
a (ι × φ L ◦ j)∗ P |{0}×B ⊥ trivial et (ι × φ L ◦ j)∗ P |B×{y} ≃ φ L (y)|B ≃ ι̂ ◦ φ L (y)
trivial pour y ∈ B ⊥ donc (lemme de la balançoire [42, p. 54]) (ι × φ L ◦ j)∗ P est
trivial. Ainsi (ι × j)∗ add∗ L ≃ ι∗ L ⊗ j ∗ L ce qui montre, en passant aux hauteurs
normalisées, h(x + y) = h(x) + h(y) pour (x, y) ∈ B × B ⊥ . Ceci entraîne aussi
engendré par ses sections globales et dans le cas torique qu’elles l’engendrent au-dessus
de A ; il faut auparavant choisir les compactifications pour que f s’étende ; ceci modifie
c sans gravité). Il existe une isogénie ψ : A′ → B telle que ψ◦ϕ = [a] sur B et ϕ◦ψ = [a]
sur A′ . Comme le degré de [a] est abs avec b = dim B, on a deg ψ = abs−1 . Nous posons
W = ψ −1 (V ) qui est un fermé équidimensionnel de A′ . L’idée consiste à appliquer
à W le lemme 3.7. Comme B est la plus petite sous-variété de Γ-torsion contenant V ,
de même A′ est la plus petite sous-variété de f (Γ)-torsion contenant une composante
quelconque de W . Ceci montre que ces composantes sont f (Γ)-transverse. Ensuite,
Nous pouvons sans restriction supposer ε < (s(b − d) − 1)−1 de sorte que l’expres-
sion obtenue est une fonction décroissante de a. Nous pouvons alors remplacer a
par c deg L B ce qui nous donne (en changeant la valeur de c)
ωKΓ (W )1+ε µess (W ) ≤ c−1 (deg L B)sε ωK
B
Γ
(V )1+ε µess (V ).
L’application du lemme 3.7 à W donne bien le théorème.
Ce résultat permet donc d’obtenir des versions améliorées des théorèmes de Del-
sinne [22], Amoroso-David [4] ou Galateau [26]. En fait on a même mieux : si l’on
dispose d’un résultat de la forme ωKΓ (V )(log 3ωKΓ (V ))κ µess (V ) ≥ cΓ pour toute
variété Γ-transverse V alors la démonstration fournit une minoration de la forme
H H
ωK Γ
(V )(log 3(deg H)2 ωKΓ
(V ))κ µess (V ) ≥ c′Γ exactement de la même façon.
Notons aussi (encore plus simplement) que si Γ était supposé de Lehmer dans le
théorème alors on aurait la conclusion avec ε = 0.
Comme Γ n’intervient qu’à travers Γ + Ators dans cet énoncé, il n’y a aucune
restriction à supposer Ators ⊂ Γ. En fait, si Γ est de rang fini, il en va de même
de Γsat donc la véracité de la conjecture pour Γsat en entraîne la véracité pour Γ et
nous pourrions donc supposer tout de suite Γ saturé.
L’ensemble X ∩ Γ + A[dim X+1] étant l’union des intersections X ∩ Γ + B (où B
parcourt l’ensemble des sous-groupes algébriques connexes de A avec dim X +dim B <
dim A), on peut se demander dans un premier temps à quelle condition une telle
intersection individuelle X ∩ Γ + B peut être dense. La réponse est donné par les
théorèmes sur le problème de Mordell-Lang [24, 25, 31, 34, 47, 55, 41]. Notons p : A →
A/B la projection. L’ensemble X∩Γ+B est dense dans X si et seulement si p(X)∩p(Γ)
est dense dans p(X). Le groupe p(Γ) est de rang fini et la variété p(X) est de dimension
≤ dim X < dim A/B. Par suite si p(X) ∩ p(Γ) est dense dans p(X) alors p(X) est
de p(Γ)-torsion (c’est une équivalence si Γ est saturé). Si c’est le cas X ⊂ p−1 (p(X))
et p−1 (p(X)) est de Γ-torsion. Tout ceci montre que si X ∩Γ+B est dense dans X alors
X n’est pas Γ-transverse. Nous pouvons donner un résultat plus précis en introduisant
un ensemble exceptionnel : ZX,Γ est l’ensemble des points x ∈ X pour lesquels il existe
une sous-variété H de Γ-torsion de A telle que
dimx X ∩ H > max(0, dim X + dim H − dim A).
(dim X+1)
Il s’agit de l’ensemble noté ZX,Γ dans [48]. Si Γ = {0} on a ZX,0 = X \ X ta
tandis qu’avec Γ = A on a ZX,A = X \ X oa dans les notations X oa et X ta de
Bombieri-Masser-Zannier [13].
le cas dans [51] pour les courbes où une borne de hauteur est établie dans le cadre
de (3) avant de revenir en (2) pour appliquer un résultat de type Lehmer. Même en
dimension supérieure on peut utiliser ce schéma pour obtenir des résultats partiels.
Les méthodes évoquées dans le cours de Ph. Habegger permettent de montrer :
(a) ZX,A est fermé.
(b) (X \ ZX,A ) ∩ Γ + A[dim X+1] est de hauteur bornée.
Dans le cas torique (a) est dû à Bombieri, Masser et Zannier [13] tandis que (b)
est dû à Habegger si Γ = {0} [29] et à Maurin [38, 39] en général. Dans le cas abélien
(a) et (b) ont été établis par l’auteur de ces lignes [49, 50] (et le théorème d’Habegger
[28] donne une autre démonstration du cas Γ = {0}).
Dans la suite de cette partie, nous examinons comment les minorations de hauteur
étudiées dans la partie précédente permettent d’obtenir des résultats de la forme :
{x ∈ (X \ ZX,A ) ∩ Γ + A[dim X+1] | h(x) ≤ β}
est fini (ou seulement non dense dans X) pour tout β ∈ R. Ceci montre que la
conjecture de Zilber-Pink est vraie pour les X tels que ZX,A 6= X (lorsque l’on
connaît les minorations de hauteurs idoines). L’on sait aussi caractériser les variétés
X remplissant cette condition.
Démonstration. – Pour établir l’énoncé, nous pouvons modifier le couple (Ā, L ) qui
sert à mesurer les degrés (seule la valeur de ρ est affectée). Dans le cas abélien, nous
′
choisissons L de sorte que L = f ∗ L pour une isogénie f : A → A′ vers une variété
′ ′
abélienne polarisée (A , L ) produit de variétés simples (Ai , L i ) deux à deux égales
ou non isogènes et telles que EndAi est un ordre maximal de EndAi ⊗ Q. Dans le cas
torique, nous utilisons ((P1 )n , O (1)) (et f = idA ). Écrivons maintenant H = γ + B
avec γ ∈ Γ et B une sous-variété semi-abélienne de A. Soit B ′ une sous-variété semi-
abélienne telle que B ⊂ B ′ et B ′ /B simple. Si nous appliquons l’hypothèse x ∈ ZX,Γ
à B et B ′ nous trouvons
(
dimx X ∩ H ≤ max(0, dim X + dim B − dim A) = 0
dimx X ∩ (γ + B ′ ) ≤ max(0, dim X + dim B ′ − dim A) < dim(B ′ /B).
Notons π : B ′ → B ′ /B la projection et Y l’union des composantes de X ∩ (γ + B ′ )
contenant x. Nos inégalités montrent que x est un point isolé de Y ∩ (γ + π −1 (0)) ⊂
X ∩ H et π(Y − γ) 6= B ′ /B. Par suite, si C est une courbe de B ′ /B non contenue
dans π(Y − γ), définie sur KΓ (B et B ′ le sont car Ators ⊂ Γ) et contenant 0 alors
V = γ + π −1 (C) est définie sur KΓ , contient H = γ + π −1 (0) et x est isolé dans X ∩ V
car les composantes de cette intersection qui contiennent x sont contenues dans Y ∩
V = Y ∩(γ +π −1 (C ∩π(Y −γ))) donc dans Y ∩(γ +π −1 (0)) où x est isolé. Il reste donc
seulement à choisir B ′ et C pour pouvoir estimer le degré de V comme dans l’énoncé.
Vu le choix de L , ceci peut se faire au but de f (quitte à choisir C comme l’image
réciproque d’une courbe à travers l’isogénie B ′ /B → f (B ′ )/f (B) induite par f ). Nous
Qm
nous autorisons donc à noter encore B l’image de B dans AQ′ = i=1 Ani i où les Ai
m
sont simples deux à deux non isogènes. Nous avons B = i=1 Bi avec Bi ⊂ Ani i
et codimBi = qi dim Ai pour un entier qi . Nous fixons une norme sur EndAi ⊗ R qui
induit une norme sur Hom(Ani , Ai ) ⊗ R ≃ (EndAi ⊗ R)ni . D’après les résultats de [36]
il existe ϕi,1 , . . . , ϕi,qi ∈ Hom(Ani , Ai ), libres sur EndAi , nuls sur Bi tels que
qi
Y
c−1 (deg Bi ) ≤ |ϕi,j |s dim Ai ≤ c(deg Bi ) ;
j=1
nous utilisons ici le lemme de Siegel sur EndAi ⊗Q [36, théorème 3.1], le calcul du degré
de Bi comme hauteur [36, théorème 5.1] ainsi que la dualité [36, théorème 7.1] pour
passer de l’espace des ϕ : Ai → Ani i d’image contenue dans Bi à celui des ϕ : Ani i → Ai
nuls sur Bi ; pour la minoration on emploie [36, proposition 8.2]. Dans le cas torique
(s = m = dim A1 = 1) le même argument vaut avec le lemme de Siegel usuel et
l’expression de deg B comme volume du module des relations de B. Nous supposons
la fonction j 7→ |ϕi,j | croissante pour tout i et nous choisissons i0 tel que la norme
|ϕi0 ,qi0 | soit maximale. Ce choix donne
1−1/codimB
Y Y
|ϕi0 ,qi0 |−s |ϕi,j |s dim Ai ≤ |ϕi,j |s dim Ai ≤ c′ (deg B)1−1/codimH
i,j i,j
P
(on fait usage de max(x1 , . . . , xN ) ≥ (x1 · · · xN )1/N pour N = i qi dim Ai =
codimB). Il va donc nous suffire de majorer deg V par Q un multiple du membre
m
de gauche. Pour cela définissons B ′ ⊂ A′ par B ′ = ′ ′
i=1 Bi avec Bi = Bi
T 0
qi0 −1
si i 6= i0 et Bi′0 = j=1 Kerϕi0 ,j . Ainsi B ⊂ B ′ et le morphisme ϕi0 ,qi0
induit une isogénie α : B ′ /B → Ai0 . Nous pouvons choisir dans Ai0 des courbes
définies sur KΓ , contenant 0, de degré borné et telles qu’aucun fermé strict ne les
contient toutes (si Ai0 est plongé dans Pℓ on le coupe par des variétés linéaires
de dimension ℓ − dim Ai0 + 1). Pour une telle courbe C ′ on pose α−1 (C ′ ) = C
et on évalue deg π −1 (C). Ici π −1 (C) = π −1 α−1 (C ′ ) = p−1 −1 ′ ′
i0 ϕi0 ,qi (C ) ∩ B donc
0
deg π −1 (C) ≤ deg B ′ · deg p−1 −1 ′
i0 ϕi0 ,qi0 (C ). Par les arguments ci-dessus on a
Y
deg B ′ ≤ c|ϕi0 ,qi0 |−s dim Ai0 |ϕi,j |s dim Ai
i,j
Bien entendu, dans l’état actuel des connaissances, ce théorème ne s’applique qu’à
Γ = Ators lorsque A est un tore ou une variété abélienne à mutliplications com-
plexes (d’après les résultats de Delsinne et Carrizosa, voir théorème 3.3). Toutefois la
conclusion est encore valable pour Γ de rang fini quelconque grâce à la bijection du
corollaire 4.1. Avec le résultat de hauteur bornée rappelé plus haut, nous avons donc
la conclusion suivante.
Théorème 4.6. – Si A est de Dobrowolski alors pour tout réel β, toute sous-variété X
de A transverse et de stabilisateur fini, tout sous-groupe Γ de rang fini, il existe ε > 0
tel que
{x ∈ X ∩ C (Γ + A[dim X+1] , ε) | h(x) ≤ β}
n’est pas dense dans X.
Pour démontrer ceci, nous pouvons comme plus haut changer de compactification.
Dans le cas torique, nous choisissons Ā = (P1 )n . Nous posons |x| = h(x)1/s pour x ∈ A
(rappelons que s = 1 si A est un tore et s = 2 sinon). De cette façon, | · | induit une
norme sur A(k̄) ⊗ R. De plus nous choisissons une norme sur End(A) ⊗ R liée à la
précédente par la propriété |ϕ(x)| ≤ |ϕ||x| pour tous x ∈ A et ϕ ∈ End(A). D’après
l’appendice, un couple (c0 , B) et une notion de projecteur normalisé sont associés à
cette norme. Nous utilisons de manière cruciale ces outils dans les preuves qui suivent.
Voyons maintenant que nous pouvons approcher efficacement nos projecteurs nor-
malisés par un ensemble fini.
Lemme 4.3. – Il existe un réel c > 0 tel que, pour tout réel Q ≥ c, il existe un en-
semble fini de projecteurs 2-normalisés EQ tel que si ψ ∈ EQ alors Q < a(ψ) ≤ 2Q
et, pour tout projecteur normalisé ϕ, il existe ψ ∈ EQ de même rang que ϕ avec
|ϕ/a(ϕ) − ψ/a(ψ)| ≤ c/a(ψ).
Proposition 4.7. – Soient Γ un groupe de rang fini et d, D des entiers avec 0 < d <
g = dim A et D ≥ 1. Dans la liste suivante, chaque assertion entraîne la précédente.
(1) Pour tout β1 ∈ R il existe ε1 > 0 tel que si X1 ∈ X d,D alors F1 = {x1 ∈
X1 ∩ C (Γ + A[d+1] , ε1 ) | |x1 | ≤ β1 } n’est pas dense dans X1 .
(2) Pour tout β2 ∈ R il existe ε2 > 0 tel que si X2 ∈ X d,D alors l’ensemble F2 des
x2 ∈ X2 qui s’écrivent x2 = γ2 + P2 + z2 avec γ2 ∈ Γsat , P2 ∈ A[d+1] , z2 ∈ A
et |γ2 | ≤ β2 , |P2 | ≤ β2 , |z2 | ≤ ε2 n’est pas dense dans X2 .
(3) Pour tout β3 ∈ R il existe ε3 > 0 tel que si X3 ∈ X d,D alors l’ensemble F3 des
x3 ∈ X3 qui s’écrivent x3 = P3 + z3 avec P3 ∈ A[d+1] , z3 ∈ A et |P3 | ≤ β3 ,
|z3 | ≤ ε3 n’est pas dense dans X3 .
(4) Pour tout β4 ∈ R il existe ε4 > 0 tel que si X4 ∈ X d,D alors l’ensemble F4 des
x4 ∈ X4 pour lesquels |x4 | ≤ β4 et il existe ϕ4 ∈ P d avec |ϕ(x4 )| ≤ |ϕ4 |ε4 n’est
pas dense dans X4 .
(2)
(5) Il existe ε5 > 0 tel que pour tous X5 ∈ X d,D et ϕ5 ∈ P d on ait
µess ((id + ϕ5 )(X5 )) ≥ a(ϕ5 )1/g ε5 .
il existe ϕ4 ∈ P d avec |ϕ4 (x4 )| ≤ |ϕ4 |ε4 . Par le lemme 4.3, il existe ϕ5 ∈ EQ
(2)
avec ϕ5 ∈ P d et |ϕ5 /a(ϕ5 ) − ϕ4 /a(ϕ4 )| ≤ c/a(ϕ5 ). Alors
ϕ5 ϕ4 ϕ4 (x4 )
|x4 + ϕ5 (x4 )| ≤ |x4 | + a(ϕ5 ) − (x4 ) +
a(ϕ5 ) a(ϕ4 ) a(ϕ4 )
|ϕ4 |
≤ |x4 | + c|x4 | + a(ϕ5 ) ε4
a(ϕ4 )
≤ (c + 1)β4 + 2c0 Qε4 ≤ Q1/2g ε5 .
Par suite h((id + ϕ5 )(x4 )) ≤ Q1/g ε5 < µess ((id + ϕ5 )(X5 )). Comme id + ϕ5 est une
isogénie (on a (id + ϕ5 ) ◦ ([a(ϕ5 ) + 1] − ϕ5 ) = [a(ϕ5 ) + 1]), on en déduit que x4
appartient à un fermé strict de X4 dépendant de ϕ5 . La conclusion découle ensuite
de la finitude de EQ .
Il nous suffit donc maintenant de démontrer l’assertion (5) puisque (1) entraîne le
théorème. Nous allons même établir un énoncé un peu plus fort dans la mesure où
(1) montre que le ε du théorème ne dépend de X que par son degré (mais il dépend
de β).
Proposition 4.8. – Si A est de Dobrowolski, il existe un réel c > 0 tel que pour toute
sous-variété X de A transverse de stabilisateur fini et tout projecteur 2-normalisé ϕ
de rang au moins dim X + 1 on a
µess ((id + ϕ)(X)) ≥ c(deg X)−g a(ϕ)1/g .
s −(1+ε)/(g−d) s N
≥ cA (ε)(a + 1) (deg Y ) ≥ cA (ε)(a + 1) .
deg Z
Comme Z = ([a + 1] − ϕ)−1 (id + ϕ)−1 (id + ϕ)(X) = ([a + 1] − ϕ)−1 (X + Ker(id + ϕ))
le nombre N est supérieur au nombre de composantes de X + Ker(id + ϕ) qui vaut
Ker(id + ϕ) CardKer(id + ϕ) (a + 1)srgϕ
Card ≥ ≥ .
Stab(X) ∩ Ker(id + ϕ) CardStab(X) (deg X)d+1
Ici la majoration
T du dénominateur résulte de l’inégalité de Bézout (en écrivant
Stab(X) = x∈X X − x) tandis qu’au numérateur nous avons CardKer(id + ϕ) =
(a+1)srgϕ car Ker(id+ϕ) = Ker[a+1]∩Imϕ (on utilise ϕ(x) = −x =⇒ x ∈ Imϕ et x ∈
Imϕ =⇒ ϕ(x) = ax). D’un autre côté nous avons deg Z = (a+1)s(g−d) deg(id+ϕ)(X)
et deg(id + ϕ)(X) ≤ c′ (a + 1)sd deg X (ce degré est majoré par un multiple
de |id + ϕ|sd deg X par le lemme 6.2 et |id + ϕ| ≤ |id| + 2c0 a). En combinant nous
avons
deg Z
≤ c′ (a + 1)s(g−rgϕ) (deg X)d+2 ≤ c′ (a + 1)s(g−d−1) (deg X)g .
N
Par suite
1+ε g
µess ((id + ϕ)(X)) ≥ c (ε)c′− g−d (deg X)− g−d (1+ε) (a + 1)s(1−(1+ε)(1− g−d ))
1
A
Théorème 4.9. – Si A est de Dobrowolski alors, pour tout réel β et toute sous-variété
X de A de stabilisateur fini et 0-transverse, il existe ε > 0 tel que
{x ∈ X ∩ Aε[dim X+1] | h(x) ≤ β}
n’est pas dense dans X.
5. Variétés semi-abéliennes
Dans cette dernière partie, nous évoquons brièvement les problèmes qui se posent
pour étendre ce qui précède aux variétés semi-abéliennes. Si l’on résume notre dé-
marche en 3 étapes :
(1) montrer un résultat de hauteur bornée (voir la fin du paragraphe a de la partie 4
et les notes de Ph. Habegger) ;
(2) montrer que Ators ou A est de Dobrowolski ;
(3) déduire de (2) un résultat de non-densité des points de hauteur bornée (voir
théorèmes 4.4 et 4.6) ;
aucune de ces étapes n’est connue à ce jour dans le cas général des variétés
semi-abéliennes. Nous ne traitons pas ici de (1). L’extension de (3) en suivant les
démonstrations faites dans la partie précédente se heurte surtout au fait que l’on
utilise fréquemment le théorème de complète réductibilité qui ne vaut pas dans le
Cette suggestion, peu étayée pour l’instant, est une partie de la motivation de
l’introduction de la notion de groupe de Dobrowolski et de son application à des
groupes de rang fini non nul (comme dans le théorème 4.4). Si la réponse à la question
est positive, la voie serait ouverte aux applications à la conjecture de Zilber-Pink
(modulo les points (1) et (3) ci-dessus).
Pour terminer mentionnons encore que les points déficients sont aussi à la base
d’un contre-exemple de Daniel Bertrand à la conjecture de Manin-Mumford relative
pour les familles de variétés semi-abéliennes (voir [11] ; on pourra consulter également
[10]).
où l’union porte sur les projecteurs normalisés de rang au moins r (on écrit natu-
rellement rgϕ = dim Imϕ ; pour la notation A[r] voir le début de la partie 4). Cette
formule explique (en partie) l’utilité de cette notion pour la conjecture de Zilber-Pink.
Nous définissons aussi (pour un usage plus technique, voir paragraphe c de la
partie 4) une notion de projecteur 2-normalisé en remplaçant simplement dans la
définition |ϕ| ≤ c0 a par |ϕ| ≤ 2c0 a. Nous utilisons également la notation a(ϕ) dans ce
contexte.
Nous établissons maintenant la proposition 6.1 comme cas particulier (A′ = A) de
l’énoncé plus général suivant.
Proposition 6.2. – Soient A′ une sous-variété semi-abélienne de A et | · | une norme
sur End(A′ ) ⊗ R. Il existe un réel c0 ≥ 1 et une famille finie B de sous-variétés semi-
abéliennes de A′ tels que, pour toute sous-variété semi-abélienne B de A vérifiant
B + A′ = A, il existe a ∈ N \ {0} et ϕ ∈ Hom(A, A′ ) avec
ϕ|A′ ◦ ϕ = aϕ, |ϕ|A′ | ≤ c0 a, Imϕ ∈ B et Ker0 ϕ = B.
Démonstration. – Choisissons B1 , . . . , Bt des sous-variétés semi-abéliennes simples
de A′ telles que l’addition induise une isogénie B1 × · · · × Bt → A′ . Définissons
B comme l’ensemble de toutes les sommes d’un nombre quelconque de Bi . Véri-
fions d’abord que pour B comme dans l’énoncé il existe B ′ ∈ B avec A = B + B ′
et B ∩ B ′ fini. Prenons pour cela un élément B ′ ∈ B tel que A = B + B ′ et minimal
pour cette propriété. Il en existe car A = B + A′ . Écrivons B ′ = Bi1 + · · · + Bik
et B̃j = B + Bi1 + · · · + Bij pour 0 ≤ j ≤ k. Si la suite des B̃j n’est pas strictement
croissante, disons B̃j−1 = B̃j alors A = B + Bi1 + · · · + Bij−1 + Bij+1 + · · · + Bik
contredisant la minimalité de B ′ . Ainsi B̃j−1 6= B̃j et par suite B̃j /B̃j−1 est isogène
à Bij par simplicité. Ceci entraîne dim B + B ′ = dim B + dim B ′ et donc B ∩ B ′ fini.
π
Si nous disposons d’un tel B ′ l’application composée B ′ ֒→ A−→A/B est une
isogénie χ de degré Card(B ∩ B ′ ) donc il existe une isogénie χ′ : A/B → B ′ telle
que χ ◦ χ′ = [Card(B ∩ B ′ )]. Posons a = Card(B ∩ B ′ ) et ϕ = (B ′ ֒→ A′ ) ◦ χ′ ◦ π. Nous
avons Imϕ = B ′ ∈ B et Ker0 ϕ = B tandis que ϕ|A′ ◦ ϕ = (B ′ ֒→ A′ ) ◦ χ′ ◦ π ◦ (A′ ֒→
A) ◦ (B ′ ֒→ A′ ) ◦ χ′ ◦ π = (B ′ ֒→ A′ ) ◦ χ′ ◦ χ ◦ χ′ ◦ π = aϕ. Pour établir la proposition, il
reste à choisir B ′ de sorte que |ϕ|A | soit majoré par un multiple de a. Nous imposons
pour cela que Card(B ∩ B ′ ) soit maximal. Si B ′′ ∈ B est tel que B ∩ B ′′ est fini alors
′
deg(ϕ|B ′′ ) = Card(B ′′ ∩ π −1 (Kerχ′ )) ≤ deg χP ′
card(B ∩ B ′′ ) ≤ adim B . Par ailleurs
pour 1 ≤ i ≤ t, le choix d’une isogénie A/ j6=i Bj → Bi donne une surjection
πi : A → Bi telle que πi|Bj = 0 si i 6= j et l’on peut imposer également que πi|Bi soit
la multiplication par un P entier, disons a′ , que l’on peut même prendre P indépendant
de i. Maintenant si B = i∈I Bi on considère j ∈ I et k 6∈ I et B ′′ = i∈I∪{k}\{j} Bi .
′
Q
Comme χ′ ◦ π|B ′ = [a] on a πℓ ◦ ϕ|B ′ = [aa′ δi,ℓ ] si i ∈ I. Par suite ( i∈I πi ) ◦ ϕ|B ′′
Q
composée avec l’isogénie i∈I∪{k}\{j} Bi → B ′′ est le produit de l’endomorphisme
Q Q
[aa′ ] de i∈I\{j} Bi par un morphisme Bk → i∈I Bi déduit de ϕ|Bk . Le degré de ce
′
produit est donc (aa′ )s(dim B −dim Bj ) deg(πj ◦ ϕ|Bk ) et ceci montre deg(πj ◦ ϕ|Bk ) ≤
′
cas(dim Bj −dim B ) deg(ϕ|B ′′ ) pour un réel c indépendant de B. Si dim Bj 6= dim Bk
alors πj ◦ ϕ|Bk = 0 donc on a dans tous les cas deg(πj ◦ ϕ|Bk ) ≤ cas dim Bk . Comme
les éléments non nuls de Hom(Bk , Bj ) sont des isogénies on a |πj ◦ ϕ|Bk | ≤ deg(πj ◦
ϕ|Bk )1/s dim Bk pour un choix idoine de norme sur Hom(Bk , Bj )⊗R. Enfin l’application
Q
linéaire Hom(A′ , B ′ ) → j∈I, 1≤k≤t Hom(Bk , Bj ), ψ 7→ (πj ◦ ψ|Bk )j,k est injective
P
donc |ψ| ≤ c j∈I, 1≤k≤t |πj ◦ψ|Bk |. En appliquant ceci à ψ = ϕ|A′ il vient |ϕ|A′ | ≤ c0 a
car |πj ◦ ϕ|Bk | ≤ ca si k 6∈ I par ce qui précède et πj ◦ ϕ|Bk = [aa′ δj,k ] si k ∈ I (pour
une version de cette démonstration dans le cas des tores voir [39, prop. 7.1]).
Nous terminons par deux lemmes qui ne concernent pas uniquement les projecteurs
normalisés mais contrôlent le degré de variétés associées à un endomorphisme ϕ en
termes de sa norme.
Lemme 6.1. – Il existe c > 0 tel que si ϕ ∈ EndA on a deg(Kerϕ) ≤ c|ϕ|s dim Imϕ .
Alors, si ϕ correspond à une matrice (mij ), le fermé Kerϕ est défini par les équations
n
Y n
Y
max(0,mij ) max(0,−mij )
Xj = Xj
j=0 j=0
Pn
en posant mi0 = − j=1 mij . Ces équations sont toutes de degré au plus c|ϕ| donc
d’après le théorème de Bézout le fermé équidimensionnel Kerϕ vérifie deg(Kerϕ) ≤
(c|ϕ|)scodimKerϕ = (c|ϕ|)s dim Imϕ .
Lemme 6.2. – Il existe c > 0 tel que si X est une sous-variété de A et ϕ ∈ EndA une
isogénie alors deg ϕ(X) ≤ c|ϕ|s dim X deg X.
Démonstration. – Étant donné ϕ ∈ End(A) notons α(ϕ) le plus petit entier naturel
tel qu’il existe une compactification π : Āϕ → Ā de A et une extension ϕ̄ : Āϕ → Ā
⊗−1 ⊗α(ϕ)
de ϕ telles que ϕ̄∗ L ⊗ π∗ L est engendré sur A par ses sections globales
sur Āϕ (pour vérifier l’existence d’un tel entier voir démonstration du lemme 3.2).
Notons aussi X̄ et X̄ϕ l’adhérence de X dans Ā et Āϕ . Lorsque ϕ est une isogénie,
on a les majorations
· dim X · dim X
deg ϕ(X) = L · ϕ(X) = L · ϕ̄(X̄ϕ ) ≤ (ϕ̄∗ L )· dim X · X̄ϕ
⊗α(ϕ) · dim X · dim X
≤ (π ∗ L ) · X̄ϕ = (α(ϕ)dim X ) L · X̄ = α(ϕ)dim X deg X.
Par conséquent, pour établir le lemme, il nous suffit de montrer que α(ϕ) est majoré
par un multiple de |ϕ|s . Pour ceci, nous pouvons même choisir un couple particulier
(Ā, L ) : dans le cas torique nous nous limitons à Ā = (P1 )n et dans le cas abélien nous
imposons que L soit engendré par ses sections globales. Nous avons alors pour m ∈ Z
⊗|m|s
et ϕ ∈ End(A) l’estimation α(mϕ) ≤ |m|s α(ϕ) d’après [m]∗ L ≃ L . Voyons
ensuite α(ϕ + ψ) ≤ s(α(ϕ) + α(ψ)) pour ϕ, ψ ∈ EndA. Ceci donnera le résultat
Pt
car, en fixant une base ϕ1 , . . . , ϕt de EndA, ces relations entraînent α( i=1 mi ϕi ) ≤
P t P t
st−1 i=1 msi α(ϕi ) ≤ c| i=1 mi ϕi |s pour tous m1 , . . . , mt ∈ Z. Dans le cas abélien,
la majoration de α(ϕ + ψ) découle du théorème du cube ([42, page 59] avec f = ϕ,
⊗−1
g = ψ = −h et L symétrique) : (ϕ + ψ)∗ L ⊗ [ϕ∗ L ⊗ ψ ∗ L ]⊗2 ≃ (ϕ − ψ)∗ L
est engendré par ses sections globales. Dans le cas torique, en écrivant ϕ + ψ =
add ◦ (ϕ, ψ), il suffit de montrer que, sur une compactification convenable G de A × A
au-dessus de Ā × Ā avec une extension add : G → A de add : A × A → A, le faisceau
∗ ⊗−1
add L ⊗ p∗1 L ⊗ p∗2 L est engendré sur A × A par ses sections globales sur G. Par
produit, il suffit même de faire ceci pour A = Gm , Ā = P1 , L = O (1). On choisit alors
pour G l’adhérence dans (P1 )3 du graphe de add : G2m → Gm . Le faisceau en question
est la restriction à G de O (1, 1 − 1) et il possède une section globale σ qui l’engendre
au-dessus de G2m : en coordonnées ((X0 : X1 ), (Y0 : Y1 ), (Z0 : Z1 )) de (P1 )3 , le fermé
G est défini par X0 Y0 Z1 = X1 Y1 Z0 et σ est obtenue en recollant X1 Y1 /Z1 et X0 Y0 /Z0 .
Pour une variante de cet argument voir [39, lemmes 4.1 et 4.2].
7. Développements récents
Nous mentionnons brièvement ici quelques progrès autour des conjectures étudiées
ci-dessous qui sont intervenus depuis l’écriture de ce texte en 2011.
Dans la direction de la conjecture 3.4, Amoroso [1] a montré que, pour le groupe
−n
Γ engendré par les nombres 23 (n ≥ 1) et leurs conjugués, un élément de KΓ× qui
n’est pas dans Γsat est de hauteur au moins log(3/2)/18. Il s’agit du cas de degré 1
de la conjecture (pour un groupe particulier). D’autre part, Pottmeyer (non publié)
×
a démontré que si Γ est un sous-groupe saturé de rang fini de Q alors KΓ× /Γ est un
groupe abélien libre : ceci va aussi dans le sens de la conjecture puisque ce serait une
conséquence d’une minoration de la hauteur sur KΓ× \ Γ.
En ce qui concerne la conjecture de Zilber-Pink, un résultat d’Habegger et Pila [30]
permet de remplacer les arguments de minorations de hauteurs par des résultats de
o-minimalité. Par conséquents les corollaires 4.2 et 4.3 deviennent inconditionnels :
si ZX,A 6= X alors la conjecture de Zilber-Pink vaut pour X et pour tout groupe Γ
de rang fini. En particulier, la conjecture 4.1 vaut pour les courbes (dim X = 1).
Références
[1] F. Amoroso – « On a conjecture of G. Rémond », Ann. Sc. Norm. Super. Pisa Cl.
Sci. 15 (2016), p. 599–608.
[2] F. Amoroso & S. David – « Le problème de Lehmer en dimension supérieure »,
J. reine angew. Math. 513 (1999), p. 145–179.
[3] , « Densité des points à coordonnées multiplicativement indépendantes », Ra-
manujan J. 5 (2001), p. 237–246.
[4] , « Minoration de la hauteur normalisée dans un tore », J. Inst. Math. Jussieu
2 (2003), p. 335–381.
[5] F. Amoroso & E. Viada – « Small points on subvarieties of a torus », Duke Math. J.
150 (2009), p. 407–442.
[6] , « Small points on rational subvarieties of tori », Comment. Math. Helv. 87
(2012), p. 355–383.
[7] F. Amoroso & U. Zannier – « A relative Dobrowolski lower bound over abelian
extensions », Ann. Scuola Norm. Sup. Pisa Cl. Sci. 29 (2000), p. 711–727.
[8] D. Bertrand – « Minimal heights and polarizations on group varieties », Duke Math.
J. 80 (1995), p. 223–250.
[9] , « Duality on tori and multiplicative dependence relations », J. Austral. Math.
Soc. Ser. A 62 (1997), p. 198–216.
[10] , « Unlikely intersections in Poincaré biextensions over elliptic schemes », Notre
Dame J. Form. Log. 54 (2013), p. 365–375.
[11] , « Special points and poincaré bi-extensions », prépublication arXiv:1104.5178,
with an appendix by Bas Edixhoven.
[12] E. Bombieri, D. W. Masser & U. Zannier – « Intersecting a curve with algebraic
subgroups of multiplicative groups », Int. Math. Res. Not. 1999 (1999), p. 1119–1140.
[56] P. Voutier – « An effective lower bound for the height of algebraic numbers », Acta
Arith. 74 (1996), p. 81–95.
[57] B. Zilber – « Exponential sums equations and the Schanuel conjecture », J. London
Math. Soc. 65 (2002), p. 27–44.
Gaël Rémond, Institut Fourier, UMR 5582, CS 40700, 38058 Grenoble Cedex 9, France
E-mail : Gael.Remond@univ-grenoble-alpes.fr
2016
50. A. NOVOTNÝ, R. DANCHIN, M. PEREPELITSA, edited by D. BRESCH – Topics on
Compressible Navier-Stokes Equations
49. T. SAITO, L. CLOZEL, J. WILDESHAUS – Autour des motifs. École d’été franco-asiatique
de géométrie algébrique et de théorie de nombres
48. T. T. Q. LÊ, C. LESCOP, R. LIPSHITZ, P. TURNER – Lectures on quantum topology in
dimension three
2015
47. M. DEMAZURE, B. EDIXHOVEN, P. GILLE, W. VAN DER KALLEN, T.-Y. LEE,
S. P. LEHALLEUR, M. ROMAGNY, J. TONG, J.-K. YU – B. EDIXHOVEN, P. GILLE,
G. PRASAD, P. POLO, eds. – Autour des schémas en groupes, École d’été « Schémas en
groupes », Volume III
46. B. CALMÈS, P.-H. CHAUDOUARD, B. CONRAD, C. DEMARCHE, J. FASEL – B. EDIX-
HOVEN, P. GILLE, G. PRASAD, P. POLO, eds. – Autour des schémas en groupes, École d’été
« Schémas en groupes », Volume II
45. B. DE TILIÈRE, P. FERRARI – C. BOUTILLIER, N. ENRIQUEZ, eds. – Dimer Models and
Random Tilings
44. L. BORCEA, H. KANG, H. LIU, G. UHLMANN – H. AMMARI, J. GARNIER, eds. – Inverse
Problems and Imaging
2014
42–43. S. BROCHARD, B. CONRAD, J. OESTERLÉ – Autour des schémas en groupes, École d’été
« Schémas en groupes », Volume I
2013
41. M. LEVINE, J. WILDESHAUS, B. KAHN – Asian-French summer school on algebraic geometry
and number theory
39–40. P. DEGOND, V. GRANDGIRARD, Y. SARAZIN, S. C. JARDIN, C. VILLANI – N. CROU-
SEILLES, H. GUILLARD, B. NKONGA, E. SONNENDRÜCKER, eds. – Numerical models
for fusion
2012
38. V. BANICA, L. VEGA, C. BARDOS, D. LANNES, J. EGGERS, M. A. FONTELOS,
A. MELLET, Y. POMEAU, M. LE BERRE – C. JOSSERAND, L. SAINT-RAYMOND, eds. –
Singularities in mechanics : formation, propagation and microscopic description
37. D. CHAFAÏ, O. GUÉDON, G. LECUÉ, A. PAJOR – Interactions between compressed sensing
random matrices and high dimensional geometry
36. K. BELABAS, H. W. LENSTRA JR., P. GAUDRY, M. STOLL, M. WATKINS, W. MCCAL-
LUM, B. POONEN, F. BEUKERS, S. SIKSEK – Explicit methods in number theory rational
points and Diophantine equations
2011
34-35. M. BRUNELLA, S. DUMITRESCU, P. EYSSIDIEUX, A. GLUTSYUK, L. MEERSSEMAN,
M. NICOLAU. S. DUMITRESCU, ed. – Complex manifolds, foliations and uniformization
33. V. P. KOSTOV – Topics on hyperbolic polynomials in one variable
2010
32. J. BARRAL, J. BERESTYCKI, J. BERTOIN, A. H. FAN, B. HAAS, S. JAFFARD,
G. MIERMONT, J. PEYRIÈRE – Quelques interactions entre analyse, probabilités et fractals
31. L. BONAVERO, B. HASSETT, J. M. STARR, O. WITTENBERG – Variétés rationnellement
connexes : aspects géométriques et arithmétiques
30. S. CANTAT, A. CHAMBERT-LOIR, V. GUEDJ – Quelques aspects des systèmes dynamiques
polynomiaux
2009
29. M. KIM, R. SUJATHA, L. LAFFORGUE, A. GENESTIER, NGÔ B. C. – École d’été franco-
asiatique de géométrie algébrique et de théorie des nombres
28. C. BERTHON, C. BUET, J.-F. COULOMBEL, B. DESPRÈS, J. DUBOIS, T. GOUDON,
J. E. MOREL, R. TURPAULT – Mathematical models and numerical methods for radiative
transfer
2008
27. P.-L. CURIEN, H. HERBELIN, J.-L. KRIVINE, P.-A. MELLIÈS – Interactive Models of
Computation and Program Behaviour
26. Z. DJADLI, C. GUILLARMOU, M. HERZLICH – Opérateurs géométriques, invariants
conformes et variétés asymptotiquement hyperboliques
25. M. DISERTORI, W. KIRSCH, A. KLEIN, F. KLOPP, V. RIVASSEAU – Random Schrödinger
operators
2007
24. M. COSTE, T. FUKUI, K. KURDYKA, C. McCRORY, A. PARUSIŃSKI, L. PAUNESCU –
Arc spaces and additive invariants in Real Algebraic and Analytic Geometry
23. R. CERF – On Cramér’s Theory in infinite dimensions
2006
22. S. VŨ NGO
. C – Systèmes intégrables semi-classiques : du local au global
21. S. CROVISIER, J. FRANKS, J.-M. GAMBAUDO, P. LE CALVEZ – Dynamique des
difféomorphismes conservatifs des surfaces : un point de vue topologique
2005
20. A. CATTANEO, B. KELLER,C. TOROSSIAN, A. BRUGUIÈRES – Déformation, Quantifica-
tion, Théorie de Lie
19. B. MALGRANGE – Systèmes différentiels involutifs
2004
18. G. CHOQUET, P. DE LA HARPE, T. DE PAW, J.-P. KAHANE, H. PAJOT, B. SÉVENNEC –
Autour du centenaire Lebesgue
17. Y. ANDRÉ – Une introduction aux motifs
2003
16. V. FRANJOU, E.M. FRIEDLANDER, T. PIRASHVILI, L. SCHWARTZ – Polynomial
functors, unstable modules and cohomology of finite group schemes
15. M. BOILEAU, S. MAILLOT, J. PORTI – Three-dimensional orbifolds and their geometric
structures
Panoramas et Synthèses
La série Panoramas et Synthèses publie, en In the series Panoramas et Synthèses are
français ou en anglais, des textes de 100 à published texts from 100 to 150 pages, in
150 pages environ faisant le point sur l’é- French or in English, which give an account
tat présent d’un sujet mathématique. Dans of the present state of some mathematical
une présentation soignée, les auteurs s’at- area. The authors aim at explaining the main
tachent à mettre en évidence les difficultés, problems, while giving some flavor of the
à donner un parfum des démonstrations et proofs and an overview of the recent develop-
un aperçu de l’histoire récente du sujet. Les ments of their subject. The texts, which are
textes, destinés à des mathématiciens profes- intended to be read by non-specialists, should
sionnels non spécialistes, doivent être utilis- be accessible to graduate students.
ables par des étudiants de doctorat.