Vous êtes sur la page 1sur 304


P. Habegger, G. Rémond, T. Scanlon,
E. Ullmo, A. Yafaev

Panoramas et Synthèses

Numéro 52


Publié avec le concours du Centre national de la recherche scientifique
Comité de rédaction


Tien-Cuong DINH Hervé PAJOT
Bertrand RÉMY (dir.)

Maison de la SMF AMS
Case 916 - Luminy P.O. Box 6248
13288 Marseille Cedex 9 Providence RI 02940
France USA
smf@smf.univ-mrs.fr www.ams.org

Vente au numéro : 55 e ($ 82)
Des conditions spéciales sont accordées aux membres de la SMF.

Secrétariat : Nathalie Christiaën

Panoramas et Synthèses
Société Mathématique de France
Institut Henri Poincaré, 11, rue Pierre et Marie Curie
75231 Paris Cedex 05, France
Tél : (33) 01 44 27 67 99 • Fax : (33) 01 40 46 90 96
panosmf@ihp.fr • http://smf.emath.fr/

© Société Mathématique de France 2017

Tous droits réservés (article L 122–4 du Code de la propriété intellectuelle). Toute représentation ou
reproduction intégrale ou partielle faite sans le consentement de l’éditeur est illicite. Cette représen-
tation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par
les articles L 335–2 et suivants du CPI.

ISSN 1272-3835
ISBN 978-2-85629-856-5

Directeur de la publication : Stéphane Seuret



P. Habegger, G. Rémond, T. Scanlon, E. Ullmo, A. Yafaev

Société mathématique de France

Publié avec le concours du Centre national de la recherche scientifique
Philipp Habegger
Department of Mathematics and Computer Science, Spiegelgasse 1, 4051 Basel, Switzerland
E-mail : philipp.habegger@unibas.ch

Gaël Rémond
Institut Fourier, UMR 5582, CS 40700, 38058 Grenoble Cedex 9, France
E-mail : Gael.Remond@univ-grenoble-alpes.fr

Thomas Scanlon
Department of Mathematics, University of California, Berkeley, Evans Hall, Berkeley, CA
94720-3840, USA
E-mail : scanlon@math.berkeley.edu

Emmanuel Ullmo
Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures sur Yvette,
E-mail : ullmo@ihes.fr

Andrei Yafaev
University College London Department of Mathematics Gower street WC1E 6BT London
United Kingdom
E-mail : yafaev@math.ucl.ac.uk

Classification mathématique par sujets. (2010) — 03C64, 11G10, 11G15, 11G50, 11J81, 14G35,
14K15, 14G40, 14J20, 14T05, 22E40.
Mots-clés et phrases. — Bornes explicites, conjecture d’André-Oort, conjecture de Manin-
Mumford, conjecture de Zilber-Pink, géométrie diophantienne, géométrie tropicale, hauteurs,
intersections exceptionnelles, multiplication complexe, o-minimalité, problème de Lehmer, sous-
groupe algébrique, sous-variétés de tores algébriques, théorème de Pila-Wilkie, théorie ergodique,
tores, variétés abéliennes, variétés de Shimura.
Keywords and phrases. — Bi-algebraicity, Zilber-Pink conjecture, functional transcendence,
o-minimality, Pila-Wilkie theorem, Shimura varieties, abelian varieties, complex multiplication, al-
gebraic tori, André-Oort conjecture, Manin-Mumford conjecture, Diophantine geometry, heights,
unlikely intersections, ergodic theory, tropical geometry.

P. Habegger, G. Rémond, T. Scanlon, E. Ullmo & A. Yafaev

Résumé. — Suite aux travaux de Faltings et Vojta démontrant les conjectures de

Mordell et Lang sur les variétés abéliennes et à ceux de Raynaud démontrant la
conjecture de Manin-Mumford, de nombreuses nouvelles questions diophantiennes
sont apparues, souvent décrites comme des questions d’intersections exceptionnelles.
L’arithmétique des espaces de modules de variétés abéliennes et plus généralement
des variétés de Shimura a parallèlement fait l’objet de nombreux travaux, dont un
axe est constitué par la conjecture d’André-Oort.
Ces deux thèmes peuvent être placés dans un même cadre – la conjecture de Zilber-
Pink. Ce volume propose une introduction à ces problèmes et aux techniques variées
qui sont employées : géométrie, théorie des hauteurs, groupes réductifs et théorie de
Hodge, variétés de Shimura, théorie des modèles à travers la notion de structures
o-minimales. Il contient les textes correspondant aux cours donnés au CIRM, en mai
2011, par Philipp Habegger, Gaël Rémond, Thomas Scanlon, Emmanuel Ullmo et
Andrei Yafaev et une ample introduction rédigée par E. Ullmo, axée sur la notion de
bi-algébricité, visant à présenter le cadre général.

Abstract. — Around the Zilber-Pink conjecture. Following Faltings and Vojta’s work
proving the Mordell-Lang conjecture for abelian varieties and Raynaud’s work proving
the Manin-Mumford conjecture, many new Diophantine questions appeared, often
described as problems of unlikely intersections. The arithmetic of moduli spaces of
abelian varieties and more generally Shimura varieties has been parallely developed,
around the central André-Oort conjecture.
These two themes can be placed in a common frame - the Zilber-Pink conjecture.
This volume proposes an introduction to these problems and to the various techniques
used : geometry, height theory, reductive groups and Hodge theory, Shimura varieties,
model theory via the notion of o-minimal structure. It contains texts corresponding
to courses presented at CIRM, in May 2011, by Philipp Habegger, Gaël Rémond,
Thomas Scanlon, Emmanuel Ullmo and Andrei Yafaev and an ample introduction by
E. Ullmo, centered on the notion of bi-algebraicity, aiming at a presentation of the
general setting.

Avant-propos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
Foreword . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii

Emmanuel Ullmo — Structures spéciales et problème de Zilber-Pink . . . . . . . 1

1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Une version abstraite de la conjecture de Zilber-Pink . . . . . . . . . . . . . . . . . . 2
3. La conjecture de Zilber-Pink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Références . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

Emmanuel Ullmo — Autour de la conjecture d’André-Oort . . . . . . . . . . . . . . . 31

1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2. La conjecture d’André-Oort pour un produit de courbes modulaires . . . . . 32
3. Variétés de Shimura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4. Théorie ergodique sur les espaces homogènes . . . . . . . . . . . . . . . . . . . . . . . . . 74
5. Equidistribution des sous-variétés spéciales des variétés de Shimura . . . . . . 81
Références . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

Andrei Yafaev — Special points and intersections in Abelian and Shimura

varieties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Acknowledgements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2. Preliminaries on Equidistribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3. Strategy of the proof . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4. The Manin-Mumford conjecture via Galois orbits and Equidistribution . . 93
5. Shimura case : lower bounds for Galois orbits and the alternative . . . . . . . 99
6. The geometric criterion and the end of the proof . . . . . . . . . . . . . . . . . . . . . . 104
7. Choice of a suitable Hecke correspondence . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8. End of the proof : the induction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

Thomas Scanlon — O-minimality as an approach to the André-Oort conjecture 111

1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2. Overview of the Pila-Zannier strategy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

3. O-minimality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4. Pila-Wilkie counting theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5. Applications of the counting theorem to diophantine geometry . . . . . . . . . . 145
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

Philipp Habegger — Effective Height Upper Bounds on Algebraic Tori . . . . 167

0. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
1. A Brief Historical Overview in the Toric Setting . . . . . . . . . . . . . . . . . . . . . . 168
2. An Effective Height Bound . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
3. Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
4. Estimates for Hilbert Functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5. More on Segre and Veronese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
6. Correspondences and Height Inequalities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
7. Degree and Height Upper Bounds for Compactifications . . . . . . . . . . . . . . . 215
8. Tropical Geometry and Degree Lower Bounds . . . . . . . . . . . . . . . . . . . . . . . . 219
9. Generically Bounded Height . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
10. Bounded Height . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
A. The Case of Abelian Varieties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
B. Height Bounds in Shimura Varieties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

Gaël Rémond — Généralisations du problème de Lehmer et applications à la

conjecture de Zilber-Pink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
2. Hauteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
3. Minorations de hauteurs normalisées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
4. Liens avec la conjecture de Zilber-Pink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
5. Variétés semi-abéliennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
6. Appendice : projecteurs normalisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
7. Développements récents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
Références . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281



Structures spéciales et problème de Zilber-Pink

Emmanuel Ullmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Les conjectures de Manin-Mumford, André-Oort ainsi que celle de Zilber-Pink

portent sur des variétés algébriques (tores algébriques, variétés abéliennes ou
semi-abéliennes, variétés de Shimura pures ou mixtes) qui possèdent un sous
ensemble naturel de points spéciaux et de sous-variétés spéciales. Le texte pro-
pose une axiomatisation, dans l’esprit de la théorie des modèles, des variétés
algébriques possédant un ensemble de points spéciaux et de sous-variétés spé-
ciales vérifiant des propriétés naturels en insistant sur les aspects bi-algébriques
de la question. Dans un deuxième temps l’article fait le point sur les résultats
récents sur cet ensemble de conjectures.

Autour de la conjecture d’André-Oort

Emmanuel Ullmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Le texte est la version écrite des exposés donnés par l’auteur au CIRM en mai
2011 sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann gé-
néralisée due à Klingler, Ullmo et Yafaev. Il contient également une introduction
à la théorie des variétés de Shimura.

Points spéciaux et intersections dans les variétés abéliennes et les variétés de Shimura
Andrei Yafaev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

Dans ce texte nous présentons les idées centrales des preuves des conjectures
de Manin-Mumford et d’André-Oort (admettant l’Hypothèse de Riemann Géné-
ralisée) basées sur la combinaison des techniques galoisiennes, géométriques et

O-minimalité comme approche à la conjecture d’André-Oort

Thomas Scanlon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
En utilisant une technique de preuve, suggérée par Zannier et utilisée avec
succès par Pila et Zannier, pour prouver la conjecture de Manin-Mumford sur
les relations algébriques sur les points de torsion d’une variété abélienne, Pila a
présenté une preuve inconditionnelle de la conjecture de André-Oort, lorsque la
variété de Shimura ambiante est un produit de courbes modulaires. Ces résultats
ont ensuite été étendus à d’autres variétés de Shimura et variétés de Shimura
mixtes. Nous exposons ici ces méthodes, en accordant une attention particulière
aux détails du théorème de comptage de Pila et Wilkie.

Bornes effectives pour la hauteur sur les tores algébriques

Philipp Habegger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Soit X une sous-variété fermée, irréductible, définie sur Q, dans le tore algé-
brique Gnm . Nous donnons un survol des majorations de la hauteur d’un point
de X, qui est contenu dans un sous-groupe algébrique de dimension n − dim X.
Les premiers résultats dans cette direction ont été obtenus par Bombieri-Zannier,
dans le cas où X est une hypersurface, et par Bombieri-Masser-Zannier quand
X est une courbe. Les majorations de ce type sont utiles pour résoudre quelques
cas de la conjecture de Zilber-Pink. L’auteur a démontré une borne pour la hau-
teur, quand X est de dimension quelconque, en 2009. Nous explicitons ici une
majoration effective.

Généralisations du problème de Lehmer et applications à la conjecture de Zilber-Pink

Gaël Rémond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
Nous proposons une présentation unifiée des différents énoncés de minorations
de hauteur qui trouvent leur source dans le problème de Lehmer. Elle englobe
les versions sur les tores multiplicatifs, les variétés abéliennes, les variantes dites
relatives ainsi que le problème de Bogomolov effectif. Cette approche suggère une
conjecture dont la formulation est nouvelle même dans le cadre classique des nom-
bres algébriques. Nous examinons ensuite comment ces minorations de hauteur
s’appliquent à la conjecture de Zilber-Pink : quitte à retirer un ensembe exce-
ptionnel convenable, l’intersection considérée vérifie une propriété de Northcott
et il suffit donc de borner la hauteur pour montrer la finitude.



Special structures and Zilber-Pink problem

Emmanuel Ullmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Around the André-Oort conjecture

Emmanuel Ullmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
The text is the written part of the lectures by the author at the CIRM in
May 2011 on the proof of the André-Oort conjecture assuming the generalized
Riemann hypothesis due to Klingler, Ullmo and Yafaev. It also contains an
introduction to the theory of Shimura varieties.

Special points and intersections in Abelian and Shimura varieties

Andrei Yafaev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
In this paper we give an overview of the proofs of the Manin-Mumford and the
André-Oort (assuming the Generalised Riemann Hypothesis) conjectures based
on a combination of Galois-theoretic, Geometric and Ergodic techniques.

O-minimality as an approach to the André-Oort conjecture

Thomas Scanlon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Employing a proof technique suggested by Zannier and first successfully imple-
mented by Pila and Zannier to give a reproof of the Manin-Mumford conjecture
on algebraic relations on torsion points of an abelian variety, Pila presented an
unconditional proof of the André-Oort conjecture when the ambient Shimura
variety is a product of modular curves. In subsequent works, these results have
been extended to some higher dimensional Shimura and mixed Shimura varieties.
With these notes we expose these methods paying special attention to the details
of the Pila-Wilkie counting theorem.

Effective Height Upper Bounds on Algebraic Tori

Philipp Habegger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Let X be an irreducible closed subvariety defined over Q of the algebraic torus
Gnm . We give an overview on what is known on upper bounds for the height when
intersecting X with an algebraic subgroup of Gnm that has dimension n − dim X.
Early general results in this directy were obtained by Bombieri-Zannier if X is a
hypersurface and Bombieri-Masser-Zannier if X is a curve. Such height bounds
are useful in the context of the Zilber-Pink Conjecture. The author proved a
height bound for X of arbitrary dimension in 2009. In this paper we give an
effective and explicit height upper bound.

Generalizations of the Lehmer problem and applications to the Zilber-Pink conjecture

Gaël Rémond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
After a classical introduction to heights, we discuss various generalisations of
Lehmer’s problem. The framework is that of normalized heights on abelian va-
rieties and tori. We include the study of obstruction indices, relative at the same
time to an arbitrary ground field and to an algebraic subgroup. We introduce the
notion of a Lehmer group to unify our statements. Usual examples correspond
to the trivial group (classical Lehmer’s problem), the torsion group (relative Le-
hmer’s problem) or the whole group of algebraic points (effective Bogomolov’s
problem) but we show that also all finite rank subgroups are of interest, even in
the one-dimensional case. We then discuss the applications of such height lower
bounds to the Zilber-Pink conjecture. We show how all the variants quoted can
be used to provide a crucial step toward the conjecture: once one knows (by other
methods) that the height of the intersection under consideration is bounded, the
Lehmer-like bounds allow to get finiteness.



Au cours des dernières années une activité intense s’est développée autour des pro-
priétés arithmétiques et géométriques des sous-variétés spéciales des tores algébriques,
des variétés (semi)-abéliennes et des variétés de Shimura. Dans ce cadre les conjectu-
res de Manin-Mumford et d’André-Oort caractérisent les sous-variétés spéciales par
la densité des points spéciaux.
Boris Zilber et Richard Pink, avec des motivations assez éloignées, ont dégagé l’é-
noncé d’une conjecture « d’intersections atypiques » pour les variétés de Shimura mix-
tes ou les variétés semi-abéliennes qui généralise les conjectures de Manin-Mumford
et d’André-Oort. Les premiers résultats dans la direction de ces énoncés au delà des
questions de type Manin-Mumford ou André-Oort sont dus à Bombieri, Masser et
Zannier. Les textes qui composent cet ouvrage se proposent de faire le point sur les
progrès récents concernant ces questions et de tracer quelques perspectives d’avenir.
Quatre cours ont été présentés aux États de la Recherche au CIRM en mai 2011 sur
ces thématiques. Le premier, donné par Emmanuel Ullmo et Andrei Yafaev, portait
sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann généralisée
(GRH), preuve due à Klingler, Ullmo et Yafaev. Le cours de Thomas Scanlon exposait
l’approche o-minimale initiée par Pila et Zannier pour des preuves inconditionnelles
de Manin-Mumford et de certains cas de la conjecture d’André-Oort. Les cours de
Philipp Habegger et de Gaël Rémond portaient sur le problème de Zilber-Pink pour
les variétés abéliennes et les tores.
Les textes qui composent ce volume suivent en grande partie les présentations
orales. Cependant un texte d’introduction générale au volume, Structures spéciales et
problème de Zilber-Pink écrit par Emmanuel Ullmo ne correspond à aucun exposé. Il
fait le lien entre les différents thèmes de l’ouvrage en cherchant à dégager le cadre
naturel « bi-algébrique » pour les problèmes de type Manin-Mumford, André-Oort
et Zilber-Pink. Un point rapide sur certains progrès importants du sujet, obtenus
principalement via la méthode o-minimale, depuis la session des États de la Recherche
en 2011, est aussi présenté dans ce texte.
Le texte d’Emmanuel Ullmo : Autour de la conjecture d’André-Oort introduit les
outils nécéssaires à la compréhension de la preuve de la conjecture d’André-Oort sous
GRH par la méthode d’Edixhoven-Hindry. On y trouve une présentation de la théorie
des variétés de Shimura qui insiste sur les aspects qui interviennent dans la conjecture

d’André-Oort et une introduction à la théorie ergodique sur les espaces homogènes

dans la lignée des travaux de Ratner, Margulis et Mozes-Shah. La première partie
du texte expose la preuve due à Edixhoven de la conjecture d’André-Oort sous GRH
pour un produit de courbes modulaires.
Le texte compagnon d’Andrei Yafaev : Special points and intersections in abelian
varieties and Shimura varieties décrit les grandes lignes de la preuve, sous GRH, de
la conjecture d’André-Oort pour une variété de Shimura générale. La preuve mélange
des techniques galoisiennes, géométriques et ergodiques.
Le texte de Thomas Scanlon : o-minimality as an approach to the André-Oort
conjecture développe le point de vue o-minimal introduit par Pila et Zannier pour
donner une nouvelle preuve de la conjecture de Manin-Mumford. Ce point de vue
aboutit à des preuves inconditionnelles de certains cas de la conjecture d’André-Oort
et propose une perspective prometteuse pour l’étude de problèmes de type Zilber-Pink.
Une introduction détaillée à la théorie o-minimale qui met l’accent sur le théorème de
comptage de Pila-Wilkie est présentée ainsi que la preuve par Pila de la conjecture
d’André-Oort pour un produit de courbes modulaires par ces méthodes. Le texte se
termine par un point sur la preuve récente de la conjecture d’André-Oort pour l’espace
de modules des variétés abéliennes principalement polarisées suivant la stratégie de
Pila et Zannier.
La contribution de Philipp Habegger : Effective height upper bounds on algebraic
tori commence par un panorama des résultats sur la conjecture de Zilber-Pink sur les
tores depuis les travaux fondateurs de Bombieri, Masser et Zannier puis se concentre
sur l’obtention de bornes supérieures pour la hauteur dans ce cadre. Une version
explicite et nouvelle du théorème de la hauteur bornée pour les tores est énoncée et
prouvée. Deux appendices décrivent les bornes pour les hauteurs qui sont connues
dans le cas des variétés abéliennes et des variétés de Shimura.
Après une introduction générale à la notion de hauteur, le texte de Gaël Rémond :
Généralisations du problème de Lehmer et applications à la conjecture de Zilber-Pink
passe en revue les résultats de minoration de hauteur dans la lignée des problèmes
de Lehmer et de Bogomolov effectif et explique leurs applications à la conjecture de
Zilber-Pink pour les variétés abéliennes et les tores.
Nous espérons que ce panorama sur des questions centrales en géométrie arithmé-
tique aidera le lecteur à se familiariser avec les outils variés de géométrie algébrique,
de théorie des nombres, de théorie de Galois, de théorie ergodique ou de théorie des
modèles et o-minimalité qui se combinent harmonieusement dans les démonstrations
des énoncés autour de Zilber-Pink et que sa lecture contribuera à susciter de l’intérêt
et de nouvelles recherches dans ce sujet en plein développement.



In recent years we have witnessed the development of an intense activity around

arithmetic and geometric properties of special subvarieties of algebraic tori, (semi)-
abelian varieties and Shimura varieties. In this context the Manin-Mumford conjecture
and the André-Oort conjecture characterize special subvarieties by the density of their
special points.
Starting with quite distinct motivations, Boris Zilber and Richard Pink have come
up with a conjecture on “unlikely intersections” for mixed Shimura varieties or semi-
abelian varieties which encompasses both the Manin-Mumford and André-Oort con-
jectures. The first results in the direction of these problems, beyond the questions of
Manin-Mumford or André-Oort type, are due to Bombieri, Masser and Zannier. The
papers of this volume expose the state of the art on the recent progresses towards
these questions and give an overview of future prospects.
Four courses were presented during the conference “États de la Recherche” at
CIRM, Marseille, France, in May 2011 on these topics. The subject of the first course,
by Emmanuel Ullmo and Andrei Yafaev, was the proof of the André-Oort conjecture,
conditional to the generalized Riemann hypothesis (GRH), a proof due to Klingler,
Ullmo and Yafaev. Thomas Scanlon’s course described the o-minimal approach ini-
tiated by Pila and Zannier, giving a new proof of the Manin-Mumford conjecture and
giving unconditional proofs of several cases of the André-Oort conjecture. The cou-
rses given by Philipp Habegger and Gaël Rémond studied the Zilber-Pink problem
for abelian varieties and algebraic tori.
The texts in this volume follow for a large part the oral presentations. However a
general introductory text, Structures spéciales et problème de Zilber-Pink [Special stru-
ctures and the Zilber-Pink problem] written by Emmanuel Ullmo does not correspond
to any course. It provides a link between the different themes of the present volume
emphasizing the natural “bi-algebraic” setting for the Manin-Mumford, André-Oort
and Zilber-Pink problems. A summary of the important advances on the subject,
obtained since the 2011 États de la Recherche conference, mainly via the o-minimal
method, is also presented in this text.
Emmanuel Ullmo’s text : Autour de la conjecture d’André-Oort [Around the André-
Oort conjecture] introduces the tools required to understand the proof of the André-
Oort conjecture, conditional on GRH, by the method of Edixhoven-Hindry. The text

provides a presentation of the theory of Shimura varieties insisting on the aspects

relevant to the André-Oort conjecture; it also provides an introduction to the ergodic
theory on homogeneous spaces in the spirit of the work of Ratner, Margulis and
Mozes-Shah. The first part of the text gives a proof of the André-Oort conjecture
for a product of modular curves; the proof is due to Edixhoven and is conditional on
The companion text of Andrei Yafaev: Special points and intersections in abelian
varieties and Shimura varieties describes the salient points of the proof, conditional
on GRH, of the André-Oort conjecture for a general Shimura variety. The proof uses
Galois, ergodic and geometric techniques.
Thomas Scanlon’s text: O-minimality as an approach to the André-Oort conjecture
develops the o-minimal point of view, as introduced by Pila and Zannier to give a new
proof of the Manin-Mumford conjecture. This approach leads to unconditional proofs
of several cases of the André-Oort conjecture and suggests a promising perspective to
study Zilber-Pink type problems. The detailed introduction to the o-minimal theory
emphasizes the Pila-Wilkie counting theorem and also presents Pila’s proof of the
André-Oort conjecture for a product of modular curves via these methods. The last
part of the text gives an overview of the recent proof of the André-Oort conjecture for
the moduli space of principally polarized abelian varieties following the Pila-Zannier
Philipp Habegger’s contribution: Effective height upper bounds on algebraic tori
starts with an overview of the known results on the Zilber-Pink conjecture for algebraic
tori, after the seminal work of Bombieri, Masser and Zannier, and then focuses on
height upper bounds in this setting. A new and explicit version of the bounded height
theorem is stated and proven. Two appendices give known height bounds in the case
of abelian varieties and Shimura varieties.
After giving a general introduction to the notion of height, Gaël Rémond’s text:
Généralisations du problème de Lehmer et applications à la conjecture de Zilber-Pink
[Generalizations of the Lehmer problem and applications to the Zilber-Pink conjecture]
reviews the current results on lower bounds for heights, as in the Lehmer and effective
Bogomolov problems, and explains the applications to the Zilber-Pink conjecture for
abelian varieties and algebraic tori.
We hope that this panorama on central questions in arithmetic geometry will help
the reader to get acquainted with various tools from algebraic geometry, number
theory, Galois theory, ergodic theory and model theory and o-minimality, which har-
moniously combine within the proofs of results around the Zilber-Pink conjecture. We
also hope that this volume will spark interest and new research on this fast growing


Panoramas & Synthèses
52, 2017, p. 1–30



Emmanuel Ullmo

Résumé. – Les conjectures de Manin-Mumford, André-Oort ainsi que celle de Zilber-

Pink portent sur des variétés algébriques (tores algébriques, variétés abéliennes ou
semi-abéliennes, variétés de Shimura pures ou mixtes) qui possèdent un sous ensemble
naturel de points spéciaux et de sous-variétés spéciales. Le texte propose une axio-
matisation, dans l’esprit de la théorie des modèles, des variétés algébriques possédant
un ensemble de points spéciaux et de sous-variétés spéciales vérifiant des propriétés
naturels en insistant sur les aspects bi-algébriques de la question. Dans un deuxième
temps l’article fait le point sur les résultats récents sur cet ensemble de conjectures.
Abstract (Special structures and Zilber-Pink problem). –

1. Introduction

Au cours des dernières années une activité intense s’est développée autour des pro-
priétés arithmétiques et géométriques des sous-variétés spéciales des tores algébriques,
des variétés abéliennes et des variétés de Shimura. Boris Zilber [86] et Richard Pink
([55], [56]), avec des motivations très éloignées, ont dégagé l’énoncé d’une conjecture
« d’intersections atypiques » pour les variétés de Shimura mixtes ou les variétés semi-
abéliennes qui généralise la conjecture de Manin-Mumford pour les variétés abéliennes
et la conjecture d’André-Oort pour les variétés de Shimura. Les premiers résultats
dans la direction de ces énoncés au delà des questions de type Manin-Mumford ou
André-Oort sont dus à Bombieri, Masser et Zannier [8]. Une session des « États de la
recherche » de la Société Mathématique de France (SMF) consacrée à ces problèmes
a été organisée au CIRM en mai 2011 et les textes qui composent cet ouvrage se pro-
posent de faire le point sur les progrès récents concernant ces questions et de tracer
quelques perspectives d’avenir.

Classification mathématique par sujets (2000). – 14G35, 03C64, 11J81.

Mots clefs. – Bi-algébricité, conjecture de Zilber-Pink, transcendance fonctionnelle, o-minimalité.

© Panoramas et Synthèses 52, SMF 2017


Dans la première partie de cette introduction nous essayons d’expliquer dans quelle
situation une variété algébrique possède un ensemble de points spéciaux et un en-
semble de sous-variétés spéciales de dimension positive pour lesquels les problèmes de
type Manin-Mumford-André-Oort ou Zilber-Pink sont à la fois vraisemblables et in-
téressants. On développe une approche inspirée de la théorie des modèles et on insiste
tout particulièrement sur l’interprétation bi-algébrique des sous-variétés spéciales et
des points spéciaux. On fait ensuite le point sur les résultats récents sur la conjecture
d’André-Oort par la méthode de Pila-Zannier et l’on conclut par une discussion rapide
sur quelques résultats dans la direction de Zilber-Pink.
Remerciements. – C’est un plaisir de remercier Yves André, Daniel Bertrand, Jean-
Benoît Bost, Marc Hindry, Ehud Hrushovski, Bruno Klingler, Michel Waldschmidt et
Andrei Yafaev pour des discussions éclairantes et des remarques mathématiques et
L’un des rapporteurs de cet article m’a donné des indications bibliographiques pré-
cieuses concernant le théorème 2.8 et m’a fourni l’énoncé et la preuve du théorème 2.9
ainsi que celle du théorème 2.10. Sa lecture détaillée m’a aussi permis d’améliorer plu-
sieurs points du texte et je lui adresse tous mes remerciements.

2. Une version abstraite de la conjecture de Zilber-Pink

2.1. Variétés algébriques munies d’une structure spéciale. – Le but de cette partie est
d’abstraire les propriétés essentielles des sous-variétés spéciales d’une variété abé-
lienne, d’une variété de Shimura ou plus généralement d’une variété de Shimura mixte
et de formuler le problème de Zilber-Pink dans ce cadre. Nous essayons dans un pre-
mier temps de dégager le cadre naturel des variétés algébriques intéressantes ayant
des sous-variétés spéciales naturelles pour lesquelles les problèmes de type Manin-
Mumford-André Oort ou Zilber-Pink soient à la fois conjecturalement vrais et non
triviaux. Le lecteur est encouragé à regarder le texte de Boris Zilber [87] qui explore
une thématique similaire du point de vue de la théorie des modèles et du principe de
trichotomie de Zilber.
Soit V une variété quasi-projective sur C de dimension n. On dit que V est munie
d’une pré-structure spéciale si l’on dispose d’un ensemble dénombrable Σ(V ) de sous-
variétés irréductibles de V appelé sous-variétés spéciales de V ayant les propriétés
(i) V est spéciale.
(ii) Une composante irréductible d’une intersection de sous-variété spéciales est
une sous-variété spéciale.
(iii) Soit Σi (V ) l’ensemble des sous-variétés spéciales de dimension i. Les éléments
de Σ0 (V ) sont appelés points spéciaux de V . Pour tout Z ∈ Σ(V ), les points spéciaux
de Z sont Zariski denses dans Z.
Dans tous les cas que nous avons en vue on dispose d’une pré-structure spéciale
sur V r pour tout entier positif r telle que :



(a) Σ0 (V r ) = Σ0 (V )r .
(b) Pour tout r-uplets d’entiers (a1 , . . . , ar ) tels que a = i=1 ai , on a
Σai (V ) ⊂ Σa (V r ).
(c) L’ensemble Σn (V ) contient une infinité dénombrable de correspondances al-
gébriques de V .
Dans ce texte une correspondance algébrique de V est une sous-variété algébrique
W de V 2 telle que les projections de W sur les facteurs sont finies et surjectives.

Définition 2.1. – Une variété algébrique V quasi-projective sur C, de dimension posi-

tive n, est dite munie d’une structure spéciale si on dispose pour tout entier positif
r d’une pré-structure spéciale sur V r vérifiant les propriétés (a), (b) et (c) précé-
dentes telle que pour toute sous-variété spéciale W de V , de dimension positive, les
sous-variétés spéciales de W r ⊂ V r vérifient aussi les propriétés (a), (b) et (c).
D’après la propriété (ii), si W est une sous-variété irréductible de V , il existe une
unique plus petite sous-variété spéciale Sp(W ) de V qui contient W . On dit que W
est Hodge générique si Sp(W ) = V . En particulier un point P de V est dit Hodge
générique si il n’est contenu dans aucune sous-variété spéciale propre de V .

Les exemples principaux de variétés algébriques sur C, munies d’une structure

spéciale sont
(i) Un tore algébrique T . Les points spéciaux sont alors les points d’ordre fini et les
sous-variétés spéciales sont les sous-variétés de torsion zT ′ , produit d’un point d’ordre
fini z par un sous-tore T ′ de T .
(ii) Une variété abélienne A. Les points spéciaux sont alors les points de torsion et
les sous-variétés spéciales sont les sous-variétés de torsion P + B, translatées d’une
sous-variété abélienne B de A par un point de torsion P .
(iii) Une variété semi-abélienne W extension d’une variété abélienne A par un tore
T . Les points spéciaux sont alors les points d’ordre fini et les sous-variétés spéciales
sont les translatées par un point spécial d’un sous-groupe algébrique. Cet exemple
généralise les cas (i) et (ii).
(iv) Une variété de Shimura pure ou mixte S. Le cas pur est détaillé dans le texte
[72] de ce volume et nous renvoyons à la thèse de Pink [54], ou aux travaux de Gao
[24] pour des définitions plus précises dans le cas mixte. Le cas central de la variété
abélienne universelle U g au dessus de l’espace de modules grossiers A g des variétés
abéliennes principalement polarisées de dimension g est discuté dans la section 2.2.5.
Les sous-variétés spéciales sont alors les composantes irréductibles des translatées par
un opérateur de Hecke d’une sous-variété de Shimura.
On peut montrer que toute variété semi-abélienne se réalise comme sous-variété
d’une variété de Shimura mixte [55] remarque 2.13.
Comme un produit fini de variétés semi-abéliennes est une variété semi-abélienne
et un produit fini de variété de Shimura mixtes est une variété de Shimura mixte on



vérifie sans peine que ce sont des exemples de variétés algébriques munies d’une struc-
ture spéciale. Seule la condition (c) sur les correspondances méritent une explication.
Explicitons le cas d’une variété abélienne et le cas des variétés de Shimura pures.
Soit A une variété abélienne et soit α un endomorphisme de A. En prenant pour α
la multiplication par un entier n on voit que l’on dispose d’un ensemble dénombrable
de tels endomorphismes. Soit
Aα ⊂ A × A
le graphe de α. Alors Aα est une correspondance algébrique de A × A qui est une
sous-variété spéciale de A × A.
Soit S une variété de Shimura pure. Les correspondances de Hecke fournissent
un ensemble dénombrable infini de correspondances de S qui sont des sous-variétés
spéciales de S × S.

Remarque 2.2. – Je ne sais pas si la condition portant sur les sous-variétés spéciales
W de V est automatique. Seule la propriété (c) ne l’est pas de manière évidente.
– Il est très naturel du point de vue de la théorie des modèles ou des géométries
de Zariski de considérer des structures spéciales sur V r pour tout entier r. Les
sous-variétés spéciales se comportent alors comme les ensembles définissables
de la théorie. La condition sur les correspondances assure que V est muni de
structures supplémentaires (endomorphismes, correspondances de Hecke) et les
sous-variétés spéciales sont, au moins dans les exemples que nous avons en vue,
celles qui héritent de cette structure supplémentaire.
– Dans l’esprit de la théorie des catégories, on peut définir les morphismes entre
sous-variétés spéciales. Soit Y une sous-variété de V r et Z une sous-variété
de V s . On dit qu’un morphisme algébrique φ : Y → Z est spécial si le graphe
de φ est spécial dans V r+s . Il serait intéressant de rédiger une preuve que l’on
retrouve bien pour les variétés de Shimura et les variétés semi-abéliennes la
notion usuelle de morphismes.
– Dans les exemples que nous avons en tête, les variétés munies de structures
spéciales admettent des revêtements finies de degrés arbitrairement grands non
ramifiés en dehors d’un ouvert fixe par des variétés qui sont elles mêmes munies
d’une structure spéciale. Si fN : VN → V est un tel revêtement, l’image par fN
d’une sous-variété spéciale de VN est spéciale et une composante de l’image
inverse par fN d’une sous-variété spéciale de V est spéciale dans VN . Dans
les situations classiques (variétés semi-abéliennes, variétés de Shimura mixtes)
VN × V est aussi une variété semi-abélienne ou une variétés de Shimura mixte
selon le cas et possède donc une structure spéciale naturelle. Dans cette situation
le graphe de fN , ou celui de la restriction de fN a une sous-variété spéciale est
une sous variété spéciale de VN × V .

2.1.1. Structures spéciales fortes et correspondances modulaires. – On peut remar-

quer que si V est une variété algébrique sur Q, on peut munir VC d’une structure
spéciale en disant que les sous-variétés spéciales de VCr sont les sous-variétés de VC qui



sont définies sur Q. Une telle structure est dite triviale. Les énoncés que l’on a en vue
ne sont pas intéressants dans ce cas. Une manière d’exclure ce cas est d’introduire une
notion plus forte de structure spéciale qui contient le cas des variétés semi-abéliennes
et des variétés de Shimura mixtes.
Soit V une variété algébrique quasi-projective. Une correspondance algébrique T ⊂
V ×V de V est dite modulaire si les deux projections de T vers V sont des morphismes
étales. On vérifie que si V est une variété semi-abélienne ou une variété de Shimura
mixte définie par un réseau sans torsion, les correspondances W de V qui sont spéciales
dans V × V sont les correspondances modulaires. De manière générale si V est une
variété de Shimura arbitraire, il existe un ouvert de Zariski U de V tel que pour toute
correspondance de Hecke T ⊂ V × V , les deux projections de T vers V sont non
ramifiées au dessus de U . Si V = SL2 (Z)\H ≃ C, on peut prendre U = C − {0, 1728}.
Cela suggère la définition suivante.
Définition 2.3. – Une variété algébrique lisse quasi-projective V est munie d’une
structure spéciale forte si elle est munie d’une structure spéciale et d’un ouvert de
Zariski U de V tel que l’ensemble (infini dénombrable) des correspondances algé-
briques T qui sont spéciales dans V × V sont les correspondances de V dont les deux
projections sur V sont non ramifiées au dessus de U .
Dans l’esprit de la dernière partie de la remarque 2.2, on aurait pu définir la notion
de structure spéciale forte sur une variété quasi-projective V de la manière proche
suivante. On demande qu’il existe un ouvert de Zariski U de V et des revêtement
finis de degrés arbitrairement grands fN : VN → V non ramifiés au dessus de U tels
que VN soit muni d’une structure spéciale tels que les sous-variétés spéciales de V n
et de VNn se correspondent via fN n
pour tout N , et tout entier positif n. La notion de
sous-variété spéciale forte donnée dans la définition 2.3 nous semble plus géométrique.
L’autre justification de la définition 2.3 provient d’un théorème de Kazdhan et
Margulis que l’on décrit de la manière suivante. Le lecteur peut consulter la section 9
du livre de Margulis [40] pour des précisions, des preuves et bien plus.
Soit S une variété de Shimura. Alors S est associée à une donnée de Shimura
(G, X) où G est un Q-groupe algébrique réductif et X une G(R)-classe de conjugaison
de morphisme du tore de Deligne S vers GR vérifiant les conditions de Deligne. Une
composante connexe X + de X est un espace symétrique hermitien.
On fixe une représentation fidèle de dimension finie G ⊂ GLn,Q dans un Q-espace
vectoriel de dimension n. On définit
G(Z) := G(Q) ∩ GLn (Z).
Un sous-groupe Γ de G(Q) est commensurable à G(Z) si Γ ∩ G(Z) est d’indice fini
dans G(Z) et dans Γ. La notion de commensurabilité est indépendante du choix du
plongement choisi G ⊂ GLn,Q . Un sous-groupe Γ de G(Q) est dit arithmétique si il
est commensurable à G(Z).
Soit X + un espace symétrique hermitien. On note Aut(X + ) le groupe des automor-
phismes holomorphes de X + . On peut alors munir X + d’une métrique riemanienne



invariante par l’action de Aut(X + ) et Aut(X + ) agit sur X + par isométries. Un ré-
seau de X + est un groupe discret Λ agissant sur X + par automorphismes holomorphes
de X + tel que tout domaine fondamental de X + sous l’action de Λ soit de volume
fini pour la mesure Aut(X + )-invariante.
D’après un théorème de Borel ([10], lemme 12.5 p. 87), l’image d’un sous-groupe
arithmétique Γ de G(Q) dans Aut(X + ) est un réseau de X + . De manière générale,
soit Λ un réseau de X + . On dit que Λ est un réseau arithmétique de X + si il est
obtenu de la manière suivante. Il existe un groupe algébrique G1 sur Q, semi-simple
tel que si K∞ est un sous-groupe compact maximal de G1 (R), alors X + ≃ G1 (R)/K∞
et tel que Λ est commensurable à G1 (Z).
Notons qu’il existe en général une infinité de groupes semi-simples G1 sur Q qui ne
sont pas isomorphes sur Q tels que X + ≃ G1 (R)/K∞ . Explicitons le cas des réseaux
arithmétiques du demi-plan de Poincaré H en notant que toute surface de Riemann
projective lisse de genre au moins 2 est un quotient de H par un réseau.
Exemple 2.4. – Soit F un corps de nombres totalement réel de degré d. Soit B une
algèbre de quaternions B sur F déployée en une unique place archimédienne de F .
Soit G := F∗ \B∗ le groupe algébrique adjoint dont les points sur Q sont F ∗ \B ∗ . On
a alors
G(R) ≃ PGL2 (R) × SOr−13 ,
de sorte que pour tout sous-groupe compact maximal K∞ de G(R) on a G(R)/K∞ ≃
H. Si Γ ⊂ G(Q) est un réseau arithmétique de G(Q), alors l’image de Γ dans PGL2 (R)
est un réseau arithmétique de H.
Réciproquement tout réseau arithmétique de H est obtenu par une telle construction.
Deux réseaux arithmétiques de H associés à des algèbres de quaternions distinctes ne
sont pas commensurables.
La justification de la notion de structures spéciales fortes sur une variété provient
de l’énoncé suivant dû à Kazdhan et Margulis [40] prop. 7.7.
Théorème 2.5. – Soit V une variété algébrique complexe lisse admettant une infinité
de correspondances modulaires. On suppose que le revêtement universel de V est un
espace symétrique hermitien X + et que π1 (V ) est un réseau de X + . Alors π1 (V ) est
un réseau arithmétique de X + .
Dans cette situation, il existe une variété de Shimura S = Γ\X + avec Γ commen-
surable à π1 (V ). Soit
π : X + −→ V = π1 (V )\X + .
On note
C = CommAut(X + ) (π1 (V ))
le commensurateur de π1 (V ) dans Aut(X + ). Un point c de C est un point de Aut(X + )
tels que cπ1 (V )c−1 ∩ π1 (V ) est d’indice fini dans π1 (V ) et dans cπ1 (V )c−1 . Pour
tout c ∈ C,
Tc := {(π(x), π(c.x)), x ∈ X + } ⊂ V × V



est une correspondance modulaire de V et toute correspondance modulaire de V est

de cette forme. Il y a donc une infinité de correspondances modulaires sur X + si et
seulement si π1 (M ) est d’indice infini dans C.
Ces propriétés montrent par exemple qu’une courbe algébrique lisse projective de
genre au moins 2 qui admet une structure spéciale forte est de la forme C = Γ\H
pour un réseau Γ commensurable à un réseau Γ1 tel que S = Γ1 \H soit une courbe
de Shimura.

2.2. Structures spéciales bi-algébriques. – Il est probable que l’on puisse construire des
structures spéciales fortes sur certaines variétés qui ne se ramènent pas aux cas des
variétés semi-abéliennes ou à celui des variétés de Shimura mixtes.
On peut encore préciser le cadre en ne regardant que les variétés V munies d’une
structure spéciale bi-algébrique.
2.2.1. Structures spéciales bi-algébriques sur les tores.– Le paradigme du monde bi-
algébrique est la fonction π(z) := exp(2iπz) qui est une fonction transcendante entre
deux variétés algébriques complexes
π : C = Lie(Gm ) −→ C∗ = Gm (C).
On dit qu’un élément α de C∗ est bi-algébrique au sens arithmétique si α ∈ Q et
si il existe β ∈ Q tel que π(β) = α. Dans cette situation π −1 (α) = β + Z ⊂ Q. C’est
la justification pour le choix de la fonction exp(2iπz) plutôt que de celui de exp(z).
La bi-algébricité d’un élément α ∈ Gm (Q) ne dépend pas ainsi d’un relevé de α
par l’application d’uniformisation. Une autre présentation possible est de prendre
π = exp(z) mais de choisir H1 (Gm , Q) = 2iπQ ⊂ C comme structure rationnelle
sur C.
Le théorème de Gel’fond-Schneider ([78] thm 1.4, p.3) dit que si λ et β sont deux
nombres complexes avec λ 6= 0 et si les trois nombres eλ , β et eβλ sont algébriques
alors β ∈ Q.
En prenant λ = 2iπ dans cet énoncé, on voit qu’un nombre algébrique α ∈ Gm est
bi-algébrique (au sens arithmétique) si et seulement si il est de la forme α = e2iπβ
avec β ∈ Q. Ceci est équivalent à dire que α est un point de torsion de Gm ou que α
est spécial dans le sens précédent pour le tore algébrique Gm . L’importance de la
notion du point de vue de la théorie de Galois provient du fait qu’alors Q[α] est une
extension abélienne de Q et que l’on engendre ainsi toutes les extensions abéliennes
de Q d’après le théorème de Kronecker-Weber.
On peut remarquer que si l’on avait choisit π(z) = exp(z) et la structure rationnelle
usuelle sur C, seule l’origine de Gm serait bi-algébrique (au sens arithmétique) par le
théorème d’Hermite-Lindemann ([78] thm 1.2, p. 2).
Analysons alors la structure spéciale sur le tore Grm . On dispose de l’application
Π := (π, . . . , π) : Cr −→ Grm (C) = (C∗ )r .
On dispose alors de la notion de points bi-algébriques (au sens arithmétique) qui
correspond donc à la notion de points spéciaux.



Par ailleurs si V est une sous-variété algébrique de Grm , on dit que V est bi-
algébrique (au sens géométrique) si une composante analytique de Π−1 (V ) est une
sous-variété algébrique de Cr . Comme l’action de Zr sur Cr est algébrique, si V
est bi-algébrique alors toute composante analytique de Π−1 (V ) est algébrique. Une
conséquence simple du théorème d’Ax [6] est que les sous-variétés bi-algébriques sont
les translatés de sous-tores V = zT pour un sous-tore T de Grm et un point arbi-
traire z de Grm . Pour les variétés de dimension positive, la notion de bi-algébricité
ne dépend pas du choix de l’application d’uniformisation (on pourrait prendre Π =
(exp(z), . . . , exp(z)). Pour les points, on a donc deux notions de bi-algébricité une
arithmétique et une géométrique qui est toujours réalisée. Quand le contexte est clair,
en particulier quand la discussion porte uniquement sur des points on ne précisera
pas toujours que l’on parle du sens arithmétique.
On remarque cependant, qu’avec nos conventions, les sous-variétés spéciales sont les
sous-variétés bi-algébriques contenant un point bi-algébrique. De manière équivalente
ce sont les sous-variétés algébriques de Grm définies sur Q telle qu’une composante
analytique de π −1 (V ) soit algébrique et défini sur Q.
Nous dirons dans la suite que les sous-variétés bi-algébriques sont les sous-variétés
faiblement spéciales, de sorte qu’une sous-variété spéciale est une sous-variété faible-
ment spéciale ayant un point spécial. Du point de vue de la géométrie riemannienne
les sous-variétés faiblement spéciales de Grm apparaissent de manière naturelle. Ce
sont les sous-variétés totalement géodésiques.

2.2.2. Structures spéciales bi-algébriques sur les variétés abéliennes.– Soit A une va-
riété abélienne de dimension g sur C, on dispose donc d’une application d’uniformi-
π : Cg → A ≃ Cg /Γ
pour un réseau Γ de Cg . L’application π est une application transcendante entre
deux variétés algébriques. On dit alors comme précédemment qu’une sous-variété V
de A est faiblement spéciale si les composantes analytiques complexes de π −1 (V )
sont des sous-variétés algébriques de Cn . On vérifie que V est faiblement spéciale
si et seulement si V = P + B pour une sous-variété abélienne B de A et un point
P ∈ A(C) ([73] prop. 5.1). On remarque que tout point de A est faiblement spécial,
que les sous-variétés spéciales de A sont faiblement spéciales et qu’une sous-variété
faiblement spéciale est spéciale si et seulement si elle contient un point spécial donc
est de la forme P + B avec P de torsion. Notons encore une fois que la notion de
bi-algébricité pour les sous-variétés de dimension positive ne dépend pas du choix de
l’application d’uniformisation.
Les variétés abéliennes complexes ne sont pas toutes définissables sur Q. Si on fait
l’hypothèse supplémentaire que A est défini sur Q, on écrit de manière canonique

π := expA : Lie(AC ) −→ A(C).



Dans cette situation Lie(AQ ) est un Q-vectoriel de dimension n tel que Lie(AQ ) ⊗ C =
Lie(AC ). Ce choix naturel ne donne cependant pas lieu à une structure bi-algébrique
intéressante. On dispose en effet du résultat suivant (thm. 3 p. 28 [37]) .
Proposition 2.6. – Soit z ∈ Lie(AQ ) tel que π(z) ∈ A(Q). Alors z = 0 et π(z) = 0 est
l’élément neutre de A(C).
On rappelle tout d’abord l’énoncé du théorème du sous-groupe analytique de Wüs-
tholz ([79] thm. 1) qui est valable plus généralement pour un groupe algébrique com-
mutatif GQ défini sur Q arbitraire d’algèbre de Lie gQ . Si gC désigne l’algèbre de Lie
de G(C) et
expG : gC = gQ ⊗ C → G(C)
l’application exponentielle de G(C), on a :
Théorème 2.7. – (Wüstholz) (i) Soit b un sous-Q-vectoriel de gQ de dimension po-
sitive. Soit B = expG (b ⊗ C). On suppose que B ∩ G(Q) 6= {0}. Il existe alors
un Q-sous-groupe algébrique HQ de GQ de dimension positive d’algèbre de Lie hQ tel
que hQ ⊂ b.
De façon équivalente :
(ii) Soit u ∈ g ⊗ C tel que expG (u) ∈ G(Q). Soit h le plus petit sous-espace vectoriel
de g défini sur Q et tel que u ∈ h(C). Alors h est l’algèbre de Lie d’un sous-groupe
algébrique H de G défini sur Q.
La preuve de Lang de la proposition 2.6 n’utilise pas le théorème de Wüstholz. On
peut cependant le déduire simplement du théorème 2.7 de la manière suivante. On
peut supposer que z ∈ Lie(AQ ) est non nul. On prend GQ = Lie(AQ ) × AQ de sorte
que l’application exponentielle de G(C),
expG : gC = Lie(AC ) × Lie(AC ) −→ Lie(AC ) × AC
est simplement expG = (Id, π). Soit b = Q(z, z) c’est une Q-sous-algèbre de Lie de gQ .
Par hypothèse B ∩ G(Q) = expG (b ⊗ C) ∩ G(Q) contient le point (z, π(z)) donc est
non nul. D’après le théorème de Wüstholz, il existe un sous-groupe algébrique HQ
de GQ , de dimension positive, tel que hQ ⊂ b = Q(z, z). On a donc hQ = Q(z, z) et
HC := {(zt, π(zt)), t ∈ C}
serait un groupe algébrique. Ceci contredirait le fait que les seuls sous-groupes al-
gébriques connexes de Ga × A, de dimension 1, sont Ga et les courbes elliptiques
contenues dans A.
Soit AC une variété abélienne sur C, de dimension g, qui est définissable sur Q
et π : Lie(AC ) −→ A(C) comme précédemment. Pour pouvoir espérer caractériser
les points de torsion de A par une propriété de bi-algébricité, on cherche une base
(e1 , . . . , eg ) de Lie(AC ) tel que l’on puisse caractériser les points de torsion de A(C)
comme les images des
x ∈ VectQ (e1 , . . . , eg ) := Qe1 ⊕ · · · ⊕ Qeg ⊂ Lie(AC )



tels que π(x) ∈ A(Q). Une condition nécessaire pour cela est que le réseau des périodes
Γ = Ker(π) soit contenu dans un Q-vectoriel de dimension g. Si on suppose que A est
muni d’une polarisation principale φ pour simplifier la discussion, alors
(A, φ) ≃ (Aτ , φτ ) := (Cg /(Zg + τ Zg ), φτ )
avec τ dans le demi-espace de Siegel Hg formé des matrices symétriques d’ordre g
de partie imaginaire définie positive et φτ la forme symplectique standard sur Γ =
Zg + τ Zg . Pour que Γ soit contenu dans un Q-vectoriel de dimension g il faut et il
suffit que les entrées de la matrice τ soient dans Q. Soit
Jg : Hg −→ A g (C) ≃ Sp2g (Z)\Hg
l’application modulaire telle que Jg (τ ) soit le point modulaire de (Aτ , φτ ) :=
(Cg /(Zg + τ Zg ), ψ). Comme A est défini sur Q, Jg (τ ) est défini sur Q. D’après le
résultat de Cohen et de Shiga-Wolfart discuté plus loin dans ce texte (thm. 2.16),
on trouve que A est à multiplication complexe. Le résultat suivant est obtenu par
Masser [41]. Un énoncé proche est aussi donné par Lang [38].

Théorème 2.8. – Soit A une variété abélienne à multiplication complexe de dimen-

sion g. On sait alors que A est défini sur Q. Soit
π = expA : Lie(AC ) −→ A(C) = Γ\Cg
l’application d’uniformisation. Soit VQ ⊂ Lie(A) le Q-vectoriel de dimension g en-
gendré par le réseau Γ. Soit x ∈ VQ tel que π(x) ∈ A(Q). Alors π(x) est de torsion
dans A et x ∈ Γ ⊗ Q.

La preuve initiale de cet énoncé ne nécessite pas le théorème de Wüstholz. Le

rapporteur de ce texte m’a suggéré l’énoncé suivant qui généralise le théorème 2.8 et
m’a expliqué la preuve qui repose elle sur le théorème de Wüstholz (2.7).

Théorème 2.9. – Soit A une variété abélienne définie sur Q. Soient D = End(A) ⊗ Q
son algèbrePd’endomorphismes et Λ = Zω1 +· · ·+Zωr un sous-groupe de H1 (A(C), Z).
Soit x = i=1 αi ωi un point de Λ ⊗ Q tel que expA (x) ∈ A(Q). Alors x ∈ D ⊗ Γ
et expA (x) est un point de torsion de A.

Preuve. Comme la décomposition de Poincaré respecte les Q-structures, on peut se

ramener, sans perte de généralité, au cas où A est une variété abélienne simple ; donc
où D est un corps. On suppose dans un premier temps que les ωi sont linéairement
indépendants sur D. On applique alors le théorème de Wüstholz à G = Ar+1 avec
b := {(z0 , z1 , . . . , zr ) ∈ Lie(A), z0 = αi zi }.

Comme les αi sont algébriques, b est défini sur Q. Le point u := (x, ω1 , . . . , ωr ) de b⊗C
est tel que expG (u) ∈ G(Q). Il existe donc une sous-variété abélienne H de G = Ar+1



telle que h = Lie(H) ⊂ b et u ∈ h ⊗ C. Comme A est simple, H est contenu dans le

noyau d’une surjection κ : Ar+1 → A, dont la différentielle s’écrit
dκ : (z0 , z1 , . . . , zr ) 7→ γi zi ,

où les γi sont des éléments de D non tous nuls. Comme u ∈ h ⊗ C, on a

γ0 x + γ1 ω1 + · · · + γr ωr = 0.
Mais γ0 6= 0 car les ωi sont linéairement indépendants sur D. On obtient ainsi que x ∈
D ⊗ Λ.
Le cas général s’obtient de manière analogue en considérant une base w1 , . . . , ws
de Q ⊗ Λ sur D et en décomposant les ωi dans cette base. Dans la situation CM du
théorème 2.8, on prend Λ = H1 (A, Z) et on a s = 1.

Jean-Benoît Bost m’a suggéré la question bi-algébrique suivante qui a le mérite de

s’appliquer à toutes les variétés abéliennes définies sur Q. Soit A une variété abélienne
complexe qui est définissable sur Q. Soit EA l’extension vectorielle universelle de A.
Alors EA est défini sur Q et on a une suite exacte de la forme
0 → VA −→ EA −→ A → 0
avec VA un Q-vectoriel de dimension g. Sur C on obtient la suite exacte
0 → VA ⊗ C −→ EA (C) −→ A(C) → 0
La suite exacte associée des espaces tangents à l’origine s’interprète canoniquement
en terme de structures de Hodge sous la forme :
0 → VA ⊗ C ≃ H 0,−1 (A(C)) → T0 (EA ) ≃ H1 (A(C), C) → T0 (A) ≃ H −1,0 (A(C)) → 0.
Soit Γ := H1 (A(C), Z) ⊂ H1 (A(C), C). On a des morphismes d’uniformisation
πE : H1 (A(C), C) −→ EA (C) ≃ Γ\H1 (A(C), C)
πA : T0 (A) −→ A(C) ≃ Γ\T0 (A).
Un point x ∈ EA (Q) est dit bi-algébrique si il existe y ∈ H1 (A, Z) ⊗ Q tel
que π(y) = x.
La preuve de l’énoncé suivant suggéré par Bost m’a été communiqué par le rap-
porteur de ce texte.

Théorème 2.10. – Soit A une variété abélienne définie sur Q. Soient EA son extension
vectorielle universelle et Γ le groupe H1 (EA , Z) = Ker(expEA ). Soit
U ∈ Γ ⊗ Q ⊂ T0 (EA )(C)
tel que expEA (U ) ∈ EA (Q). Alors U ∈ Γ ⊗ Q et de façon équivalente expEA (U ) est
un point de torsion de EA .



On peut remarquer que cet énoncé caractérise de manière bi-algébrique les points
de torsion de A(C) car le groupe des points de torsion de A(C) est canoniquement
isomorphe à celui de EA (C).
Preuve. Soit u l’image de U par la projection T0 (EA ) → T0 (A). Alors u ∈
H1 (A, Z) ⊗ Q et expA (u) ∈ A(Q). D’après le théorème 2.9, u ∈ H1 (A, Q). Soit U ′ le
relèvement de u dans H1 (EA , Q). Alors Ũ := U − U ′ vérifie les mêmes hypothèses
que U et Ũ ∈ VA (C). Comme la restriction de expEA à VA est l’identité, on voit que

Ũ ∈ VA (Q) ∩ (Γ ⊗ Q).
Plusieurs approches utilisant le théorème de Wüstholz permettent de montrer
que VA (Q) ∩ (Γ ⊗ Q) est réduit à 0, donc que Ũ = 0 et que
U = U ′ ∈ H1 (EA , Q).
Cela se déduit en particulier d’un autre énoncé de Wüstholz ([79] thm. 2) qui assure
que les périodes de deuxième espèce d’une variété abélienne sont nulles ou transcen-

2.2.3. Réalisations semi-algébriques des espaces symétriques hermitiens.– Soit H :=

{z ∈ C, Im(z) > 0} le demi-plan de Poincaré. C’est une variété analytique complexe
qui est aussi semi-algébrique réelle une fois C identifié à R2 . Le but de cette section
est de vérifier que c’est un fait général pour toutes les réalisations usuelles des espaces
symétriques hermitiens. On dispose donc d’une structure de variété semi-algébrique
réelle pour les variétés analytiques complexes uniformisant les variétés de Shimura.
Cela permet finalement de donner une notion naturelle et canonique de sous-variétés
algébriques pour les sous-ensembles des espaces symétriques hermitiens.
Soit GR un groupe semi-simple sur R et soit K∞ un sous-groupe compact maximal
de G(R). On suppose que l’espace symétrique
X = XG = G(R)/K∞
est hermitien. On dispose de plusieurs réalisations de X comme sous-ensemble analy-
tique complexe d’une variété algébrique.
– La réalisation d’Harish-Chandra ([44] ch. 4 et ch. 5) comme un domaine hermi-
tien borné D = DG dans l’espace tangent holomorphe p+ en un point base x0 .
La description explicite des domaines hermitiens bornés de type classique don-
née par exemple dans ([44] ch. 4.2) montre qu’ils sont toujours semi-algébriques
– Via le plongement de Borel on dispose d’une réalisation XB,G comme sous-
variété analytique complexe du dual compact X ∨ de X ([44], thm 1 p.52).
– Quand G = Sp2g,R la réalisation d’Harish-Chandra de l’espace symétrique
XSp2g = G(R)/K∞ de G est

Dg = {z ∈ Mg (C)|t z = z,t zz − Ig < 0}



et on dispose aussi de la réalisation de Siegel de XSp2g donnée par

Hg := {z ∈ Mg (C),t Z = Z, Im(Z) > 0}.

– Plus généralement une réalisation X = X G de X est un sous-ensemble analy-

tique X d’une variété algébrique complexe X̃ telle que X est muni d’une action
transitive de G(R) telle que pour tout x0 ∈ X l’application

ψx0 : G(R) → X
g 7→ g.x0

est semi-algébrique et qui fait de X un espace symétrique hermitien associé

à G(R). Soient X 1 et X 2 deux réalisations de XG un isomorphisme de réalisa-
tions est la donnée d’un biholomorphisme ψ : X 1 → X 2 qui est G(R)-équiva-

On dispose alors de la proposition suivante ([71], lemme 2.1)

Lemme 2.11. – Soit X une réalisation de XG . Alors X est semi-algébrique.

Soit ψ : X 1 → X 2 un isomorphisme de réalisations de XG . Alors ψ est une
application semi-algébrique.

Toutes les réalisations mentionnées dans cette section sont isomorphes de sorte
qu’elles sont toutes semi-algébriques.

Définition 2.12. – Soit X ⊂ X̃ une réalisation de X. Un sous-ensemble Y de X

est dit algébrique irréductible si Y est une composante analytique complexe d’une
intersection X ∩ Ỹ pour une sous-variété algébrique Ỹ de X̃ . Un sous-ensemble
de X est dit algébrique si il est une union finie d’algébriques irréductibles.

On montre qu’une intersection X ∩ Ỹ du type précédent n’a qu’un nombre fini

de composantes analytiques complexes et que ces composantes sont semi-algébriques.
Finalement on dispose de la proposition suivante [34], appendice B.

Proposition 2.13. – (i) Soit X une réalisation de X. Un sous-ensemble Y de X est

algébrique si et seulement si Y est une sous-variété analytique complexe fermé de X
qui est semi-algébrique dans X .
(ii) Soit φ : X 1 −→ X un isomorphisme de réalisation. Un sous-ensemble Y1
de X 1 est algébrique si et seulement si son image Y2 = φ(Y1 ) est algébrique dans X 2 .

On voit donc que la notion d’algébricité pour un sous-ensemble de X ne dépend

pas du choix de la réalisation.



2.2.4. Sous-variétés faiblement spéciales des variétés de Shimura et structures bi-

algébriques. – Soient (G, X) une donnée de Shimura et K un sous-groupe compact
ouvert de G(Af ). Soit X + une composante de X et G(Q)+ le sous-groupe de G(Q)
fixant X + . Soient Γ = G(Q)+ ∩ K et S = Γ\X + la variété de Shimura sur C associée.
Ben Moonen a donné une caractérisation des sous-variétés totalement géodésiques
de S en termes de données de Shimura. Une telle sous-variété est dite faiblement
spéciale dans S. Le résultat principal de Moonen [45] est alors le théorème suivant.
Théorème 2.14 (Moonen). – Soit (H, XH ) une sous-donnée de Shimura de (G, X). On
suppose que la donnée de Shimura adjointe (H ad , XH
) de (H, XH ) se décompose sous
la forme d’un produit de données de Shimura
(H ad , XH
) = (H1 , X1 ) × (H2 , X2 ).
Soit y2 un point de X2 et Z l’image de X1+ × {y2 } dans S. Alors Z est faiblement
spéciale. Dans cette situation Z est spéciale si et seulement si y2 est un point spé-
cial de X2 . Réciproquement toute sous-variété faiblement spéciale est soit spéciale
soit obtenue par une construction du type précédent. En particulier une sous-variété
faiblement spéciale est spéciale si et seulement si elle contient un point spécial.
Soit X une réalisation de X + . Soit π : X −→ S = Γ\ X l’application d’uni-
formisation. On dit qu’une sous-variété algébrique V de S est bi-algébrique si une
composantes analytique de π −1 (V ) est algébrique. Comme l’action de Γ sur X est al-
gébrique et que les composantes de π −1 (V ) sont permutés par Γ, si V est bi-algébrique
alors toute composante de π −1 (V ) est algébrique. Au vu de la discussion de la section
précédente, on voit que la bi-algébricité de V ne dépend pas du choix d’une réalisation
de X + . Le résultat suivant est obtenu dans [73] par des arguments de monodromie.
Proposition 2.15. – Une sous-variété algébrique V de S est faiblement spéciale si et
seulement si elle est bi-algébrique.
Un résultat fondamental de la théorie des variétés de Shimura est que toute variété
de Shimura S associée à une donnée de Shimura (G, X) est une composante géomé-
trique d’une variété ShK (G, X) qui est est définissable canoniquement sur un corps
de nombres E(G, X) — le corps reflex — qui ne dépend que de (G, X) ( [72] 3.3.5).
Dans cette situation S est définie sur une extension abélienne de E(G, X).
Pour donner une caractérisation convenable des points spéciaux en terme de bi-
algébricité il est crucial de normaliser les réalisations de X + et les morphismes donnant
l’uniformisation des variétés de Shimura.
L’exemple le plus simple concerne la courbe modulaire et la fonction
j : H = {z ∈ C, Im(z) > 0} −→ S = SL2 (Z)\H = C.
Le modèle canonique S de S est dans ce cas défini sur Q, c’est l’espace affine S = A1Q
que l’on interprète comme l’espace de module des courbes elliptiques sur Q. Un point
x de S(Q) est dit bi-algébrique si il existe τ ∈ H(Q) := H∩Q tel que j(τ ) = x. Comme
SL2 (Z) agissant sur H préserve H(Q), si x est bi-algébrique tout point de j −1 (x) est



dans H(Q). Dans cette situation le théorème de Schneider ([64] 1937) assure que x est
bi-algébrique si et seulement si x est un point à multiplication
√ complexe. Dans cette
situation Q[τ ] est une extension quadratique imaginaire Q[ −d] de Q et Q[τ, x] est
une extension galoisienne de Q[τ ] de groupe de Galois abélien. C’est une réponse pour
les corps quadratiques imaginaires au « Kronecker Jugentraum » également connu
comme le 12e problème de Hilbert qui prédit que les extensions abéliennes d’un corps
de nombres F sont contenues dans des extensions de F engendrées par des valeurs
spéciales de fonctions analytiques.
L’extension de ce résultat à l’espace de modules A g des variétés abéliennes prin-
cipalement polarisées de dimension g est donnée par Cohen [15] et Shiga-Wolfart [66]
en utilisant le théorème du sous-groupe analytique de Wüstholz (thm. 2.7).
Par la théorie des modèles canoniques, A g (C) admet une modèle canonique A g
sur Q qui est une variété algébrique quasi-projective sur Q. Les points spéciaux sont
alors dans A g (Q). On peut normaliser la fonction
Jg : Hg := {z ∈ Mg (C)|z = z t , Im(z) > 0} −→ A g (C) ≃ Sp2g (Z)\Hg
qui uniformise A g (C) de sorte que l’image inverse d’un point CM est dans Hg (Q) :=
Hg ∩ Mg (Q). On fixe une telle normalisation, de sorte que les points spéciaux sont
Théorème 2.16 (Cohen, Shiga-Wolfart). – Un point z ∈ A g (Q) est bi-algébrique si et
seulement si il est spécial.
Dans cette situation une sous-variété spéciale V de S est une sous-variété algébrique
définie sur Q telle que les composantes de π −1 (V ) soient algébriques et définies sur Q,
i.e. composante d’une intersection d’une sous-variété algébrique de Mg,Q avec Hg .
La notion de bi-algébricité pour les points d’une variété de Shimura S = Γ\X +
dépend à priori de la réalisation X de X + et de la normalisation de l’application
d’uniformisation. Pour les variétés de Shimura de type PEL des normalisations sont
donnés dans les travaux de Shimura et reprises dans le texte de Shiga-Wolfart [66].
Les choix sont faits de tel sorte que les points CM sont bi-algébriques.
Pour une variété de Shimura arbitraire, on procède de la manière suivante ([73],
ch. 3.3 et 3.4). Soit (G, X) une donnée de Shimura et V une Q-représentation fidèle
de dimension finie. Au vue de l’interprétation de Deligne de X comme G(R)-classe
de conjugaison de morphismes du tore de Deligne S = C∗ dans GR on dispose pour
tout x ∈ X + d’une structure de Hodge Vx sur V , donc d’une filtration de Hodge
Fx∗ (VC ) sur VC ([72] 3.2). D’après Deligne, le plongement de Borel X ⊂ X ∨ de X +
dans son dual compact X ∨ est l’application
x 7→ Fx∗ (VC ).
Si on fixe x0 dans X + et que l’on note Q le sous-groupe de GL(VC ) stabilisant Fx∗ (VC ),
on voit que X ∨ est réalisé comme une sous-variété de la variété de drapeaux ΘC :=
GL(VC )/Q. Comme V est un Q-vectoriel, ΘC est canoniquement l’extension à C d’une
variété algébrique ΘQ sur Q. Par la définition du corps reflex E(G, X) de (G, X) on



voit que X ∨ comme sous-variété de ΘC est défini sur E(G, X). On dit alors qu’un
point de X est algébrique si P ∈ X + ∩ X ∨ (Q) = X + ∩ ΘQ (Q).
Un point x ∈ X + est CM si et seulement si
x : S → GR
se factorise par l’extension TR d’un Q-tore maximal TQ de GQ . Un argument simple
donné dans ([73] ch 3.4) montre que si π : X → S désigne l’application d’unifor-
misation, les point spéciaux de S sont bi-algébriques. Je ne sais pas, en dehors du
cas des variétés de Shimura de type abélien qui se déduit des résultats de Cohen et
Shiga-Wolfart si cela caractérise les points spéciaux de S.
Les isomorphismes de réalisations entre la réalisation bornée et les réalisations non
bornées de Siegel de X sont donnés par des transformations de Cayley explicites qui
sont automatiquement des applications semi-algébriques comme on l’a vu. On peut
vérifier que les Q-structures naturelles sont préservées de sorte que pour les questions
de bi-algébricités on peut passer d’une réalisation à l’autre. La brique élémentaire de
ces transformations de Cayley sont du type
c : H := {z ∈ C, |Im(z) > 0} −→ ∆ := {z ∈ C, |z| < 1}
z 7→ .
Le lecteur intéressé peut consulter par exemple la section I.5 de [11] pour plus de
précisions sur les réalisations des espaces symétriques hermitiens et sur leurs isomor-
phismes via les transformations de Cayley.
2.2.5. Structures spéciales bi-algébriques et conjecture de Kollar-Pardon. – Pour ré-
sumer les structures que nous avons rencontrées, on fait les définitions suivantes.

Définition 2.17. – (i) On dit qu’une variété algébrique V sur C est munie d’une struc-
ture bi-algébrique si son revêtement universel Vb est biholomorphe à un ouvert semi-
algébrique d’une variété algébrique. Si V est muni d’une structure bi-algébrique alors
pour tout r ∈ N∗ , V r est muni d’une structure bi-algébrique.
(ii) On dit qu’une variété algébrique V sur C est munie d’une structure spéciale
bi-algébrique forte si V est à la fois muni d’une structure spéciale forte et d’une
structure bi-algébrique telle que les sous-variétés spéciales de V r sont les sous-variétés
bi-algébriques ayant un point spécial.
(iii) On dit qu’une variété algébrique V sur C est munie d’une structure spéciale
bi-algébrique forte arithmétique si elle est munie d’une structure spéciale bi-algébrique
ayant les propriétés arithmétiques suivantes.
(a) La variété V est définie sur Q.
(b) Le revêtement universel Vb se plonge dans une variété algébrique définie sur Q.
(c) Soit π : Vb → V l’application d’uniformisation. Les points spéciaux de V sont
les points z de V (Q) tels que tout y ∈ π −1 (z) soit dans Vb (Q).



Les variétés semi-abéliennes et les variétés de Shimura mixtes sont munis de struc-
tures spéciales bi-algébriques fortes. Les variétés de Shimura de type abélien et Gm
sont munies de structures spéciales bi-algébriques fortes arithmétiques. Une question
naturelle dans ce langage est de vérifier que les variétés abéliennes à multiplication
complexe et les variétés de Shimura mixtes sont munies de structures spéciales bi-
algébriques fortes arithmétiques.
Explicitons l’exemple de la variété de Shimura mixte U g qui est la variété abélienne
universelle sur A g .
La construction de U g s’obtient à partir du Q-groupe algébrique
P2g = V2g ⋊ GSp2g
où V2g est le Q-vectoriel de dimension 2g muni de l’action naturelle du groupe sym-
plectique GSp2g . Le groupe P2g (R) agit de manière transitive sur
Xg+ := R2g × Hg .
(v, h).(v ′ , x) := (v + hv ′ , hx).
On peut plonger Xg+ comme un ouvert (pour la topologie archimédienne) d’une va-
riété algébrique complexe Xg∨ munie d’une action transitive de P2g (C). Ce plongement
est P2g (R)-équivariant de sorte que l’on a
Xg+ = P2g (R).x0 ֒→ P2g (C).x0 = P2g (C)/StabP2g (C) (x0 ) = Xg∨ .
On vérifie encore que Xg+ est semi-algébrique réel et on définit comme dans le cas
pur la notion de sous-variété algébrique de Xg+ . Au vu de sa description explicite, on
dispose aussi d’une Q-structure sur Xg+ .
Soit Γ = Z2g ⋊ GSp2g (Z). Alors Γ est un réseau arithmétique de Xg+ et on a une
application d’uniformisation
π : Xg+ −→ U g = Γ\Xg+ .
Plus généralement si N est un entier positif, on note GSp2g (Z)(N ) l’ensemble des
matrices de GSp2g (Z) qui sont congrues à 1 modulo N et
Γ(N ) = Z2g ⋊ GSp2g (Z)(N ).
Soit A g,N l’espace de modules des variétés abéliennes principalement polarisées de
dimension g munies d’une structure symplectique de niveau N . On a alors A g,N ≃
GSp2g (Z)(N )\Hg et A g,N = A g . On note
U g,N := Γ(N )\Xg+ .
On a un morphisme
η = ηN : U g,N −→ A g,N
tel que pour tout N pair avec N ≥ 4 et tout x ∈ A g,N (C) représentant la variété
abélienne principalement polarisée Ax de dimension g munie d’une structure symplec-
tique de niveau N , la fibre η −1 (x) de η au dessus de x est Ax munie de sa structure
symplectique. Le lecteur peut consulter la thèse de Pink ([54] ch. 10), en particulier



le théorème 10.6 et la proposition 10.8 pour des énoncés plus précis ainsi que des
preuves. Les points spéciaux sont dans ce cas les points de torsion des fibres au dessus
d’un point spécial. D’après la thèse de Pink [54] on dispose d’un modèle canonique
de U g,N sur Q et le morphisme η est lui même défini sur Q.
Richard Pink donne une définition des sous-variétés faiblement spéciales pour les
variétés de Shimura mixtes en terme de données de Shimura mixtes ([55] def. 4.1).
Ziyang Gao vérifie alors que les variétés faiblement spéciales sont les variétés bi-
algébriques. Dans la situation précédente une sous-variété algébrique de U g est fai-
blement spéciale si et seulement si une composante de son image inverse par π est
algébrique [24].
Par ailleurs Xg+ = R2g × Hg est naturellement plongé dans R2g × (C)g . On peut
donc parler de la notion de point algébrique de Xg+ et les points spéciaux de U g
sont alors bi-algébriques. On s’attend à ce que ce soient les seuls. Cela contient le
théorème 2.8 pour les variétés abéliennes à multiplication complexe. Cela explique
aussi pourquoi on ne trouve une interprétation bi-algébrique satisfaisante pour les
points de torsion des variétés abéliennes que dans le cas des variétés abéliennes à
multiplication complexe.

Il me semble plausible qu’il n’y ait pas d’autres variétés algébriques sur C munies
d’une structure spéciale bi-algébrique forte arithmétique ou non au delà des exemples
déjà rencontrés dans ce texte. La conjecture suivante de Kollar et Pardon [36] prévoit
en tout cas des restrictions très fortes sur les variétés munies d’une structure bi-

Conjecture 2.18. – Soit V une variété algébrique projective lisse munie d’une structure
bi-algébrique. Alors le revêtement universel Vb de V est biholomorphe à un produit
(1) Vb = W × Cn × D
où W est une variété algébrique projective normale simplement connexe et D un
domaine symétrique hermitien.

Il est tentant de penser que les 3 facteurs du membre de droite de l’équation (1)
sont le reflet de la trichotomie de Zilber. Je ne sais cependant pas donner un sens
précis à cette assertion.

2.3. Manin-Mumford -André-Oort et Zilber-Pink abstrait. – Soit S une variété algé-

brique munie d’une structure spéciale. Le conjecture de Manin-Mumford-André-Oort
abstraite est la suivante.

Conjecture 2.19. – (i) Soit Z une sous-variété de S contenant un ensemble Zariski

dense de points spéciaux. Alors Z est une sous-variété spéciale de S.
(ii) Soit Z une sous-variété de S. L’ensemble des sous-variétés spéciales de S conte-
nues dans Z et maximal parmi les sous-variétés spéciales contenues dans Z est fini.



On montre que les deux formulations de la question sont équivalentes en utilisant

les propriétés (ii) et (iii) des structures spéciales.

Soit d la dimension de S. Pour tout entier r avec 0 ≤ r ≤ d, on note Σr = Σr (S)

l’ensemble des sous-variétés spéciales de S de dimension au plus r.
Soit Z une sous-variété irréductible de S. Soit <Z> la plus petite sous-variété
spéciale de S contenant Z (définition 2.1). On définit le défaut δ(Z) de Z comme le
nombre entier
δ(Z) = dim(<Z>) − dim(Z).
On définit pour tout entier r comme précédemment
Z(r) := V ∩ Z.
V ∈Σr

Avec ces définitions le problème de Manin-Mumford-André-Oort abstrait devient

Z(r) est Zariski dense dans Z si et seulement si δ(Z) = 0.
La forme abstraite de la conjecture de Pink est alors :

Conjecture 2.20. – (i) Si δ(Z) > 0 alors Z(δ(Z) − 1) n’est pas Zariski dense dans Z.
(ii) On suppose que Z est Hodge générique dans S = <Z> (def 2.1). Soit
s = dim(S) − dim(Z) = δ(Z).
Alors Z(s − 1) n’est pas Zariski dense dans Z.

Les deux formulations du problème de Pink sont équivalentes et elles impliquent

la forme abstraite de Manin-Mumford-André-Oort.
On peut formuler, dans l’esprit de Zilber, une conjecture un peu plus forte du
problème en terme d’intersections atypiques.

Définition 2.21. – Soit V une variété algébrique de dimension d. Soient A et B deux

sous-variétés de dimension a et b respectivement. On dit que l’intersection de A et
de B est atypique si il existe une composante C de A ∩ B telle que
dim(C) > a + b − d.
On dit alors qu’un tel C est une composante atypique de A ∩ B.

Si Z est une sous-variété irréductible de S comme précédemment, on note Zatyp

la réunion des composantes atypiques des intersections de Z avec les sous-variétés
spéciales de S.
Avec cette définition la conjecture de Zilber abstraite est la suivante.

Conjecture 2.22. – Soit Z une sous-variété algébrique Hodge générique de S. L’en-

semble Zatyp n’est pas Zariski dense dans Z.



Soit s = dim(S) − dim(Z), soit V une sous-variété spéciale de S de dimension au

plus s − 1. Si l’intersection V ∩ Z est non vide, alors toute composante de V ∩ Z est
atypique. On en déduit que
Z(s − 1) ⊂ Zatyp
de sorte que la forme abstraite de la conjecture de Zilber entraîne la forme abstraite
de celle de Pink quand Z est Hodge générique.
On suppose de plus que l’on a une notion bien définie de sous-variétés faiblement
spéciales de S. C’est le cas dans tous les exemples que nous avons en vue. Pour
tout entier r avec 0 ≤ r ≤ d, on note Σ′r = Σ′r (S) l’ensemble des sous-variétés
faiblement spéciales de S de dimension au plus r. On définit pour tout entier r comme
précédemment et toute sous-variété Z de S,
Z((r)) := (V ∩ Z)>0
V ∈Σ′r

ou (V ∩ Z)>0 désigne la réunion des composantes de V ∩ Z de dimension positive.

Une question générale qui a une réponse positive dans plusieurs cas importants est la
Question 2.23. – Est il vrai que
Z oa := Z − Z((s))
est un ouvert de Z ?
On peut remarquer que si Z est contenu dans une sous-variété faiblement spéciale
stricte alors Z oa est l’ensemble vide. Il existe aussi des exemples tels que Z oa est vide
même si Z n’est pas contenu dans une sous-variété faiblement spéciale stricte.

3. La conjecture de Zilber-Pink
Dans cette partie on fait un point rapide sur ce qui est connu pour les problèmes
de type Manin-Mumford-André-Oort ou Zilber-Pink dans les exemples classiques de
variétés algébriques munies d’une structure spéciale.

3.1. Manin-Mumford. – Quand V = A est une variété abélienne ou une variété semi-
abélienne, la conjecture 2.19 est connue sous le nom de conjecture de Manin-Mumford.
La première preuve de la conjecture de Manin-Mumford pour les sous-variétés des
variétés abéliennes est donnée par Raynaud [59] par des techniques p-adiques. De
nombreuses preuves alternatives sont apparues par la suite par des approches très
diverses montrant la richesse de la question. Citons notamment :
– la preuve de Hindry [32] par une combinaison de méthodes galoisiennes et géo-
– celle de l’auteur de ces notes et de Zhang via la conjecture de Bogomolov [69],
[84] par des techniques de théorie d’Arakelov et d’équidistribution de suites de
points de petite hauteur,



– celle de Hrushowski [33] via la théorie des modèles,

– celle de Pink et Roessler [57] qui traduit l’approche de Hrushowski dans le
langage de la géométrie algébrique,
– enfin celle de Pila et Zannier [53] par une combinaison de théorie o-minimale,
de transcendance fonctionnelle et de théorie de Galois.

3.2. André-Oort. – Yves André [2], intéressé par des problèmes de transcendance des
périodes des variétés de Shimura propose la conjecture 2.19 pour les courbes dans
une variété de Shimura. Frans Oort [47], motivé par des questions concernant les ja-
cobiennes à multiplication complexe propose la conjecture 2.19 pour les sous-variétés
de l’espace de module A g des variétés abéliennes principalement polarisée de dimen-
sion g. Il ne fait pas de doute que l’un et l’autre avait en tête l’analogie avec l’énoncé de
la conjecture de Manin-Mumford. Le problème précédent pour une variété de Shimura
mixte est donc connu sous le nom de conjecture d’André-Oort.
Pour la conjecture d’André-Oort pour les variétés de Shimura plusieurs séries de
travaux ont été inspirés des différentes méthodes ayant permis de donner une preuve
de Manin-Mumford.
Les méthodes p-adiques de Raynaud [59] ont été la source d’inspiration de Oort
et de son école dans un premier temps. Des résultats notables dans la direction de
la conjecture d’André-Oort pour l’adhérence de Zariski d’un ensemble de points CM
d’une variété de Shimura vérifiant des hypothèses de réduction en une place fixée sont
obtenus par Moonen ([46] thm 5.7) et Yafaev [80].
Edixhoven a développé une approche de la conjecture d’André-Oort qui après ana-
lyse s’avère très proche dans l’esprit de celle d’Hindry pour Manin-Mumford. Nous
parlerons donc de la méthode d’Edixhoven-Hindry. Cette méthode est expliquée en
détail dans ce volume dans mon texte [72] ainsi que celui de Yafaev [81]. Les résul-
tats obtenus ainsi utilisent de manière essentielle l’hypothèse de Riemann générali-
sée (GRH) via des énoncés de type Cebotarev effectifs [65]. Edixhoven montre tout
d’abord la conjecture d’André-Oort sous GRH pour un produit de 2 courbes modu-
laires [21]. Edixhoven et Yafaev [23], obtiennent ensuite le résultat pour une courbe
dans une variété de Shimura arbitraire et Edixhoven traite le cas des sous-variétés
de dimension arbitraire dans un produit de n copies de la courbe modulaire [22]. La
conjecture d’André-Oort sous GRH est alors obtenue pour une variété de Shimura ar-
bitraire par Klingler-Yafaev et l’auteur de ce texte ([35], [74]) en incorporant des idées
de théorie ergodique sur les espaces homogènes à la Margulis-Ratner ([14], [70]), dans
la méthode galoisienne et géométrique d’Edixhoven-Hindry. Notons aussi que la mé-
thode d’Edixhoven-Hindry donne des résultats inconditionnels concernant l’ahérence
de Zariski d’un ensemble de points CM contenus dans une orbite de Hecke.
Le premier résultat inconditionnel de la conjecture d’André-Oort est obtenu par
André pour un produit de 2 courbes modulaires par une méthode utilisant les déve-
loppement de Puiseux qui n’a pas pu s’étendre à d’autres cas [3].
La méthode de Pila-Zannier pour Manin-Mumford a été adaptée par Pila qui ob-
tient ainsi une preuve inconditionnelle d’AO pour un produit arbitraire de courbes



modulaires [49]. Comme pour le cas de la conjecture de Manin-Mumford la méthode

est une combinaison de théorie o-minimale, de transcendance fonctionnelle et de théo-
rie de Galois. Ce point de vue est développé dans ce volume dans le texte de Scanlon
[63] et nous renvoyons à la dernière partie de ce texte pour une discussion détaillée des
résultats récents. Une preuve inconditionnelle de la conjecture d’André-Oort pour A g
est obtenue par la méthode de Pila grâce à la combinaison du travail de nombreux au-
teurs. On montre dans [71] comment André-Oort se déduit en général de 3 ingrédients
principaux. Soit S une variété de Shimura et π : X + → S := Γ\X + l’application
– La définissabilité dans la structure o-minimale Ran,exp de la restriction de π
à un ensemble fondamental convenable. Ce résultat est obtenu par Peterzil-
Starchenko pour A g [48] et dans [34] pour une variété de Shimura arbitraire.
– La conjecture d’Ax-Lindemann hyperbolique qui est maintenant connue en toute
généralité s’énonce de la manière suivante :

Théorème 3.1. – Soit V ⊂ X + un ensemble irréductible algébrique au sens de

la section 2.2.4. Alors l’adhérence de Zariski W de π(V ) est faiblement spéciale
(i.e bi-algébrique).

Ax Lindemann est prouvé par Pila pour les produits de courbes modulaires
[49], par Ullmo-Yafaev pour les variétés de Shimura compactes [75], par Pila-
Tsimerman pour A g [50] et par Klingler-Ullmo-Yafaev pour une variété de
Shimura arbitraire [34].
– Des bornes inférieures convenables pour la taille des orbites sous Galois de points
spéciaux. Cet ingrédient est aussi au centre de l’approche de Edixhoven-Hindry.
Pour une discussion sur le type de borne attendu pour une variété de Shimura
arbitraire nous référons à la section 2.3 de [71]. Notons que les bornes recherchées
sont connues sous GRH pour toute variété de Shimura d’après des résultats de
Tsimerman [67] et Ullmo-Yafaev [76]. Pour un point z de A g paramétrant la
variété abélienne Az , on note dz la valeur absolue du discriminant du centre des
endomorphismes de Az . Si z est un point spécial alors le corps de définition k(z)
de z est un corps de nombres. On cherche à montrer dans ce cas qu’il existe des
constantes positives α et β tels que pour tout point spécial de A g on ait

(2) [k(z) : Q] > αdβz .

Une première approche directe de Tsimerman [67] permet de montrer cette
inégalité pour g ≤ 6 ; le cas g ≤ 3 a aussi été obtenu dans [76]. Une preuve
pour g arbitraire est conséquence de l’observation remarquable de Tsimerman
[68] que la minoration (2) espérée se déduit du théorème de l’isogénie de Masser-
Wüstholz [42] et d’une borne supérieure pour la hauteur de Faltings hF (Az )
de Az de la forme suivante
(3) ∀ǫ > 0, hF (Az ) ≪ǫ dǫz .



Colmez a conjecturé [16] une formule close pour la hauteur de Faltings d’une
variété abélienne à multiplication complexe. Nous renvoyons au texte de Colmez
ou à [39] pour les notions de base de la théorie des variétés abéliennes à mul-
tiplication complexe. On se ramène simplement au cas où les endomorphismes
de Az sont l’anneau d’entiers d’un corps CM, Ez de degré 2g sur Q. Dans cette
situation Colmez montre que hF (Az ) ne dépend que du type CM (Ez , Φ) de Az .
En fixant le corps de multiplication complexe E et en faisant la moyenne sur les
2g -types CM Φ possibles de E, on obtient conjecturalement une formule qui se
présente sous une forme plus simple pour la moyenne des hauteurs de Faltings
des variétés abéliennes CM par OE . Des arguments classiques de théorie analy-
tique des nombres montrent alors que la conjecture de Colmez ou sa version en
moyenne entraînent la majoration de l’équation (3).
Finalement une preuve de la conjecture de Colmez en moyenne a été obtenu
par Andreatta, Goren, Howard et Madapusi-Pera [5] par une étude des points
CM sur les variétés de Shimura de type orthogonal et par Yuan et Zhang par
une analyse de points de Heegner sur certaines courbes de Shimura [82].
Daw et Orr [20] montrent que la méthode de Pila-Zannier permet de donner
une nouvelle preuve d’André-Oort sous l’hypothèse de Riemann généralisée. En
étendant les arguments précédents aux variétés de Shimura mixtes, Gao montre
la conjecture d’André-Oort pour U g ou plus généralement pour les variétés de
Shimura mixtes dont la projection sur la partie pure est de type abélien. En
utilisant les résultats de Daw et Orr, Gao montre aussi la conjecture d’André-
Oort sous l’hypothèse de Riemann généralisée pour une variété de Shimura mixte
arbitraire [25].

3.3. Intersections atypiques et conjecture de Zilber-Pink. – Les problèmes d’intersec-

tions atypiques et la conjecture de Zilber-Pink ont surtout été étudiés pour les tores
et les variétés abéliennes. Le lecteur pourra consulter la monographie de Zannier [83]
pour une présentation lucide, de nombreux exemples et une bibliographie détaillée
ainsi que le séminaire Bourbaki de Chambert-Loir [13].
Le problème de Pink abstrait est formulé comme une conjecture pour les variétés de
Shimura mixtes par Pink ([56] conjecture 1.1) et se formule de manière identique pour
les variétés semi-abéliennes. Pink montre en fait que sa conjecture pour les variétés de
Shimura mixtes paramétrant des variétés abéliennes entraîne ce même énoncé pour les
variétés abéliennes ([55] prop. 4.6 et [56] th. 5.7) donc entraîne aussi la conjecture de
Manin-Mumford. Cette même implication pour les variétés semi-abéliennes n’est pas
totalement clarifiée comme le montre la remarque 2-(i) du texte de Daniel Bertrand
[7]. On dispose avec la conjectures de Pink, au delà de l’analogie formelle, d’un énoncé
général qui englobe les questions abordées dans cette introduction et dans ce volume.
Des versions en famille de la conjectures de Manin-Mumford ont aussi été proposées
par André sous forme de question ([4] lect. III) et par Pink ([56] conj. 6.2). Cette
conjecture pour les familles variétés abéliennes est ouverte (voir néanmoins [43]), et
est aussi une conséquence de la conjecture de Pink pour les variétés de Shimura mixtes



([56] thm. 6.3). Pour les familles de variétés semi-abéliennes la conjecture est fausse
comme cela a été remarqué par Bertrand [7] mais les contre-exemples fournis par les
« sections de Ribet » sont expliqués par la conjecture initiale de Pink pour les variétés
de Shimura mixtes paramétrant des familles de variétés semi-abéliennes (introduites
pour le cas abélien dans la section 2.2.5 de ce texte).
Les textes de Philippe Habegger [29] et Gaël Rémond [62] dans ce volume décrivent
les progrès en direction de la conjecture de Zilber-Pink pour un tore Grm ou une variété
abélienne. Nous renvoyons à ces textes pour une présentation précise des résultats
connus. La notion de hauteur est centrale dans les approches envisagées pour ces
cas. Pour une variété abélienne définie sur Q ou sur le tore Grm on dispose d’une
hauteur canonique b h sur les points algébriques qui prend des valeurs positives ou
nulles. Les points spéciaux (i.e. les points de torsion) sont alors les points de hauteur
0. La définition de hauteur canonique s’étend aussi aux sous-variétés. La conjecture
de Bogomolov prouvée par Zhang et l’auteur ([69], [84]) puis par David et Philippon
pour les variétés abéliennes, caractérise les sous-variétés spéciales comme étant celles
de hauteur nulle. Les résultats analogues pour Grm sont dus à Zhang [85].
Il n’existe pas de caractérisation des points spéciaux ou des sous-variétés spéciales
des variétés de Shimura en terme de hauteur de Faltings même si comme on l’a vu
les résultats récents sur la conjecture de Colmez fournissent des bornes supérieures
très précises sur la hauteur de Faltings des points à multiplication complexe. Colmez
montre par exemple que la hauteur de Faltings des points CM sur SL2 (Z)\H tend
vers l’infini quand le discriminant de l’anneau de multiplication complexe de la courbe
elliptique Ez paramétrée par z tend vers l’infini [17].
Soit S le tore Grm ou une variété abélienne définie sur Q. La stratégie initiée par les
travaux fondateurs de Bombieri, Masser et Zannier a plusieurs étapes. La première
est la proposition suivante. On utilise les notations de la section 2.3.

Proposition 3.2. – Soit Z une sous-variété de S et soit s la codimension de Z dans S.

Alors Z oa := Z − Z((s)) est un ouvert de Zariski.

Ce résultat est obtenu par Bombieri, Masser et Zannier pour Grm [9] et par Rémond
dans le cas abélien ([60], [61]). On constate que Z oa est vide si Z est contenu dans une
sous-variété faiblement spéciale propre. Il existe cependant des exemples ou Z n’est
pas contenu dans une sous-variété spéciale propre et pour lesquels Z oa est vide ([83]
section 1.3.3).
L’étape suivante est le théorème suivant (conjecture de la hauteur bornée).

Théorème 3.3. – La hauteur des points algébriques de Z oa ∩ Z(s) est uniformément


Ce résultat est au centre des textes d’Habegger [29] et de Rémond [62] dans ce
volume. Il est dû à Habegger pour Grm [28] et une preuve effective est donnée dans le
texte de Habegger dans ce volume. Dans le cas des variétés abéliennes le résultat est
dû à Rémond ([60], [61]) et Habegger [27].



Des résultats suffisamment précis sur le problème de Lehmer relatif permettent de

montrer que Z oa ∩ Z(s − 1) est en fait fini. Pour Gnm ces résultats sont obtenus par
Amoroso et David [1]. Pour les variétés abéliennes à multiplication complexe ils sont
obtenus par Ratazzi [58] et Carrizosa [12]. Des arguments simples permettent alors
de conclure que si Z est « suffisamment transverse » — ce qui implique en particulier
que Z oa est non vide — alors Z(s − 1) est fini comme prévu par la conjecture de Pink.
Précisons la condition de transversalité ci dessus quand la variété ambiante est une
variété abélienne A. Le cas du tore Grm est identique. On dit qu’une sous-variété Z de A
est suffisamment transverse si pour tout morphisme surjectif de variétés abéliennes
φ : A → B, on a
dim(φ(X)) ≥ min(dim(X), dim(B)).
Si Z est une courbe dans A, alors Z est suffisamment transverse si et seulement
si Z n’est pas contenu dans une sous-variété faiblement spéciale. Rémond montre
en général que Z oa est vide si et seulement si Z est suffisamment transverse ([61]
prop. 4.2). Le résultat suivant de Habegger ([28], [27]) résume en grande partie ce qui
est connu.

Théorème 3.4. – Soit G une variété abélienne à multiplication complexe ou le tore

Grm . Soit Z une sous-variété de G de codimension s suffisamment transverse. Alors
Z(s − 1)(Q) n’est pas dense dans Z.

Même si cette condition de transversalité est trop forte par rapport à ce qui est
attendu pour Zilber-Pink il semble difficile avec les techniques actuelles d’obtenir des
résultats en direction de Zilber-Pink quand elle n’est pas vérifiée. Cette condition
est naturelle dans un contexte ou l’on dispose d’un lemme de Poincaré mais s’adapte
assez mal dans le contexte des variétés de Shimura. Il serait bon de trouver une bonne
notion de transversalité pour la conjecture de Zilber-Pink concernant les variétés de
Shimura mixtes ou pures.
Une nouvelle approche qui précise la conjecture des hauteurs et permet aussi d’ob-
tenir des résultats de finitude passe par des estimations effectives de type Bogomolov,
c’est à dire des minorations effectives de la hauteur canonique ou du minimum es-
sentiel des sous-variétés qui ne sont pas spéciales. Des bornes de ce type ont été
envisagées par David et Philippon pour les tores [18] et les variétés abéliennes [19].
Les applications en direction de la conjecture de Zilber-Pink par cette approche ont
été développées par Viada [77], Habegger [26] et Rémond.
Les résultats sur Zilber-Pink pour les variétés de Shimura sont limités. Une rai-
son est que la question d’André-Oort n’était pas entièrement résolue. Une autre est
que la notion de hauteur, centrale dans les approches pour les variétés abéliennes et
les tores n’est pas adaptée au moins de manière directe au cas des variétés de Shi-
mura. On peut cependant prévoir que la méthode de Pila-Zannier via l’o-minimalité,
la transcendance fonctionnelle et des techniques galoisiennes seront l’objet de futurs
développements qui permettront d’améliorer notre compréhension du problème de



Zilber-Pink pour les variétés de Shimura. Les premiers résultats en ce sens sont obte-
nus par Pila-Tsimerman ([51], [52] ) et Habegger-Pila ([30], [31]) pour un produit de
courbes modulaires. Il ne fait pas de doute que ces méthodes sont promises à un bel

[1] F. Amoroso & S. David – « Le problème de Lehmer en dimension supérieure »,
J. reine angew. Math. 513 (1999), p. 145–179.
[2] Y. André – G-functions and geometry, Aspects of Mathematics, E13, Friedr. Vieweg
& Sohn, Braunschweig, 1989.
[3] , « Finitude des couples d’invariants modulaires singuliers sur une courbe algé-
brique plane non modulaire », J. reine angew. Math. 505 (1998), p. 203–208.
[4] , « Shimura varieties, subvarieties and CM points », lectures NCTS, Hsinchu,
[5] F. Andreatta, E. Goren, B. Howard & K. Madapusi-Pera – « Faltings heights
of abelian varieties with complex multiplication », prépublication https://www2.bc.
[6] J. Ax – « On Schanuel’s conjectures », Ann. of Math. 93 (1971), p. 252–268.
[7] D. Bertrand – « Special points and Poincaré bi-extensions », avec un appendice
par Bas Edixhoven. preprint 2011, disponible sur la page web de l’auteur https:
[8] E. Bombieri, D. W. Masser & U. Zannier – « Intersecting a curve with algebraic
subgroups of multiplicative groups », Int. Math. Res. Not. 1999 (1999), p. 1119–1140.
[9] , « Anomalous subvarieties—structure theorems and applications », Int. Math.
Res. Not. 2007 (2007), Art. ID rnm057, 33.
[10] A. Borel – Introduction aux groupes arithmétiques, Publications de l’Institut de Ma-
thématique de l’Université de Strasbourg, XV. Actualités Scientifiques et Industrielles,
No. 1341, Hermann, Paris, 1969.
[11] A. Borel & L. Ji – Compactifications of symmetric and locally symmetric spaces,
Mathematics : Theory & Applications, Birkhäuser, 2006.
[12] M. a. Carrizosa – « Petits points et multiplication complexe », Int. Math. Res. Not.
2009 (2009), p. 3016–3097.
[13] A. Chambert-Loir – « Relations de dépendance et intersections exceptionnelles »,
Séminaire Bourbaki, vol. 2010/2011, exposé no 1032, Astérisque 348 (2012), p. 149–
[14] L. Clozel & E. Ullmo – « équidistribution de sous-variétés spéciales », Ann. of Math.
161 (2005), p. 1571–1588.
[15] P. B. Cohen – « Humbert surfaces and transcendence properties of automorphic func-
tions », Rocky Mountain J. Math. 26 (1996), p. 987–1001, Symposium on Diophantine
Problems (Boulder, CO, 1994).
[16] P. Colmez – « Périodes des variétés abéliennes à multiplication complexe », Ann. of
Math. 138 (1993), p. 625–683.
[17] , « Sur la hauteur de Faltings des variétés abéliennes à multiplication complexe »,
Compositio Math. 111 (1998), p. 359–368.



[18] S. David & P. Philippon – « Minorations des hauteurs normalisées des sous-variétés
des tores », Ann. Scuola Norm. Sup. Pisa Cl. Sci. 28 (1999), p. 489–543.
[19] , « Minorations des hauteurs normalisées des sous-variétés de variétés abeliennes.
II », Comment. Math. Helv. 77 (2002), p. 639–700.
[20] C. Daw & M. Orr – « Heights of pre-special points of Shimura varieties », Math. Ann.
365 (2016), p. 1305–1357.
[21] B. Edixhoven – « Special points on the product of two modular curves », Compositio
Math. 114 (1998), p. 315–328.
[22] , « Special points on products of modular curves », Duke Math. J. 126 (2005),
p. 325–348.
[23] B. Edixhoven & A. Yafaev – « Subvarieties of Shimura varieties », Ann. of Math.
157 (2003), p. 621–645.
[24] Z. Gao – « Towards the André-Oort conjecture for mixed Shimura varieties : The
Ax-Lindemann theorem and lower bounds for Galois orbits of special points », https:
//doi.org/10.1515/crelle-2014-0127, 2015.
[25] , « About the mixed André-Oort conjecture : reduction to a lower bound for the
pure case », C. R. Math. Acad. Sci. Paris 354 (2016), p. 659–663.
[26] P. Habegger – « A Bogomolov property for curves modulo algebraic subgroups »,
Bull. Soc. Math. France 137 (2009), p. 93–125.
[27] , « Intersecting subvarieties of abelian varieties with algebraic subgroups of com-
plementary dimension », Invent. math. 176 (2009), p. 405–447.
[28] , « On the bounded height conjecture », Int. Math. Res. Not. 2009 (2009), p. 860–
[29] , « Effective height upper bounds on algebraic tori », prépublication
[30] P. Habegger & J. Pila – « Some unlikely intersections beyond André-Oort », Com-
pos. Math. 148 (2012), p. 1–27.
[31] , « O-minimality and certain atypical intersections », Ann. Sci. Éc. Norm. Supér.
49 (2016), p. 813–858.
[32] M. Hindry – « Autour d’une conjecture de Serge Lang », Invent. math. 94 (1988),
p. 575–603.
[33] E. Hrushovski – « The Manin-Mumford conjecture and the model theory of difference
fields », Ann. Pure Appl. Logic 112 (2001), p. 43–115.
[34] B. Klingler, E. Ullmo & A. Yafaev – « The hyperbolic Ax-Lindemann-Weierstraß
conjecture », Publ. math. IHÉS 123 (2016), p. 333–360.
[35] B. Klingler & A. Yafaev – « The André-Oort conjecture », Ann. of Math. 180
(2014), p. 867–925.
[36] J. Kollár & J. Pardon – « Algebraic varieties with semialgebraic universal cover »,
J. Topol. 5 (2012), p. 199–212.
[37] S. Lang – Introduction to transcendental numbers, Addison-Wesley Publishing Co.,
Reading, Mass.-London-Don Mills, Ont., 1966.
[38] , « Diophantine approximation on abelian varieties with complex multiplica-
tion », Advances in Math. 17 (1975), p. 281–336.
[39] , Complex multiplication, Grundl. math. Wiss., vol. 255, Springer, New York,



[40] G. A. Margulis – Discrete subgroups of semisimple Lie groups, Ergebn. Math.

Grenzg., vol. 17, Springer, Berlin, 1991.
[41] D. W. Masser – « Linear forms in algebraic points of Abelian functions. III », Proc.
London Math. Soc. 33 (1976), p. 549–564.
[42] D. W. Masser & G. Wüstholz – « Factorization estimates for abelian varieties »,
Publ. Math. IHÉS 81 (1995), p. 5–24.
[43] D. Masser & U. Zannier – « Torsion points on families of simple abelian surfaces
and Pell’s equation over polynomial rings », J. Eur. Math. Soc. (JEMS) 17 (2015),
p. 2379–2416.
[44] N. Mok – Metric rigidity theorems on Hermitian locally symmetric manifolds, Series
in Pure Mathematics, vol. 6, World Scientific Publishing Co., Inc., Teaneck, NJ, 1989.
[45] B. Moonen – « Linearity properties of Shimura varieties. I », J. Algebraic Geom. 7
(1998), p. 539–567.
[46] , « Linearity properties of Shimura varieties. II », Compositio Math. 114 (1998),
p. 3–35.
[47] F. Oort – « Some questions in algebraic geometry », prépublication http://www.math.
uu.nl/people/oort, 1995.
[48] Y. Peterzil & S. Starchenko – « Definability of restricted theta functions and
families of abelian varieties », Duke Math. J. 162 (2013), p. 731–765.
[49] J. Pila – « O-minimality and the André-Oort conjecture for Cn », Ann. of Math. 173
(2011), p. 1779–1840.
[50] J. Pila & J. Tsimerman – « Ax-Lindemann for Ag », Ann. of Math. 179 (2014),
p. 659–681.
[51] , « Ax-Schanuel for the j-function », Duke Math. J. 165 (2016), p. 2587–2605.
[52] , « Multiplicative relations among singular moduli », prépublication
[53] J. Pila & U. Zannier – « Rational points in periodic analytic sets and the Manin-
Mumford conjecture », Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 19 (2008),
p. 149–162.
[54] R. Pink – « Arithmetical compactification of mixed Shimura varieties », Dissertation,
Rheinische Friedrich-Wilhelms-Universität Bonn, 1989.
[55] , « A combination of the conjectures of Mordell-Lang and André-Oort », in
Geometric methods in algebra and number theory, Progr. Math., vol. 235, Birkhäuser,
2005, p. 251–282.
[56] , « A combination of the conjectures of Mordell-Lang and André-Oort », in
Geometric methods in algebra and number theory, Progr. Math., vol. 235, Birkhäuser,
2005, p. 251–282.
[57] R. Pink & D. Roessler – « On ψ-invariant subvarieties of semiabelian varieties and
the Manin-Mumford conjecture », J. Algebraic Geom. 13 (2004), p. 771–798.
[58] N. Ratazzi – « Intersection de courbes et de sous-groupes et problèmes de minoration
de dernière hauteur dans les variétés abéliennes C.M », Ann. Inst. Fourier (Grenoble)
58 (2008), p. 1575–1633.
[59] M. Raynaud – « Sous-variétés d’une variété abélienne et points de torsion », in Arith-
metic and geometry, Vol. I, Progr. Math., vol. 35, Birkhäuser, 1983, p. 327–352.



[60] G. Rémond – « Intersection de sous-groupes et de sous-variétés. II », J. Inst. Math.

Jussieu 6 (2007), p. 317–348.
[61] , « Intersection de sous-groupes et de sous-variétés. III », Comment. Math. Helv.
84 (2009), p. 835–863.
[62] , « Généralisation du probème de Lehmer et application à la conjecture de Zilber-
Pink », ce volume.
[63] T. Scanlon – « o-minimality as an approach to the André-Oort conjecture », ce vo-
[64] T. Schneider – « Arithmetische Untersuchungen elliptischer Integrale », Math. Ann.
113 (1937), p. 1–13.
[65] J-P. Serre – « Quelques applications du théorème de densité de Chebotarev », Publ.
Math. IHÉS 54 (1981), p. 323–401.
[66] H. Shiga & J. Wolfart – « Criteria for complex multiplication and transcendence
properties of automorphic functions », J. reine angew. Math. 463 (1995), p. 1–25.
[67] J. Tsimerman – « Brauer-Siegel for arithmetic tori and lower bounds for Galois orbits
of special points », J. Amer. Math. Soc. 25 (2012), p. 1091–1117.
[68] , « A proof of the André-Oort conjecture for A g », prépublication
[69] E. Ullmo – « Positivité et discrétion des points algébriques des courbes », Ann. of
Math. 147 (1998), p. 167–179.
[70] , « Equidistribution de sous-variétés spéciales. II », J. reine angew. Math. 606
(2007), p. 193–216.
[71] , « Applications du théorème d’Ax-Lindemann hyperbolique », Compos. Math.
150 (2014), p. 175–190.
[72] , « Autour de la conjecture d’André-Oort », ce volume.
[73] E. Ullmo & A. Yafaev – « A characterization of special subvarieties », Mathematika
57 (2011), p. 263–273.
[74] , « Galois orbits and equidistribution of special subvarieties : towards the André-
Oort conjecture », Ann. of Math. 180 (2014), p. 823–865.
[75] , « Hyperbolic Ax-Lindemann theorem in the cocompact case », Duke Math. J.
163 (2014), p. 433–463.
[76] , « Nombre de classes des tores de multiplication complexe et bornes inférieures
pour les orbites galoisiennes de points spéciaux », Bull. Soc. Math. France 143 (2015),
p. 197–228.
[77] E. Viada – « The intersection of a curve with a union of translated codimension-two
subgroups in a power of an elliptic curve », Algebra Number Theory 2 (2008), p. 249–298.
[78] M. Waldschmidt – Diophantine approximation on linear algebraic groups, Grundl.
math. Wiss., vol. 326, Springer, Berlin, 2000.
[79] G. Wüstholz – « Algebraic groups, Hodge theory, and transcendence », in Proceedings
of the International Congress of Mathematicians, Vol. 1, 2 (Berkeley, Calif., 1986),
Amer. Math. Soc., Providence, RI, 1987, p. 476–483.
[80] A. Yafaev – « On a result of Moonen on the moduli space of principally polarised
abelian varieties », Compos. Math. 141 (2005), p. 1103–1108.
[81] , « Special points and intersections on abelian and Shimura varities », ce volume.



[82] X. Yuan & S.-W. Zhang – « On the averaged Colmez conjecture », prépublication
[83] U. Zannier – Some problems of unlikely intersections in arithmetic and geometry,
Annals of Math. Studies, vol. 181, Princeton Univ. Press, Princeton, NJ, 2012.
[84] S.-W. Zhang – « Equidistribution of small points on abelian varieties », Ann. of Math.
147 (1998), p. 159–165.
[85] S. Zhang – « Positive line bundles on arithmetic varieties », J. Amer. Math. Soc. 8
(1995), p. 187–221.
[86] B. Zilber – « Exponential sums equations and the Schanuel conjecture », J. London
Math. Soc. 65 (2002), p. 27–44.
[87] , « Model theory of special subvarieties and Schanuel-type conjectures », Ann.
Pure Appl. Logic 167 (2016), p. 1000–1028.

Emmanuel Ullmo, Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures
sur Yvette, France • E-mail : ullmo@ihes.fr


Panoramas & Synthèses
52, 2017, p. 31–87



Emmanuel Ullmo

Résumé. – Le texte est la version écrite des exposés donnés par l’auteur au CIRM en
mai 2011 sur la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann
généralisée due à Klingler, Ullmo et Yafaev. Il contient également une introduction à
la théorie des variétés de Shimura.
Abstract (Around the André-Oort conjecture). – The text is the written part of the
lectures by the author at the CIRM in May 2011 on the proof of the André-Oort
conjecture assuming the generalized Riemann hypothesis due to Klingler, Ullmo and
Yafaev. It also contains an introduction to the theory of Shimura varieties.

1. Introduction

Le but de ce texte est de présenter la preuve de la conjecture d’André-Oort sous

l’hypothèse de Riemann généralisée, (GRH dans la suite), pour les produits de courbes
modulaire due à Edixhoven [18] et d’introduire les outils nécessaires à la compréhen-
sion de la preuve de cette conjecture pour une variété de Shimura arbitraire, sous
GRH, due à Klingler, Yafaev et l’auteur de ces notes ([40], [22]). Les grandes lignes
de la preuve de ces résultats sont présentées dans le texte compagnon de Yafaev dans
ce volume. Ces deux textes sont les versions écrites et détaillées d’un cours donné en
commun au CIRM en mai 2011 sur le sujet.
Il y a quatre parties correspondants aux quatre exposés oraux donnés par l’auteur
du texte sur les huit du cours commun en question. Voici une très brève description du
contenu de ces notes, la table des matières donnant une idée plus précise des thèmes

Classification mathématique par sujets (2000). – 11G15, 14G35, 22E40.

Mots clefs. – Variétés de Shimura, multiplication complexe, géométrie diophantienne, théorie er-

© Panoramas et Synthèses 52, SMF 2017


La première partie présente la preuve due à Edixhoven de la conjecture d’André-

Oort sous GRH pour les produits de courbes modulaires. Nous essayons de dégager
les étapes qui se retrouvent dans la preuve du cas général.
La deuxième partie introduit les notions de bases de la théorie des variétés de
Shimura. L’accent est mis sur les ingrédients intervenant dans l’énoncé et la preuve de
la conjecture d’André-Oort sous GRH. On insiste particulièrement sur les définitions
et propriétés des sous-variétés spéciales et on explique certaines propriétés dues à
Edixhoven et Yafaev d’irréductibilité d’image de sous-variétés des variétés de Shimura
par des opérateurs de Hecke.
Dans les deux dernières sections on développe les outils nécessaires à la compréhen-
sion de la partie ergodique de la preuve de la conjecture d’André-Oort sous GRH. On
explique en particulier les principes de bases de la théorie ergodique sur « Γ\G(R) »
pour un réseau arithmétique Γ d’un groupe algébrique. Les résultats de Ratner sur
la dynamique des flots unipotents sont décrits. Le théorème d’équidistribution des
sous-variétés fortement spéciales est expliqué dans la dernière section.
Notons enfin que les progrès récents sur la conjecture d’André-Oort sans GRH
impulsés par Pila sont décrits dans ce volume dans la contribution de Scanlon et dans
le texte introductif de l’auteur.

2. La conjecture d’André-Oort pour un produit de courbes modulaires

Le but de cette partie est de décrire la preuve d’Edixhoven [17] [18] de la conjecture
d’André-Oort sous GRH pour un produit de courbes modulaires. La plupart des énon-
cés obtenus dans ce cadre s’étendent aux variétés de Shimura arbitraires. La stratégie
ainsi dégagée par Edixhoven a donc été centrale dans tous les travaux postérieurs sur
la conjecture d’André-Oort sous GRH.

2.1. La conjecture d’André-0ort pour un produit de 2 courbes modulaires

2.1.1. Courbes modulaires. – Nous nous intéresserons dans cette partie à la variété
de Shimura la plus simple : la courbe modulaire
Y0 (1) = SL2 (Z)\H
où H = {z ∈ C, Im(z) > 0} est le demi-plan de Poincaré et

SL2 (Z) = { ac db ∈ M2 (Z)| ad − bc = 1}
est le groupe modulaire.
Un des intérêts principaux des variétés de Shimura est que l’on dispose de deux
descriptions de nature différentes qui donnent des informations complémentaires. Les
variétés de Shimura sont des espaces localement symétriques hermitiens et des espaces
de modules pour des « objets intéressants » (typiquement des variétés abéliennes ou
plus généralement des structures de Hodge). Nous développerons ces deux points de
vue pour une variété de Shimura générale dans la section 3. Nous nous contenterons
de donner dans cette partie ces descriptions pour la courbe modulaire.



La description de H comme espace symétrique hermitien est donnée par

H = SL2 (R)/K∞

( ! )
cos θ − sin θ
K∞ ≃ SO2 (R) = ,θ ∈ R
sin θ cos θ
est un sous-groupe compact maximal de SL2 (R).

On a une action par homographies de GL2 (R)+ sur H, donné pour α = a b
c d ∈
GL2 (R)+ et z ∈ H par
az + b
α.z = .
cz + d
Dans cette description

K∞ = SO2 (R) = FixSL2 (R) ( −1),

de sorte que l’isomorphisme SL2 (R)/SO2 (R) ≃ H est donné par g.SO2 (R) 7→ g. −1.
Soit B le sous-groupe de Borel de SL2 (R) des matrices triangulaires supérieures.
Au vu de la décomposition d’Iwasawa SL2 (R) = B SO2 (R) on peut préciser l’isomor-
phisme précédent :
1 −1
y 2 xy 2 √
−1 .SO2 (R) 7→ z = x + −1y.
0 y 2

On dispose d’une mesure SL2 (R)-invariante µ = dxdy y 2 sur H. Le groupe modulaire

SL2 (Z) agit de manière proprement discontinue sur H et le quotient SL2 (Z)\H est
de µ-volume fini π3 . On dit que SL2 (Z) est un réseau de H (par analogie avec le cas
des variétés abéliennes) et le quotient d’un espace symétrique hermitien par un réseau
est par définition un espace localement symétrique hermitien.
L’invariant j donne un isomorphisme SL2 (Z)\H → C = A1C et muni SL2 (Z)\H
d’une structure de variété algébrique quasi-projective.
Du point de vue modulaire SL2 (Z)\H est un espace de module pour les classes
d’isomorphismes de courbes elliptiques sur C. Dans cette description on associe à
SL2 (Z)τ la courbe elliptique Eτ ≃ C/Γτ sur C où Γτ désigne le réseau Z ⊕ τ Z de C. Il
est classique que toute courbe elliptique sur C est de la forme E ≃ Eτ pour un τ ∈ H et
que deux courbes elliptiques Eτ et Eτ ′ sont isomorphes (comme surfaces de Riemann
de genre 1 avec une origine) si et seulement si il existe γ ∈ SL2 (Z) tel que τ ′ = γτ .
Il existe enfin un modèle canonique Y0 (1)Q sur Q qui est un espace de module
grossier pour les courbes elliptiques sur Q (voir [15]). On a donc un isomorphisme
Y0 (1)Q ⊗ C ≃ SL2 (Z)\H et Y0 (1)Q ≃ A1Q .



2.1.2. Multiplication complexe des courbes elliptiques. – Soit E une courbe elliptique
sur C. On sait que E = C/Λ pour un réseau Λ de C. Un endomorphisme de E est
donné par la multiplication par un élément z ∈ C tel que zΓ ⊂ Γ. Si End(E) = Z,
on dit que E est sans multiplication complexe. C’est la situation générique, un terme
auquel on donnera un sens précis dans le cadre des variations de structures de Hodge à
la section 3.1.4. Si ce n’est pas le cas, End(E) est un ordre dans un corps quadratique
imaginaire F . Soit OF l’anneau des entiers de F , alors un ordre dans F est de la forme
OF,f = Z + f OF
pour un entier f ≥ 1. On note Pic(OF,f ) le groupe de Picard (i.e. le groupe de classes)
de OF,f . Quand End(E) = OF,f , on dit que E est à multiplication complexe par OF,f .
Pour plus de détails et certaines preuves le lecteur peut consulter [35] et [38] ch. XI.
Proposition 2.1. – L’ensemble ΣF,f des classes d’isomorphismes de courbes elliptiques
E telles que End(E) = OF,f est un Pic(OF,f )-torseur. Il est en particulier fini de
cardinal hf := |Pic(OF,f )|.
Une conséquence qui nous sera utile est donnée par le théorème de Brauer-Siegel
([23] ch. XVI).
Théorème 2.2. – Soit E une courbe elliptique à multiplication complexe par OF,f , alors
|Gal(Q/F ).E| = |Pic(OF,f )| = |disc(End(E))| 2 +o(1)
quand |disc(End(E))| → ∞.
Soit Λ un OF,f -module projectif de rang 1, alors E = C/Λ a multiplication com-
plexe par OF,f . Si Λ et Λ′ sont deux tels OF,f -modules projectifs de rang 1 alors
C/Λ ≃ C/Λ′ si et seulement si Λ et Λ′ ont la même classe dans Pic(OF,f ). Récipro-
quement soit E = C/Λ ayant multiplication complexe par OF,f , alors Λ = π1 (E, 0)
est un OF,f -module de rang 1 dont les endomorphismes sont exactement OF,f . Ceci
entraine que Λ est projectif de rang 1.
L’opération de Pic(OF,f ) sur ΣF,f est donné par
Λ.C/Λ′ = C/Λ ⊗OF,f Λ′ .
On dispose alors du théorème classique suivant :
Théorème 2.3. – Soit E à multiplication par OF,f .
(1) j(E) est un entier algébrique dans l’extension abélienne maximale de F non
ramifiée en dehors de f .
L’action de Gal(Q/F ) sur ΣF,f est donnée par un homomorphisme surjectif dit de
réciprocité r = rF,f : Gal(Q/F ) → Pic(OF,f ). Soit p un idéal premier non ramifié
dans OF,f et F (p) le Frobenius correspondant alors
r(F (p)) = [p]−1 .
Autrement dit
(C/Λ)F (p) = C/Λ ⊗OF,f p−1 .



Le lecteur pourra consulter le texte de Serre [35] pour la preuve de cet énoncé.
Il est utile d’avoir une interprétation adélique du morphisme de réciprocité via la
théorie du corps de classe. Soit AF,f l’anneau des adèles de F . On a un isomorphisme
F ∗ \A∗F,f /(Z
b ⊗ OF,f )∗ ≃ P ic(OF,f ).
et un morphisme
r : Gal(Q/F ) → F ∗ \A∗F,f /(Z
b ⊗ OF,f )∗
tel que r(F (p)) est l’idèle dont l’unique composante non triviale est l’inverse πp−1 de
l’uniformisante en p.

Lemme 2.4. – Soit F = Q[ −d] pour un entier positif d sans facteurs carrés. On
réalise ΣF,f comme un sous-ensemble de SL2 (Z)\H. Soit l = ll′ un nombre premier
totalement décomposé dans OF,f , l’action de [l] sur ΣF,f est donnée par
[l].SL2 (Z)x = SL2 (Z)gx .x,
pour un gx ∈ GL2 (Q)+ de déterminant l.
On rappelle que pour tout nombre premier l, on a la décomposition :
a a 
0 1
SL2 (Z) ( 10 0l ) SL2 (Z) = SL2 (Z) ( 10 al ) SL2 (Z) −l 0 .

L’opérateur de Hecke Tl est la correspondance de SL2 (Z)\H donnée par l’action de la

double classe SL2 (Z) ( 10 0l ) SL2 (Z). Explicitement
a+τ a
Tl .SL2 (Z)τ = {SL2 (Z) }0≤a<l {SL2 (Z)lτ }.
Le théorème des diviseurs élémentaires nous assure qu’une matrice de déterminant
l dans GL2 (Q) appartient à SL2 (Z) ( 10 0l ) SL2 (Z). On peut reformuler et préciser le
lemme 2.4 de la manière suivante.
Lemme 2.5. – Avec les hypothèses et notations du lemme 2.4, on a
(1) [l].SL2 (Z)x ∈ Tl SL2 (Z)x.
0 1

De plus l’élément gx du lemme 2.4 n’est pas dans SL2 (Z) −l 0 .
La première partie est une réécriture de la discussion précédente. Pour la deuxième
partie il suffit de voir que si x = SL2 (Z)τ est un point correspondant à une courbe
elliptique à multiplication par un ordre OF,f de discriminant d et si l ne divise pas d
alors x′ = SL2 (Z)lτ correspond à une courbe elliptique à multiplication par OF,f l de
discriminant dl2 .
Pour prouver cela on rappelle que les points τ ∈ H tels que Eτ est CM par un
ordre de discriminant d est en correspondance biunivoque avec les formes quadratiques
binaires définies positives Q(x, y) = ax2 + bxy + cy 2 de discriminant d = b2 − √
−b+ d
La correspondance associe à une telle forme quadratique Q, la racine τ = 2a de
partie imaginaire positive de Q(x, 1) = 0. Dans cette description lτ correspond à la
forme binaire ax2 + blxy + cl2 y 2 de discriminant dl2 .



2.1.3. Théorème de Chebotarev effectif. – Nous utiliserons la forme suivante du théo-

rème de Chebotarev effectif sous l’hypothèse de Riemann généralisée. Le lecteur est
encouragé à consulter le texte de Serre [36] pour la preuve et des applications du
résultat suivant.
Proposition 2.6. – On suppose vraie l’hypothèse de Riemann généralisée pour les corps
de nombres. Soit M une extension Galoisienne de degré n sur Q. Soit A = AM un
ordre de l’anneau d’entiers OM dont la valeur absolue du discriminant est d = dA .
Soit πA (x) le nombre de nombres premiers p ≤ x qui sont non ramifiés dans A et
totalement décomposés dans A. Pour x plus grand qu’une constante absolue et
x > 2(log d)2 (log log d)2
on a
πA (x) ≥ .
3n log x
Si n est borné, il existe une constante c tel que pour x plus grand qu’une constante
absolue et
x > 2(log d)2 (log log d)2
il existe un nombre premier l tel que x < l < c.x qui est non ramifié et totalement
décomposé dans AM . Cela résulte du fait que le nombre de nombres premiers qui
sont ramifiés dans AM est o(log d) et de l’estimation π(x) ≃ logx x pour le nombre de
nombres premiers plus petit que x.
2.1.4. La conjecture pour un produit de 2 courbes modulaires. – Dans cette partie
S = SL2 (Z)\H × SL2 (Z)\H ≃ C × C.
Les sous-variétés spéciales dans ce cas sont, les couples (x1 , x2 ) de points CM, les
variétés de la forme {x} × C (ou de la forme C × {x}) pour un point CM x et l’image
dans C × C de la courbe modulaire
Y0 (N ) = Γ0 (N )\H

où Γ0 (N ) = { ac d ∈ SL2 (Z), c ≡ 0 [mod]N }.

Rappelons que Y0 (N ) est la courbe modulaire paramétrant les isogénies cycliques

d’ordre N , φ : E1 → E2 entre courbes elliptiques. Dans cette description le morphisme
de Y0 (N ) vers C × C est juste
(E1 → E2 ) 7→ (j(E1 ), j(E2 )).
Il est aussi connu que le corps des fonctions C(Y0 (N )) est C(j(z), j(N z)), de sorte
que l’on dispose de deux morphismes
α : Y0 (N ) → Y0 (1), α(Γ0 (N ).z) = j(z)
β : Y0 (N ) → Y0 (1), β(Γ0 (N ).z) = j(N z)
et l’image de Y0 (N ) par (j(z), j(N z)) est la sous-variété spéciale envisagée. Dans la
suite nous noterons Y0 (N ) l’image dans C2 de Y0 (N ).



Théorème 2.7 (Edixhoven [17]). – On suppose l’hypothèse de Riemann pour les corps
quadratiques imaginaires. Soit C une courbe algébrique irréductible dans C × C dont
les deux projections sont dominantes. On suppose que C contient un ensemble Zariski-
dense de points x = (x1 , x2 ) à multiplication complexe. Alors C = Y0 (N ) pour
un N ∈ N× .

Comme C contient un ensemble Zariski-dense de points définis sur Q, C est défini

sur Q. On remplace C par une union finie de conjugués sous Gal(Q/Q) de sorte que C
soit irréductible sur Q (mais pas géométriquement irréductible).
Soit zn = (z1,n , z2,n ) une suite de points CM, Zariski-dense dans C. Notons OFn ,fn
et OFn′ ,fn′ les anneaux de multiplication complexe de z1,n et z2,n . On peut supposer
sans perte de généralités que
dn := max(|disc(OFn ,fn )|, |disc(OFn′ ,fn′ )|) → ∞.
D’après le théorème de Chebotarev effectif sous l’hypothèse de Riemann (Prop. 2.6
appliquée à l’ordre OFn ,fn OFn′ ,fn′ de Fn Fn′ ) il existe l décomposé dans OFn ,fn et OFn′ ,fn′
tel que
l ≪ (log dn )3 .
Notons Tl = Tl × Tl , il existe alors d’après le lemme 2.4 un conjugué par Galois
znσ de zn tel que
znσ ∈ Tl zn .
Comme l’opérateur Tl est défini sur Q, on en déduit que
O(zn ) := {znθ , θ ∈ Gal(Q/Q)} ⊂ C ∩ Tl C}.
Si l’intersection C ∩ Tl C est propre, l’inégalité de Bezout, le choix de l via le
théorème de Chebotarev effectif (sous GRH) et le théorème de Brauer-Siegel assurent
(2) dn2 ≪ |O(zn )| ≪ deg(C) deg(Tl C) ≪ l2 ≪ (log dn )6 .
Comme dn tend vers l’infini, pour n assez grand C ∩ Tl C n’est pas propre. Comme
C est Q-irréductible on a en fait
(3) C ⊂ Tl C.
La marge de manoeuvre dans Chebotarev montre que cette dernière inclusion est
valable pour une infinité de l. Edixhoven en déduit dans son approche initiale que C
est un Y0 (N ). Nous allons suivre cette approche initiale mais on peut remarquer que
(1) Pour tout l assez grand et pour toute composante géométrique C1 de C qui
n’est pas spéciale Tl C est irréductible. C’est une application d’un résultat ultérieur
d’Edixhoven et Yafaev que nous expliquerons dans la section 3.4 car si C1 n’est pas
spéciale alors C1 est Hodge générique.
(2) On peut aussi remarquer que si C1 n’est pas spéciale alors il en est de même des
autres composantes géométriques de C. On en déduit que Tl C a le même nombre de
composantes que C pour l assez grand et donc que si C ⊂ Tl C, on a en fait C = Tl C.



(3) Il est facile de voir que l’orbite sous Tl de n’importe quel point est dense
dans C × C. On a en fait le résultat plus précis suivant que nous n’utiliserons pas
(voir [8], [7] pour une preuve et des généralisations en rang arbitraire).

Théorème 2.8. – Soit x ∈ SL2 (Z)\H. Pour tout l ∈ N, on note

1 X
∆l,x = δy
deg(Tl )
y∈Tl .x

la mesure de probabilité obtenue comme la moyenne des mesures de Dirac δy pour y ∈

Tl .x. Alors quand l tend vers l’infini ∆l,x converge faiblement vers la mesure de Poin-
caré normalisée µ = π3 dxdyy 2 . Autrement dit, pour toute fonction continue bornée f
sur SL2 (Z)\H,
f (y) → f.µ.
deg(Tl ) SL2 (Z)\H
y∈Tl .x

En combinant (1), (2) et (3), on voit que les composantes de C sont spéciales.
Le point (1) est moins élémentaire que les autres arguments. C’est une conséquences
d’un théorème de Deligne et André sur les variations de structure de Hodge et d’un
résultat de Nori. Pour garder cette partie aussi élémentaire que possible nous expli-
quons dans la suite l’approche initiale d’Edixhoven qui a par ailleurs inspiré d’autres
développements ultérieurs.

On note Tln (l) l’opérateur de Hecke sur Y0 (l) = Γ0 (l)\H défini par la double classe
1 0
Γ0 (l) Γ0 (l).
0 ln
Un calcul simple ou une lecture détaillée du livre de Miyake [26] montre que
! !
1 0 a 1 a
Γ0 (l) Γ0 (l) = Γ0 (l) ,
0 ln 0≤a<ln
0 ln

de sorte que Tln (l) est une correspondance de degré ln et que pour tout entier n ≥ 1,
Tln (l) = (Tl (l))n .

Une application du lemme 2.5 nous donne le résultat raffiné suivant :

Lemme 2.9. – Notons πl : Γ0 (l)\H → SL2 (Z)\H correspondant à l’inclusion Γ0 (l) ⊂

SL2 (Z). Soit P ∈ SL2 (Z)\H un point à multiplication complexe par OF,f et P̃ ∈ Y0 (l)
tel que πl (P̃ ) = P . Soit l un nombre premier décomposé dans OF,f et σ ∈ Gal(Q/F )
correspondant à un idéal maximal divisant l. On a
P̃ σ ∈ Tl (l)P̃ .



Revenons à la preuve du théorème. Soit Cl une composante Q-irréductible de

(πl × πl )−1 C ⊂ Y0 (l) × Y0 (l). Soit c un entier. On note Tlc (l) = Tlc (l) × Tlc (l).
La preuve des équations (2) et (3) combinée au lemme précédent donne
Cl ⊂ Tl Cl .
Noter que l’indice de Γ0 (l) dans SL2 (Z) est l + 1.

Corollaire 2.10. – Il existe une composante géométriquement irréductible Z de Cl et

un entier c tel que
Z ⊂ Tlc (l)Z.

En effet si Z1 , . . . , Zr sont les composantes géométriquement irréductibles de Cl ,

on a des inclusions de la forme
Z1 ⊂ Tl (l)Zi1 ⊂ Tl (l)Tl (l)Zi2 = Tl2 (l)Zi2 ⊂ · · · ⊂ Tlr (l)Zir .
Il existe alors des indices ik < il tels que Zik = Zil . On prend alors Z = Zik et on
voit que Z ⊂ Tlc (l)Z avec c = il − ik .
π : H × H → SL2 (Z)\H × SL2 (Z)\H
π ′ : H × H → Γ0 (l)\H × Γ0 (l)\H
les projections naturelles et fixons une composante irréductible X de la sous-variété
analytique (π ′ )−1 Z. Soit G = SL2 (R) × SL2 (R) et GX = StabG (X). On va montrer
que GX est le graphe d’un automorphisme intérieur de SL2 (R). Comme l’action de G
sur H × H est algébrique, GX est un sous-groupe analytique.

Lemme 2.11. – Les noyaux des projections de GX vers SL2 (R) sont discrets.

Soit K = StabSL2 (R)×{1} (X). Pour tout τ ∈ H, K stabilise

Xτ := X ∩ H × {τ }.
Comme la projection de C sur le deuxième facteur est dominante, Xτ est discret. La
composante connexe K 0 de K stabilise donc tous les éléments de Xτ . Le stabilisateur
de τ dans SL2 (R) est un sous-groupe
√ compact maximal de SL2 (R), donc est un conju-
gué de SO2 (R) = FixSL2 (R) ( −1). Comme la projection de C sur le premier facteur
est dominante, K 0 est contenu dans l’intersection de tous les conjugués de SO2 (R)
qui est {±1}.

Lemme 2.12. – Soit Γ = SL2 (Z) × SL2 (Z) et ΓX = GX ∩ Γ. Soit di le degré des
projections de C vers SL2 (Z)\H. L’indice de la i-ème projection pi (ΓX ) dans SL2 (Z)
est borné par di .



On a une factorisation π : H × H → SL2 (Z)\H × SL2 (Z)\H de la forme

H × H → SL2 (Z)\H × H → SL2 (Z)\H × SL2 (Z)\H.
On note Y l’image de X dans SL2 (Z)\H ×H. Alors Y est une composante irréductible
de l’image inverse Z de C dans SL2 (Z)\H×H. Comme C est le quotient de X par ΓX ,
on voit que C est aussi le quotient de Y par p2 (ΓX ). On en déduit que p2 (ΓX ) est le
stabilisateur dans SL2 (Z) de Y ⊂ Z. Comme l’orbite sous-SL2 (Z) de Y est l’ensemble
des composantes irréductibles de Z, on voit que SL2 (Z)/p2 (ΓX ) est l’ensemble des
composantes irréductibles de Z. Par ailleurs Z est par définition le produit fibré
 
Z → H
 
↓ ↓.
C → C
En particulier Z a au plus d2 composantes. L’argument pour la première projection
est identique.
Notons que ces deux lemmes n’utilisent pas l’hypothèse Z ⊂ Tlc (l)Z. Le point clef
est le résultat suivant.

Lemme 2.13. – Le groupe topologique GX n’est pas discret.

Le groupe GX est fermé et contient ΓX . L’hypothèse Z ⊂ Tlnc (l)Z pour tout entier
n assure que GX contient un élément de la forme
! !
nc 1 an 1 b n
l− 2 γ ×
0 lnc 0 lnc
avec 0 ≤ an < lnc , 0 ≤ bn < lnc et γ ∈ Γ = SL2 (Z) × SL2 (Z). Soit H le sous-groupe
de GX engendré par ΓX et ces éléments. Les deux projections de H ne sont pas
discrètes donc H n’est pas discret.

Fin de la preuve. – L’algèbre de Lie Lie(GX ) est non triviale d’après le lemme pré-
cédent et les deux projections pi (Lie(GX )) sont normalisées par pi (ΓX ) qui sont
Zariski-denses dans SL2 (R). On en déduit que pi (Lie(GX )) = Lie(SL2 (R)) pour i = 1
et i = 2. Comme SL2 (R) est connexe, GX se projette surjectivement sur les deux fac-
teurs SL2 (R). Le noyau de p1 : GX → SL2 (R), est discret normal dans SL2 (R)×{1} et
contient {±1} donc est égal à {±1}. Par le lemme de Goursat, GX est le graphe d’un
automorphisme σ de SL2 (R)/{±1}. Les automorphismes de SL2 (R)/{±1} sont inté-
rieurs. Comme pi (ΓX ) est d’indice fini dans SL2 (Z), σ provient d’un automorphisme
intérieur de SL2,Q . Le groupe des automorphismes intérieurs de SL2,Q est PGL2,Q .
D’après Hilbert 90, l’application GL2 (Q) → PGL2 (Q) est surjective donc σ est donné
par la conjugaison par un élément g ∈ GL2 (Q). Donc GX = {(h, ±ghg −1 ), h ∈
SL2 (R)}.
Soit x = (τ, hτ ) ∈ X. Soit T = StabSL2 (R) (τ ) ≃ SO2 (R). Alors
StabG0X (x) = {(t, gtg −1 ), t ∈ T } = {(t, hth−1 ), t ∈ T }.



On en déduit que gT g −1 = hT h−1 donc que g −1 h normalise T , mais le normalisateur

de T dans GL2 (R) est T.Gm (R) (où Gm (R) désigne l’ensemble des matrices diagonales
de GL2 (R)). On en déduit que h.τ = g.τ et que
X = {(τ, g.τ ), τ ∈ H}.
En remplaçant g par un multiple ag, on peut supposer par le théorème des diviseurs
élémentaires que gZ2 ⊂ Z2 et que Z2 /g.Z2 = Z/mZ pour un entier m. Cela montre
que C = Y0 (m) et cela termine la preuve du théorème.

Remarque 2.14. – Edixhoven donne l’exemple suivant qui justifie le passage à Y0 (l) ×
Y0 (l) dans la preuve. Il construit des courbes C ⊂ SL2 (Z)\H × SL2 (Z)\H tel que C ⊂
Tl C qui ne sont pas spéciales. Le problème vient de l’involution d’Atkin wl qui inter-
vient dans Tl mais pas dans Tl (l). Soit C une courbe telle que une composante Cl de
l’image inverse de C dans Y0 (l) × Y0 (l) soit invariante par wl × wl . Alors C ⊂ Tl C,
mais à priori il n’est pas nécessaire que Cl ⊂ Tl Cl . Soit Z le quotient de Y0 (l) × Y0 (l)
par l’involution wl ×wl . Le théorème de Bertini donne l’existence de familles continues
de courbes dans Z dont l’image inverse dans Y0 (l) × Y0 (l) sont irréductibles. Comme
il n’y a qu’un nombre dénombrable de sous-variétés spéciales dans Y0 (l) × Y0 (l) on
peut choisir une courbe dans Z dont l’image inverse C ′ dans Y0 (l) × Y0 (l) est ir-
réductible (et bien sur invariante par wl × wl .) On prend alors pour C son image
dans SL2 (Z)\H × SL2 (Z)\H. En terme de théorie des groupes, comme wl normalise
Γ0 (l), le groupe engendré par wl et l’image de ΓX peut être discret.
Il est aussi notable que le passage à Y0 (N ) qui correspond à un passage à un niveau
Iwahori pour une variété de Shimura générale (où la structure de l’algèbre de Hecke
est plus simple) joue un rôle important dans les arguments de Klingler et Yafaev [22]
pour la fin de la preuve de la conjecture d’André-Oort sous l’hypothèse de Riemann

2.2. La conjecture d’André-Oort pour des produits de courbes modulaires

2.2.1. Préliminaires, notations
Définition 2.15. – Soit I un ensemble fini de cardinal r. Pour tout i ∈ I, soit Γi un
sous-groupe de congruence de SL2 (Z). On note XΓi = Γi \H et
S= X Γi .

Une sous-variété fermée irréductible Z de S est dite spéciale de type Ω = ΩZ pour

une partition
Q ΩZ = (I1 , . . . , It ) de I telle que Z est un produit de sous-variétés Zi
de Si = j∈Ii Γj \H d’une des formes suivantes :
1. Le cardinal de Ii est 1 et Zi est un point CM de la composante correspondante.
2. Il existe des pour tout j ∈ Ii des éléments sj ∈ GL2 (Q) de déterminant positif
tel que Zi est l’image de l’application
H → Si , τ 7→ (Γj sj τ )j∈Ii .



Étant donné une sous-variété spéciale de type Ω, on note c(Ω) le nombre de facteurs
CM. Une sous-variété Z est dite fortement spéciale si c(Ω) = 0.

On peut vérifier que cette définition de variétés spéciales et de variétés fortement

spéciales coincide avec les définitions usuelles en termes de sous-données de Shimura
données plus loin dans ce texte ([18] ch. 2).

Le but de cette section est de montrer, sous l’hypothèse de Riemann générali-

Q pour les corps quadratiques imaginaires, la conjecture d’André-Oort pour S =
i∈I XΓi . Il est facile de voir que la conjecture d’André-Oort n’est pas sensible au
niveau et que l’on peut supposer sans perte de généralités dans la suite que S =
(SL2 (Z)\H)r .

Il y a les étapes suivantes que l’on retrouve dans [40] et [22] pour une variété de
Shimura arbitraire.

1. Minorations de la taille des orbites sous Galois des sous-variétés spéciales.

2. Équidistribution des sous-variétés fortement spéciales.

3. Alternative Galois/ergodique.

4. Caractérisation des sous-variétés spéciales.

5. Technique géométriques et galoisiennes.

2.2.2. Minorations d’orbites sous Galois. – Pour un point CM x de SL2 (Z)\H, on

note Ox l’anneau de multiplication complexe de x. C’est un ordre dans un corps
quadratique imaginaire. On note dx la valeur absolue du discriminant de Ox . Soit Z
une sous-variété spéciale de S de type Ω avec s = c(Ω). Soit {x1 , . . . , xs } l’ensemble
des points CM qui sont des facteurs de Z. Le paramètre fondamental de toute la
discussion sera
(4) dZ := max dxi .

Proposition 2.16. – Soit ǫ > 0, soit Z une sous-variété spéciale de S de type Ω

avec c(Ω) > 0. Alors
(5) |{σ(Z), σ ∈ Gal(Q/Q)}| ≫ dZ2 .

Démonstration. – Le cardinal de cet ensemble est au moins celui de l’orbite sous

Galois des facteurs CM de Z. Le résultat est alors une conséquence du théorème de
Brauer-Siegel (c.f. thm. 2.2).



2.2.3. Équidistribution des sous-variétés spéciales. – Soit Z une sous-variété spéciale

de S. Alors Z est isomorphe à un produit de courbes modulaires donc est munie
d’une mesure de probabilité canonique µZ de support Z. On note en particulier µS
la mesure canonique sur S. Soit P (S) l’ensemble des mesures de probabilité sur S.
Une suite de mesures µn ∈ P converge faiblement vers µ ∈ P si pour toute fonction
continue bornée f sur S
f µn → f µ.
Le résultat suivant est un cas particulier d’un théorème général qui sera discuté dans
la dernière section de ces notes.

Théorème 2.17. – Soit S un produit de courbes modulaires et Zn une suite de sous-

variétés fortement spéciales de S. Il existe une sous-suite Znk et une sous-variété
fortement spéciale Z telles que µZnk converge faiblement vers µZ et Znk ⊂ Z pour
tout k.

Il sera pratique d’utiliser la définition suivante.

Définition 2.18. – Soit M une variété algébrique et (Yn )n∈N une suite de sous-variétés
de M . On dit que (Yn )n∈N est générique dans M si pour toute sous-variété N de M
avec N 6= M , l’ensemble
{n ∈ N, Yn ⊂ N }
est de cardinal fini.

Le résultat suivant est un corollaire du théorème 2.17.

Corollaire 2.19. – Soit S un produit de courbes modulaires et Zn une suite générique

de sous-variétés fortement spéciales de S. Alors µZn converge faiblement vers µS .

Nous introduirons aussi pour une variété de Shimura générale la notion de sous-
variétés T -spéciales. Dans notre situation, on fixe un sous-ensemble J de I et pour
tout i ∈ J on fixe un anneau de multiplication complexe Oi = Z + fi OKi dans
un corps quadratique imaginaire Ki . On peut classiquement associer un sous-tore
|J| |I|
T de PGL2,Q ⊂ PGL2,Q à ces données. Une sous-variété T -spéciale est une sous-
variété spéciale dont les facteurs CM sont indexés par les i ∈ J et les points CM
correspondants ont multiplication complexe par Oi . Pour J = ∅, TQ = {1} une
variété T -spéciale n’est rien d’autre qu’une variété fortement spéciale.
Il est facile alors de remplacer fortement spéciale par T -spéciale dans l’énoncé
précédent. Par ailleurs l’alternative Galois/Ergodique est aussi très simple dans ce
cas :



Proposition 2.20. – Soit Zn une suite de sous-variétés spéciales de S. En passant au

besoin à une sous-suite soit
|{σ(Zn ), σ ∈ Gal(Q/Q)}| → ∞.
Soit il existe un tore TQ tel que Zn soit une suite sous-variétés T -spéciales et µZn
converge faiblement vers la mesure de probabilité µZ canoniquement associée à une
variété T -spéciale Z telle que Zn ⊂ Z.

2.2.4. Un critère d’irréductibilité. – On se donne dans cette partie une sous-variété

X de
S := (SL(2, Z)\H)r = Cr
contenant une sous-variété spéciale Z avec c(ΩZ ) > 0. On veut montrer que si X est
contenu dans un translaté Tα .X de X par un opérateur de Hecke bien choisi, alors X
contient une sous-variété spéciale Z ′ contenant strictement Z.
Nous aurons besoin de quelques propriétés sur les degrés des sous-variétés de S :=
(P1 )r . Le groupe de Chow de (P1 )r est Z[ǫ1 , . . . , ǫr ] avec ǫ2i = 0 pour tout i. Soit V
une sous-variété de (P1 )r pure de codimension i. La classe [V ]de V dans le groupe de
Chow CH i ((P1 )r ) est
[V ] = aI ǫI

où I parcourt les sous-ensembles de {1, . . . , r} à i éléments.

Q Pour un tel I on note
I ∨ le complémentaire de I dans {1, . . . , r}. Alors ǫI = i∈I ǫi (y penser comme un
produit extérieur) et aI désigne le degré de la projection de V sur le produit (P1 )r−i
des composantes indexées par I ∨ . On définit le degré de V par
deg(V ) = aI .

Pour une sous-variété V de S = (SL(2, Z)\H)r , on définit le degré de V comme le

degré de sa fermeture de Zariski dans (P1 )r . Si S ′ := j=1 Γj \H est un produit de
courbes modulaires (avec Γi sous-groupe d’indice fini de SL2 (Z) pour tout j) et V
sous-variété de S ′ , on définit le degré de V par
deg(V ) = [C(V ′ ) : C(V )] deg(V ′ )
où V ′ désigne l’image de V dans S et C(V ) et C(V ′ ) sont les corps de fonctions de V
et V ′ . Notons que le degré [C(V ′ ) : C(V )] est borné par [Γi : SL2 (Z)].

Proposition 2.21 (Edixhoven [18] prop. 4.2). – Soit r ≥ 3 un entier. Soit X une hy-
persurface de S telle que pour tout I ⊂ {1, . . . , r} de cardinal r − 1, la projection
pI : X → (SL2 (Z)\H)r−1 sur les facteurs indexés par I est dominante. On note dI le
degré de pI . Soit s ≤ r un entier et Tαl la correspondance de Hecke définie par
!s !r−s
lθ 0 1 0
αl = × ∈ (GL2 (Q)+ )r ,
0 1 0 1



pour un nombre premier l et un entier θ ≥ 1. Si l > max(deg(X), 3), alors Tαl .X est

Preuve. On note G = SL2 (Z/lθ Z)/{±1} et Y = Y (lθ ) la courbe modulaire associée

à ce quotient. Donc Y (lθ ) est un espace de modules pour les courbes elliptiques munies
d’une structure symplectique sur l’ensemble des points de lθ -torsion. Le groupe G agit
librement sur Y (lθ ) et
G\Y (lθ ) ≃ Y (1) ≃ C.
De même Gr agit librement sur Y (lθ )r avec quotient Cr . On note
πr : Y (lθ )r → Cr
le morphisme associé. Comme Tαl X est une image de πr−1 (X) par un morphisme fini,
on voit qu’il suffit de montrer que πr−1 (X) est irréductible.
On note V une composante de πr−1 (X) et H = StabGr (V ). Le groupe Gr agit
transitivement sur l’ensemble des composantes irréductibles de πr−1 (X). Il suffit donc
de voir que H = Gr . On va en fait montrer que les projections de H sur les facteurs
Gr−1 sont toutes surjectives. Par symétrie, il suffit de voir que la projection pr−1 :
H → Gr−1 sur les r − 1 premiers facteurs est surjective.
On considère tout d’abord le produit fibré
 
P = X ×Cr−1 Y (lθ )r−1 → Y (lθ )r−1
 
 ↓ ↓ 
X → Cr−1
de sorte que X ≃ P/Gr−1 et Cr−1 = Y (lθ )/Gr−1 .
Soit d = maxI dI , P a au plus d composantes car le morphisme P → Y (lθ )r−1 est
génériquement fini de degré au plus d. On a par ailleurs une action transitive de Gr−1
sur l’ensemble Irr(P ) des composantes irréductibles de P . Le fixateur dans Gr−1
d’une composante irréductible de P est donc un sous-groupe de Gr−1 d’indice au
plus d.

Lemme 2.22. – Le groupe Gr n’a pas de sous-groupes propres d’indice au plus d.

Preuve. Cela résulte du fait que G et donc Gr sont engendré par ses l-Sylow. Un
sous-groupe d’indice au plus d < l de Gr contient tous les l-Sylow et donc est égal
à Gr .
On en déduit que P est irréductible. On a par ailleurs un diagramme commutatif
 
V → πr−1 X → Y (lθ )r
 
 ↓ ↓ ↓ .
α(V ) = V ′ → P → Y (lθ )r−1
Vu l’irréductibilité de P , on a α(V ) = V ′ = P . On en déduit que
StabGr−1 (V ′ ) = pr−1 (H) = StabGr−1 (P ) = Gr−1 .



Lemme 2.23. – Soit H un sous-groupe de Gn avec n ≥ 2. On suppose que pour tout

sous-ensemble I de {1, . . . , n} de cardinal 2 la projection pI (H) = G2 . Alors H = Gn .

Preuve. On peut supposer que n ≥ 3, on a H ⊂ G × Gn−1 et on note p1 : Gn → G

et p2 : Gn → Gn−1 les projections sur les facteurs. On peut supposer (en faisant une
récurrence sur n-ou en ne s’intéressant qu’au H du problème que l’on regarde) que
les deux projections de H par p1 et p2 sont surjectives. On note
H1 := H ∩ Gn−1 = Ker(p1|H ) ⊳ Gn−1
H2 := H ∩ G = Ker(p2|H ) ⊳ G.
Le lemme de Goursat affirme alors qu’il existe un isomorphisme
φ : Gn−1 /H1 → G/H2
tel que si on note π : Gn → Gn−1 /H1 × G/H2 et
Gr(φ) := {(x, φ(x)), x ∈ Gn−1 /H1 }
son graphe, alors
H = π −1 Gr(φ).
Si H2 = G, alors H = Gn . Si H2 6= G alors H1 6= Gn−1 . Notant Gj le j-ième
facteur de Gn , il existe j ≥ 2 tel que H1 ∩ Gj 6= {Gj }. Alors
p1,2 : H → G1 × Gj
n’est pas surjectif.
2.2.5. Caractérisation des sous-variétés spéciales. – Dans cette partie on note encore
S := (SL(2, Z)\H)r = Cr .
Pour tout sous ensemble I ⊂ {1, . . . , r}, on note CI le produit des facteurs indexés
par I et pI : S → CI la projection correspondante. Soit V une sous-variété irréductible
de S. Un sous-ensemble I de S est dit minimal pour V si pI V est une hypersurface
de CI et pour tout I ′ ⊂ I de cardinal |I ′ | = |I| − 1 la restriction de pI ′ à V est
dominante. On dit aussi dans cette situation que pI est une projection minimale. Une
conséquence simple de la définition des sous-variétés spéciales est donnée par le lemme
suivant du à Edixhoven ([18] Prop 3.6).

Lemme 2.24. – Une sous variété V de S est spéciale si et seulement si les ensembles
minimaux I de V sont de cardinal |I| ≤ 2 et si pour toute projection minimale pI (V )
est spéciale dans CI .

Nous utiliserons aussi le lemme suivant ([18] lemma 3.5).

Lemme 2.25. – Soit

T X une sous-variété de S, alors X est une union de composantes
irréductibles de I p−1
I pI X, la réunion portant sur les sous-ensembles minimaux I
pour X.



Le but de cette partie est de donner la caractérisation suivante des sous-variétés

spéciales contenues dans une sous-variété en terme d’opérateurs de Hecke.

Proposition 2.26. – Soit X une sous-variété de S dont les composantes irréductibles

ont toutes les mêmes ensembles minimaux. On suppose que toute composante irré-
ductible Xi de X contient une sous-variété spéciale Zi avec s := c(ΩZi ) indépendant
de i telle que la projection de Zi sur les s premiers facteurs est un point CM. On sup-
pose aussi que la première projection de X est dominante. Soit l ≥ max(deg(X), 13)
un nombre premier tel que X ⊂ Tl X. Alors X est un produit X = X 1 × X 2 pour
des variétés X 1 et X 2 de Cs et de Cr−s respectivement. De plus les composantes
irréductibles de X 1 sont spéciales. En particulier, chaque composante irréductible Xi
contient une sous-variété spéciale Zi′ contenant Zi telle que c(ΩZi′ ) < c(ΩZi ) = s.

On commence par le lemme suivant.

Lemme 2.27. – Soit I un sous-ensemble de {1, . . . , r} minimal pour les composantes

irréductibles de X. Soit I est contenu dans {1, . . . , s}, soit I est contenu dans {s +
1, . . . , r}. Si |I| ≥ 3, alors I ⊂ {s + 1, . . . , r}.

Preuve. Notons I1 = I ∩ {1, . . . , s} et I2 = I ∩ {s + 1, . . . , r}.

Supposons tout d’abord |I| ≥ 3 Comme I est minimal, les composantes irré-
ductibles de pI (X) et de pI (Tl X) sont des hypersurfaces de CI . Notons Tl,I la
correspondance de Hecke sur CI qui est le produit des Tl sur les facteurs indexés
par I1 et qui est triviale sur les facteurs indexés par I2 . Alors pI Tl X = Tl,I pI X.
Comme deg(pI (X)) ≤ deg(X), la proposition 2.21 assure que pI X et Tl,I pI X ont
le même nombre de composantes irréductibles. L’inclusion X ⊂ Tl X assure alors
que pI X = Tl,I pI X. Pour i ∈ {1, 2} fixons xi ∈ pIi X. Alors pI X contient l’orbite
sous Tl,I de (x1 , x2 ). Comme les orbites sous Tl d’un point arbitraire de SL2 (Z)\H
sont denses pour la topologie complexe (elles sont même équidistribuées pour la me-
sure de Poincaré normalisée), on voit que pI X contient CI1 × {x2 }. Les composantes
de pI X sont donc de la forme CI1 × pI2 Xi pour une composante irréductible Xi de X.
Ceci contredit la minimalité de I si I1 6= ∅.
Si |I| = 2 et que I1 6= ∅ et I2 6= ∅. Soit Xi une composante de X et Zi ⊂ Xi la sous-
variété spéciale donnée par l’hypothèse. Alors pI Zi est de la forme {xi }×C ⊂ C2 pour
un point CM xi de C = SL2 \H. On en déduit que pI Xi = {x} × C, ce qui contredit
la minimalité de I.
Si |I| = 1 alors pI X est un point CM et I ⊂ {2, . . . , s}.
Preuve de la proposition 2.26. D’après le lemme 2.25, X est une union de compo-
santes irréductibles de \
I pI X.

l’intersection portant sur les ensembles minimaux de X. L’intersection des p−1

I pI X
pour les I minimaux contenus dans {1, . . . , s} est de la forme X ′1 × Cr−s . Celle



portant sur les I ⊂ {s + 1, . . . , r} est de la forme Cr × X ′2 . Donc X est de la forme

X = X 1 × X 2 pour des unions X i de composantes irréductibles de X ′i .
Fixons une composante Xi = Y1 × Y2 de X. Soit I un ensemble minimal pour Y1 ,
alors |I| ≤ 2 et si |I| = 1, pI Y1 est un point spécial. Si |I| = 2, le cas r = 2 de la
conjecture assure que pI Y1 est aussi une sous-variété spéciale. Le lemme 2.24 nous
assure alors que Y1 est spéciale. La sous-variété spéciale Zi de Xi est de la forme
Zi = {x1 } × · · · × {xs } × Z i
pour une sous-variété spéciale Z i de Cr−s . La sous-variété spéciale Zi′ = Y1 × Z i
répond alors à la question. L’inégalité c(ΩZi′ ) < c(ΩZi ) est assuré par le fait que la
projection de Zi′ sur le premier facteur est dominante.
2.2.6. Techniques géométriques et Galoisiennes
Théorème 2.28. – On admet l’hypothèse de Riemann pour les corps quadratiques ima-
ginaires. Soit X une sous-variété de S contenant un ensemble Zariski dense Σ de
sous-variétés spéciales. Alors les composantes irréductibles de X sont spéciales.

On peut supposer que les sous-variétés de Σ sont toutes du même type Ω. Comme
X contient un ensemble Zariski dense de points spéciaux (donc définis sur Q) X est
défini sur Q. En remplaçant X par l’union de ses conjugués sous Gal(Q/Q) on peut
supposer que X est défini sur Q. On peut aussi supposer que X est irréductible sur Q.
On peut aussi supposer que les projections de X sur les facteurs de S sont dominantes.
On peut extraire de Σ une suite générique de sous-variétés de X (au sens de la
définition 2.18) par le procédé diagonal classique suivant. L’ensemble des sous-variétés
Y de X définies sur Q avec Y 6= X est dénombrable. Soit (Yn )n∈N une indexation
de l’ensemble des sous-variétés Y de X définies sur Q avec Y 6= X. Comme Σ est
Zariski dense dans X, pour tout n ∈ N il existe Zn ∈ Σ tel que Zn n’est pas contenu
dans i=1 Yi . Comme les Zn sont définis sur Q la suite (Zn )n∈N est générique dans X.
Si c(Ω) = 0, le théorème 2.17 et notre hypothèse assurent qu’il existe une suite Zn
de sous-variétés spéciales de X générique dans X telle que la suite de mesures associées
µZn converge faiblement vers la mesure µZ associée à une sous-variété spéciale Z.
Comme pour tout n le support Zn de µZn est contenu dans X qui est fermé, on voit
que Z ⊂ X. De plus Zn ⊂ Z pour n ≫ 0, donc Z contient un ensemble Zariski dense
dans X. Finalement X = Z est une sous-variété spéciale.
On suppose donc que s := c(Ω) > 0. En changeant au besoin l’ordre des facteurs,
on peut supposer que les sous-variétés Z dans Σ s’écrivent sous la forme
Z = {x1 } × · · · × {xs } × Z ′
avec Z ′ fortement spéciale dans Cr−s . On rappelle que si x ∈ C = SL2 (Z)\H est un
point CM, on note Ox son anneau de multiplication complexe et dx le discriminant
de Ox . On peut aussi supposer que dZ := max(dxi ) = dx1 .
Au vu de la discussion précédente le théorème est conséquence de la proposition
suivante :



Proposition 2.29. – On suppose que c(Ω) > 0. Alors X contient un ensemble Zariski
dense de sous-variétés spéciales de type Ω′ avec c(Ω′ ) < c(Ω).
Le théorème de Chebotarev effectif a pour conséquence le lemme suivant :
Lemme 2.30. – On admet l’hypothèse de Riemann généralisée pour les corps quadra-
tiques imaginaires. Pour dZ suffisamment grand , il existe un premier l décomposé
dans chaque Oxi tel que
deg(X) ≪ l ≪ (log dZ )3 .
Comme la première projection de X est dominante, l’ensemble des p1 Z pour Z
dans Σ est dense dans C. La proposition 2.16 assure alors que dZ n’est pas borné
quand Z varie dans Σ. Le lemme assure donc l’existence pour dZ assez grand d’un l
décomposé dans tout les Oxi tel que
max(3, deg(X)) < l ≪ (log dZ )3 .
Si X est contenu dans Tl X, la proposition 2.26 nous assure que X contient bien une
sous-variété spéciale Z ′ contenant Z telle que c(Ω′ ) < c(Ω).
On suppose donc qu’il existe une composante géométriquement irréductible X ′
de X qui n’est pas contenue dans Tl .X. Comme nous avons supposé que X est
irréductible sur Q et comme Tl est défini sur Q, l’intersection de X avec Tl X est
Lemme 2.31. – On suppose que X n’est pas contenu dans Tl X. Il existe une hyper-
surface H de (P1Q )r tel que
1. X n’est pas contenu dans H et Tl X ⊂ H.
2. deg(H) ≪ l2s .
Preuve. On note V la fermeture dans (P1C )r d’une sous-variété V de S. Ecrivons la
décomposition X
[X] = aI ǫI
r−dim(X) 1 r
de [X] dans CH ((P ) ). Alors
[Tl X] = (l + 1)s aI ǫI .

On peut choisir une hypersurface H telle que

X r
[H] = dim(X)!(l + 1)s aI ǫi .
|I|=r−dim(X) i=1

Comme l est décomposé dans chaque Oxi et comme Z ′ est géométriquement ir-
réductible sur Q, un conjugué par Galois de Z est contenu dans Tl X. Comme cette
intersection est rationnelle sur Q, Z ⊂ X ∩ H.
Lemme 2.32. – Soit Y une Q-composante de X ∩ H contenant Z. Si dZ est suffisam-
ment grand, la projection de Y sur le premier facteur est dominante.



Preuve. Supposons que la première projection de Y ne soit pas dominante. Une

composante géométriquement irréductible de Y est de la forme {x1 } × Y ′ . L’image
de la première projection de Y contient l’orbite sous-Galois O(x1 ) de x1 , donc [Y ] est
divisible par |O(x1 )|ǫ1 . On sait par ailleurs d’après le lemme 2.16 que pour tout ǫ > 0,
|O(x1 )| ≫ dZ2 ,
donc deg(Y ) ≫ dZ2 . Les choix de H, l et le théorème de Bezout nous assurent que
deg(Y ) ≪ l2s ≪ (log dZ )6s .
Pour dZ ≫ 0 ces deux inégalités sont incompatibles.
On remplace X = X1 par une composante Y = X2 de X ∩ H contenant Z et on
procède par récurrence. Noter que seule l’hypothèse de surjectivité de Y sur le premier
facteur compte pour notre preuve.
Pour construire Xi+1 à partir de Xi , on choisit un nombre premier li totalement
décomposé dans les Oxk avec l1 = l, et li tel que deg(Xi ) < li < A deg(Xi ). L’existence
d’un tel li est assuré par la discussion sur Chebotarev effectif après la proposition 2.6.
Si l’intersection de Xi avec Tli Xi est propre on construit Xi+1 comme une com-
posante de l’intersection Xi ∩ Hi contenant Z pour une hypersurface Hi de degré
≃ deg(Tl Xi ) contenant Tl Xi mais ne contenant pas Xi . Si cette intersection n’est
pas propre on applique la proposition 2.26 pour conclure à l’existence de Z ′ contenant
Z dans X tel que c(ΩZ ′ ) < c(Ω).
Notons aussi qu’il existe une constante universelle C telle que
deg(Xi ) ≪ (log dZ )C
de sorte que l’on peut appliquer la méthode du lemme précédent pour voir qu’a chaque
cran la première projection de Xi est dominante.
Au bout d’un nombre fini d’étapes on se trouve dans la situation suivante :
1. dim(Xk ) = dim(Z) + 1.
2. deg(Xk ) ≪ (log dZ )C .
3. |Gal(Q/Q).Z| ≫ǫ dZ2 .
Ces inégalités montrent que l’intersection Xk ∩ Tlk Xk n’est pas propre et donc
que Xk ⊂ Tlk Xk . On conclut encore à l’aide de la proposition 2.26 l’existence de Z1
contenant Z dans X tel que c(ΩZ1 ) < c(Ω).

3. Variétés de Shimura

Le but de cette partie est de présenter les objets de la théorie des variétés de
Shimura qui sont au centre de la conjecture d’André-Oort.



3.1. Structures de Hodge et groupes de Mumford-Tate

3.1.1. Tores algébriques. – On note Gm le groupe multiplicatif, de sorte que pour
tout anneau A, Gm (A) = A× . Soit k un corps et ks une clôture séparable de k. Soit T
un tore sur k, on a donc par définition
Tks = Grm,ks
pour un entier r.
On définit le groupe des caractères X ∗ (T ) et le groupe des cocaractères X∗ (T ) :
X ∗ (T ) = Hom(Tks , Gm,ks ),
X∗ (T ) = Hom(Gm,ks , Tks ).
On dispose d’une action continue de Gal(ks /k) sur X ∗ (T ) et X∗ (T ) et le foncteur
X∗ (.) (resp. X ∗ (.)) de la catégorie des tores algébriques sur k dans la catégorie des
groupes abéliens libres de rang fini munis d’une action continue de Gal(ks /k) est une
équivalence de catégories (resp. une anti-équivalence de catégories).
On dispose d’un accouplement parfait
X ∗ (T ) × X∗ (T ) → Z = End(Gm,ks )
(χ, µ) 7→ <χ, µ> = χoµ.
Noter que les endomorphismes de Gm,ks sont de la forme z 7→ z n pour n ∈ Z et on a
donc par définition
χoµ(z) = z <χ,µ> .
Pour k = ks et ρ : T → GL(V ) une représentation de T dans un espace vectoriel
V de dimension finie sur k, on dispose d’une décomposition
(7) V = Vχ = V n1 ,...,nr
χ∈X ∗ (T ) (n1 ,...,nr )∈Zr

où on a fait les identifications

X ∗ (Grm ) = X ∗ (T ) −→ Zr
h r
Y i
(z1 , . . . , zr ) → zini 7→ (n1 , . . . , nr )
Vχ := {v ∈ V, ρ(t).v = χ(t).v}
V n1 ,...,nr
= {v ∈ V, ρ(z1 , . . . , zr ).v = z1−n1 . . . zr−nr .v}.
Cette décomposition détermine ρ. Pour un corps général k, il existe une équivalence
de catégories entre la catégorie Repk (T ) des représentations de T dans un espace
vectoriel de dimension finie sur k et la catégorie des espaces vectoriels V de dimension
finie sur k munis d’une X ∗ (T )-graduation
V ⊗k ks = Vks ,χ
χ∈X ∗ (T )



telle que pour tout σ ∈ Gal(ks /k) on ait

Vkσs ,χ = Vks ,χσ .
3.1.2. Structures de Hodge. – On définit le R-tore de Deligne S = ResC/R Gm . Alors
X ∗ (S) = Zz ⊕ Zz munie de l’action évidente de la conjugaison complexe (z c = z,
z c = z). Ceci détermine S d’après ce qui précède. On a
S(R) = C∗ ⊂ S(C) = C∗ × C∗ .

Définition 3.1. – On définit :

(a) Le cocaractère de poids
w : Gm,R → S
donné sur les points par l’inclusion naturelle
R∗ = Gm (R) ⊂ S(R) = C∗ .
(b) Le cocaractère principal
µ : Gm,C → SC
z 7→ (z, 1).

Définition 3.2. – Soit A un sous-anneau de R. (Dans la pratique A = Z, A = Q ou

A = R.) Une A-structure de Hodge pure de poids n ∈ Z est un A-module libre de rang
fini V , muni d’un R-morphisme de groupes algébriques
(9) h : S → GL(VR ),
tel que
hw : Gm,R → GL(VR )
est donné par
z 7→ z −n 1V .
L p,q
Autrement dit VC = p+q=n VC avec VCp,q = VCq,p et (z1 , z2 ) ∈ S(C) = C∗ × C∗
agit sur VCp,q par multiplication par z1−p z2−q (donc z ∈ S(R) = C∗ agit sur VCp,q par
multiplication par z −p z −q ).
Une A-structure de Hodge est une somme directe de A-structures de Hodge pures
de poids ni .
Le type d’une structure de Hodge V est l’ensemble des (p, q) ∈ Z2 tels que VCp,q est
non nul.

L’automorphisme C := h(i) de VR est appelé Opérateur de Weil. Si v p,q ∈ VCp,q ,

C.v p,q = h(i).v p,q = iq−p v p,q .
Un homomorphisme de A-structure de Hodge est un morphisme A-linéaire V1 → V2
tel que fR : V1,R → V2,R est S-équivariant (ou tel que pour tout (p, q) ∈ Z2 , on a
p,q p,q
fC (V1,C ) ⊂ V2,C ). On note HomASH (V1 , V2 ) le groupe des morphismes de structures
de Hodge de V1 dans V2 .



Soit n un entier. La A-structure de Hodge de Tate A(n) est défini comme le A-mo-
dule libre de rang 1
A(n) = (2iπ)n A ⊂ C
muni d’une structure de Hodge pure de type (−n, −n). On note A = A(0) la structure
de Hodge triviale.
Si V1 et V2 est une A-structure de Hodge de poids n1 et n2 , alors V1 ⊗ V2 est une
structure de Hodge de poids n1 + n2 . De même si V est une A-structure de Hodge
de poids n alors V ∨ := HomASH (V, A) est une structure de Hodge de poids −n. On
note V (n) = V ⊗ A(n).

Définition 3.3. – Une A-structure de Hodge V de poids n est dite polarisable si il existe
un homomorphisme de A-structures de Hodge
φ : V ⊗ V → A(−n)
tel que la forme bilinéaire
VR × VR → R
(v, w) 7→ (2iπ)n φ(v ⊗ h(i)w)
est symétrique et définie positive. Il revient au même de demander que φ soit non
dégénérée et que φ soit alternée si n est pair et symétrique si n est impair.

Example 3.4. – Soit X une variété algébrique projective lisse sur C, alors les groupes
de cohomologie de Betti H i (X, Z) sont des Z-structures de Hodge polarisables. On a
H i (X, Z)C = H i (X, C)
et pour p + q = i
H i (X, C)p,q = H q (X, ΩpX ).
Le cup produit H i (X, Z) ⊗ H j (X, Z) → H i+j (X, Z) et l’isomorphisme de Kunneth
H k (X × Y, Q) = H i (X, Q) ⊗ H j (Y, Q)

sont des morphismes de structures de Hodge. Le choix d’un plongement X dans Pn dé-
termine une polarisation sur la partie primitive de la cohomologie et la décomposition
de Lefschetz M
H i (X, Q) = c1 (L)j H i−2j (X, Q(−j))

donne la polarisation sur H i (X, Q)

Example 3.5. – Le foncteur X → H1 (X, Z) de la catégorie des variétés abé-

liennes complexes dans la catégorie des Z-structures de Hodge polarisables de type
(−1, 0), (0, −1) est une équivalence de catégories. Un foncteur quasi-inverse est donné
de la manière suivante : Soit VZ une Z-structure de Hodge de type (−1, 0), (0, −1).
Pour v ∈ VR l’opérateur de Weil
h(i).v = iv



détermine une structure complexe sur VR . Dans cette situation X := VR /VZ est un tore
complexe. Soit φ : VZ ⊗ VZ → Z(1) une polarisation. Alors φ est une forme alternée
prenant des valeurs entières sur VZ . La théorie de Riemann permet alors d’associer à
un tel φ un fibré inversible ample Lφ sur X. Donc X est en fait une variété abélienne.

Remarque 3.6. – On voit de la même manière que la catégorie des variétés abéliennes
sur C à isogénie près est équivalente à la catégorie des Q-structures de Hodge polari-
sables de type (−1, 0), (0, −1) et que la catégorie des tores complexes est équivalentes
à la catégorie des Z-structures de Hodge de type (−1, 0), (0, −1).

Proposition 3.7. – La catégorie des Q-structures de Hodge polarisables est semi-simple

et tanakienne.

Preuve. Soit V une Q-structure de Hodge et φ : V ⊗ V → Q(−n) une polarisation.

Tout tenseur T = V ⊗n ⊗ (V ∨ )⊗m est muni d’une polarisation déduite de φ. Si W ⊂ V
est une sous-Q-structure de Hodge, alors
φ|W ⊗W : W ⊗ W → Q(−n)
est une polarisation et
W ∗ = {x ∈ V, φ(x, w) = 0 pour tout w ∈ W }
est une Q-sous-structure de Hodge polarisée de V telle que V ≃ W ⊕ W ∗ (isomor-
phisme de Q-structures de Hodge polarisées ).
3.1.3. Groupes de Mumford-Tate
Définition 3.8. – Soit VQ une Q-structure de Hodge donnée par
h : S → GL(VR ).
Le groupe de Mumford-Tate MT(V ) (ou MT(h)) de V est le plus petit Q-sous-groupe
algébrique M de GL(VQ ) tel que h se factorise par MR . On définit de même le groupe
de Hodge Hg(V ) de V en utilisant à la place de h,
h|U1 : U1 −→ GL(VR )
où U1 (R) = {z ∈ C∗ = S(R), |z| = 1}.

Lemme 3.9. – Soit µ le cocaractère principal Gm,C → SC et

µh = hC µ : Gm,C → GL(VC ).
Alors M T (V ) est aussi le plus petit Q-sous-groupe algébrique M de GL(VQ ) tel que µh
se factorise par MC .

Remarque 3.10. – (a) Les définitions impliquent que MT(V ) et Hg(V ) sont des
Q-groupes algébriques linéaires connexes.
(b) Si V est pure de poids n 6= 0 alors
hw : Gm,R → GL(VR )



est donné par z → z −n 1V . On en déduit que MT(V ) contient le centre Gm,Q 1V

de GL(VQ ). Si V est pure de poids 0 alors
MT(V ) = Hg(V ) ⊂ SL(VQ ).

(c) On a toujours Hg(V ) ⊂ SL(V ) et si V est pure de poids non nul alors MT(V )
est le produit presque direct de Hg(V ) et de Gm,Q 1V à l’intérieur de GL(V ).

Le lien entre Q-sous-structures de Hodge et groupes de Mumford-Tate est donné

par le résultat fondamental suivant.

Théorème 3.11. – Soit V une Q-structure de Hodge. Soient m, n deux entiers positifs
ou nuls. On note T m,n := V ⊗m ⊗ (V ∨ )⊗m . Soit T une Q structure de Hodge obtenue
comme somme directe de Q-structures de Hodge de la forme T mi ,ni . On dispose alors
d’une action induite de MT(V ) sur V . Soit W ⊂ T un Q-sous-espace vectoriel, alors
W est une Q-sous-structure de Hodge si et seulement si W est un MT(V )-sous-

3.1.4. Variations de structures de Hodge. – Nous donnons ici des définitions de base
de la théorie des variations de structure de Hodge. Le lecteur peut consulter entre
autres [41] 17.3.1 ou [3] pour plus de détails et pour certaines preuves.
Soit S une variété complexe, on rappelle qu’une variation de Q-structures de Hodge
de poids n sur S est la donnée d’un triplet
V = ( V Q , F . , Q),
où V Q est un système local de Q-espaces vectoriels de dimension finie sur S, F . est
une filtration de V O := V Q ⊗Q O S par des sous-fibrés holomorphes définissant en
tout s ∈ S une Q-structure de Hodge V s de poids n ;
Q : V Q × V Q → Q(−n)S
est une forme bilinéaire localement constante non dégénérée qui induit en tout s ∈ S
une polarisation de la structure de Hodge V s .
Soit ∇ la connexion de Gauss-Manin. On demande de plus que la condition de
transversalité de Griffiths
∇ F p ⊂ Ω1S ⊗ OS F p−1
soit vérifiée.
Soit π : S̃ → S le revêtement universel de S. Soit s ∈ S et s̃ ∈ S̃ tels que π(s̃) = s.
On fixe une trivialisation
(10) π ∗ V Q ≃ S̃ × VQ
et on note
ρ : π1 (S, s) → GL(VQ )
la représentation de monodromie correspondante au système local V Q .



Définition 3.12. – Le groupe de monodromie algébrique est le plus petit Q-sous-groupe

algébrique de GL(VQ ) contenant l’image de ρ. On note Hmon,s la composante connexe
de l’identité du groupe de monodromie algébrique. Notons que le groupe de mono-
dromie algébrique est indépendant des choix de s et s̃ une fois que l’on a fixé la
trivialisation (10).

Notons par ailleurs pour tout s ∈ S, MTs = MT( V s ) ⊂ GL( V s ) le groupe de

Mumford-Tate de V s . Le choix de s̃ au dessus de s donne un isomorphisme V s ≃ VQ ,
d’où un plongement
is̃ : MTs → GL(VQ ).
Il existe une union dénombrable Σ de sous-espaces analytiques propres de S telle
que pour tout s ∈ S\Σ l’image M de is̃ dans GL(VQ ) est indépendante des choix de s
et s̃. Pour s ∈ Σ l’image de is̃ est un sous-groupe propre de M .

Définition 3.13. – Un point de S\Σ est appelé Hodge générique et S\Σ est le lieu
Hodge générique de S. Le groupe M est appelé groupe de Mumford-Tate générique de
la variation de structure de Hodge.

Le lien entre groupe de monodromie algébrique et groupe de Mumford-Tate géné-

rique est donné par le résultat suivant.

Théorème 3.14. – (a) Le groupe Hmon,s est un sous-groupe normal du groupe dérivé
M der .
(b) Si il existe t ∈ S tel que M Tt est un tore, alors
(11) Hmon,s = M der .

L’inclusion de Hmon,s dans M der est un résultat dû à Deligne[13]. La normalité

de Hmon,s dans M der et la preuve de (b) sont dus à André [1].

3.2. Variétés de Shimura

3.2.1. Espaces symétriques hermitiens. – Soit GQ un Q-groupe algébrique réductif et
h : S → GR
un morphisme de groupes algébriques. Toute représentation
ρ : GQ → GL(VQ )
dans un Q-espace vectoriel de dimension finie détermine une Q-structure de Hodge
(VQ , ρh) sur VQ . Pour tout g ∈ G(R), on obtient une Q-structure de Hodge
(VQ , gρhg −1 ) sur VQ . Soit X la G(R)-classe de conjugaison de h. Alors X est un
espace de paramètres pour des Q-structures de Hodge sur VQ . On aimerait obtenir
les propriétés naturelles suivantes :
(a) On voudrait que X paramétre des Q-structures de Hodge polarisées pures de
poids donné n. Soit Cg = (gρhg −1 )(i), on cherche donc une polarisation naturelle
φ : VQ ⊗ VQ → Q(−n)



telle que
(2iπ)n φ(v ⊗ Cg .w)
soit (pour tout g ∈ G(R)) une forme bilinéaire symétrique définie positive sur VR .
(b) On voudrait que X ≃ G(R)/ZG (h) soit muni d’une structure de variété com-
plexe. On obtiendra en fait une structure d’espace symétrique hermitien sur X.
(c) Les Q-structures de Hodge paramétrées par X devraient varier holomorphique-
ment. On devrait obtenir ainsi plus précisément une variation de structures de Hodge
sur X.
3.2.2. Involutions de Cartan. – Soit GR un groupe algébrique connexe sur R. On note
g → g la conjugaison complexe sur G(C). Un involution θ de GR est une involution
de Cartan si
Gθ (R) := {g ∈ G(C)| g = θ(g)}
est compact.

Example 3.15. – L’exemple principal est GR = GLn,R , θ.M = (t M )−1 ,

Gθ (R) = {g ∈ GLn (C),t gg = 1n } = U (n)
est compact donc θ est une involution de Cartan.

Théorème 3.16. – Il existe une involution de Cartan sur GR si et seulement si GR est

réductif. Les involutions de Cartan de GR sont conjugués sous G(R).

On remarque que si G(R) est compact, l’identité de GR est une involution de Cartan
de GR .
Soit G → GL(VR ) une représentation fidèle de GR . Alors GR est réductif si et
seulement si on peut trouver une base de V telle que G soit stable par g 7→ (t g)−1 .
Dans cette situation la restriction de g 7→ (t g)−1 à G est une involution de Cartan
de GR .
Soit θ une involution de GR . Il existe une unique forme réelle GθR de GC telle que
la conjugaison complexe sur Gθ (C) soit donnée par g 7→ θ(g). Notons aussi que toute
forme réelle de GC est associée à une involution de GR par ce procédé. Avec cette
description, on voit que l’involution θ est de Cartan si et seulement si la forme réelle
associée GθR est la forme compacte de GC .

Lemme 3.17. – Soit GR un groupe algébrique connexe sur R. Si G(R) est compact,
alors toute représentation réelle de dimension finie
ρ : GR −→ GL(VR )
est munie d’une forme bilinéaire G(R)-invariante définie positive.
Réciproquement si GR admet une représentation fidèle de dimension finie munie
d’une forme bilinéaire G(R)-invariante définie positive, alors G(R) est compact.



Preuve. Soit ρ : GR → GL(VR ) une représentation réelle de dimension finie. Si G(R)

est compact, alors H := ρ(G(R)) est compact. Soit dH la mesure de Haar sur H.
Fixons une forme bilinéaire symétrique définie positive <., .> sur VR . La forme bili-
néaire symétrique Z
<u, v>G = <h.u, h.v>dH
est alors G(R)-invariante et définie positive.
Réciproquement, soit <., .>G une forme G(R)-invariante sur une représentation
fidèle (VR , ρ) de GR . Alors G(R) s’injecte dans O(VR , <., .>G ) qui est compact donc
G(R) est compact.
Définition 3.18. – Soit GR un groupe algébrique réel et C ∈ G(R) tel que C 2 ∈
Z(G(R)). On voit que ad(C) est une involution de GR . Une C-polarisation d’une
représentation réelle VR de GR est une forme bilinéaire G(R)-invariante φ sur VR
telle que la forme bilinéaire
φC (u, v) = φ(u, c.v)
est symétrique et définie positive.
Proposition 3.19. – Si ad(C) est une involution de Cartan de GR , alors toute repré-
sentation (réelle de dimension finie) de GR est munie d’une C-polarisation. Récipro-
quement, si ρ : G → GR est une représentation fidèle munie d’une C-polarisation,
alors ad(C) est une involution de Cartan.
3.2.3. Décompositions de Cartan et Espaces symétriques. – Soit GR un groupe algé-
brique linéaire et θ une involution de Cartan de GR (en particulier GR est réductif).
K∞ := {g ∈ G(R)| θ(g) = g},
alors K∞ est un sous-groupe compact maximal de G(R).
Θ : Lie(GR ) −→ Lie(GR )
l’application tangente de θ à l’origine 1G . Alors Θ2 = 1 et une involution de Lie(GR )
obtenue de cette manière est appelé involution de Cartan de Lie(GR ). On obtient une
décomposition dite de Cartan
Lie(GR ) = k ⊕ p
k = Lie(GR )+ = {X ∈ Lie(GR )| Θ(X) = X}
p = Lie(GR )− = {X ∈ Lie(GR )| Θ(X) = −X}.
On vérifie sans peine que [k, k] ⊂ k, [k, p] ⊂ p, [p, p] ⊂ k. Par conséquent, k est une
sous-algèbre de Lie de Lie(GR ) de groupe de Lie associé K∞ ⊂ G(R).
Proposition 3.20. – Tout élément g de G(R) s’écrit de manière unique sous la forme
g = k exp(X) avec k ∈ K∞ et X ∈ p. La décomposition G(R) = K∞ exp(p) ainsi
obtenu est appelé décomposition de Cartan de G(R).



Rappelons la définition suivante.

Définition 3.21. – Soit (X, g) une variété riemannienne . On note Isom(X, g) (ou
Isom(X)) le groupe des isométries de X. On dit que (X, g) est un espace symétrique
si tout x ∈ X est un point fixe isolé d’une isométrie sx de Isom(X).

On suppose que G(R) est un groupe de type adjoint et que G(R) n’est pas compact.
Soit X = G(R)/K∞ , alors l’espace tangent à TX en 1G .K∞ est p. On a une action
à gauche de G(R) sur X et cette action induit une action dk : p → p de K∞ sur p
tangente en 1G K∞ à
K∞ × X → X
k.(gK∞ ) = kgK∞
On peut définir une métrique riemannienne g sur X en fixant une forme bilinéaire
g0 définie positive sur p telle que pour tout k ∈ K∞ , dk est une isométrie de p. Alors
g est l’unique métrique sur X coïncidant avec g0 sur p telle que G(R) agisse par
Les involutions de Cartan de G(R) et les décompositions de Cartan sont conjuguées
sous G(R). L’espace X s’interprète alors comme l’ensemble des décompositions de
Cartan de G(R). Pour x ∈ X, on note G(R) = K∞,x exp(px ) la décomposition de
Cartan associée. L’application Z 7→ −Z de px induit sur X une isométrie sx dont x
est un point fixe isolé. En particulier X est un espace symétrique de type non compact.
Il est classique que l’on obtient tous les espaces symétriques de type non compact par
ce procédé.

Example 3.22. – Prenons G = SLn,R , alors θ est l’application g →7 (g t )−1 . Alors

K∞ = SOn (R) et P = exp(p) s’identifie à l’ensemble des matrices définies positives
de déterminant 1.

3.2.4. Espaces symétriques hermitiens

Définition 3.23. – Un espace symétrique hermitien est un espace symétrique X muni
d’une structure de variété complexe tel qu’en tout x ∈ X l’involution associée sx est
une application holomorphe. Il existe donc par définition une structure complexe
Jx : TX,x → TX,x
qui est un endomorphisme de TX,x tel que Jx2 = −1. La métrique riemannienne gx
sur TX,x vérifie
gx (Jx Y, Jx Z) = gx (Y, Z)
pour tout Y , Z dans TX,x . On voit alors que gx est la partie réelle d’une unique forme
hermitienne hx sur TX,x vu comme C-espace vectoriel. De plus Jx et gx varient de
manière C ∞ pour x ∈ X.

L’énoncé suivant caractérise les espaces symétriques hermitiens en termes classiques

[21] et en termes de variations de structures de Hodge suivant l’interprétation de
Deligne [12], [14].



Théorème 3.24. – (a) Un espace symétrique hermitien de type non compact est de
la forme X = G(R)/K∞ pour un groupe GR de type adjoint et K∞ un sous-groupe
compact maximal de G(R). Si GR est simple alors l’espace symétrique X est hermitien
si et seulement si on a un isomorphisme
Z(K∞ ) ≃ U1 .
(b) Soit h : S → GR avec GR un groupe réductif non compact tel que
(D1) Lie(GC ) est une structure de Hodge de type (−1, 1), (0, 0), (1, −1).
(D2) int h(i) induit une involution de Cartan de Gad
R .
Soit X la G(R)-classe de conjugaison de h. Alors les composantes connexes de X
sont des espaces symétriques hermitiens. Tout espace symétrique hermitien est obtenu
de cette manière (même si on se restreint à des groupes GR de type adjoint).
(c) Dans cette situation, toute représentation GR → GL(VR ) induit une variation
de structures de Hodge sur X.

3.2.5. Rappels sur les diagrammes de Dynkin. – On commence par des rappels rapides
sur les systèmes de racines et les diagrammes de Dynkin. Soit GC un groupe semi-
simple sur C. Soit TC un tore maximal de GC . Soit BC un sous-groupe de Borel
contenant TC . On notera
X = X ∗ (TC ), Y = X∗ (TC )
XQ = X ⊗Z Q, YQ = Y ⊗Z Q.
Soit R le système de racine de (GC , TC ). Par définition
R = {α ∈ X ∗ (TC ), tel que α apparaît dans la représentation adjointe de GC }.

Soit W R = NGC (TC )/ZG (TC ) le groupe de Weyl de R . Soit R le système de racine

dual de R . On peut réaliser R comme le système de racines associé à un couple
(G∨ ∨ ∨ ∨ ∨
C , TC ) formé d’un groupe semi-simple GC et d’un tore maximal TC de GC . On
∨ ∨ ∨ ∨ ∨ ∨
dispose d’une bijection α 7→ α de R dans R . On a ( R ) ≃ R et (α ) = α
pour tout α ∈ R .
Il existe un produit scalaire W R -invariant
<., .> : X ∗ (TC ) × X∗ (TC ) → Z
qui nous permet d’identifier XQ et YQ . Par ailleurs W R ∨ ≃ W R et on a des isomor-
phismes canoniques X ∗ (TC ) = X∗ (TC∨ ) et X∗ (TC ) = X ∗ (TC∨ ).

On note B = {α1 , . . . , αr } une base de racines positives de R , alors B =

{α1∨ , . . . , αr∨ } est une base de R et on note ω1 , . . . , ωr l’ensemble des poids fon-
damentaux de R obtenu en prenant le dual de {α1∨ , . . . , αr∨ } pour le produit sca-
laire <., .>.
Le réseau des poids radiciels Q( R ) est le Z-module libre de rang maximal de XQ :
Q( R ) = Zα1 ⊕ Zα2 ⊕ · · · ⊕ Zαr .



Le réseau des poids P ( R ) = Q( R ) est le Z-module libre de rang maximal
de XQ :

P ( R ) = Q( R ) = Zω1 ⊕ Zω2 ⊕ · · · ⊕ Zωr .
On a une inclusion Q( R ) ⊂ P ( R ). Si GC est adjoint alors
X ∗ (TC ) = Q( R ),
et si GC est simplement connexe alors
X ∗ (TC ) = P ( R ).

On notera enfin α̃ la plus grande racine de R . On a donc

α̃ = ni αi
et pour toute racine α = i=1 mi αi de R , on a mi ≤ ni pour tout i.
Les sommets du diagramme de Dynkin D R de R sont indexés par {α1 , . . . , αr }.
Un sommet αi de D R est dit spécial si dans l’écriture de α̃ le coefficient ni de αi
est 1.

3.2.6. Espaces symétriques hermitiens en terme de diagramme de Dynkin. – Le but

de cette section est de montrer le résultat suivant.

Théorème 3.25. – Les classes d’isomorphismes d’espaces symétriques hermitiens

irréductibles sont classifiées par les sommets spéciaux des diagrammes de Dynkin

On a en fait le résultat plus précis suivant.

Lemme 3.26. – Soit GC un groupe semi-simple de type adjoint sur C. Il y a une bi-
jection entre
(a) L’ensemble des couples (GR , X) avec GR une forme réelle non compacte de GC
et X une G(R)-classe de conjugaison d’un morphisme
h : S −→ GR
telle que
(D1) La représentation Lie(GC ) est de type (−1, 1), (0, 0), (1, −1).
(D2) int(h(i)) est une involution de Cartan de GR .

(b) La G(C)-classe de conjugaison d’un cocaractère non trivial

µ : Gm,C −→ GC
telle que dans la représentation Lie(GC ) seule les caractères z, 1, z −1 interviennent.



On passe de (GR , X) à (GC , µ) en associant à h le cocaractère µh = hC (z, 1)

(autrement dit en composant l’extension à C hC de h avec le cocaractère principal
(c.f. section 3.1.2).
Réciproquement soit g 7→ g la conjugaison complexe de sur G(C). Alors θ = adµ(i)
est une involution dont la forme réelle associée Gθ est muni d’un morphisme
u = µ|U1 : U1 → Gθ (R).
Comme Gθ est adjoint cela définit un morphisme
h : S → GθR
(trivial sur Gm,R et coincidant avec u sur U1 ). Soit X la Gθ (R)-classe de conjugai-
son de h. Le couple (Gθ , X) vérifie les conditions (i) et (ii). On vérifie que les deux
constructions sont inverses l’une de l’autre.

Preuve du théorème 3.25. – Soit µ : Gm,C → GC vérifiant les hypothèses du b.

Comme les tores maximaux de GC sont conjugués sous G(C), on peut fixer un
tore maximal TC de GC tel que µ(Gm,C ) ⊂ TC . Comme le groupe de Weyl W R
agit transitivement sur les chambres de Weyl, on peut choisir une base de racine
positive {α1 , . . . , αr }de R tel que <αi , µ> ≥ 0 pour tout i. Les caractères de Gm,C
intervenant dans Lie(GC ) sont alors les z <α,µ> pour α ∈ R .
La condition (b) implique donc que <α, µ> ∈ {−1, 0, 1} pour tout α ∈ R . Comme
µ est non trivial, il existe i tel que <αi , µ> > 0. Soit α̃ = ni αi la plus grande
racine. alors <α̃, µ> = 1, il existe donc un i tel que ni = 1 et <αi , µ> = 1 et
pour tout j 6= i <αj , µ> = 0. On voit donc que αi est un sommet spécial de R

et que µ = ωi∨ est un poids minuscule de R (en particulier µ = ωi∨ est un poids

fondamental de R ).
Il est facile de voir que la condition <α̃, µ> = 1 est équivalente à la condition µ
non trivial et <α, µ> ∈ {−1, 0, 1} pour tout α ∈ R .

3.2.7. Données de Shimura et variétés de Shimura. – Une donnée de Shimura est un

couple (GQ , X) formée d’un Q-groupe réductif GQ et d’une G(R)-classe de conjugaison
de morphismes h : S → GR vérifiant les conditions de Deligne :
(D1) Lie(GC ) est de type (−1, 1), (0, 0), (1, −1).
(D2) int(h(i) induit une involution de Cartan de G
(D3) Soit GQ ≃ ZG1,Q Z2,Q . . . Gr,Q la décomposition presque directe de GQ en
facteurs presque Q-simples. Alors pour tout i ∈ {1, . . . , r} Gi (R) n’est pas compact.
Ces définitions impliquent en particulier qu’une composante connexe X + de X
est un espace symétrique hermitien. Tout espace symétrique hermitien est obtenu de
cette manière.
Soit K ⊂ G(Af ) un sous-groupe compact ouvert. On définit la variété de Shimura
(12) ShK (G, X) = G(Q)\[X × G(Af )/K]



où G(Q) agit diagonalement à gauche sur X × G(Af )/K. On notera pour x ∈ X

et g ∈ G(Af )
[x, g.K]
la classe de (x, gK) dans ShK (G, X). Si G(R)+ désigne le stabilisateur dans G(R)
d’une composante connexe X + de X et G(Q)+ := G(Q) ∩ G(R)+ , on vérifie sans
peine que
ShK (G, X) = G(Q)+ \[X + × G(Af )/K].
On se permettra d’oublier les crochets dans l’écriture de ShK (G, X).
Proposition 3.27. – L’ensemble G(Q)+ \G(Af )/K est fini. On se donne un système de
représentants {g1 , . . . , gr } de G(Q)+ \G(Af )/K. Alors
ShK (G, X) = Γi \X +

où Γi est l’image de G(Q) ∩+

gi Kgi−1 dans Gad (Q)+ .
Démonstration. – Pour la finitude du groupe de classes G(Q)+ \G(Af )/K le lecteur
peur consulter le chapitre 5.1 du livre de Platonov et Rapinchuk [32] en particulier le
thm. 5.1 p. 251.
Soit [x, gK] ∈ ShK (G, X). Soit α ∈ G(Q)+ , k ∈ K et i ∈ {1, . . . , r} tels que g =
αgi k. Alors, [x, gK] = [α−1 .x, gi K].
Soit x1 et x2 des éléments de X + tels que [x1 , gi K] = [x2 , gi K]. Il existe alors
β ∈ G(Q)+ et k ′ ∈ K tels que
β.x1 = x2 et gi = βgi k ′ .
On en déduit que β ∈ G(Q)+ ∩ gi Kgi−1 .
ShK (G, X) → Γi \X +
[x, gj K] 7→ Γj x ∈ Γj \X +
est alors bien définie et est un isomorphisme.
Dans cette situation les Γi sont des réseaux de X + . Par définition les Γi sont donc
de volume fini pour la mesure G(R)+ -invariante sur X + . Ceci résulte d’un théorème
de Borel [5] qui sera rappelé dans la section 4.1.
D’après les résultats de Baily et Borel [2] les Γi \X + ont une structure naturelle
de variété algébrique quasi-projective. De plus si K1 ⊂ K2 sont deux sous-groupes
compacts ouverts de G(Af ) le morphisme naturel
ShK1 (G, X) −→ ShK2 (G, X)
est algébrique.
Si Γi est sans torsion, alors Γi \X + est une variété lisse. On utilise en général une
notion un peu plus forte qui est celle de sous-groupes arithmétiques nets.



3.2.8. Sous-groupes arithmétiques nets. – Soit GQ un groupe algébrique linéaire

sur Q. Fixons une représentation fidèle ρ : GQ → GLn,Q . Nous référons au livre de
Borel [6] et à la section 0.6 de la thèse de Pink [31] pour la notion de sous-groupe net
de G(Q) ou de G(Af ).

Un élément g ∈ G(Q) est dit net si le sous-groupe de Q engendré par les valeurs
propres de g est sans torsion. Un sous-groupe Γ de G(Q) est dit net si tout élément
de γ est net. En particulier un sous-groupe net est sans torsion. On vérifie que la
notion de sous-groupe net de G(Q) ne dépend pas du choix de la représentation fidèle
ρ de GQ .

Soit g = (gp )p ∈ G(Af ). Soit Λp le sous-groupe de Qp engendré par les valeurs
∗ ∗ ∗
propres de gp . Soit ιp : Q → Qp un plongement. Comme tout sous-groupe de Q
formé de racines de l’unité est invariant par Gal(Q/Q) le sous-groupe de torsion

(ιp (Q ) ∩ Λp )tors ne dépend pas de ιp . On dit que g est net si
\ ∗
(ιp (Q ) ∩ Λp )tors = {1}.

Un sous-groupe K de G(Af ) est net si tous ses éléments sont nets. Il suffit pour

cela que pour un p le groupe (ιp (Q ) ∩ Λp )tors soit trivial. Cette notion est encore
indépendante de la représentation fidèle ρ. Si K est un sous-groupe compact ouvert
net de G(Af ) alors pour tout g ∈ G(Af ), gKg −1 est net. On en déduit que les réseaux
Γi ⊂ G(Q) de la proposition 3.27 sont nets.
Soit HQ ⊂ GQ un sous-groupe algébrique. Si K ⊂ G(Af ) est un sous-groupe net
alors H(Af ) ∩ K est un sous-groupe net de H(Af ). Si φ : G → H est un homomor-
phisme de groupes algébrique et K ⊂ G(Af ) est net alors φ(K) est un sous-groupe
net de H(Af ).
Enfin on peut pour des questions indépendantes du niveau (comme la conjecture
d’André-Oort) se ramener au cas net car si K ⊂ G(Af ) est un sous-groupe compact
ouvert, il existe une sous-groupe K ′ d’indice fini de K tel que K ′ soit net.

3.3. Sous-variétés spéciales des variétés de Shimura

3.3.1. Sous-données de Shimura. – Un morphisme de données de Shimura
f : (G1 , X1 ) → (G2 , X2 )
est la donnée d’un morphisme de groupe algébrique f : G1 → G2 induisant une
application de X1 dans X2 . Autrement dit fixons x ∈ X1 alors f x ∈ X2 et X2 est la
G2 (R)-classe de conjugaison de f x. Une sous-donnée de Shimura (H, XH ) de (GQ , X)
est un morphisme de donnée de Shimura donnée par l’inclusion d’un sous-groupe
algébrique HQ de GQ . Il existe donc
x : S → HR
avec x ∈ X tel que XH soit la H(R)-classe de conjugaison de x.
On dispose en fait d’une sorte de réciproque.



Proposition 3.28. – Soit (GQ , X) une donnée de Shimura avec GQ semi-simple de type
adjoint. Soit HQ un Q-sous-groupe algébrique de GQ . Supposons qu’il existe x ∈ X se
factorisant par HR . Alors HQ est réductif et
(i) Lie(HC ) est de type (1, −1), (0, 0), (−1, 1).

(ii) int(x( −1)) induit une involution de Cartan de HRad
Si HQ est sans Q-facteur R-anisotrope (i.e. HQ vérifie la condition de Deligne D3)
et si XH désigne la H(R)-classe de conjugaison de x, alors (H, XH ) est une sous-
donnée de Shimura de (GQ , X). C’est en particulier le cas si HQ est le groupe de
Mumford-Tate de x.

Notons tout d’abord le résultat suivant de Eskin, Mozes et Shah ([20], Lemme 5.1)

Lemme 3.29. – Soit FQ un groupe réductif connexe. Les conditions suivantes sont équi-
valentes :
(C1 ) FQ n’est pas contenu dans un Q-sous-groupe parabolique propre de GQ .
(C2 ) Le centralisateur ZGQ (FQ ) de FQ dans GQ est Q-anisotrope.
(C3 ) Tout Q-sous-groupe de GQ contenant FQ est réductif.

√ la preuve de la proposition 3.28. Comme GR est adjoint, le centralisateur
de x( −1) dans G(R) est un compact maximal Kx de √G(R). Prenons pour FQ le
groupe de Mumford-Tate de x, alors ZGR (FR ) ⊂ ZGR (x( −1)) = Kx . On en déduit
que ZGQ (FQ ) est Q-anisotrope car son extension à R est R-anisotrope. Par définition
des groupes de Mumford-Tate FQ ⊂ HQ . L’équivalence des conditions (C2 ) et (C3 )
montre que HQ est réductif.
On constate que x vérifie (i) car Lie(HR ) est un sous espace de Lie(GR ) invariant
par S.

Comme C = x( −1) est de carré central dans H(R), il suffit d’après ([14] 1.1.15
c.f. proposition 3.19) de voir que GR admet une représentation réelle (V, ρ) fidèle
et C-polarisable. Il suffit de prendre V = Lie(GR ) pour la représentation adjointe et
la C-polarisation induite par la forme de Killing B(X, Y ) (de sorte que B(X, CY ) est
proportionnelle à une forme bilinéaire symétrique et définie positive).
Si HQ est de plus sans Q-facteurs R-anisotropes alors (HQ , XH ) vérifie les condi-
tions de Deligne (D1), (D2) et (D3) donc (HQ , XH ) est une sous-donnée de Shimura
de (GQ , X).
√ finalement que HQ est le groupe de√ Mumford-Tate de x. Comme
int(x( −1)) est un involution de Cartan de HRad , x( −1) centralise tout les facteurs
R-compacts de HR . Si LQ est un Q-facteur de HQ ≃ LQ L′Q qui est R-compact alors

x( −1) centralise LR . Ecrivons la décomposition
Lie(LC ) = Lie(LC )−1,1 ⊕ Lie(LC )1,−1 ⊕ Lie(LC )0,0 .

Alors x( −1) agit à la fois trivialement et par multiplication par −1 = ii sur
Lie(LC )−1,1 . On en déduit que Lie(LC )−1,1 = {0} et donc aussi que Lie(LC )1,−1 = {0}.



Il résulte de cela que x(S) centralise LR et donc que x se factorise par L′R . Ceci contre-
dit la définition des groupes de Mumford-Tate.
3.3.2. Sous-variétés spéciales des variétés de Shimura. – Soit (G, X) une donnée de
Shimura. Soit K un sous-groupe compact ouvert de G(Af ). On fixe une composante
connexe X + de X. Soit K ⊂ G(Af ) un sous-groupe compact ouvert. En utilisant la
notation de la proposition 3.27 on définit la variété de Shimura
(13) ShK (G, X) = G(Q)\[X × G(Af )/K] = Γi \X + .
+ +
Soit Γ := G(Q) ∩ K et S = Γ\X . Alors S est une composante irréductible
de ShK (G, X).
Nous aurons besoin de la définition des opérateurs de Hecke dans ce cadre (voir
par exemple [28] 1.6.1).
Définition 3.30. – Soient g ∈ G(Af ) et Kg = K ∩gKg −1 . La correspondance de Hecke
Tg sur ShK (G, X)(C) est définie par le diagramme
ShK (G, X)C ←π1 ShKg (G, X)C π2
→ ShK (G, X)C
où π1 est donné par l’inclusion Kg ⊂ K et π2 est l’application
[x, θ] → [x, θg].
Soit Z une sous-variété de ShK (G, X)C , on note Tg .Z le cycle π2∗ π1∗ Z de ShK (G, X)C .
On dit que Tg .Z est le translaté de Z par l’opérateur de Hecke Tg .
On suppose dans la suite de cette section que G = Gad est un groupe adjoint donc
que X + est une G(R)+ classe de conjugaison de morphismes de
S → GR .
Soit (H, XH ) une sous-donnée de Shimura. Si KH = K ∩ H(Af ), on dispose d’un
morphisme induit de variétés de Shimura
ψ : ShKH (H, XH )C −→ ShK (G, X)C .
On choisit alors un système de représentants RH,K de
H(Q)+ \H(Af )/KH ,
on a donc [
ShKH (H, XH )C = ∆λ \XH
avec ∆λ = H(Q)+ ∩ λKH λ .
Définition 3.31. – Avec les notations précédentes, une sous-variété de la forme
ψ(∆λ \XH ) est appelée sous-variété de type Shimura de ShK (G, X)(C). Une compo-
sante irréductible d’un translaté par un opérateur de Hecke d’une sous-variété de type
Shimura de ShK (G, X)(C) est appelée sous-variété spéciale ou sous-variété de type
de Hodge.



La translation par l’opérateur de Hecke dans la définition précédente est anodine en

vertu du lemme suivant qui montre qu’il y a très peu de différences entre sous-variétés
de Shimura et sous-variétés spéciales.

Lemme 3.32. – Soit RG,K un système de représentants de

G(Q)+ \G(Af )/K,
Soit V une sous-variété de type de Hodge de ShK (G, X)C . Il existe β ∈ RG,K et une
sous-variété de type Shimura V1 tels que V est une composante irréductible de Tβ .V1 .

Preuve. Il existe une sous-donnée de Shimura (H, XH ) et λ ∈ G(Af ) tels que V est
l’image de XH × λK dans ShK (G, X)(C). On peut écrire λ = γβk avec γ ∈ G(Q)+ ,
β ∈ RG,K et k ∈ K. Soient Hγ = γ −1 Hγ et Xγ la Hγ (R)-classe de conjugaison
de γ −1 .x0 pour un x0 ∈ XH , (Hγ , Xγ ) est une sous-donnée de Shimura et V est
aussi l’image de Xγ × βK dans ShK (G, X)C . On en déduit que V est une composante
irréductible de
Tβ .ShK∩Hγ (Af ) (Hγ , Xγ )C .

Définition 3.33. – Un point x de S est dit Hodge générique si il n’est pas contenu
dans une sous-variété spéciale Z de S avec Z 6= S. Un point de X + est dit Hodge
générique si son image dans S est Hodge générique. On définit de même la notion de
points Hodge générique d’une composante connexe arbitraire de ShK (G, X). On vérifie
sans peine que cette notion coïncide sur X + avec celle donnée à la définition 3.13 une
fois que l’on utilise l’interprétation de X + en terme de variations de structures de
Hodge donnée au théorème 3.24. Par ailleurs on montre que si K est net, la variation
de structures de Hodge sur X + descend en une variation de structures de Hodge sur S.
On vérifie sans peine que la définition d’être Hodge générique pour un point x de S
rentre alors dans le cadre de la définition 3.13.

Si on ne s’intéresse qu’aux sous-variétés spéciales de la composante S, il n’y a pas,

au vu de la preuve précédente, de différences entre sous-variétés de Shimura et sous-
variétés spéciales. On a en fait un lemme plus précis qui permet de supposer que H
est le groupe de Mumford-Tate générique de XH . Par définition cela signifie que H
est le plus petit sous-groupe algébrique M de GQ tel que pour tout x ∈ XH , x se
factorise par MR .

Lemme 3.34. – Soit V une sous-variété spéciale de S. Remarquer que S est l’image
de X + × {1} dans ShK (G, X). Il existe une sous-donnée de Shimura (H, XH )
de (G, X) telle que H est le groupe de Mumford-Tate générique de XH et tel que V
+ +
est l’image de XH × {1} dans S pour une composante XH de XH . En particulier V
est une sous-variété de Shimura.



Preuve. Soit v ∈ V ⊂ S un point Hodge générique de V et x ∈ X + s’envoyant

sur v. Il existe une sous-donnée de Shimura (HV , XHV ) de (G, X) telle que V soit
l’image de XH V
× {1} dans ShK (G, X). Soient H le groupe de Mumford-Tate de x,
XH := H(R).x et XH := H(R)+ .x. Alors, par la proposition 3.28, (H, XH ) est une
sous-donnée de Shimura de (HV , XHV ). Soit V ′ l’image de XH ×{1} dans ShK (G, X).
′ ′
Alors V ⊂ V . Comme V est une sous-variété spéciale contenant v et comme v est
Hodge générique dans V , on a V ⊂ V ′ . On obtient donc que V = V ′ . Ceci termine la
preuve car H est alors le groupe de Mumford-Tate générique de XH .

Remarque 3.35. – Soit V une sous-variété spéciale de S. Le groupe H du lemme 3.34

n’est bien défini qu’à conjugaison par γ ∈ Γ près. Cela correspond à changer x par γ.x
dans la preuve précédente. Si on fixe un domaine fondamental F de X pour l’ac-
tion de Γ, alors V détermine H si on fait la convention dans la preuve précédente
que x ∈ F .

3.3.3. Corps reflex des données de Shimura. – Soit (G, X) une donnée de Shimura.
Pour tout x ∈ X on note µx = xC µ le cocaractère de GC composé du cocaractère
principal µ : Gm,C → SC et de l’extension complexe xC : SC → GC de x.

Définition 3.36. – Le corps reflex de (GQ , X) est le corps de définition de la

G(C)-classe de conjugaison de µx . On note E(GQ , X) le corps reflex de (GQ , X). On
vérifie qu’il ne dépend pas du choix de x ∈ X. Le corps reflex est un corps de nombres
que l’on peut considérer comme sous-corps de Q.

(a) Si (HQ , XH ) ⊂ (GQ , X) est une sous-donnée de Shimura, alors

E(GQ , X) ⊂ E(HQ , XH ).

(b) Si TQ est un Q-tore dans GQ et qu’il y a pour un h ∈ X une factorisation

h : S → TR alors E(TQ , {h}) est le corps de définition de µh .
(c) D’après [12] prop. 3.8, E(GQ , X) est un corps de nombres qui est soit totalement
réel soit à multiplication complexe.
(d) On note π ad : G → Gad et π ab G → C := G/Gder . Soit x ∈ X. Soit X ad la
G (R) classe de conjugaison de π ad x. Alors (Gad , X ad ) est une donnée de Shimura

indépendante du choix de x ∈ X. De même (C, {π ab x}) est une donnée de Shimura

indépendante de x ∈ X (définissant une variété de Shimura de type CM). Alors
E(G, X) est le sous-corps de Q engendré par E(Gad X ad ) et E(C, {π ab x}).

Deligne ([14] 2.3.5) explique le calcul de E(G, X) pour G adjoint en terme de dia-
grammes de Dynkin. Des exemples explicites du calcul de E(G, X) dans des exemples
intéressants sont donnés par Milne ([25] 12.1–12.4).
Le calcul de E(T, {x}) pour une donnée de Shimura de type CM s’explique en
terme de type CM. Le lecteur intéressé par la complexité combinatoire de la question
peut consulter le texte de Dodson [16].



3.3.4. Morphismes de réciprocités. – Soit TQ un Q-tore dans GQ et h ∈ X tel que

l’on ait une factorisation h : S → TR . Alors E = E(TQ , {h}) est le corps de définition
de µh . On note R E = ResE/Q Gm,E . On dispose donc d’un morphisme
µE : Gm,E −→ TE
dont l’extension à C est µh .
Comme Gm et T sont définis sur Q on obtient par restriction à la Weil le morphisme
ResE/Q (µE ) : ResE/Q Gm,E −→ ResE/Q TE .
On dispose aussi d’un morphisme norme
NE/Q : ResE/Q TE −→ T.

Définition 3.37. – Le composé

r = r(TQ , {h}) = NE/Q ResE/Q (µE ) : R E −→ T
est appelé morphisme de réciprocité de (TQ , {h}).

Le morphisme X∗ (r) associé :

X∗ (r) : X∗ ( R E ) = Z[σ] −→ X∗ (T )

est donné par

[σ] 7→ µσh .
Suivant Deligne ([14] on définit pour tout groupe réductif N
π(N ) := N (A)/N (Q)ρ(Ñ (A))
où ρ : Ñ → N der désigne le revêtement universel de N der . Deligne définit aussi
πo (π(N )) := π0 (π(N ))/π0 (N (R)+ ).
La théorie du corps de classes identifie alors Gal(Q/E)ab à π0 (π(RE )).
Le morphisme de réciprocité induit sur les points rationnels et les points adéliques
rQ : R E (Q) = E × −→ T (Q)
rA : RE (A) = (A ⊗ E)× −→ T (A)
rA/Q : πo (π( R E )) → πo (π(T )).

On note T (Q)− l’adhérence de T (Q) dans T (Af ). Un calcul simple montre

que πo (π(T )) ≃ T (Af )/T (Q)− . On obtient alors un morphisme encore noté
r : Gal(Q/E) → T (Af )/T (Q)− en composant les morphismes
Gal(Q/E) → Gal(Q/E)ab ≃ πo (π(RE )) → πo (π(T )) ≃ T (Af )/T (Q)− .



Soit KT un sous-groupe compact ouvert de T (Af ). On obtient une action conti-

nue de Gal(E/E) sur ShKT (TQ , {h}) donnée pour σ ∈ Gal(E/E) et [h, tKT ] ∈
ShKT (TQ , {h}) par

(14) σ.[h, tKT ] = [h, r(σ)tKT ].

Au total ShKT (TQ , {h})C est un ensemble fini muni d’une action de Galois continue
de Gal(E/E). Il admet donc un modèle canonique sur E qui est un schéma fini sur E
que l’on notera ShKT (TQ , {h})E .

3.3.5. Modèles canoniques. – Soit (GQ , X) une donnée de Shimura et K un sous-

groupe compact ouvert de G(Af ). Pour tout x ∈ X, on note

Σx := {[x, aK] a ∈ G(Af )} ⊂ ShK (G, X)

On rappelle que x ∈ X est dit spécial si le groupe de Mumford-Tate MT(x) est un

tore. Un point [x, aK] ∈ ShK (G, X) est dit spécial si x est spécial. Cette définition ne
dépend pas du choix des représentants de [x, aK] car si α ∈ G(Q) alors MT(α.x) =
α−1 MT(x)α. Si (TQ , {x}) est une sous-donnée de Shimura de (GQ , X) alors KT =
K ∩ T (Af ) est un sous-groupe compact ouvert de T (Af ) et l’image de

ShKT (TQ , {x})

dans ShK (G, X) est formée de points spéciaux et on peut obtenir tous les points
spéciaux de cette manière (peut-être à la translation par un nombre fini d’opérateurs
de Hecke).

Définition 3.38. – Soit E = E(G, X) le corps reflex de (G, X). Un modèle canonique
de ShK (G, X)C est un modèle ShK (G, X)E de ShK (G, X)C sur E tel que pour toute
sous-donnée de Shimura (T, {x}) de (G, X), où T est un Q-tore algébrique, le mor-
phisme ShKT (T, {x})C → ShK (G, X)C se descend en un morphisme

ShKT (TQ , {h})F ⊗F EF → ShK (G, X)E ⊗E EF.

Dans cette équation F désigne le corps reflex de (T, {x}) et EF le sous-corps de Q

engendré par E et F .

Un argument utilisant l’existence de nombreux points CM sur ShK (G, X) permet

de montrer l’unicité du modèle canonique. Le résultat suivant est l’aboutissement de
nombreux travaux dus entre autres à Shimura, Deligne, Borovoi, Milne et Shih.

Théorème 3.39. – Soit (GQ , X) une donnée de Shimura et K un sous-groupe compact

ouvert de G(Af ). Il existe un modèle canonique de ShK (G, X)C sur le corps reflex E
de (G, X).



3.3.6. Variations de structures de Hodge. – Soit (GQ , X) une donnée de Shimura et

η : GQ −→ GL(VQ )

une représentation. On suppose de plus que le poids

w : GM,C −→ GC

est défini sur Q. Notons que cette condition est automatique si GQ est de type ad-
joint ou plus généralement si η se factorise par Gad
Q . Alors η définit une variation de
structures de Hodge polarisées (VSHP) sur X de fibré sous-jacent X × VQ .

Lemme 3.40. – Le groupe de Mumford-Tate générique Mη de cette VSHP est un sous-

groupe normal de η(GQ ) contenant η(Gder
Q ).

Pour expliquer le lemme il est bon de définir le groupe de Mumford-Tate générique

MT(X) de (GQ , X).

Définition 3.41. – Soit (GQ , X) une donnée de Shimura. Le groupe de Mumford-Tate

générique MT(X) de (GQ , X) est le plus petit Q-sous-groupe algébrique M de GQ tel
que pour tout
h : S → GR
avec h ∈ X, le morphisme h se factorise par MR .

Comme X est une classe de G(R)-conjugaison d’un morphisme h, on voit

que MT(X)R est un sous-groupe normal de GR . On en déduit que MT(X) est
un sous-groupe normal de GQ . La propriété (D3) des données de Shimura assure
que MT(X) contient les Q-facteurs presque simples de Gder
Q . Finalement MT(X)
est donc un Q-sous-groupe normal de GQ contenant Gder
Q . Le lemme 3.40 se déduit
simplement du fait que

(15) Mη = η(MT(X)).

Soit C la composante connexe du centre de GQ /Ker(η). Supposons que C soit le

produit presque directe d’un Q-tore déployé C1 et d’un Q-tore C2 tel que C2 (R) est
compact. Cette condition est aussi vérifiée si η se factorise par Gad
Q . On obtient dans
cette situation ([27] 2.3) la proposition suivante.

Proposition 3.42. – Soit K ⊂ G(Af ) un sous-groupe compact ouvert net. On fixe un

réseau VZ de VQ tel que
η(K) ⊂ GL(VZ ⊗ Z).b

La VSHP sur X induit une VSHP V η,Z sur ShK (G, X).



On fixe une composante irréductible X + de X, soit Γ = G(Q)+ ∩ K, alors S =

Γ\X + est la composante de ShK (G, X) image de X + × {1} dans ShK (G, X). On note
encore V η,Z la Z-VSHP sur S obtenue par restriction de V η,Z à S.
La représentation de monodromie est alors la restriction à Γ ≃ π1 (S, s) de η.
Comme Γ ∩ Gder (Q) est un réseau arithmétique de Gder
Q , on sait d’après un théorème
der der
de Borel [4], que Γ ∩ G (Q) est dense dans GQ . Le groupe de monodromie est alors
η(Gder 0
Q ) ⊂ GL(VQ ). C’est aussi une conséquence du théorème 3.14 et du fait que S
possède un point spécial.
Soit Z une sous-variété irréductible de S Hodge générique et Z reg le lieu lisse de Z.
On obtient par restriction une Z-variation de structures de Hodge V Z η,Z sur Z
Fixons un point Hodge générique lisse s de Z et un point s̃ de X au dessus de s.
ρZ : π1 (Z reg , s) −→ GL(VZ )
la représentation de monodromie et ΠZ l’image de ρZ . Soit jZ le morphisme d’inclu-
sion de Z reg dans S et
jZ ∗ : π1 (Z reg , s) → π1 (S, s)
le morphisme induit. La représentation de monodromie ρZ est ηjZ,∗ .
Une nouvelle application du théorème 3.14 donne le lemme suivant.

Lemme 3.43. – Supposons que Z reg contienne un point spécial non singulier. Le groupe
de monodromie de V Z η,Z (composante connexe neutre de l’adhérence schématique
de ΠZ dans GL(VQ ) ) est η(Gder
Q ).

Rappelons l’énoncé du théorème suivant dû à Nori ([30] Thm. 4.13).

Théorème 3.44. – Soit H un sous-groupe de GLn (Z) engendré par un nombre fini
d’éléments. Soit H la clôture de Zariski de H dans GLn,Z . Si H(C) a un groupe fon-
damental fini la fermeture de H dans GLn (Z)b est ouverte dans la fermeture de H(Z)
dans GLn (Z).

Comme ΠZ est engendré par un nombre fini d’éléments et que le groupe fonda-
mental d’un groupe semi-simple sur C est fini on obtient le corollaire suivant qui nous
sera utile dans la section suivante.

Corollaire 3.45. – Soit η(Gder )Z la fermeture de Zariski de η(Gder

Q ) dans GL(VZ ).
b b b
Soit ΠZ la fermeture de ΠZ dans GL(VZ ⊗ Z). Alors ΠZ est ouvert dans η(Gder b
Q )Z (Z).



3.4. Irréductibilité des images par les opérateurs de Hecke. – Le but de cette section
est de montrer le théorème suivant d’Edixhoven et Yafaev.
Soit (GQ , X) une donnée de Shimura avec GQ semi-simple de typeQ adjoint. Soit K
un sous-groupe compact ouvert net de G(Af ). On suppose que K = p Kp pour des
sous-groupes compacts ouverts Kp de G(Qp ). Cette condition n’est pas essentielle mais
notons qu’il existe toujours un sous-groupe d’indice fini K ′ de K qui est un produit
(prendre n’importe quelle groupe de congruence principal convenable). Soit X + une
composante connexe de X et S l’image de X + × {1} dans ShK (G, X).
Théorème 3.46 (Edixhoven-Yafaev [19] thm 5.1). – Soit Z une sous-variété irréductible
et Hodge générique de S contenant un point spécial non singulier. Il existe un entier
n (dépendant de Z) tel que pour tout q ∈ G(Q)+ dont l’image dans G(Ql ) est dans Kl
pour tout l divisant n la sous-variété Tq .Z de S est irréductible.
Rappelons la construction de l’opérateur de Hecke Tq de S pour un élément q
de G(Q). Soit Γq = Γ ∩ q −1 Γq et Sq = Γq \X + . On a deux applications
πi : Sq → S = Γ\X + .
La première application π1 correspond à l’inclusion Γg ⊂ Γ tandis que π2 se déduit
par passage au quotient de l’application
tq : X + → X + , x 7→ q.x.
Comme K est net, Γ est sans torsion et les πi sont des recouvrements étales. En
particulier les πi sont propres et plats et induisent des morphismes sur les groupes de
cycles et les groupes de Chow :
πi∗ : Chi (Sq ) → Chi (S)
πi∗ : Chi (Sq ) → Chi (S).
La correspondance Tq opérant sur le cycle Y est alors donné par
Tq .Y = π2∗ π1∗ Y.
Pour montrer l’irréductibilité de Tq .Z, il suffit donc de montrer l’irréductibilité
de π1∗ Z. Comme π1 est un recouvrement étale il en est de même de
π1 : Zqreg −→ Z reg .
Comme Zqreg est Zariski-dense dans Z, il suffit de montrer l’irréductibilité de Zqreg .
On reprend les notations de la section précédente, on a en particulier fixé une
représentation η : GQ → GL(VQ ) et un réseau VZ de VQ tel que η(K) ⊂ GL(VZ ⊗ Z). b
On note ΠZ l’image de π1 (Z , s) par la représentation de monodromie ρZ associée
à la Z-VSHP V Z η,Z sur Z
Soit jZ l’inclusion de Z reg , Γ = π1 (S, s) est un un π1 (Z reg , s)-ensemble via jZ∗ :
π1 (Z reg , s) → π1 (S, s). Pour q ∈ G(Q)+ , le π1 (Z reg , s)-ensemble correspondant au
recouvrement π1 : Sq → S est Γ/Γq . Il suffit donc de montrer que π1 (Z reg , s) agit
transitivement sur Γ/Γq .



Le théorème de Nori 3.44 et son corollaire 3.45 assurent l’existence d’un n ∈ N tel
que les images de π1 (Z reg , s) et de Γ dans GL(VZ/mZ ) coïncident pour tout m premier
à n.

Lemme 3.47. – Il existe un entier m premier à n tel que Γq contient le noyau Γ(m)
ψm : Γ −→ GL(VZ/mZ ).

Si on accepte le lemme, on voit que l’on a une application surjective

Γ/Γ(m) → Γ/Γq .
D’après ce qui précède π1 (Z reg , s) agit transitivement sur Γ/Γ(m) donc π1 (Z reg , s)
agit transitivement sur Γ/Γq .
Pour montrer le lemme, remarquons que Γq = q −1 Kq ∩ K ∩ G(Q)+ est un sous-
groupe de congruence de G(Q)+ . Notons que la représentation η étant fidèle, les Γ(m)
sont les sous-groupes de congruences principaux. On en déduit que Γq contient Γ(m)
pour m suffisamment divisible. On peut choisir m premier à n en utilisant le fait que
l’image de q dans G(Ql ) est contenu dans Kl pour tout l divisant n (on utilise ici par
commodité mais non de manière essentielle l’hypothèse que K est produit des Kp ).

4. Théorie ergodique sur les espaces homogènes

4.1. Réseaux arithmétiques des groupes linéaires. – Soit GQ un groupe algébrique li-
néaire sur Q et X ∗ (GQ ) l’ensemble des caractères rationnels de GQ définis sur Q. On
dit que GQ est de type F si X ∗ (GQ ) = 1.
On fixe une représentation fidèle ρ : GQ → GL(VQ ) dans un Q-espace vectoriel de
dimension finie VQ et un réseau VZ de VQ . Soit
G(Z) := {g ∈ G(Q), ρ(g) ∈ GL(VZ )}.
Rappelons que deux sous-groupes L et L′ d’un groupe H sont dit commensurables
si L ∩ L′ est d’indice fini dans L et dans L′ . On vérifie sans peine que la commensu-
rabilité est une relation d’équivalence.

Définition 4.1. – (a) Un sous-groupe Γ ⊂ G(Q) est dit arithmétique si Γ est commen-
surable à G(Z). On montre en fait que cette notion est indépendante des choix de ρ
et du réseau VZ de VQ .
(b) Soit GR un groupe algébrique linéaire, un sous-groupe Γ ⊂ G(R) est dit arith-
métique si il existe une Q-forme GQ de GR telle que Γ ⊂ G(Q) soit un sous-groupe
arithmétique de G(Q).
(c) Soit GR un groupe semi-simple sans facteurs compacts, K∞ un sous-groupe
compact maximal de G(R) et X = G(R)/K∞ l’espace symétrique de type non
compact associé. Un sous-groupe arithmétique Γ de X est un sous-groupe arith-
métique du groupe des points rationnels H(Q) d’un groupe algébrique réductif HQ
tel que H(R)/Z(H)(R)KH ≃ X où KH désigne un sous-groupe compact maximal



de H(R) et Z(H) désigne le centre de HQ . Dans cette situation Γ agit proprement

sur X.

Remarque 4.2. – Noter que dans cette dernière définition, le groupe HR peut avoir
des facteurs compacts. On peut sans perte de généralité supposer que HQ n’a pas
de facteur simple H1 sur Q tel que H1 (R) soit compact. Pour construire les réseaux
arithmétiques du demi-plan de Poincaré H, on part d’une algèbre de quaternion B sur
un corps totalement réel F telle que B est déployée en une unique place archimédienne
de F . Soit B ∗1 le groupe algébrique sur Q des unités de B de norme 1. Un réseau
arithmétique de B ∗1 est un réseau arithmétique de H et tout réseau arithmétique
de H s’obtient à partir d’un groupe HQ ayant même groupe adjoint que B ∗1 pour une
certaine algèbre de quaternion B du type précédent sur un corps de nombres totalement

Définition 4.3. – Soit GR un groupe algébrique linéaire. Un sous-groupe discret Γ ⊂

G(R) est un réseau de G(R) si la mesure de Γ\G(R) est finie pour une mesure
G(R)-invariante sur G(R). On note alors µG la mesure de probabilité G(R)-inva-
riante sur Γ\G(R). Si GR ≃ G1,R G2,R pour des sous-groupes normaux Gi de G tels
que Gi (R) n’est pas compact et si Γ est commensurable à Γ1 Γ2 pour des réseaux Γi
de Gi (R), on dit que Γ est réductible. Un réseau de GR qui ne peut pas se décompo-
ser sous cette forme est dit irréductible. Soit GQ un groupe semi-simple, un réseau
arithmétique Γ ⊂ G(Q) de G(R) est irréductible si et seulement si GQ est Q-simple.

Les énoncés suivants sont dus à Borel [5].

Théorème 4.4. – Soit GQ un groupe algébrique linéaire. Soit Γ un sous-groupe arith-

métique de G(Q), alors Γ est un réseau de G(R) si et seulement si X ∗ (GQ ) = {1}.
Dans cette situation Γ est Zariski-dense dans GR .

Un groupe algébrique linéaire GQ tel que X ∗ (GQ ) = {1} sera dit de type F . Il
revient au même de dire que le centre de GQ ne contient pas un tore déployé.

Théorème 4.5. – Soit GQ un groupe algébrique de type F et Γ un réseau arithmétique

de G(Q). Alors Γ\G(R) est compact si et seulement si GQ est Q-anisotrope. Soit Ru
le radical unipotent de GQ . Alors GQ est anisotrope si et seulement si X ∗ (GQ ) = 1
et si tout élément unipotent u de G(Q) est dans Ru (Q). Il revient au même de dire
que GQ ne contient pas de tores déployés.

Proposition 4.6. – Si α : GQ → G′Q est un Q-morphisme dominant et Γ ⊂ G(Q) un

sous-groupe arithmétique, alors α(Γ) est un sous-groupe arithmétique de G′ (Q).



4.2. Opérateurs de Hecke. – On suppose dans cette partie que GQ est un Q-groupe
algébrique semi-simple sans Q-facteurs simples Gi tels que Gi (R) soit compact. On
fixe un réseau arithmétique Γ ⊂ G(Q). On définit le commensurateur Comm(Γ) de Γ
dans G(R) par
Comm(Γ) = {g ∈ G(R), Γ et g −1 Γg sont commensurables }.
Comme Γ est arithmétique, Comm(Γ) contient G(Q) et en particulier Γ est d’indice
infini dans Comm(Γ). Ceci caractérise les réseaux arithmétiques de G(R) car d’après
un résultat de Margulis ([24], Ch. IX, thm. 6.5), un réseau irréductible Λ de G(R) est
arithmétique si et seulement si Λ est d’indice infini dans Comm(Λ).
Pour tout a ∈ Comm(Γ) on a une décomposition finie
(16) ΓaΓ = Γai

deg(a) = |Γ\ΓaΓ| = [Γ : Γ ∩ a−1 Γa].
Plus précisément si {α1 , . . . , αdeg(a) } désigne un système de représentants dans Γ
de Γ ∩ a−1 Γa\Γ alors
(17) ΓaΓ = Γaαi

La correspondance de Hecke Ta associe à tout Γx ∈ Γ\G(R) l’ensemble fini

Ta .x := {Γai x, 1 ≤ i ≤ deg(a)}.
On vérifie que Ta est indépendant des choix dans la décomposition de l’équation (16)
et ne dépend que de la double classe ΓaΓ.

4.3. Préliminaires ergodiques. – Soit X un espace métrique localement compact. On

note P (X) l’ensemble des mesures de Borel de probabilité sur X. Soit Cb (X) l’en-
semble des fonctions continues bornées sur X. On dit qu’une suite µn ∈ P (X)
converge faiblement vers µ ∈ P (X) si pour tout f ∈ Cb (X)
µn (f ) = f µn → µ(f ) = f.µ quand n → ∞.
On écrira dans cette situation µn → µ (ou simplement µn → µ).
On définit la topologie faible* sur P (X) commeR la plus petite topologie telle que
pour tout f ∈ Cb (X), les applications µ → µ(f ) = X f dµ soient continues.

Proposition 4.7. – Si X est un espace métrique compact, alors µn converge faiblement

vers µ ∈ P (X) si et seulement si µn converge vers µ pour la topologie faible*. L’es-
pace P (X) est métrisable et compact pour la topologie faible* : si µn est une suite
de P (X), il existe une sous-suite faiblement convergente.



Soit X un espace localement compact muni d’une action d’un groupe localement
compact H non compact. L’ensemble des mesures de probabilité de Borel qui sont
H-invariantes forment un ensemble convexe.

Définition 4.8. – Une mesure de probabilité µ ∈ P (X), H-invariante est dite ergo-
dique si une des conditions suivantes est vérifiée.
(a) Tout sous-ensemble A ⊂ X, mesurable et H-invariant vérifie µ(A) = 0 ou
µ(A) = 1.
(b)Toute fonction mesurable f sur X, constante sur les orbites de H dans X est
constante µ-presque partout. (i.e si pour presque tout x ∈ X (pour la mesure µ) et
tout h ∈ H, f (h.x) = f (x) alors f est constante µ-presque partout)
(c) La mesure µ est un point du bord de l’ensemble convexe des mesures de proba-
bilité de Borel qui sont H-invariantes.
On dit aussi que l’action de H est µ-mélangeante si pour toute suite (hn )n∈N de H
tel que hn → ∞ (i.e. telle que pour tout compact K ⊂ X, {n ∈ N, hn ∈ K} est fini)
et pour tout sous-ensemble mesurable E, F de X
µ(A ∩ hn B) → µ(A)µ(B).
Une action µ-mélangeante est ergodique pour µ.

Il est classique que toute mesure H-invariante sur X est une moyenne de mesures
H-invariantes ergodiques. Le théorème suivant dit de décomposition ergodique permet
en général de ramener l’étude des mesures H-invariantes sur X à celles qui sont

Théorème 4.9. – Il existe un espace Z tel que pour toute mesure H-invariante µ sur X
il existe une mesure ν sur Z et une famille
R mesurable {µz }z∈Z de mesure H-inva-
riantes ergodiques
R sur X Rtels
R que µ = Z µz dν. Par définition pour toute fonction
f ∈ L1 (X, µ), X f dµ = Z X f dµz dν(z).

L’espace Z est l’ensemble des points extrémaux de l’espace convexe des me-
sures H-invariantes. De plus deux mesures H-invariantes ergodiques distinctes µ1
et µ2 sur X sont mutuellement singulières : Il existe un sous-ensemble Ω de X tel
que µ1 (Ω) = 1 et tel que µ2 (Ω) = 0.

4.4. Théorie ergodique sur les espaces homogènes Γ\G. – Soit G un groupe de Lie.
Un réseau Γ de G est un sous-groupe discret de G de covolume fini pour la mesure
G-invariante. Le réseau est dit uniforme si Ω = Γ\G est compact. Dans cette situation
tout sous-groupe de Lie F de G agit (à droite) sur Γ\G et le but de la théorie ergodique
dans cette situation est de comprendre les orbites de F et de classifier les mesures
F -invariantes. Une orbite ΓxF est dite périodique si il existe une mesure de probabilité
µ ∈ P (Ω), F -invariante de support ΓxF . Noter que les orbites périodiques de F sont
fermées dans Ω (Raghunathan thm. 1.13 [33]).



Une classe naturelle de mesures de probabilité H-invariantes sur Ω est donnée par
les mesures de probabilité L-invariantes sur une orbite ΓxL, périodique pour un sous-
groupe de Lie L de G contenant F . Une telle mesure sera dite homogène ou algébrique.
Une mesure µ sur Ω est donc homogène ou algébrique si son support Supp(µ) est une
orbite fermée de son sous-groupe d’invariance Λ(µ).
Pour un sous-groupe de Lie F arbitraire de G la détermination des mesures F -in-
variantes ergodiques ou celle des orbites fermées de F sont des problèmes non résolus.
Dans les applications que nous avons en vue, G = G(R)+ pour un groupe algébrique
GQ semi-simple sans Q-facteurs simples Gi avec Gi (R) compact, Γ est un réseau arith-
métique de G(Q). Toutes ces hypothèses seront en vigueur à partir de maintenant.
Le cas où F = T (R) pour un tore déployé maximal est l’un des plus intéressants et
des progrès notables ont étés obtenus par Lindentrauss et Einsiedler dans les années
Quand F est engendré par des unipotents la théorie est essentiellement complète
grâce aux travaux de Ratner que nous décrivons maintenant.
Les deux énoncés suivants sont fondamentaux et sont dus à Ratner. Le premier est
le théorème dit de classification des mesures [34]. Le second est un énoncé topologique
qui classifie les adhérences d’orbites de F .

Théorème 4.10. – Soit F un sous-groupe fermé connexe de G engendré par ses sous-
groupes unipotents à un paramètre. Alors toute mesure de probabilité F -invariante et
ergodique pour l’action de F est homogène.

Théorème 4.11. – Soit F un sous-groupe fermé connexe de G engendré par ses sous-
groupes unipotents à un paramètre. Pour tout x ∈ Γ\G on note xF l’adhérence de xF .
Il existe un sous-groupe fermé connexe F ′ de G contenant F tel que xF est une orbite
périodique xF ′ de F ′ .

Nous aurons besoin de préciser ces résultats en suivant le formalisme de Mozes-

Shah [29]). Certains des énoncés qui suivent utilisent que Γ est un réseau arithmétique
de G(Q).

Définition 4.12. – Un groupe algébrique connexe H sur Q est dit de type H si son
radical résoluble est unipotent et si Hs = H/Ru (H) est produit presque direct de
groupes Q-simples Hi tels que Hi (R) est non compact.

Soit F ⊂ G(R)+ un sous-groupe de Lie fermé connexe. Nous dirons que F est de
type K (de type H dans [29]) si :
3.1) F ∩ Γ est un réseau de F .
En particulier F ∩ Γ\F est fermé dans Γ\G(R)+ ; soit µF sa mesure invariante
3.2) Le sous-groupe L(F ) engendré par les sous-groupes unipotents à un paramètre
de G contenus dans F opère ergodiquement sur F ∩ Γ\F par rapport à µF .



On note Q K (Ω) le sous-ensemble de P (Ω) formé des mesures telles que le sous-
groupe L(Λ(µ)) agit ergodiquement par rapport à µ. On note aussi Q K ,e (Ω) le sous-
ensemble de Q K (Ω) formé des mesures dont le support contient Γe ∈ Ω. Il résulte des
définitions que si F est de type K alors µF ∈ Q K ,e (Ω).

Théorème 4.13 (Mozes-Shah). – i) µ ∈ Q K ,e (Ω) si et seulement si µ = µF pour

un F ∈ K .
ii) Q K ,e (Ω) est compact pour la topologie faible.
iii) Si µn ∈ Q K ,e (Ω) converge vers µ ∈ Q K ,e (Ω) alors
Supp(µn ) ⊂ Supp(µ)
pour n ≫ 0.
Explicitons le lien entre les Q-sous-groupes algébriques de G(Q) de type H et les
sous-groupes de Lie de G = G(R)+ de type K .
Soit F un sous-groupe de Lie de G. On notera comme précédemment L(F ) le sous-
groupe de F engendré par les sous-groupes unipotents à un paramètre. Pour HQ dans
la classe H et H = H(R)+ on a :
L(H) = Ru (H)(R) Hi (R)+ = N L(Hs )
où le produit porte sur les composantes R-simples Hi de HR qui ne sont pas compacts.
(Les produits sont presque directs).
Le résultat suivant est montré dans [9] à partir de résultats antérieurs de Shah [37].
Lemme 4.14. – Soit F ⊂ G(R)+ un sous-groupe de type K . Alors F = H(R)+ pour
un Q-sous-groupe HQ de G de type H . De plus si L = L(F )
(a) Γ\ΓL = Γ\ΓF dans G(R)+ .
(b) F est l’unique sous-groupe fermé de G tel que Γ\ΓL = Γ\ΓF .
(c) Le groupe HQ est le groupe de Mumford-Tate de L (i.e. le plus petit Q-sous-
groupe algébrique M de G tel que L ⊂ M (R)+ ).
Le groupe L est invariant dans F et ergodique sur Γ\ΓF . Il a donc une orbite
dense. Il existe donc g ∈ F tel que
Γ\ΓF = Γ\ΓgL = Γ\ΓLg,
d’où (a).
D’après Shah ([37], Prop. 3.2), l’égalité (a) implique que F = H(R)+ , d’où les
autres assertions.
Le lemme suivant voisin de résultats de Shah [37] est tiré du lemme 2.3 de [10] et
et du lemme 3.1 d [9].
Lemme 4.15. – Soit HQ un groupe de type F . Alors HQ est de type H si et seulement
si L(H) opère ergodiquement sur Γ\H(R)+ par rapport à µH . En particulier si HQ
est de type H , alors H = H(R)+ est de type K .



Montrons tout d’abord qu’un groupe vérifiant l’hypothèse ergodique du lemme est
de type H . Soit en effet HQ un groupe de type F , donc :
HQ = N ⋊ (T.Hs )
où N est unipotent, T est un tore (anisotrope), Hs est semi-simple et le produit T.Hs
est quasi-direct. Alors L(H) = N (R) ⋊ L(Hs ). On a un morphisme dominant
π : H −→ T ′
pour un tore T ′ isogène à T . Comme Γ ⊂ H(R)+ est un sous-groupe arithmé-
tique, π(Γ) = ΓT ′ est discret dans T ′ (R)+ . Les orbites de L(H) s’envoient sur des
points de ΓT ′ \T ′ (R)+ . Par hypothèse, il existe une orbite sous L(H) qui est dense
dans Γ\H(R)+ . Comme π est dominant on en déduit que T ′ (et par suite T ) est
Si Hs a un facteur Hi Q-simple qui est R-anisotrope, alors on a de même un
morphisme surjectf
Γ\H(R)+ −→ Γi \Hi′ (R)+
avec Hi′ isogène à Hi , l’action de L(H) à droite étant triviale. L’image Γi de Γ est
contenue dans un sous-groupe arithmétique ([5], cor. 7.3) donc est finie. Ceci contredit
Pour l’implication inverse, supposons H de type H . Si H est semi-simple le lemme
(4.15) est vérifié dans ([10], Lemme 2.3).
En général H = N ⋊ Hs et tout sous-groupe arithmétique de H(R)+ contient un
sous-groupe d’indice fini de la forme ΓN ⋊ Γs ([5] cor. 7.13). Comme les revêtements
finis ne changent pas les propriétés ergodiques, on est ramené à vérifier que le produit
semi-direct N.L(Hs ) opère ergodiquement sur ΓN \N ×Γs \Hs . La démonstration facile
de ce fait est laissée au lecteur.

On peut réécrire le théorème de Mozes-Shah dans le contexte arithmétique en te-

nant compte de la relation entre classe H et classe K . Soit HQ un sous-groupe
algébrique de GQ de type H on note µH la mesure associée sur Ω de support
Γ\ΓH(R)+ ≃ Γ ∩ H(R)+ \H(R)+ .

Théorème 4.16. – Soit GQ un groupe semi-simple de type H et soit Hn ⊂ G une suite

stricte de Q-sous-groupes algébriques de GQ de de types H et µn = µHn la suite de
mesures sur Ω associée. Il existe un Q-sous groupe algébrique HQ de GQ de type H
et une sous-suite Hnk de Hn tels que µnk converge faiblement vers la mesure µH . De
plus pour Hnk ⊂ HQ pour tout k.

Preuve. L’existence de la sous-suite Hnk et de HQ dans H tels que µnk converge

faiblement vers µH résulte du théorème de Mozes-Shah et du lien entre classe H et
classe K . On sait aussi que l’on peut supposer que pour tout k, Supp(µnk ) ⊂ supp(µ).
On en déduit que Lie(Hnk (R)) ⊂ Lie(H(R)), donc Hn (R)+ ⊂ H(R)+ . Puisque
Hn (Q)+ est Zariski-dense dans Hn , ceci implique que Hnk ⊂ HQ , d’où la dernière
assertion du théorème.



5. Equidistribution des sous-variétés spéciales des variétés de Shimura

Soit (G, X) une donnée de Shimura. On suppose (sans perte de généralités) que G
est semi-simple de type adjoint. Soit K un sous-groupe compact ouvert de G(Af ).
On fixe une composante connexe X + de X. Soit K ⊂ G(Af ) un sous-groupe compact
On note Γ := G(Q)+ ∩ K et S = Γ\X + qui est une composante irréductible de la
variété de Shimura ShK (G, X).
Soit V une sous-variété spéciale de S. Il existe alors une sous-donnée de Shimura
(H, XH ) de (G, X) telle que V est l’image de XH × {1} dans S pour une compo-
sante XH de XH . D’après le lemme 3.34, on peut supposer que HQ est le groupe
de Mumford-Tate générique de XH . On fera toujours ce choix dans la suite de sorte
que V détermine HQ à conjugaison par un élément γ ∈ Γ près.
On peut munir V d’une mesure de probabilité canonique µV . Pour tout x ∈ X +
on dispose d’une application
πx : Γ\G(R)+ −→ S = Γ\X +
Γg 7→ Γg.x.
Comme G est adjoint, le groupe HQ est de type F . Il suffit en effet de vérifier que le
centre connexe T de H est un tore Q-anisotrope. On montre le fait plus fort que TR est
R-anisotrope autrement dit que T (R) est compact. Soit en effet xH : S → HR ⊂ √ GR un
élément de XH . Alors T (R) est contenu dans le centralisateur dans G(R) de xH ( −1).
Comme ce centralisateur est un compact maximal de G(R) (car G est adjoint) on en
déduit bien que T (R) est compact.
D’après le résultat de Borel (théorème 4.4), ΓH := H(R)+ ∩ Γ est un réseau arith-
métique de H(Q). Par définition il existe une mesure de probabilité H(R)+ -invariante
µH sur
ΓH \H(R)+ ≃ Γ\ΓH(R)+ ⊂ Γ\G(R)+ .
Pour tout xH ∈ XH on a V = πxH (ΓH \H(R)+ ) et la mesure de probabilité µV =
(πxH )∗ µH est indépendante du choix de xH ∈ XH . On dira que µV est la mesure
canonique de V . Si P (S) désigne l’ensemble des mesures de probabilité de Borel
sur S alors µV ∈ P (S) et Supp(µV ) = V . Si H est un tore, alors V est un point
spécial et µV une mesure de Dirac de support V .
On cherche à étudier pour une suite Vn de sous-variétés spéciales de S la conver-
gence faible de la suite de mesures µn = µVn associée. On ne peut espérer un résultat
général car les points spéciaux de S sont denses dans S et la suite de mesures associées
à une suite de points spéciaux de S peut avoir un comportement arbitraire. On dira
qu’une sous-variété spéciale V de S est fortement spéciale si le sous-groupe HQ de GQ
est semi-simple. Notons que HQ n’est déterminé par V qu’à conjugaison près dans Γ
mais que la notion d’être fortement spéciale ne dépend pas de ce choix.
Le résultat principal que nous avons en vue est dû à Clozel et à l’auteur de ces
notes [10].



Théorème 5.1. – Soit Vn une suite de sous-variétés fortement spéciales de S. Soit µn

la mesure de probabilité associée à Vn . Il existe une sous-variété fortement spéciale V
et une sous-suite µnk qui converge faiblement vers µV . De plus V contient Vnk pour
tout k.

Une conséquence formelle dans l’esprit de la conjecture d’André-Oort est le résultat


Corollaire 5.2. – Soit Y une sous-variété d’une variété de Shimura S. Il existe un

ensemble fini {V1 , . . . , Vk } de sous-variétés fortement spéciales de dimension positive
Vi ⊂ Y tel que si V est une sous-variété fortement spéciale de dimension positive
avec V ⊂ Y alors V ⊂ Vi pour un certain i ∈ {1, . . . , k}.

On montre le corollaire de la manière suivante. Soit Vn une suite de sous-variétés

fortement spéciales maximales parmi les sous-variétés fortement spéciales contenues
dans Y . En passant à une sous-suite on peut supposer d’après le théorème 5.1 que µn
converge faiblement vers µV pour une variété fortement spéciale V . Comme Y est
un fermé, le support de µV est contenu dans Y . On en déduit que V ⊂ Y . Par la
maximalité des Vn et le fait que Vn ⊂ V pour tout n assez grand, on en déduit que la
suite Vn est stationnaire.

Remarque 5.3. – Soit V une sous-variété fortement spéciale de S et HQ le sous-groupe

algébrique de GQ associé. Alors HQ est de type H et H(R)+ et de type K . En effet
HQ est semi-simple par hypothèse et par la condition (D3) de Deligne les facteurs
Q-simples de HQ ne sont pas compacts.

Preuve du théorème 5.1. – Soit Ω := Γ\G(R)+ . Soit Vn une suite de sous-variétés

fortement spéciales de S. On suppose que Vn est l’image de XH n
× {1} pour une
sous-donnée de Shimura (Hn , XHn ) de (G, X) telle que Hn est semi-simple et est le
groupe de Mumford-Tate générique de XHn .

Soit νn = µHn la mesure de probabilité, de P (Ω), Hn (R)+ -invariante, de support

Σn := Γ ∩ Hn (R)+ \Hn (R)+ ≃ Γ\ΓHn (R)+ . Au vu de la remarque précédente et de
la version des résultats de Mozes-Shah donnée au théorème 4.16, on peut en passant
au besoin à une sous-suite trouver un Q-sous-groupe algébrique HQ de GQ de type
H tel que νn converge faiblement vers νH . De plus Hn ⊂ HQ .
Soit x ∈ X se factorisant par HR . On peut pour construire un tel x choisir n
arbitrairement et prendre n’importe quel élément x de XHn car par définition x se
factorise par Hn,R ⊂ HR . D’après la proposition 3.28, HQ est réductif. Comme HQ
est de type H , il est en fait semi-simple et ses Q-facteurs simples ne sont pas R-ani-
sotropes. Soit XH la H(R)-classe de conjugaison de x. D’après la proposition 3.28,
(H, XH ) est une sous-donnée de Shimura et l’image V de XH × {1} dans S est une
sous-variété fortement spéciale de S.
Pour en déduire un résultat sur la suite Vn de S on doit choisir pour tout n
un xn ∈ XH n
de sorte que Vn = πxn (Σn ) et µn = (πxn )∗ νn .



Si on peut faire un choix de xn tel que la suite xn converge vers x∞ ∈ XH , un

argument simple d’analyse prouve que µn converge simplement vers µV = (πx∞ )∗ νH .
Si S est compact (i.e. si GQ est Q-anistrope) alors on procède de la manière sui-
vante : En changeant au besoin (Hn , XHn ) en (γn Hn γn−1 , Xγn Hn γn−1 ) pour un γn
dans Γ, on peut choisir xn dans un domaine fondamental fixe de X + pour l’action
de Γ. Comme ce domaine fondamental est compact, on peut en passant à une sous-
suite supposer que xn converge vers x∞ ∈ XH .
Quand S n’est pas compact on utilise le résultat suivant de Dani et Margulis ([11]
théorème 2).

Proposition 5.4. – Il existe un ensemble compact C de Γ\G(R)+ tel que pour tout
sous-groupe unipotent à un paramètre W = (ut )t∈R et tout g ∈ G(R)+ , si
Γ\ΓgW ∩ C = ∅
alors il existe un Q-sous-groupe parabolique propre P de GQ tel que
gW g −1 ⊂ P (R).

On en déduit tout d’abord :

Lemme 5.5. – Soient FQ un Q-sous-groupe semi-simple de type H (i.e tel que F (R)+ ∈
K ) et g ∈ G(Q)+ tels que
Γ\ΓgF (R)+ ∩ C = ∅.
Il existe alors un Q-sous-groupe parabolique propre P de GQ tel que FQ ⊂ P .

Démonstration. – Soit L = L(F ) le sous-groupe de F (R)+ engendré par les sous-

groupes unipotents à un paramètre de G(R)+ qui sont contenus dans F (R)+ . On sait
alors que FQ est le groupe de Mumford-Tate de L d’après le lemme 4.14). Fixons un
sous-groupe à un paramètre
W = (ut )t∈R ⊂ L
tel que W n’est contenu dans aucun sous-groupe normal de L(F ).

Pour tout h ∈ F (R)+

Γ\ΓghW ∩ C ⊂ Γ\ΓgF (R)+ ∩ C = ∅
D’après la proposition 5.4, pour tout h ∈ F (R)+ , il existe un Q-parabolique propre
Ph tel que
ghW h−1 g −1 ⊂ Ph (R).
Comme l’ensemble des paraboliques sur Q est dénombrable, il existe un Q-parabolique
propre P0 et un ensemble A ⊂ F (R)+ de mesure positive (pour la mesure de Haar
sur F (R)+ ) tels que pour tout h ∈ A :
ghW h−1 g −1 ⊂ P0 (R).



Comme l’ensemble des h ∈ F (R)+ tels que ghW h−1 g −1 ⊂ P0 (R) est un sous-ensemble
de Zariski de F (R)+ de mesure positive, par connexité de F (R)+ on en déduit que
pour tout h ∈ F (R)+
ghW h−1 g −1 ⊂ P0R .
Comme W n’est contenu dans aucun sous-groupe normal de L on en déduit que
gLg −1 ⊂ P0R .
Soit P = g −1 P0 g, on a L ⊂ PR donc
FQ = M T (L) ⊂ P.
Ceci termine la preuve du lemme car P est un Q-parabolique propre.
Lemme 5.6. – Il existe un compact C ′ de Γ\X + tel que si Z est une sous-variété
fortement spéciale de S alors
(18) Z ∩ C ′ 6= ∅.
Preuve. Soit Ω un compact de G(R)+ contenant l’origine e comme point intérieur.
On note
C1 = C.Ω = {cω, c ∈ C, ω ∈ Ω},
c’est encore un compact de Γ\G(R)+ . Pour tout x ∈ X + , on note comme précédem-
ment πx l’application associée de Γ\G(R)+ vers Γ\X + . On fixe x0 ∈ X + et on note
C ′ = πx0 (C1 ). On remarque que pour tout ω ∈ Ω, si on note xω = ω.x0 alors
πxω (C) ⊂ C ′ .
Soit Z un sous-variété fortement spéciale de S. Il existe donc une sous-donnée de
Shimura (F, XF ) de (G, X) avec FQ semi simple telle que Z soit l’image de XF+ × {1}
dans S.
Soit x ∈ XF+ de sorte que XF+ = F (R)+ .x. Comme G(Q)+ est dense dans G(R)+ ,
il existe ω ∈ Ω et γ ∈ G(Q)+ tels que x = γω.x0 . Soit FγQ = γ −1 FQ γ. On a alors
XF+ = F (R)+ γ.xω et
Z = πxω (Γ\ΓγFγ (R)+ ).
Si Z ∩ C ′ = ∅ alors à fortiori Z ∩ πxω (C) = ∅ et finalement
Γ\ΓγFγ (R)+ ∩ C = ∅.
Par le lemme 5.5, on en déduit que FγQ ⊂ P pour un Q-sous-groupe parabolique
propre P .
Ceci est en fait impossible par définition des sous-variétés fortement spéciales.
√ En
effet soit xF ∈ XF , alors le centralisateur ZGR (FR ) est contenu dans ZGR (xF ( −1))
qui est un compact maximal de G(R) (on rappelle que G est adjoint). On en déduit
à fortiori que ZGQ (FQ ) est Q-anisotrope. D’après le lemme 3.29, FQ n’est pas contenu
dans un sous-groupe parabolique propre.
A l’aide du lemme 5.6, on peut finir la preuve du théorème 5.1 comme dans le cas
S compact. On fixe en effet un domaine fondamental F de X + pour l’action de Γ.
On peut supposer comme dans le cas S compact que le point xn ∈ XHn est dans F



pour tout n. Le lemme 5.6 assure en fait que l’on peut choisir en fait xn ∈ XHn dans
un compact de F .
Des généralisations du théorème 5.1 sont données dans [39] et dans [40]. Décrivons
brièvement ce dernier résultat qui joue un rôle dans la preuve de la conjecture d’André-
Oort sous l’hypothèse de Riemann généralisée.

Définition 5.7. – Soit (G, X) une donnée de Shimura avec GQ de type adjoint. Soit T
un Q-tore algébrique dans GQ . Une sous-donnée de Shimura (H, XH ) de (G, X) est
dite T -spéciale si T est la composante connexe du centre du groupe de Mumford-Tate
générique H ′ de XH . On peut sans perte de généralité supposer que H = H ′ . Alors
H = T Hder . Soit S comme précédemment. Une sous-variété T -spéciale de S est une
sous-variété de Shimura de S que l’on peut définir à partir d’une sous-donnée de
Shimura T -spéciale. Si T est triviale, une sous-variété T -spéciale est juste une sous
variété fortement spéciale.

Une variante simple de la preuve du théorème 5.1 donne le résultat suivant.

Théorème 5.8. – Soit T un tore dans GQ . Soit Zn une suite de sous-variétés T -spé-
ciales de S. Soit µn la suite de mesures associée. Il existe une sous-suite µnk et une
sous-variété T -spéciale Z tels que µnk → µZ . De plus Znk ⊂ Z pour tout k.

[1] Y. André – « Mumford-Tate groups of mixed Hodge structures and the theorem of
the fixed part », Compositio Math. 82 (1992), p. 1–24.
[2] W. L. J. Baily & A. Borel – « Compactification of arithmetic quotients of bounded
symmetric domains », Ann. of Math. 84 (1966), p. 442–528.
[3] J. Bertin & C. Peters – « Variations de structures de Hodge, variétés de Calabi-Yau
et symétrie miroir », in Introduction à la théorie de Hodge, Panor. Synthèses, vol. 3,
Soc. Math. France, Paris, 1996, p. 169–256.
[4] A. Borel – « Density properties for certain subgroups of semi-simple groups without
compact components », Ann. of Math. 72 (1960), p. 179–188.
[5] , Introduction aux groupes arithmétiques, Publications de l’Institut de Mathé-
matique de l’Université de Strasbourg, XV. Actualités Scientifiques et Industrielles, vol.
1341, Hermann, Paris, 1969.
[6] , Linear algebraic groups, second éd., Graduate Texts in Math., vol. 126, Sprin-
ger, New York, 1991.
[7] L. Clozel, H. Oh & E. Ullmo – « Hecke operators and equidistribution of Hecke
points », Invent. math. 144 (2001), p. 327–351.
[8] L. Clozel & E. Ullmo – « équidistribution des points de Hecke », in Contributions
to automorphic forms, geometry, and number theory, Johns Hopkins Univ. Press, Bal-
timore, MD, 2004, p. 193–254.
[9] , « équidistribution de mesures algébriques », Compos. Math. 141 (2005),
p. 1255–1309.



[10] , « équidistribution de sous-variétés spéciales », Ann. of Math. 161 (2005),

p. 1571–1588.
[11] S. G. Dani & G. A. Margulis – « Asymptotic behaviour of trajectories of unipotent
flows on homogeneous spaces », Proc. Indian Acad. Sci. Math. Sci. 101 (1991), p. 1–17.
[12] P. Deligne – « Travaux de Shimura », 244 (1971), p. 123–165.
[13] , « La conjecture de Weil pour les surfaces K3 », Invent. math. 15 (1972), p. 206–
[14] , « Variétés de Shimura : interprétation modulaire et techniques de construc-
tion de modèles canoniques », in Automorphic Forms, Representations, and L-functions
(A. Borel & W. Casselman, éds.), Proc. of Symp. in Pure Math., vol. 33, Amer. Math.
Soc., 1979, p. 247–290.
[15] P. Deligne & M. Rapoport – « Les schémas de modules de courbes elliptiques »,
349 (1973), p. 143–316.
[16] B. Dodson – « The structure of Galois groups of CM-fields », Trans. Amer. Math. Soc.
283 (1984), p. 1–32.
[17] B. Edixhoven – « Special points on the product of two modular curves », Compositio
Math. 114 (1998), p. 315–328.
[18] , « Special points on products of modular curves », Duke Math. J. 126 (2005),
p. 325–348.
[19] B. Edixhoven & A. Yafaev – « Subvarieties of Shimura varieties », Ann. of Math.
157 (2003), p. 621–645.
[20] A. Eskin, S. Mozes & N. A. Shah – « Non-divergence of translates of certain alge-
braic measures », Geom. Funct. Anal. 7 (1997), p. 48–80.
[21] S. Helgason – Differential geometry, Lie groups, and symmetric spaces, Graduate
Studies in Math., vol. 34, Amer. Math. Soc., Providence, RI, 2001.
[22] B. Klingler & A. Yafaev – « The André-Oort conjecture », Ann. of Math. 180
(2014), p. 867–925.
[23] S. Lang – Algebraic number theory, second éd., Graduate Texts in Math., vol. 110,
Springer, New York, 1994.
[24] G. A. Margulis – Discrete subgroups of semisimple Lie groups, Ergebn. Math.
Grenzg., vol. 17, Springer, Berlin, 1991.
[25] J. S. Milne – « Introduction to Shimura varieties », in Harmonic analysis, the trace
formula, and Shimura varieties, Clay Math. Proc., vol. 4, Amer. Math. Soc., Providence,
RI, 2005, p. 265–378.
[26] T. Miyake – Modular forms, Springer, Berlin, 1989.
[27] B. Moonen – « Linearity properties of Shimura varieties. I », J. Algebraic Geom. 7
(1998), p. 539–567.
[28] , « Models of Shimura varieties in mixed characteristics », in Galois represen-
tations in arithmetic algebraic geometry (Durham, 1996), London Math. Soc. Lecture
Note Ser., vol. 254, Cambridge Univ. Press, Cambridge, 1998, p. 267–350.
[29] S. Mozes & N. Shah – « On the space of ergodic invariant measures of unipotent
flows », Ergodic Theory Dynam. Systems 15 (1995), p. 149–159.
[30] M. V. Nori – « On subgroups of GLn (Fp ) », Invent. math. 88 (1987), p. 257–275.
[31] R. Pink – « Arithmetical compactification of mixed Shimura varieties », Dissertation,
Rheinische Friedrich-Wilhelms-Universität Bonn, 1989.



[32] V. Platonov & A. Rapinchuk – Algebraic groups and number theory, Pure and
Applied Mathematics, vol. 139, Academic Press, Inc., Boston, MA, 1994.
[33] M. S. Raghunathan – Discrete subgroups of Lie groups, Ergebn. Math. Grenzg.,
vol. 68, Springer, New York-Heidelberg, 1972.
[34] M. Ratner – « On Raghunathan’s measure conjecture », Ann. of Math. 134 (1991),
p. 545–607.
[35] J-P. Serre – « Complex multiplication », in Algebraic Number Theory (Proc. Instruc-
tional Conf., Brighton, 1965), Thompson, Washington, D.C., 1967, p. 292–296.
[36] , « Quelques applications du théorème de densité de Chebotarev », Publ. Math.
IHÉS 54 (1981), p. 323–401.
[37] N. A. Shah – « Uniformly distributed orbits of certain flows on homogeneous spaces »,
Math. Ann. 289 (1991), p. 315–334.
[38] J. H. Silverman – The arithmetic of elliptic curves, Graduate Texts in Math., vol.
106, Springer, New York, 1986.
[39] E. Ullmo – « Equidistribution de sous-variétés spéciales. II », J. reine angew. Math.
606 (2007), p. 193–216.
[40] E. Ullmo & A. Yafaev – « Galois orbits and equidistribution of special subvarieties :
towards the André-Oort conjecture », Ann. of Math. 180 (2014), p. 823–865.
[41] C. Voisin – Théorie de Hodge et géométrie algébrique complexe, Cours Spécialisés,
vol. 10, Soc. Math. France, Paris, 2002.

Emmanuel Ullmo, Institut des Hautes Études Scientifiques, 35, route de Chartres, 91440 Bures
sur Yvette, France • E-mail : ullmo@ihes.fr


Panoramas & Synthèses
52, 2017, p. 89–110




Andrei Yafaev

Abstract. – In this paper we give an overview of the proofs of the Manin-Mumford and
the André-Oort (assuming the Generalised Riemann Hypothesis) conjectures based
on a combination of Galois-theoretic, Geometric and Ergodic techniques.
Résumé (Points spéciaux et intersections dans les variétés abéliennes et les variétés de Shi-
Dans ce texte nous présentons les idées centrales des preuves des conjectures de
Manin-Mumford et d’André-Oort (admettant l’Hypothèse de Riemann Généralisée)
basées sur la combinaison des techniques galoisiennes, géométriques et ergodiques.

1. Introduction

These notes are expanded versions of the lectures given at the ‘États de la recherche’
conference held at CIRM, Luminy in May 2011. The conference was devoted to the
recent developments on the André-Oort and Zilber-Pink conjectures. My lectures
were given jointly with Emmanuel Ullmo and our aim was to present, in a reasonable
amount of detail, the proof of the André-Oort conjecture (assuming the Generalized
Riemann Hypothesis or GRH for short) which combines Galois-theoretic and Ergodic
techniques. These notes partly rely on Ullmo’s notes (see [25]) in this volume which
provide the necessary background.
Furthermore, Ullmo’s text [26] gives a good introduction to the abstract formula-
tion of the Zilber-Pink conjectures and we use his terminology and notations.
The main goal of these notes is to give an overview of the strategies of the proofs.
For technical details we refer to the original papers [28] and [14].

2010 Mathematics Subject Classification. – 11G15, 14G35, 14K15, 22E40.

Key words and phrases. – Shimura varieties, abelian varieties, Manin-Mumford conjecture, Diophantine
geometry, ergodic theory.

© Panoramas et Synthèses 52, SMF 2017


Statements such as the André-Oort and the Zilber-Pink conjectures can be formu-
lated most generally in the context of mixed Shimura varieties. For this we refer to
Ullmo’s text [26].
In these notes, we focus on the cases of Abelian and pure Shimura varieties. We
start with some abstract preliminaries on Equidistribution, in particular, we make
precise what we mean by equidistribution in our context.
We then proceed to explain the implementation of our strategy in the case of
Abelian varieties (the Manin-Mumford conjecture). The proof follows the same lines
as the Shimura case but each ingredient is much easier to formulate and to prove, and
the assumption of the GRH is not needed in this case.
Finally, we sketch the proof of the André-Oort conjecture assuming the GRH using
a strategy which combines Galois-theoretic techniques with Geometric techniques and
Equidistribution. We would like to point out here that a proof under GRH following
the same lines, but avoiding the equidistribution altogether (and using some group-
theoretic considerations instead) was carried out by Daw (see [4]).
Quite recently, Jonathan Pila and Umberto Zannier came up with a new approach
to the Manin-Mumford and André-Oort conjectures which uses ideas and results from
the theory of o-minimality and gives a hope to prove the André-Oort conjecture uncon-
ditionally. It yielded a number of unconditional results on the André-Oort conjecture
(see [15]. [16], [17] and [6]) culminating in the unconditional proof of the André-Oort
conjecture for all Shimura varieties of Abelian type (see [23] and references therein).
It should also be pointed out, that a new proof of the André-Oort conjecture under
GRH using the Pila-Zannier strategy is now available by combining lower bounds
for Galois orbits of special points ([29] or [22]) under GRH, with the hyperbolic Ax-
Lindemann-Weierstrass conjecture proven in [13] and upper bounds on heights of
pre-special points proven in [5] by Daw and Orr. An overview of Pila-Zannier’s ap-
proach as well as necessary background on o-minimality can be found in Scanlon’s
notes [20] in this volume. Another good reference for this approach is Daw’s survey
[3] (this survey is closer in spirit to these notes).


The author is extremely grateful to the organizers of the conference for inviting
him to give these lectures and to CIRM for its hospitality. During the conference the
author benefited from numerous discussions with leading experts in the field. In par-
ticular, the strategy for proving the hyperbolic Ax-Lindemann-Weierstass conjecture
was initiated there.
The author is very grateful to the referees and to Marc Hindry for pointing out
numerous inaccuracies and suggesting improvements.



2. Preliminaries on Equidistribution

In this section we consider a quasi-projective algebraic variety X over C endowed

with a special structure as defined in [26] and assume that the set of special subvari-
eties Σ(X) is countable.
We furthermore assume that X is endowed with a canonical probability measure
that we call µX and that each special subvariety Z is endowed with a canonical
probability measure µZ with support Z. This will indeed be true in the cases we are
going to consider. In particular, this is true for mixed Shimura varieties.
Let P (X) be the set of Borel probability measures on X and let C(X) be the set
of bounded continuous functions on X.

Definition 2.1. – We say that a sequence (µn ) of elements of P (X) is weakly conver-
gent to µ ∈ P (X) if for all f ∈ C(X)
µn (f ) = f dµn −→ µ(f ) = f dµ as n −→ ∞.

We write
µn −→ µ.

The usual definition of equidistribution of a subsequence of P (X) is as follows.

Definition 2.2. – A sequence of measures (µn ) in P (X) is said to equidistribute if µn

converges to µX .

In the case of measures attached to special subvarieties we will take a slightly

different definition of Equidistribution which is as follows.

Definition 2.3 (Equidistribution). – We say that a sequence of special subvarieties (Zn )

is equidistributed if there exists a special subvariety Z such that after possibly extract-
ing a subsequence the following conditions hold:
1. µZn −→ µZ and
2. Zn ⊂ Z for all n large enough.

We will need the following definition.

Definition 2.4. – Let X be as before and Z a special subvariety of X. A sequence of

special subvarieties (Zn ) of Z is called strict (relative to Z) if any proper special
subvariety of Z contains only finitely many Zn s.

We have the following.

Proposition 2.5. – Suppose that (Zn ) and all its subsequences are equidistributed
S in the
sense of Definition 2.3. Then components of the Zariski closure of n Zn are special.



Proof. – Let Y be component of the Zariski closure of n Zn . Replace (Zn ) by the
subsequence of Zn s contained in Y . Let ZY be the smallest special subvariety of X
containing Y (such a ZY exists by definition of a special structure). The set of proper
special subvarieties of ZY is countable and we number them as (Zn′ ).
For any k ≥ 1, let Znk be an element of (Zn ) not contained in i=1 Zk′ . Such a
choice is clearly possible by the Zariski density and by construction (Znk ) is strict
relative to ZY . By the equidistribution property there exists a special subvariety
Z ⊂ Y containing infinitely many Znk s which implies that Z = Y = ZY and hence
Y is special.

In fact, a stronger statement than the (abstract) André-Oort conjecture (in cases
where it makes sense) is the so-called Equidistribution conjecture which is the follow-

Assume that X is defined over Q and let F be a number field of definition of X.

Assume that all special subvarieties are also defined over Q. To any x ∈ X(Q), one
attaches the following probability measure
1 X
∆x = δy
[F (x) : F ]
y∈Gal(F /F )·x

where δy denotes the Dirac measure with support in {y}.

Conjecture 2.6 (Equidistribution conjecture). – Let xn be a strict (with respect to X)

sequence of special points in X. Then

∆xn −→ µX .

There are few cases of Shimura varieties for which this conjecture is known. It is
only known for modular curves in full generality (Duke, [9]). Zhang (see [30]) proved
the Equidistribution conjecture for some quaternionic Shimura varieties but only for
sequences satisfying additional assumptions.

We refer to Ullmo’s text [24] for a thorough account of the Equidistribution ap-
proach to the Manin-Mumford and the André-Oort type of questions.

The Equidistribution conjecture is one of the directions for future developments.

One has to prove two things: one is the Equidistribution of toric orbits and the other
is to derive from it the Equidistribution of Galois orbits. There is some recent work
on the Equidistribution of toric orbits by Eiseindler, Linderstrauss, Venkatesh and
Ph. Michel.



3. Strategy of the proof

The strategy that yields the proof of the Manin-Mumford and the André-Oort
conjectures (under the GRH) is based on an alternative between Galois and Ergodic
theory (Equidistribution). In these notes, we will present the implementations of this
strategy in the Abelian and Shimura cases respectively.
Let X/Q be a variety endowed with a special structure. All special subvarieties are
assumed to be defined over Q. Furthermore, as in the previous section, we assume
that X and its special subvarieties are endowed with natural probability measures.
Let (Zn ) be a sequence
S of special subvarieties of X and let Y be a component of
the Zariski closure of n Zn . Replace (Zn ) by the subsequence contained in Y . Our
aim is to prove that Y is special.
Choose a number field F such that Y is defined over F . In the cases we consider,
X is canonically endowed with an ample line bundle L and we can calculate degrees
of subvarieties with respect to this line bundle.
Then one shows that one of the following occurs.
1. The sequence (Zn ) is equidistributed and so are all of its subsequences. In this
case Y is special and we are done.
deg L (Gal(F /F ) · Zn ) −→ ∞ as n −→ ∞.
In this case we will be able to construct for each n ”large enough” a special
subvariety Zn′ such that
Zn ⊂ Zn′ ⊂ Y
and dim(Zn′ ) > dim(Zn ).
We then reiterate the process with (Zn′ ) instead of (Zn ). In the end we will get
that Y is special.

4. The Manin-Mumford conjecture via Galois orbits and Equidistribution

Even though our main goal in these notes is to outline the proof of the André-Oort
conjecture under the GRH via an approach combining the Galois theoretic results
with Equidistribution (as explained in Section 3), it seems useful to outline the proof
of the Manin-Mumford conjecture following the same lines first. The proof we outline
here is due to Ratazzi and Ullmo (see [18]) and is very much inspired by the work of
Hindry ([12]). It should be noted that the Manin-Mumford conjecture has a very large
number of genuinely different proofs (due to Raynaud, Szpiro-Ullmo-Zhang, Hindry,
Pila-Zannier) and even stronger statements such as the Bogomolov’s conjecture are
Let us recall the situation. Let A be an Abelian variety over Q. Let us note here
that even though the Manin-Mumford conjecture is formulated for Abelian varieties
over the complex numbers, by standard specialization arguments (see [19]), one can
assume that the variety is defined over Q. A special (also sometimes called torsion)



subvariety is one of the form B + x where B is an Abelian subvariety of A and x is a

torsion point. Let Σ be a set of torsion points in A. Recall that the Manin-Mumford
conjecture asserts that the irreducible components of the Zariski closure of Σ are
special subvarieties.

4.1. Equidistribution. – In this section we state the Equidistribution property of se-

quences of Abelian subvarieties of an Abelian variety.
In fact, one first considers real tori and proves Equidistribution of their subtori. To
be more specific, we are in the following situation.
Let X = Zn \Rn be a real torus and let π : Rn −→ X be the canonical projection.
Define the set of strongly special subvarieties as
{Z = π(R ⊗ H), H is a Q-vector subspace of Qn }.
Any Z as above is canonically endowed with a probability measure µZ : the pushfor-
ward by π of the Lebesgue measure on R ⊗ H normalized to be a probability measure
on X.
The essential ingredient is the following general criterion.

Theorem 4.1 (Weyl’s criterion). – Let X be a compact metric space and let C(X) be
the space of continuous functions on X. Let φn ∈ C(X) be a sequence such that
their linear combinations are dense in C(X) (C(X) is endowed with the usual norm
||f || = supx∈X |f (x)|).
Then µn −→ µ if and only if for all m ∈ N,
µn (φm ) −→ µ(φm ).

A consequence of the Weyl criterion in our case is the following.

Proposition 4.2. – Let X = Zn \Rn . For (k1 , . . . , kn ) ∈ Zn , define the associated char-
acter χ = χk1 ,...,kn of X by
χk1 ,...,kn ((x1 , . . . , xn )) = exp(2iπ kj xj ).

A sequence of measures µm on X converges weakly to a measure µ if and only if

for any character χ of X as above,
µm (χ) −→ µ(χ)
as m −→ ∞.

Proof. – This is a consequence of the Weyl criterion stated above and the theory of
Fourier series.

Theorem 4.3. – Let (Zn ) be a sequence of strongly special subvarieties of X. Then

there exists a strongly special subvariety Z such that after possibly replacing (Zn ) by
a subsequence, (µZn ) weakly converges to µZ and Zn ⊂ Z for all n ≫ 0.



Proof. – For details we refer to [18], Section 4.1. The proof relies on the criterion 4.2
stated above.

We then deduce the following theorem.

Theorem 4.4 (Equidistribution theorem for Abelian subvarieties)

Let A be an Abelian variety over C and let (Bn ) be a sequence of Abelian subvari-
eties of A. After, if necessary, passing to a subsequence, there is an Abelian subvariety
B ⊂ A such that the measures µn canonically attached to Bn weakly converge to µB
and Bn ⊂ B for all n large enough.

Proof. – By Theorem 4.3, there is a strongly special subvariety Z ⊂ A (A being

viewed as a real torus) with the required properties. We need to show that Z is an
Abelian variety i.e., Z has a complex structure. Let B be the group generated by the
Bn for all n such that Bn ⊂ Z. Then B is an Abelian variety. We have B ⊂ Z and
Bn ⊂ B for all n large enough. By passing to the limit, we get that Z ⊂ B, hence
B = Z and Z is an Abelian variety.

We will use this theorem in the proof of Manin-Mumford in the following form.

Corollary 4.5. – Let (Zn ) be a sequence of special subvarieties of A. Assume that Zn =

x + Bn where x is a fixed torsion point and Bn is an Abelian subvariety. Then (Zn )
and all of its subsequences are equidistributed in the sense of Definition 2.3.

4.2. Galois orbits and the alternative. – In this section we give lower bounds for Galois
orbits of torsion points on an Abelian variety defined over a number field in terms of
a positive power of the order of the point. This, as we will see, uses results of Serre’s
on Galois representations on the torsion of Abelian varieties. Note that, although it
uses much more advanced results, this is really analogous to the action of Gal(Q/Q)
on torsion points of C∗ (roots of unity). The usual cyclotomic theory immediately
yields a lower bound for the Galois orbit of a root of unity in terms of, for example,
the square root of the order.
We have the following theorem of Serre’s giving lower bounds for Galois orbits of
torsion points on Abelian varieties.

Theorem 4.6 (Serre). – Let A be an Abelian variety over a number field K.

1. There exists a constant c(A, K) > 0 such that for any x ∈ Ators of order n and
any m coprime with n, there exists a σ ∈ Gal(K/K) such that
[mc(A,K) ]x = σ(x).
2. For any ǫ > 0, there exists a constant C1 (A, K, ǫ) > 0 such that for any x ∈ Ators
of order n, we have
|Gal(K/K) · x| ≥ C1 (A, K, ǫ)n1−ǫ .



Proof. – Part 1 is a hard theorem of Serre’s stating that the image of the Galois
representation on Tl A contains an open subgroup Ul of Z∗l for all l and furthermore
that the index |Z∗l /Ul | is bounded by a constant independent of l.
If l 6= p, then p ∈ Z∗l and pc is in the image of Galois for some c. For this, one
can consult Serre ([21], Lettre à Ken Ribet) or handwritten notes of Serre’s course at
College de France by Eva Bayer available on her webpage.
Let us prove that (1) implies (2). Let x be a torsion point of A. By (1), there
is a constant c > 0 such that for any integer m coprime with n, we have [mc ]x ∈
Gal(K/K) · x. In particular, we have
|Gal(K/K) · x| ≥ |{xc : x ∈ (Z/nZ)∗ }| = .
|{x ∈ (Z/nZ)∗ : xc = 1}|
We know that φ(n) ≫ n1−ǫ , therefore it is enough to give an upper bound for the
cardinal of the set x ∈ (Z/nZ)∗ such that xc = 1. Write
n= pki i

and let ni = piki −1 (pi

− 1). This is the cardinality of (Z/pki i Z)∗ . By writing (Z/nZ)∗
as a product of cyclic groups, we see that
|{x ∈ (Z/nZ)∗ : xc = 1}| ≤ 2 gcd(c, ni ) ≤ 2cr .
On the other hand, the number of primes dividing n is ≪ log log(n) , thus cr ≪ nǫ .

It is now easy to explain the alternative in this case. To do this we need the following
lemma, which is an effective version of Poincaré’s lemma.

Theorem 4.7 (Bertrand, see appendix to [18]). – There exists a constant C(A) such
that, for any Abelian subvariety B of A, there exists an Abelian subvariety B ′ such
A = B + B′
and |B ∩ B ′ | < C(A)

Using this theorem, we will normalize the notation Z = x + B by requiring that

x ∈ B ′ . From now on, we will always assume that our special subvarieties are normal-
ized in this sense.
Hence it makes sense to say that a sequence Zn = xn + Bn of special subvarieties
is such that ord(xn ) is bounded (where ord(xn ) denotes the order of xn ). The degree
of a subvariety Z (denoted deg(Z)) of A is calculated with respect to the ample line
bundle induced by a fixed polarization. If Z is not irreducible, then the degree of Z is
the sum of the degrees of its irreducible components. We will use this convention
throughout this text. One obtains (see proof of Lemme 3.5 of [18]) from what precedes
the following lower bound for degrees of Galois orbits.



Theorem 4.8 (Lower bound for degrees of Galois orbits). – There exists a constant
C(A, K) such that for any special subvariety Z = x + B with B defined over K and
x ∈ B ′ , one has
deg(Gal(K/K) · Z) > C(A, K)ord(x)1/2 .

A consequence of the Equidistribution result stated in the previous section is the


Theorem 4.9 (Equidistribution). – If Zn = xn +Bn is a sequence of special subvarieties

is such that ord(xn ) is bounded.
Then (Zn ) is equidistributed, in particular, the components of its Zariski closure
are special.

The alternative is now clear : given a sequence of special subvarieties Zn = xn + Bn

with xn ∈ Bn′ , then at least one of the following happens:

1. ord(xn ) is unbounded and deg(Gal(K/K) · Zn ) −→ ∞

2. (Zn ) is equidistributed.

4.3. End of the proof. – Let L be an ample line bundle on A induced by a polarization
(that we fix once and for all). The degrees will be calculated with respect to this line
bundle. We have the following (see lemme 6 of [12]):

Theorem 4.10 (Hindry). – Let X be an irreducible subvariety of A and Stab(X) =

{a ∈ A : a + X = X}. Then

n2 dim(X)
deg([n]X) = deg(X).
|Stab(X) ∩ ker[n]|

From this theorem one deduces the following criterion.

Theorem 4.11 (Geometric criterion). – Let X be an irreducible subvariety of A. Sup-

pose that there exists an integer d ≥ 2 such that

[d]X ⊂ X.

Then X is special.

Proof. – We refer to [18] for the proof.



4.4. Induction in the Abelian case: proof of Manin-Mumford. – We can now finish the
proof of Manin-Mumford by induction. Let (Zn ) be a sequence of special subvarieties.
Write Zn = xn + Bn where xn ∈ Bn′ . We can, and do, assume that the Zn s are
equidimensional. Let Y be an irreducible component of the closure of n Zn . We
replace Zn by the subsequence of the Zn s contained in Y and we choose a number
field K such that A, Y and all Abelian subvarieties are defined over K (one can
achieve the last condition by making an extension of degree 3(2 dim A) ).
If dn := ord(xn ) is bounded, then (Zn ) and all its subsequences are equidistributed
and hence Y is special.
Suppose this is not the case. Let p be a prime not dividing dn and let d = pc(A,K)
(where c(A, K) is the constant from Theorem 4.6, (1)). Let Y 1 = Y ∩ [d]Y .
If dim Y 1 = dim Y , then, since Y is irreducible, Y1 = [d]Y and hence [d]Y ⊂ Y .
Then Y is special by the geometric criterion 4.11.
Suppose dim(Y 1 ) < dim(Y ). Note that Y , [d]Y and hence Y 1 are defined over K.
By Lemme 3.3 of [18], Zn ⊂ Y 1 (this is a more-or-less direct consequence of The-
orem 4.6). We replace Y 1 by a K-irreducible component that contains Zn . Let g be
the dimension of A. By Theorem 4.10,

deg([d]Y ) ≤ d2g deg(Y ).

And so, by Bézout’s theorem (in the form Lemme 3.4 of [18]), we have

deg(Y1 ) ≪ d2g .

Starting with Y1 instead of Y and iterating at most m = dim(Y ) − dim(Zn ) times we

find the following alternative:

1. either we construct a special subvariety of Y containing Zn properly

2. or we construct a variety Y m defined over K such that Zn ⊂ Y m is a component
of Y m and
deg(Y m ) ≪ dc
for some constant c depending only on g. But Y m contains Gal(K/K) · Zn and
by Theorem 4.8 combined with the inequality deg(Y m ) ≪ dc , we obtain that

d1/2 m c
n ≪ deg(Gal(K/K) · Zn ) ≤ deg(Y ) ≪ d .

By the Prime Number Theorem, we can choose a prime p not dividing dn such
that d = pc(A,K) is of the order (log(dn ))c(A,K) . This gives a contradiction.
Hence we end up in case (1).

By this procedure we construct a sequence (Zn′ ) such that Zn ⊂ Zn′ ⊂ Y for all n
large enough, and dim Zn′ > dim Zn . We reiterate the same process with this sequence
(Zn′ ). This concludes the proof.



5. Shimura case: lower bounds for Galois orbits and the alternative
We now move onto the case of Shimura varieties (the André-Oort conjecture). All
the relevant definitions concerning Shimura varieties and their special subvarieties
can be found in Ullmo’s notes [25] (especially Chapter 3) but we recall some of them
for the sake of completeness. The reader is assumed to be familiar with the notions
of Shimura datum, Shimura variety, special point, reflex field, Hecke correspondence,
Mumford-Tate group and generic Mumford-Tate group.
The strategy is formally the same as in the case of Abelian varieties. It is the
one outlined in Section 3: using lower bounds for degrees of Galois orbits of special
subvarieties and a geometric criterion involving Hecke correspondences, one produces
a set of special subvarieties that has the Equidistribution property. The Generalized
Riemann Hypothesis is used twice: once to obtain lower bounds for Galois orbits and
the second time to choose a Hecke correspondence of suitably bounded degree in the
course of the induction.

5.1. Degrees of the Galois orbits. – Our aim in this section is to give lower bounds
for degrees of the Galois orbits of special subvarieties and characterize sequences of
special subvarieties whose Galois degree is uniformly bounded. This lies at the heart
of the proof and this is the content of the paper [28]. We only sketch the main ideas of
the proof. The details are extremely technical and interested reader is referred to [28].
We need to obtain lower bounds for the degrees of Galois orbits of special sub-
varieties in terms of certain invariants attached to Shimura data defining special
subvarieties in question.
Consider a Shimura datum (G, X) and a compact open subgroup K of G(Af ). We
assume (this causes no loss of generality) G to be semisimple of adjoint type and we
work with the connected component
S = Γ\X +
which is the image of X + × {1} in ShK (G, X) where X + is a fixed connected Q compo-
nent of X while Γ is G(Q)+ ∩ K. We assume that K is neat and that K = p Kp with
Kp compact open subgroups of G(Qp ). This amounts to replacing K by a subgroup
of finite index and causes no loss of generality. Let us fix a number field F over which
S admits a canonical model.
A special subvariety V of S is a component of the image of the Shimura vari-
ety ShK∩H(Af ) (H, XH ) where (H, XH ) is a Shimura subdatum with H the generic
Mumford-Tate group on XH . We usually identify V with this component (i.e., we for-
get about the map from ShK∩H(Af ) (H, XH ) to ShK (G, X)). We refer to Section 3.3.2
of [25] for a detailed discussion of special subvarieties. Let us point out here that the
requirement that H be the generic Mumford-Tate group on XH is a normalisation.
Notice that multiplying H by a subtorus of the center of its centralizer does not change
the geometric object (special subvariety). This is analogous to the normalization we
used in the case of Abelian varieties: a special subvariety x + B was normalized by
requiring that x ∈ B ∩ B ′ (with B ′ as in the Theorem 4.7). This gave meaning to



saying that the order of x remains bounded when x+B ranges through a set of special
In the Shimura case, our normalization will allow us to give meaning to saying that
the connected center remains the same.
Let H der be the derived subgroup of H and T the connected center of H. Let F be
a number field containing the reflex field E(G, X). The notion of degree we use is the
following. For notions of the Baily-Borel compactification and Baily-Borel line bundle
we refer to [1].
Definition 5.1 (Degree of a Galois orbit of a special subvariety.)
Let V be an irreducible subvariety of S defined over Q. Let S be the Baily-Borel
compactification of S. We define deg(Gal(F /F ) · V ) to be the degree of the Zariski
closure in S of the subvariety Gal(F /F ) · V of S calculated with respect to the Baily-
Borel bundle L on S.
Just like in the previous section, the degree of a reducible subvariety, is by definition
the sum of the degrees of its components. Let us define KT := K ∩ T (Af ) and KTm
to be the maximal compact
Q open subgroup Q of Tm(Af ). The groups KT and KT are
direct products K = p KT,p and KT,p = p KT,p . For almost all primes p, one has
KT,p = KT,p (this is because KT and KTm are adelically open and KT,p ⊂ KT,p m
We let i(T ) be the number of primes such that KT,p 6= KT,p . We also let LT be the
splitting field of T and dT the absolute value of the discriminant of LT . The degree
of LT over Q is bounded independently of (H, XH ).
Theorem 5.2. – Assume the Generalized Riemann Hypothesis (GRH) for CM fields.
Fix an integer R > 0. There exist constants C > 0, B > 0 and µ > 0 such that the
following holds.
Let V ⊂ S be a special subvariety defined by a Shimura datum (H, XH ) and T be
the connected center of H. Let dT , KT , KTm and i(T ) be as defined above. Let F be a
field of degree at most R over Q and containing LT .
deg(Gal(F /F ) · V ) > C · B i(T ) |KTm /KT |dµT .
Remark 5.3. – It is very important to emphasize here that the constant C depends
only on (G, X), K and R. It does not depend on (H, XH ) in any way.
Another remark is that this lower bound is actually stronger than the one obtained
in Theorem 2.9 of [28]. There, only the bound in a power of log(dT ) is obtained.
However, the bound in small power of dT can be obtained by adapting the methods of
[29] and [22]. This of course assumes the GRH.
It should be observed that this lower bound has two important terms. The first is
the term B i(T ) |KTm /KT | which is obtained without the use of the GRH. The second
term is dµT and this term is obtained under GRH. It is very desirable to have an
unconditional bound in connection with Pila’s strategy (at least for sequences of
special points).



We would like to point out here that Tsimerman, using recent results on the
Colmez’s conjecture on the Faltings heights of CM Abelian varieties, obtained uncon-
ditional lower bounds for Galois orbits of CM points on Shimura varieties of Abelian
type (see [23]). However, this result does not directly imply Theorem 5.2, even for
subvarieties of A g .
To see this, consider the following example. Let B be a quaternion algebra over
a totally real field F of degree n > 1 and assume that B splits exactly one real
place of F . Let G = ResF/Q B ∗ . Then (G, H) (where H is the upper-half plane) is
a Shimura datum of Abelian type. However it does not define a special subvariety
of some A g . To construct a subvariety of A g , one follows Deligne’s construction of
“modèles étranges” (see Section 6 of [7]) which consists of enlarging the center√of G
in order to obtain a symplectic embedding. Let d ≥ 1 be an integer and Z = F ( −d)
the corresponding imaginary quadratic extension of F . Deligne considers the group
G′ defined as
G′ = Z ∗ × G/F ∗
where F ∗ is embedded in Z ∗ ×G via f 7→ (f, f −1 ). Then the Shimura datum (G′ , H) is
a subdatum of a certain symplectic Shimura datum and thus defines a special subva-
riety of some A g .
Let Fm be a sequence of totally real number fields of degree n > 1 and Bm a
sequence of quaternion algebras over Fm split at exactly one place of Fm . Fix d ≥ 1
and consider the sequence (Zm ) of special (non-strongly) subvarieties of A g (g =
4n) obtained by Deligne’s construction as outlined above. The reciprocity attached
to Zm is not given by a CM type and hence Tsimerman’s argument is not applicable.
It should be noticed that it is still possible to obtain appropriate lower bounds for
Galois orbits in this example by appealing to results of Daw (see [4]).
We now briefly outline the steps in the proof of Theorem 5.2. Let KH := K ∩H(Af )
and let us define KH := KTm KH . This is a compact open subgroup of H(Af )
containing KQ H . One needs to alter the group KH a little bit: replace it with
m m
(KH,3 ∩ K3 ) p6=3 KH,p to make it neat (where K3 is the congruence subgroup of
level three). This only changes the constants by an integer depending on dim(G)
only. The morphism
π : ShKH (H, XH ) −→ ShKH
m (H, XH )

is finite of degree |KH /KH | = |KTm /KT |. Notice that the finite group KH m
/KH =
m m
KT /KT acts on ShKH (H, XH ) and π is the quotient map. We let V := π(V ). Our
first aim is to understand and quantify the action of Gal(F /F ) on π −1 V m . The Galois
action is described by a so-called reciprocity morphism. The definition is extremely
technical and we refer an interested reader to Section
Q 2.1 of [28]. What is relevant to
us is the following. There exists a subgroup U = p Up of KTm , where each Up is an
open subgroup of KT,p of uniformly (i.e., depending only on (G, X)) bounded index,
such that the following holds. Let V be an irreducible component of π −1 (σV m ). Then
Gal(F /F ) · V is contained in U · V where U is the image of U in KTm /KT . It should



also be noted that, as the Baily-Borel line bundle is KTm /KT -equivariant, for any
α ∈ KTm /KT ,
deg(αV ) = deg(V ).
One then proves the following lemma which realizes the ‘splitting’ of the Galois orbit
into two pieces.

Lemma 5.4. – The degree of Gal(F /F ) · V is at least the degree of

(Gal(F /F ) · V ) ∩ π −1 V m
times the number of Galois conjugates of V m .

One shows that the first term (the degree of (Gal(F /F ) · V ) ∩ π −1 V m ) is bounded
below by a uniform constant times the size of U . Recall that
KTm /KT = m
KT,p /KT,p
m m
and KT,p /KT,p is non-trivial only for the i(T ) primes such that KT,p 6= KT,p . As the
index of Up in KT,p is uniformly bounded, say by, B we see that the size of U is at
least B i(T ) |KTm /KT |. This accounts for the first piece.
We do not give details regarding the second piece. This uses the GRH in the form
of the Effective Chebotarev Theorem (see [25], Section 2.1.3). Details can be found
in Section 6 of [29].

5.2. The alternative. – We now consider a sequence (Zn ) of special subvarieties defined
by Shimura data (Hn , Xn ). Our aim is to work out the conditions on (Hn , Xn ) under
which the Galois orbits of the Zn have bounded degrees. We fix once and for all a
faithful representation
ρ : G −→ GLn
defined over Q.
Fix a non-trivial subtorus T ⊂ G with T (R) compact. A sequence of special sub-
varieties (Zn ) defined by Shimura data (Hn , Xn ) is called T -special if for each n, one
has Hn = T Hnder . This definition is analogous to sequences of special subvarieties of
Abelian varieties of the form xn + Bn where the xn have bounded order.
In this section we show that sequences (Zn ) with bounded Galois degree split into
a finite number of T -special subsequences. We let, as before, (Hn , Xn ) be the Shimura
datum defining Zn and Tn the connected center of Hn .
Let F be a number field over which S admits a canonical model and let Zn be a
sequence of special subvarieties with deg(Gal(F /F ) · Zn ) bounded. Using the lower
bound from Theorem 5.2, we first see that dTn is bounded, hence the splitting field
Ln of Tn can be assumed to be constant, equal to a field L.
By considering the representations of the tori Tn induced by ρ, one then sees that
the tori Tn lie in finitely many GLn (Q)-conjugacy classes. We can therefore assume
that the tori Tn lie in one GLn (Q)-conjugacy class.



Let us now investigate the consequences of the boundedness of the term

B i(Tn ) |KTmn /KTn |. This term is bounded hence both i(Tn ) and |KT,n /KT,n | are
For a prime p unramified in L such that KT,p 6= KT,p and such that the closure
GZp of G in GLn,Zp is reductive and smooth, the Tn lie in one GLn (Zp )-conjugacy
class. Indeed, for such a prime p, the Tn,Zp (obtained by taking the Zariski closure
of Tn in GLn,Zp ) are tori over Zp and the conclusion is then a consequence of the
results of [8], Exposé X.
To deal with the remaining finitely many primes, we need the following lemma
(Proposition 3.19 of [28]).
Lemma 5.5 (Clozel’s lemma). – Let G be a reductive group over Qp , T ⊂ G a non
trivial torus and H := ZG (T ) (the centralizer of T in G). Let K be a fixed compact
open subgroup of G(Qp ) and let KT = KTm be the maximal compact subgroup of T (Qp ).
The function
I(g) = |KT /T (Qp ) ∩ g −1 Kg| → ∞
as g → ∞ in G(Qp )/H(Qp ) (where a basis of neighborhoods of ∞ is given by the
complements of compact subsets of G(Qp )/H(Qp )).
In particular, let W be a set of g ∈ G(Qp )/H(Qp ) such that I(g) is bounded. The
image of W in G(Zp )\G(Qp )/H(Qp ) is finite.
Remark 5.6. – We believe that this lemma is of independent interest. This lemma was
generalized to the case of any reductive group in Section 5 of [27].
A combination of all that precedes allows us to conclude that the tori Tn lie in
finitely many GLn (Z)-orbits. In order to conclude that the sequence Zn splits into a
finitely many of T -special sequences, we need to show that the tori Tn lie in finitely
many Γ-orbits.
We now need to pass from GLn (Z) to Γ. Because Γ has finite index in G(Z) =
G(Q) ∩ GLn (Z), it suffices to prove that the tori lie in finitely many G(Z)-orbits.
Let S be the finite set of primes p such that either TZp is not a torus or the closure
of G in GLnZp is not reductive and smooth. Let A := ZS be the ring of S-integers. As
we work in one GLn (Z)-conjugacy class, the tori we work with have smooth Zariski
closure in GLnZS . By a result of Gille and Moret-Bailly (see [11]), there are only
finitely many G(A)-conjugacy classes of such tori and Clozel’s Lemma 5.5 finishes the
To summarize, we have obtained the following.
Theorem 5.7. – Let (Zn ) be a sequence of special subvarieties. Assume that there exists
C > 0 such that for any n ≥ 0,

deg(Gal(Q/F ) · Zn ) < C.
Then there exists a finite set of subtori {T1 , . . . , Tr } of G such that each Zn is
Ti -special for some i.



The Galois-Ergodic alternative is now realized by the following result proved in

Section 3.1 of [28] and which is actually a consequence of the main result of [2].

Theorem 5.8 (Equidistribution of T -special subvarieties). – Fix T ⊂ G a subtorus such

that T (R) is compact. Let (Zn ) be a sequence of T -special subvarieties of S. Let µn be
the probability measure canonically attached to Zn . There exists a subsequence nk and
a special subvariety Z of S such that

1. Let µZ be the probability measure canonically attached to Z. Then

µnk −→ µZ

2. Znk ⊂ Z for all k large enough.

This is to be compared to the Equidistribution theorem for subvarieties of Abelian

varieties of the form x + B where x is a fixed point and B is an Abelian subvariety.
In particular, we have the following.

Corollary 5.9. – Let (Zn ) be a sequence of T -special subvarieties. The components of

the Zariski closure of n Zn are special.

6. The geometric criterion and the end of the proof

We can now outline the proof of the André-Oort conjecture assuming the GRH.
In order to complete the proof, we need two more major ingredients. They are a
geometric criterion involving Hecke correspondences and a result about the existence
of suitable Hecke correspondences.
Let us recall the general situation. We have a Shimura variety
S S and a subvariety
Z containing a sequence (Zn ) of special subvarieties such that n Zn is Zariski dense
in Z. We denote by (Hn , Xn ) the Shimura datum defining Zn . We let Tn be the
connected center of Hn . We choose a number field F such that S admits a canonical
model over F and furthermore, Z is defined over F .
From the preceding section it follows that, if deg Gal(Q/F ) · Zn are bounded, then
Z is special and we are done. We therefore assume that the degrees of the Galois
orbits of the Zn are unbounded.
We let Ln be the splitting field of Tn and dn the absolute value of its discriminant.
To prove that Z is special, it is enough to show that, for all n ≫ 0, Zn is contained
in a special subvariety Zn′ ⊂ Z with dim(Zn′ ) > dim(Zn ).
This will be done by an induction, similar to the induction in the Abelian case as
in Section 4.4.



6.1. The geometric criterion. – Recall that in the Abelian case, the geometric criterion
stated that, a subvariety invariant under certain non-trivial translations by integers
is special. In the Shimura case the analog of the translation by an integer is a suitable
Hecke correspondence.
We say that a subvariety Z of S is Hodge generic if Z is not contained in any proper
special subvariety. Section 3.4 of Ullmo’s notes [25] contains the following statement.
Let Z be a Hodge generic subvariety of S containing a smooth special point. Let q be
in G(Q) which is in Kp for all p except for p = l for a certain prime l large enough
(depending on Z) and such that Tq -orbits are dense and Z ⊂ Tq Z, then Z = S and
hence Z is special.
This criterion is used to prove the André-Oort conjecture in the case of curves,
however, it is unusable in the higher dimensional cases. The dependence of l on Z is
very non-effective and we will see at the end of this section why this statement fails
without the assumption ‘l large enough’. In the case where S = Cn (see Section 2.2.4
and 2.2.5 of [25]), one can establish the dependence of l on the degree of Z. In the
general case such an effective result seems to be beyond reach (and may simply not
exist). There is however a refined version of the criterion which is used in the proof
of the André-Oort conjecture under GRH in [14]. We present it in this section. For
details the reader is referred to Section 7 of [14].
Let (G, X) be a Shimura datum. By a non-strongly special subdatum we mean a
Shimura subdatum (H, XH ) such that H = T H der with T a non-trivial subtorus.

Theorem 6.1 (Geometric criterion). – Let (G, X) be a Shimura datum with G semisim-
ple of adjoint type and let K be a neat compact open subgroup of G(Af ) which is a
Let V be a non-strongly special subvariety of S contained in a Hodge-generic sub-
variety Y of S. Let T be the connected center of the group defining V .
Let l be a prime number splitting T and let m be an element of T (Ql ).
Suppose that Y satisfies the conditions
(1) Y ⊂ Tm Y .
(2) for every k1 and k2 in Kl the image of k1 mk2 in G(Ql ) generates an unbounded
(for the l-adic topology) subgroup of G(Ql ).
Then Y contains a special subvariety V ′ containing V properly.

Proof. – We only present a sketch of the proof and omit all technicalities. For technical
details, we refer to [14].
We refer to Ullmo’s notes [25], Section 3.3.6 for the notion of monodromy. Fix
a smooth Hodge generic point x ∈ Y and fix VZ a lattice in V = Qn such that
K ⊂ GL(VZb ). Let
ρm : π1 (Y sm , x) −→ GL(VZ )
be the monodromy representation and let Γ′ be its image. Recall ([25], Lemme 3.43)
that Γ′ is Zariski dense in (the image of) G.



We let Kl′ be the closure of Γ′ in G(Ql ). By [25], Corollaire 3.45, the group Kl′ is a
compact open subgroup of Kl . Let Shl (G, X) be the pro-l Shimura covering. This is
the projective limit over compact open subgroups of G(Alf ). Notice that G(Ql ) acts
on Shl (G, X). There is a component Ye of the preimage of Y in Shl (G, X) which is
stable by Kl′ .
The condition Y ⊂ Tm Y implies that Ye is also stable by k1 mk2 for some
k1 , k2 ∈ Kl .
Hence Y is stable by the group Ul generated by Kl′ and k1 mk2 . By assumption,
this group is unbounded.
One then shows that there is a component V ′ of the closure of the orbit of Ul · V
which is a special subvariety V ′ containing V properly.

The main difficulty now is to choose an m in T (Ql ) such that for any k1 and k2
in Kl , the element k1 mk2 generates an unbounded subgroup of G(Ql ). The idea is to
replace the group Kl by a smaller one but whose index we can still control. We will
replace Kl with a suitable Iwahori subgroup.
We are not going into details about Iwahori subgroups: they may be found in
Section 8.1 of [14]. Instead we just list the relevant properties. Let Il be an Iwahori
subgroup in good position with respect to T . Then the following holds.

1. Il ∩ T (Ql ) is the maximal compact subgroup of T (Ql ).

This is what Il being in good position with resepect to T means.
2. The relation Tmr = (Tm )r holds in the Hecke algebra attached to Il . This
property will be used in an essential way.
The important property is that, if TQl is split and T (Ql ) ∩ Kl = KT,l , then there
exists an Iwahori subgroup Il of Kl in good position with respect to T such that
|Kl /Il | < lf ,
where f is a uniform integer (independent of (H, XH )).
Without the assumption that Kl is contained in a suitable Iwahori subgroup, it is
actually quite easy to find examples of m such that Tm has dense orbits but there
exist k1 and k2 such that k1 mk2 does not generate an unbounded subgroup.
Consider the following counter-example: let G = PGL2 and suppose that Kl′ is the
group of matrices in G(Zl ) congruent to upper triangular ones modulo l. The element
m is m = ( 10 0l ) . Suppose that k1 = ( 01 10 ) and k2 = 1. One then sees that k1 mk2 has
order two and will not generate an unbounded subgroup. By assuming that Kl lies
in a suitable Iwahori, which in this case is Kl′ , we prevent this from happening: the
element k1 is not in Kl′ .
Counter-examples to the property ‘Z ⊂ Tq Z implies Z is special’ in the case where
S = C × C were constructed by Edixhoven in [10].



7. Choice of a suitable Hecke correspondence

In this section we state a theorem that provides suitable candidates for the elements
m ∈ G(Ql ) to be used in the application of the geometric criterion 6.1. The two
important properties the element m has to have are
1. for any k1 and k2 in Kl , the element k1 mk2 generates an unbounded subgroup,
2. and the degree of Tm is bounded by a uniform power of l.
The notations are as in the previous section. We have the following.

Theorem 7.1. – Let l be a prime number splitting T and m an element of T (Ql ). We

assume that the compact open subgroup K is of the form K = K l · Kl , where K l is
a compact open subgroup of G(Alf ) and Kl is a compact open subgroup of G(Ql )
contained in an Iwahori subgroup Il of G(Ql ) in good position with respect to T . Let
E be the reflex field of the Shimura datum defining V .
Then there exists an element m ∈ T (Ql ) satisfying the following conditions:
(1) Gal(E/E) · V ⊂ V ∩ Tm V .
(2) For every k1 , k2 ∈ Kl the image of k1 mk2 in G(Ql ) generates an unbounded
subgroup of G(Ql ).
(3) [Kl : Kl ∩ mKl m−1 ] < lk where k is a uniform integer.

The proof of the theorem is very technical and is omitted. The interested reader
may consult Section 8 of [14].

8. End of the proof: the induction

We now have all the ingredients at hand to give the final argument. Again the reader
is invited to compare the proof we present here to the Abelian case. We consider a
Shimura datum (G, X) and K a compact open subgroup of G(Af ). Without loss
of generality, Qwe assume that G is semisimple of adjoint type, K is neat and is a
product K = p Kp of compact open subgroups Kp of G(Qp ). We also fix a faithful
representation ρ : G −→ GLn . Fix an integer R > 0.
Let V be a special subvariety defined by (H, XH ) with H = T H der . Let, for sim-
plicity of notations, αV := B i(T ) |KTm /KT | with B as in the Theorem 5.2, let L be the
splitting field of T and let dL be the absolute value of its discriminant. Let S be a
connected component of ShK (G, X). We let F be a number field over which S admits
a canonical model, containing the reflex field E(H, XH ) and such that [F : Q] < R.
Recall the lower bound for the degree of the Galois orbit of V (see Theorem 5.2):
| deg(Gal(F /F ) · V )| > CαV dµL
for some uniform constant C.
The induction is based on the following theorem.



Theorem 8.1. – Let Y be a Hodge generic subvariety of ShK (G, X) defined over F .
We suppose that Y contains a non-strongly special subvariety V defined by a Shimura
datum (H, XH ). We let T be the connected center of H.
Suppose that there exists a prime l such that Kl is a maximal compact open subgroup
of G(Ql ), the torus TQl is split and that KT,l = KT,l . We assume that the prime l
also satisfies the inequality:
r r
l(k+2f )2 deg(Y )2 < CαV dµL
where r = dim(Y ) − dim(V ) > 0.
Then Y contains a special subvariety V ′ containing V properly.
The proof of this theorem is done by a downward induction on r. For details, the
reader is referred to the proof of Theorem 9.2.1 of [14].
Let Y be a subvariety of S containing a Zariski dense sequence (Zn ) of special
subvarieties defined by Shimura subdata (Hn , Xn ). Assume that Y is defined and
irreducible over F . We write αn for αZn and dn for dLn where Ln is the splitting field
of the connected center of Hn . After replacing ShK (G, X) with the smallest special
subvariety containing Y , we assume that Y is Hodge generic.
If αn dn is bounded, then the sequence (Zn ) is equidistributed and Y is special.
Hence we suppose that αn dn is unbounded.
In view of the previous theorem, the André-Oort conjecture will follow at once
from the following:
Theorem 8.2. – Assume the Generalized Riemann Hypothesis for CM fields.
For any n ≫ 0, there exists a prime l satisfying the following:
1. TnQl is split and KT,l = KT,l
r r
2. l(k+2f )2 deg(Z)2 < Cαn dµn .
Proof. – Recall that αn = B i(Tn ) |KTmn /KTn |. One has the following inequality:
αn ≥ (Bc)i(Tn ) i(Tn )!,
where c is a constant independent of (Hn , Xn ).
This is a consequence of the fact that, for a prime p unramified in Ln and such
that KTmn ,p 6= KTn ,p , one has
|KTmn ,p /KTn ,p | ≥ cp.
To prove the existence of a prime l satisfying (1) and (2), we need to show that
the number of primes split in L and satisfying (2) is larger than in := i(Tn ). This is
where the effective Chebotarev theorem comes in.
Suppose that in is unbounded. Then, classical inequalitites (such as the Stirling
formula) imply:

αn > (B ′ in )in ,
where B ′ is uniform.



For x > 0, define πLn (x) to be the number of primes p such that p splits completely
in Ln and p ≤ x. The Effective Chebotarev theorem gives

πLn (x) ≫ x
when x is larger than some absolute constant and (log dn )3 .
C µ 1/(k+2f )2r
By taking x ≫ ( deg(Z) 2r αn dn ) and using the inequality αn > (B ′ in )in ,
one easily concludes that πLn (x) > in when x is large enough. Hence we find a prime
satisfying the conditions of 8.2.
Assume now that in is bounded. Then an easy calculation shows again that
πL (x) > in when x is large enough.

[1] W. L. J. Baily & A. Borel – “Compactification of arithmetic quotients of bounded
symmetric domains”, Ann. of Math. 84 (1966), p. 442–528.
[2] L. Clozel & E. Ullmo – “Équidistribution de sous-variétés spéciales”, Ann. of Math.
161 (2005), p. 1571–1588.
[3] C. Daw – “The André-Oort conjecture via o-minimality”, in O-minimality and dio-
phantine geometry, London Math. Soc. Lecture Note Ser., vol. 421, Cambridge Univ.
Press, Cambridge, 2015, p. 129–158.
[4] , “Degrees of strongly special subvarieties and the André-Oort conjecture”,
J. reine angew. Math. 721 (2016), p. 81–108.
[5] C. Daw & M. Orr – “Heights of pre-special points of Shimura varieties”, Math. Ann.
365 (2016), p. 1305–1357.
[6] C. Daw & A. Yafaev – “An unconditional proof of the André-Oort conjecture for
Hilbert modular surfaces”, Manuscripta Math. 135 (2011), p. 263–271.
[7] P. Deligne – Travaux de Shimura, Séminaire Bourbaki, vol. 1970/1971, exposé no 389,
Lecture Notes in Math., vol. 244, Springer, Berlin, 1971.
[8] M. Demazure & A. Grothendieck (eds.) – Schémas en groupes. III: Structure
des schémas en groupes réductifs, Séminaire de Géométrie Algébrique du Bois Marie
1962/64 (SGA 3), Lecture Notes in Math., vol. 153, Springer, Berlin-New York, 1970.
[9] W. Duke – “Hyperbolic distribution problems and half-integral weight Maass forms”,
Invent. math. 92 (1988), p. 73–90.
[10] B. Edixhoven – “Special points on the product of two modular curves”, Compositio
Math. 114 (1998), p. 315–328.
[11] P. Gille & L. Moret-Bailly – “Actions algébriques de groupes arithmétiques”, in
Torsors, étale homotopy and applications to rational points, London Math. Soc. Lecture
Note Ser., vol. 405, Cambridge Univ. Press, Cambridge, 2013, p. 231–249.
[12] M. Hindry – “Autour d’une conjecture de Serge Lang”, Invent. math. 94 (1988), p. 575–
[13] B. Klingler, E. Ullmo & A. Yafaev – “The hyperbolic Ax-Lindemann-Weierstrass
conjecture”, Publ. Math. IHÉS 123 (2016), p. 333–360.
[14] B. Klingler & A. Yafaev – “The André-Oort conjecture”, Ann. of Math. 180 (2014),
p. 867–925.



[15] J. Pila – “Rational points of definable sets and results of André-Oort-Manin-Mumford

type”, Int. Math. Res. Not. 2009 (2009), p. 2476–2507.
[16] , “O-minimality and the André-Oort conjecture for Cn ”, Ann. of Math. 173
(2011), p. 1779–1840.
[17] J. Pila & J. Tsimerman – “The André-Oort conjecture for the moduli space of Abelian
surfaces”, Annals of Math. 179 (2014), p. 197–228.
[18] N. Ratazzi & E. Ullmo – “Galois + équidistribution = Manin-Mumford”, in Arith-
metic geometry, Clay Math. Proc., vol. 8, Amer. Math. Soc., Providence, RI, 2009,
p. 419–430.
[19] M. Raynaud – “Sous-variétés d’une variété abélienne et points de torsion”, in Arith-
metic and geometry, Vol. I, Progr. Math., vol. 35, Birkhäuser, 1983, p. 327–352.
[20] T. Scanlon – “o-minimality as an approach to the André-Oort conjecture”, this vol-
[21] J-P. Serre – Œuvres. Vol. I, Springer, Berlin, 1986.
[22] J. Tsimerman – “Brauer-Siegel for arithmetic tori and lower bounds for Galois orbits
of special points”, J. Amer. Math. Soc. 25 (2012), p. 1091–1117.
[23] , “A proof of the André-Oort conjecture for A g ”, preprint arXiv:1506.01466.
[24] E. Ullmo – “Manin-Mumford, André-Oort, the equidistribution point of view”, in
Equidistribution in number theory, an introduction, NATO Sci. Ser. II Math. Phys.
Chem., vol. 237, Springer, Dordrecht, 2007, p. 103–138.
[25] , “Autour de la conjecture d’André-Oort”, this volume.
[26] , “Structures spéciales et problème de Zilber-Pink”, this volume.
[27] E. Ullmo & A. Yafaev – “Mumford-Tate and generalised Shafarevich conjectures”,
Ann. Math. Qué. 37 (2013), p. 255–284.
[28] , “Galois orbits and equidistribution of special subvarieties: towards the André-
Oort conjecture”, Ann. of Math. 180 (2014), p. 823–865.
[29] , “Nombre de classes des tores de multiplication complexe et bornes inférieures
pour les orbites galoisiennes de points spéciaux”, Bull. Soc. Math. France 143 (2015),
p. 197–228.
[30] S.-W. Zhang – “Equidistribution of CM-points on quaternion Shimura varieties”, Int.
Math. Res. Not. 2005 (2005), p. 3657–3689.

Andrei Yafaev, University College London Department of Mathematics Gower street WC1E 6BT
London United Kingdom • E-mail : yafaev@math.ucl.ac.uk


Panoramas & Synthèses
52, 2017, p. 111–165



Thomas Scanlon

Abstract. – Employing a proof technique suggested by Zannier and first successfully

implemented by Pila and Zannier to give a reproof of the Manin-Mumford conjecture
on algebraic relations on torsion points of an abelian variety, Pila presented an un-
conditional proof of the André-Oort conjecture when the ambient Shimura variety is
a product of modular curves. In subsequent works, these results have been extended
to some higher dimensional Shimura and mixed Shimura varieties. With these notes
we expose these methods paying special attention to the details of the Pila-Wilkie
counting theorem.
Résumé (O-minimalité comme approche à la conjecture d’André-Oort). – En utilisant une
technique de preuve, suggérée par Zannier et utilisée avec succès par Pila et Zannier,
pour prouver la conjecture de Manin-Mumford sur les relations algébriques sur les
points de torsion d’une variété abélienne, Pila a présenté une preuve inconditionnelle
de la conjecture de André-Oort, lorsque la variété de Shimura ambiante est un produit
de courbes modulaires. Ces résultats ont ensuite été étendus à d’autres variétés de
Shimura et variétés de Shimura mixtes. Nous exposons ici ces méthodes, en accordant
une attention particulière aux détails du théorème de comptage de Pila et Wilkie.

1. Introduction
In the paper [56] Pila gave the first unconditional proof of the André-Oort conjec-
ture for mixed Shimura varieties expressible as products of curves. This fact on its
own is a remarkable development, but the method of proof, coming as it does from the
theory of o-minimality, constitutes a major breakthrough. Zannier had proposed that
a theorem of Pila and Wilkie on counting rational points in definable sets in combina-
tion with suitable estimates on sizes of Galois orbits could be used to prove theorems

2010 Mathematics Subject Classification. – 03C64, 14G35, 14K15.

Key words and phrases. – o-minimality, Pila-Wilkie theorem, abelian varieties, Shimura varieties,
Manin-Mumford conjecture, André-Oort conjecture.

Partially supported by NSF grants FRG DMS-0854998 and DMS-1001550.

© Panoramas et Synthèses 52, SMF 2017


in the vein of the André-Oort conjecture, and, indeed, in joint work with Pila [62]
he implemented this strategy to reprove the Manin-Mumford conjecture. Subsequent
work by many authors [30, 45, 44, 43, 49, 58, 15] has borne out the promise of this
strategy and the pace of the continuing developments suggests that the project has
not been played out.
These notes are based on a pair or lecture series I delivered in May 2011, one in
Luminy to an assembled group of experts on the André-Oort conjecture with the
aim of expositing the applications of the Pila-Wilkie counting theorem to diophantine
geometric problems and then a second lecture series in Lyon to model theory students
participating in a special Maloa (Mathematical Logic and its Applications) semester
with the goal of explaining in detail the counting theorem itself. I have prepared two
other accounts of these theorems [70, 71] to which the reader is referred for gentler
introductions. In this paper, I will follow the proofs of the original papers fairly
closely resisting the temptation to “simplify” those arguments. I do not claim any of
the results explicated in this paper as my own, though, of course, any errors I may
have inadvertently introduced are mine. The principal innovation is to have assembled
in one place the key steps in these proofs.
The subject has progressed during the three years since the bulk of this paper was
written. Most notably, Tsimerman has completed an unconditional proof of the André-
Oort conjecture for A g , the coarse moduli space of principally polarized abelian
varieties of dimension g, using the Pila-Zannier method [78]. The present text retains
the structure and emphases of its 2012 version, but we conclude with a short section
describing the current state of the art.
This paper is organized as follows. In Section 2 we outline the Pila-Zannier strat-
egy. We follow with Section 3 in which we review the basic theory of o-minimality.
In Section 4, the technical heart of this paper, we expose in detail the Pila-Wilkie
counting theorem. Finally, in Section 5 we present some of the details of the proofs
of the diophantine geometric theorems proven with these methods.
Many people have assisted me in writing these notes. I thank in particular Jonathan
Pila and Umberto Zannier for their detailed comments on earlier drafts. I thank
Matthias Aschenbrenner, Philipp Habegger, and Emmanuel Ullmo for enlightening
discussions. I thank the anonymous referees for their close reading and for suggesting
innumerable improvements.

2. Overview of the Pila-Zannier strategy

In this section we shall outline the main steps of the Pila-Zannier strategy for
proving diophantine geometric theorems. Since the surveys [70] and [71] are devoted
exactly to such outlines, we shall be brief here.
We are interested in proving theorems to the effect that if X is a “special” variety (a
Shimura variety, an abelian variety, a moduli space for abelian varieties et cetera) and
Y ⊆ X is an irreducible closed subvariety containing a Zariski dense set of “special”
points (special points in the sense of the theory of Shimura varieties, torsion point,



CM-moduli points, et cetera), then Y is a “special” subvariety (variety of Hodge-

type, group subvariety, submoduli variety, et cetera). In practice, we must specify the
meaning of the term special (as we have suggested parenthetically). The Pila-Zannier
strategy takes advantage of the theory of o-minimality which is essentially a theory
of real geometry. As such, the technique applies only over the complex numbers, but
one could speculate about extensions of the relevant counting theorems to analytic
geometric situations over other local fields. Indeed, Comte, Cluckers and Loeser have
formulated and proved a version of the Pila-Wilkie counting theorem for sets de-
fined using p-adic analytic functions [12]. Subsequently, Chambert-Loir and Loeser
have shown how to use this nonarchimedian counting theorem to prove functional
transcendence results for maps coming from p-adic analytic uniformizations [11].
The first step in the Pila-Zannier strategy is to realize the complex algebraic variety
X(C) analytically as a coset space. That is, we seek some complex homogenous space
X for the action of some (open subgroup of a) real algebraic group G(R) by analytic
automorphisms so that some analytic function π : X → X(C) represents X(C) as
the quotient Γ\X where Γ ≤ G(R) is an arithmetic subgroup. For example, if X is
an abelian variety over C of dimension g, then X(C), being a complex torus, may
be expressed as Cg /Λ for some lattice Λ. In this case, we would take X = Cg and
G = G2g g
a acting via an appropriate real analytic trivialization of C as R
for which
2g 1
Λ is identified with Z . In the case that X = A regarded as the j-line, then we could
X = h := {τ ∈ C : Im(τ ) > 0}
to be the upper half plane, G = PSL2 to be the special linear group acting via
fractional linear transformations, Γ := PSL2 (Z) and π := j : X → A1 (C) to be the
j-function. The reader might object that as the irreducible closed subvarieties of A1
are not particularly complicated, being either points or the full space, the problem
considered here is trivial. Treat instead X = AN regarded as the moduli space of
products of N elliptic curves, X = hN and π : X → AN (C) given by
(τ1 , . . . , τN ) 7→ (j(τ1 ), . . . , j(τN ))

Of course, we need to be somewhat careful about how we choose the analytic

covering π : X → X(C). In particular, we wish to have that the special points in X(C)
come from arithmetically simple points in X. What is meant by arithmetically simple?
We shall ensure that X ⊆ CM is an open subset of some complex affine space. Thus, it
would make sense to ask whether a point in X is rational or algebraic. In practice, we
might like for the special points in X(C) to be the images of the rational points in X,
or possibly just algebraic points in X of some bounded degree. With our example
of X a complex abelian variety, the set of torsion points on X(C) is exactly the
image of Q2g under the analytic covering map. In the case of the j-function giving
a covering of A1 (C) by h, the set of special points, the j-invariants of elliptic curves
with complex multiplication, is the image of the quadratic imaginary numbers. In
the general applications of this method, we shall arrange that the set of preimages of



special points under the covering map be the set of algebraic points in X of degree at
most d over Q for some fixed natural number d.
Once we have found the desired analytic covering map, the problem of describing
the set of special points on the algebraic subvariety Y ⊆ X may be converted to
the problem of calculating the set of algebraic points of degree ≤ d on the analytic
variety Y := π −1 Y . On the face of it, such a move converts a difficult problem to an
intractable one as there is very little in general that one can say about the algebraic
points on an analytic variety and the known theorems about the rational points on
algebraic varieties are amongst the deepest in all of mathematics. To exploit this
translation from special points on an algebraic variety to rational (or algebraic of
bounded degree) points on an analytic variety we use the theory of definability in
o-minimal structures. The covering map π : X → X(C) is almost never definable in a
logically tame structure in any sense, but if we were to restrict π to an appropriate
fundamental domain D ⊆ X then the whole situation is often definable in an o-minimal
expansion of the real numbers.
In the cases we have been considering, o-minimal definability takes on a very con-
crete form. Using real and imaginary parts we identify C with R2 , and hence, CN with
R2N . By a semialgebraic set we mean a subset of R2N defined by a finite boolean com-
bination of conditions of the form f (x1 , . . . , x2n ) ≥ 0 where f is a polynomial with
real coefficients. In the cases we have been considering, the fundamental domain D
may be taken to be semialgebraic. Indeed, when X is a complex abelian variety, then
the natural choice for D would be [0, 1)2g . In the case of the covering of the affine line
by the j-function, the usual fundamental domain,
−1 1
D := {z ∈ C : ≤ Re(z) < and |z| ≥ 1},
2 2
is easily seen to be semialgebraic. We say that a function is restricted analytic if it is
the restriction of a real analytic function on some open set to a compact box. By an
explicitly definable function we mean the restriction to a semialgebraic domain of a
function built as a composition of polynomials, restricted analytic functions, and the
real exponential function. The covering maps we have been considering are explicitly
definable. In the case of the covering of an abelian variety π : Cg → X(C) since π is
globally analytic and the fundamental domain D is contained in a compact box, one
sees that the restriction of π to D is already the restriction of a restricted analytic
function to a semialgebraic set. For the j-function, one sees from the q-expansion of j,
that the restriction of j to D may be realized as the restriction to a semialgebraic set
of the composite of a restricted analytic function with a function built from restricted
analytic functions and the real exponential function.
At this point we may invoke the Pila-Wilkie counting theorem (or one of its refine-
ments) to say something about the distribution of algebraic points on Y e := D ∩ Y =
(π ↾ D) Y (C). The counting theorem says that after accounting for rational points
which might lie on semialgebraic sets, there are subpolynomially many rational points
on a definable set. Let us be a little more precise.



For a rational number b written in lowest terms we define the (multiplicative)
height as follows:
a 0 if a = 0
H( ) :=
b max{|a|, |b|} otherwise.
For an n-tuple x = (x1 , . . . , xn ) ∈ Q we define
H(x) := max{H(xi ) : i ≤ N }.
Given a set X ⊆ Rn and a number t ≥ 1 we define
X(Q, t) := {x ∈ Qn ∩ X : H(x) ≤ t}
N (X, t) := #X(Q, t).
Finally, we define the algebraic part of X, X alg , to be the union of all connected,
positive dimensional semialgebraic subsets of X. The Pila-Wilkie counting theorem
asserts that for any ε > 0 we have N (X \ X alg , t) = O(tε ). Various refinements of
this theorem are known in which, for example, the set X may be allowed to vary in a
family, the exceptional set may be taken to be smaller than the full algebraic part, and
one can count points of some bounded degree over the rationals rather than merely
rational points. We shall delay our discussion of these refinements until Section 4.
Applying the Pila-Wilkie counting theorem (or its refinement for algebraic points
of bounded degree) to our definable set Y, e we see that there are few, meaning sub-
polynomially many, points on Y e which are preimages of special points unless Y e alg is
large. It is possible for the algebraic part to be large. For example, in the case where
X is an abelian variety, if Y ⊆ X is an algebraic subgroup, then Y is a linear sub-
space of Cg . As such, Y e alg = Y
e (as long as dim(Y ) > 0). To continue the argument
one must show that this is essentially the only way for Y e alg to be large. Such re-
sults are formalized as what we call Ax-Lindemann-Weierstraß theorems, since they
generalize the classical theorem of Lindemann and Weierstraß that if α1 , . . . , αn are
Q-linearly independent algebraic numbers, then eα1 , . . . , eαn are algebraically inde-
pendent, via statements in line with Ax’s formal version of Schanuel’s conjecture that
if α1 , . . . , αn ∈ tC[[t]] are C-linearly independent power series with zero constant term,
then the field C(α1 , . . . , αn , exp(α1 ), . . . , exp(αn )) has transcendence degree at least
n + 1 over C.
Finally, one concludes these arguments by playing a lower bound on the size of the
Galois orbit of a special point against the upper bounds coming from the counting
theorem. That is, we find a field of definition k for Y and X, some number ε > 0,
a constant C and some natural number valued measure of complexity of a special
point c(ζ) so that [k(ζ) : k] > Cc(ζ)ε for all special points ζ. For example, in the case
that X is an abelian variety one could measure the complexity of a torsion point by
its order for which such lower bounds on the degree of a torsion point are known.
The trick is to relate the complexity of a special point to the height of a point in D
mapping to it by π. In the case of torsion points, these quantities are nearly identical,



but in general there may be a polynomial distortion. In any case, since every Galois
conjugate (over k) of a special point on Y must also lie on Y , the existence of a Zariski
dense set of special points on Y would imply that there are more rational (or algebraic
of bounded degree) points on Y e than the counting theorem would allow unless the
e is large. From an appropriate Ax-Lindemann-Weierstraß theorem
algebraic part of Y
we then conclude that some special relations hold on Y. e Possibly after passing to a
quotient, we then conclude that Y must be special.
While the argument outlined above contains many lacuna and elides some essential
subtleties, it does accurately reflect the general lines of the o-minimal approach to
the André-Oort problems. We shall return to these arguments supplying some details
in Section 5.

3. O-minimality
O-minimality was isolated by van den Dries [17] as the requisite condition to prove
the basic structural results of semialgebraic geometry and then by Steinhorn and
Pillay (partially in collaboration with Knight) [63, 37, 64] in its logical form. The
reader should consult the book by van den Dries [19] for a fuller account of o-minimal
geometry and the notes for Wilkie’s Bourbaki seminar [86] for a discussion of the range
of geometric theories to which o-minimality applies. In this section, we shall take a
middle route, focusing on a specific o-minimal structure, namely the expansion of the
ordered field of real numbers by restricted analytic functions and the real exponential
function, while recounting some of the general theorems in o-minimality, especially the
cell decomposition theorem, and discussing what it would mean to consider o-minimal
structures on nonstandard models. This last point may be a significant departure from
most expository articles on o-minimality aimed for a general mathematical audience
in that part of the characteristically logical nature of the subject will be revealed.
An o-minimal structure is a totally ordered structure (in the sense of first-order
logic) all of whose definable, with parameters, subsets are finite unions of points and
intervals. The notions of structure in the sense of first-order logic and definability
may very well be somewhat unfamiliar to the reader. Since the idea of definability is
central to the Pila-Zannier strategy, we shall discuss it in depth. On the other hand,
since the general principles of first-order logic and the admittedly stultifying details of
the constructions of terms, formulae, languages, interpretations, et cetera are spelled
out in innumerable textbooks on this subject, we shall content ourselves now with a
short summary specialized to our applications.

3.1. A review of first-order logic. – In specifying a first-order structure one must indi-
cate both a language and an interpretation of this language.

Definition 3.1. – A language L is given by the data of a set C of constant symbols, a

set R of relation symbols, a set F of function symbols and functions n : R → Z+
and n : F → Z+ giving the arity of each relation and function symbol.



Remark 3.2. – We have been intentionally vague in saying that a language is given
by the data listed above. The tuple h C , R , F , ni is sometimes called a signature or
a vocabulary and the language is the set of formulae constructed from the signature.
Such niceties are of little concern to us here, but the reader may encounter these
distinctions in the literature.

Remark 3.3. – We have emphasized that the elements of the sets giving the language
are symbols. Since in our intended applications these symbols will transparently cor-
respond to actual functions and relations, one might reasonably conclude that such a
distinction is merely scholastic, but it is precisely this move in separating syntax from
semantics which grounds mathematical logic. In our applications, we shall deduce
properties of the sets defined via the standard interpretations of the symbols from
results proven about nonstandard interpretations.

Definition 3.4. – Given a language L , an L -structure M consists of a nonempty set

M together with interpretations of each of the symbols from L . That is, for each
constant symbol c ∈ C we have a distinguished element cM ∈ M , for each relation
symbol R ∈ R we are given a set RM = R(M ) ⊆ M n(R) , and for each function
symbol f ∈ F we have an actual function f M : M n(f ) → M .

The structures we shall consider all arise from expansions of the ordered field of
the real numbers.

Example 3.5. – The real numbers as an ordered field, often denoted as R, is the struc-
ture whose underlying universe is the set of real numbers, interprets the single relation
symbol < as the usual ordering relation (so that n(<) = 2), has a constant symbol r
for each r ∈ R with rR = r, has two function symbols + and ·, each of arity 2, inter-
preted by the usual addition and multiplication functions, respectively, and one more
function symbol − with n(−) = 1 to be interpreted as the additive inverse operation.

Example 3.6. – We may regard the ring C (R, R) of continuous real valued functions
on R as an L -structure in the language of Example 3.5 by interpreting the symbols
+, ·, and − in the usual way, each constant r ∈ R as the corresponding constant
function, and < by the partial order f < g ⇐⇒ (∀x ∈ R)f (x) < g(x).

While we have only explicitly presented addition and multiplication as distin-

guished operations in R, there are, of course, other functions which we can build
from these operations. For example, a polynomial function may be explicitly repre-
sented as a composition of the basic functions. In order to maintain the separation of
syntax from semantics, we should say that the polynomial may be expressed as a for-
mal composition of the basic function symbols, variables and distinguished constant
symbols (that is, it is a term) while the function defined by the polynomial is the
interpretation of that term which is an honest composition of functions.
Given an L -structure one may define sets within that structure by evaluating
equalities and the distinguished relations on the functions defined by terms functions.



More precisely, for any L -structure M, sets of the following kind are the basic definable
– Given a pair of terms t and s built from the variables x1 , . . . , xn , the set
(t = s)(M) := {(a1 , . . . , an ) ∈ M n : tM (a) = sM (a)}
is a basic definable set.
– Given a basic relation symbol R of arity m and t1 , . . . , tm terms built from the
variables x1 , . . . , xn , then the set
(R(t1 , . . . , tm ))(M) := {(a1 , . . . , an ) ∈ M n : (tM M
1 (a), . . . , tm (a)) ∈ R(M)}

is a basic definable set.

Remark 3.7. – When we write tM we mean the honest function on M n given by

composing the basic functions as described in the formal presentation of the term t.
The expressions t = s and R(t1 , . . . , tm ) are called atomic formulae. One should
indicate the ambient space with the notation for the definable set defined by a given
formula since one could always allow further dummy variables.

The class of the quantifier-free definable sets is obtained from the basic definable
sets by closing under finite boolean operations. Likewise, the quantifier-free formulae
are obtained from the atomic formulae by closing under finite boolean operations.
To obtain all of the definable sets, we close off the class of definable sets under the
operations of coordinate projections and finite boolean combinations. At the level of
syntax, coordinate projections correspond to existential quantifiers. That is, if the set
X ⊆ M n+1 is defined by the formula φ(x1 , . . . , xn+1 ) and π : M n+1 → M n is the
projection map (x1 , . . . , xn+1 ) 7→ (x1 , . . . , xn ), then the image of X under π is defined
by the formula (∃xn+1 )φ.

Remark 3.8. – What distinguishes first-order logic from other forms of symbolic logic
is that quantification is permitted only over the elements of the structure. That is,
one is not permitted to form a formula using syntax like “for every subset X of the
structure . . . ” or “there is a finite sequence of elements such that . . . ”. Consequently,
many sets which are obviously “definable” in the sense that in a natural mathematical
language one may specify the set through a rigorous definition are not definable sets.
For example, in the structure R the set of rational numbers is not definable.

Remark 3.9. – Our definition of definable set gives the notion of a set definable with-
out parameters. In the basic example we have been considering, namely R, since
every element of the structure is already named by a constant, there is no distinction
between this concept of definability and the more general notion of parametrically
definable sets though we shall encounter situations requiring this extension. Given a
structure M in some language L we may expand M to a structure in a larger language
having a constant symbol for each element of M . A set is parametrically definable if
it is definable in this expanded language. We often drop the word “parametrically”.



Example 3.10. – Returning to the real numbers considered as an ordered field, R, we

see that for any subvariety of affine space, X ⊆ AnR , the set of R-valued points, X(R),
is definable. Indeed, if the ideal of X is generated by the polynomials f1 , . . . , fm ∈
R[x1 , . . . , xn ], then taking f˜i to be a term corresponding to the polynomial fi we have
X(R) = (f˜1 (x) = 0 & · · · & f˜m (x) = 0)(R).

Example 3.11. – More generally, a basic definable set in R is a basic semialgebraic

set, that is a set of the form
{(a1 , . . . , an ) ∈ Rn : g(a1 , . . . , an ) ≥ 0}
for some polynomial g ∈ R[x1 , . . . , xn ]. A general quantifier-free definable set in R is
simply a semialgebraic set. A fundamental theorem of Tarski [76] asserts that every
definable set in R is semialgebraic.

Remark 3.12. – It makes sense to consider formulae with no free variables, also called
sentences. Reading the definition of the interpretation of a formula, we see that if
φ is a formula with no free variables and M is an L -structure, then φ(M ) should be
considered as a subset of M 0 , a singleton, and is thus either empty or all of M 0 . We
say that φ is true in M or that M models φ, written M |= φ, if φ(M ) 6= ∅. For a set
Σ of sentences, we write M |= Σ to mean that for every φ ∈ Σ we have M |= φ.

The compactness theorem is the fundamental theorem of model theory. When

we enter into some detailed arguments, the compactness theorem will be invoked
explicitly to provide nonstandard models and to deduce uniformities from case by
base arguments.

Theorem 3.13. – If L is any first-order language and Σ is a set of L -sentences having

the property that for any finite subset Σ0 ⊆ Σ there is some M0 with M0 |= Σ0 , then
there is some L -structure M such that M |= Σ.

Various proofs of the compactness theorems are available. For example, it follows
from Gödel’s Completeness Theorem (N.B.: not the Incompleteness Theorem) [27].
Algebraists may be familiar with Łoś’s proof using ultraproducts [38].
For the sake of illustration, we show how the compactness theorem may be used
to show that finiteness across a class of models implies boundedness.

Proposition 3.14. – Let T be a theory in some language L , that is, a set of L -sen-
tences, and φ(x; y) an L -formula. Suppose that for every model M of T and every
parameter b from M , the definable set
φ(M; b) := {a ∈ M : M |= φ(a; b)}
is finite. Then there is a natural number N depending only on φ and T so that every
such set has size at most N .



Proof. – Consider an expansion L of the language L by new constant symbols {ci :

i ∈ N} ∪ {b} and the set of L sentences
T ′ := T ∪ {φ(ci , b) : i ∈ N} ∪ {ci 6= cj : i < j}
If there were no bound N as in the statement of the proposition, then each finite
subset of T ′ would have a model as if T0 ⊆ T ′ were finite then it would mention new
constants from some finite set {b} ∪ {ci : i < N } (for some N ) and by hypothesis
there is some M0 |= T with an element b for which φ(M0 , b) has size at least N .
Hence, by the compactness theorem there would be some model M |= T ′ which is, as
an L -structure, a model of T , but as cM
i 6= cj for i 6= j and {ci : i ∈ N} ⊆ φ(M, b),

we see that φ(M, b) is infinite contradicting the hypothesis that every set defined by
an instance of φ is finite.

Remark 3.15. – Of course, if in Proposition 3.14 we assumed only that for some fixed
structure M every definable set of the form φ(M, b) were finite, then we could not
conclude that the cardinality of these sets is bounded. It is essential that the finiteness
of the definable sets of the form φ(M, b) be known for all models of the theory.

We shall also see the compactness theorem used to produce nonstandard models,
that is given an infinite structure M we shall find a different structure N which satisfies
exactly the same sentences.

Definition 3.16. – By the theory of an L -structure M we mean the set

Th(M) := {φ : M |= φ}.
We say that two L -structures M and N are elementarily equivalent, written M ≡ N,
if Th(M) = Th(N).

Example 3.17. – Tarski’s theorem that every definable set in R is semialgebraic holds
in every real closed field, that is, in every ordered field for which one-variable polyno-
mials enjoy the intermediate value property: for each one-variable polynomial P (x),
if a < b and P (a) < 0 < P (b), then there is some c ∈ (a, b) with P (c) = 0. Indeed,
every real closed field is elementarily equivalent to R.

Proposition 3.18. – If M is any infinite L -structure, then there is another structure

N elementarily equivalent to M but of greater cardinality.

Proof. – Let X be a set of cardinality strictly greater than the cardinality of M. Let

L be the expansion of L by new constants {cx : x ∈ X} and consider the theory

T ′ := Th(M) ∪ {cx 6= cy : x 6= y from X}.

As in Proposition 3.14, any finite subset of T ′ may be realized in M by interpreting the
finitely many new constants as distinct elements. Hence, by the compactness theorem
there is a model N |= T ′ which satisfies Th(M) and has cardinality at least that of X
as the elements cN
x are distinct.



We shall end our review of basic model theory here though we shall return to
the compactness theorem with the proof of the Pila-Wilkie counting theorem, Theo-
rem 4.6, in Section 4.

3.2. Basic theory of o-minimality. – Let us recall the notion of o-minimality with a
formal definition.
Definition 3.19. – Let L be some language having a binary relation symbol < and
possibly other distinguished relation, function and constant symbols. We say that
an L -structure R = (R, <, . . .) is o-minimal if <R is a total order on R and every
definable (with parameters) subset of R is a finite union of singletons and intervals.
Remark 3.20. – Since we shall only consider structures in which the interpretation
of < defines a total order, we shall drop the superscript and write < rather than <R
for the total order itself on R.
Remark 3.21. – By an interval in a totally ordered set (R, <) we mean a set of the
form (−∞, a) := {x ∈ R : x < a}, (a, b) := {x ∈ R : a < x < b}, (b, ∞) := {x ∈
R : b < x}, or (−∞, ∞) := R for some elements a and b of R with a < b. It is not
enough to ask that the set be convex. For example, the set {x ∈ Q : 0 < x < π} of
rational points in the real interval (0, π) is not an interval in (Q, <).
Remark 3.22. – One might define a structure (R, <, . . .) to be strongly o-minimal
if for any elementarily equivalent structure (R′ , <, . . .) ≡ (R, <, . . .) the structure
(R′ , <, . . .) is also o-minimal. It is a nontrivial theorem, due to Knight, Pillay and
Steinhorn [37], that if one assumes that the ordering < is dense, then strong o-
minimality is equivalent to o-minimality.
In the direct applications of o-minimality considered in this paper, the o-minimal
structures will be expansions of the ordered field of real numbers. However, somewhat
more general structures, namely elementary extensions of the real numbers, will ap-
pear in the proof of the Pila-Wilkie counting theorem. Thus, while the reader would
correctly apprehend the intended geometric consequences of o-minimality by restrict-
ing attention to real geometry, we cannot impose such a restriction without severely
limiting the scope of the arguments.
Let us consider some examples of o-minimal structures on the real numbers.
Theorem 3.23 (Tarski). – The ordered field of real numbers, R := (R, <, +, ·, −), is
O-minimality had not been defined at the time of Tarski’s work on real geometry,
but Theorem 3.23 is an immediate corollary of his quantifier elimination theorem for
real closed fields: in R every definable set may be defined by a formula without any
quantifiers. In one variable, the basic definable sets have the form {x ∈ R : f (x) = 0}
or {x ∈ R : f (x) > 0} for some polynomial f ∈ R[x]. The zero set of a polynomial
is either all of R if f is the zero polynomial or is finite. By continuity of f and the



completeness of R, sets of the second kind are finite unions of open intervals having
as their endpoints ±∞ and some of the zeros of f .
Theorem 3.24 (Wilkie [84]). – The ordered field of real numbers given together with the
real exponential function
Rexp := (R, <, +, ·, exp)
is o-minimal.
As one might expect, the proof of Theorem 3.24 is substantially more difficult than
that of Theorem 3.23. From examples constructed by Osgood one knows that there
are sets definable in Rexp using existential quantifiers but which cannot be defined
using only quantifier-free formulae [7]. For example, consider the following set.
{(y1 , y2 , y3 ) ∈ R3 : (∃x1 ∈ R)(∃x2 ∈ R) [y1 = x1 & y2 = x1 x2
& y3 = x1 x2 ex2 & x21 + x22 ≤ 1]}.
However, further quantifiers are not necessary. That is, Wilkie established that the
theory of Rexp is model complete: every definable set may be defined by a formula of
the form (∃y1 ) . . . (∃yn )φ where no quantifiers appear in the formula φ.
The proof of Theorem 3.24 passes through a study of Pfaffian functions and is
based in crucial respects on earlier work of Khovanski [32] on so-called few-nomials.
By a Pfaffian chain we mean a finite sequence f1 , . . . , fm of functions fi : R → R so
that for each i there is some polynomial P (t, y1 , . . . , yi ) ∈ R[t, y1 , . . . , yi ] so that the
function fi satisfies the differential equation fi′ (t) = P (t, f1 (t), . . . , fi (t)). A function is
Pfaffian if it belongs to some Pfaffian chain. The differential equation y ′ = y satisfied
by the exponential function expresses it as a Pfaffian function. As we noted in the
previous paragraph, Theorem 3.24 is deep; to do justice to it would lead us too far
A key result used in the proof of Theorem 3.24 is the o-minimality of the theory of
the ordered field of real numbers with the restricted exponential function, that is, of
the structure (R, <, +, ·, exp ↾ [0, 1]). More generally, the theory of the ordered field
of real numbers with all restricted analytic functions is o-minimal.
Definition 3.25. – By a restricted analytic function we mean a function f : [0, 1]n → R
for which there is some open neighborhood U ⊇ [0, 1]n and a real analytic function
fe : U → R with f = fe ↾ [0, 1]n .
Remark 3.26. – One might instead define a restricted analytic function to be any
function on a compact box which extends to a real analytic function in some neigh-
borhood. One could represent any such function as the composite of a restricted
analytic function in the sense of Definition 3.25 with a linear change of variables.
Theorem 3.27 (van den Dries [18] via Gabrielov [22]). – The structure
Ran = (R, <, +, ·, {f }f :[0,1]n →R restricted analytic )
is o-minimal.



Remark 3.28. – Strictly speaking, if f : [0, 1]n → R is restricted analytic, then when
we regard f as an n-ary function symbol, its interpretation in Ran should be a function
whose domain is all of Rn . Since in practice we only care about the interpretation
of f on the box [0, 1]n we are at liberty to define its interpretation outside the box as
we see fit and we shall impose the condition that on arguments outside of the box, f
takes the value 0.

The counterexample to quantifier elimination for Rexp mentioned above also pro-
vides a counterexample to quantifier elimination for Ran . However, as a Euclidean
counterpart to their work on p-adic analytic geometry (from which they deduced some
remarkable theorems on the rationality of some Poincaré series attached to p-adic an-
alytic functions) Denef and van den Dries [16] proved Theorem 3.27 as a consequence
of a quantifier elimination theorem for a variant of Ran given together with a division
operation. Deviating slightly from their formalism in which the universe of the struc-
ture is the interval [0, 1] rather than the full set of real numbers, we would allow one
new binary function D : R2 → R defined by
y if 0 ≤ xy ≤ 1,
D(x, y) :=
0 otherwise.
Clearly, the function D is already definable, but by including it as a basic function
symbol, we allow for more complicated terms. For example, if f (x), g(z1 , . . . , zn ) and
g(z1 ,...,zn )
h(z1 , . . . , zn ) are restricted analytic functions, then the function f ( h(z1 ,...,zn )
) is repre-
sented by a term whereas without the D-function its natural definition would require
a quantifier. In this expanded language, Denef and van den Dries prove quantifier
elimination by interweaving two different steps: using the Weierstraß preparation and
division theorems to reduce questions about the sign of analytic functions to the cor-
responding question about some associated polynomials and then applying Tarski’s
elimination of quantifiers theorem for real closed fields, they show how to eliminate an
existential quantifier from an existential formula in the language of Ran (without D)
at the cost of introducing some applications of D and then they show how to remove
the applications of D at the cost of introducing existential quantifiers. It would seem
that these steps might cancel each other, but the induction is organized so that the
formulae become simpler with each iteration. Once the quantifier elimination theorem
has been established, o-minimality follows from the Weierstraß division theorem.
Combining the structures Ran and Rexp we obtain Ran,exp , the expansion of the
ordered field of real numbers by all restricted analytic functions and the global real
exponential function. By work of van den Dries and Miller [21], this structure, too,
is o-minimal. The o-minimality of Ran,exp admits other proofs. For example, in work
generalizing Wilkie’s on the exponential function, Speissegger showed that the ex-
pansion of any o-minimal structure on the real numbers by Pfaffian functions is still
o-minimal [74]. Inspired by Écalle’s theory of transseries, van den Dries, Macintyre and
Marker [20] constructed nonstandard models of Ran,exp via logarithmic-exponential



Other o-minimal expansions of the field of real numbers exist. For example, in
work of Rolin, Speissegger and Wilkie [68] it is shown that o-minimal structures may
be constructed from certain classes of quasianalytic functions. Moreover, in the same
paper it is shown that there is no maximal o-minimal structure on the real numbers.
Here, a maximal o-minimal structure on R would have been an o-minimal expansion
R of R having the property that for any other o-minimal expansion R of R all of the
definable sets in R (and its cartesian powers) are already definable sets in R . It is
shown in [68] that it is possible to find two functions f : R → R and g : R → R so that
the two structures (R, <, +, ·, f ) and (R, <, +, ·, g) are o-minimal, but the structure
(R, <, +, ·, f, g) is not o-minimal. In particular, there is no o-minimal expansion of R
in which both f and g are definable.
The known applications of o-minimality to diophantine geometric problems use
Ran,exp and to my knowledge there are no natural problems for which the o-minimality
of some of these more exotic structures may be relevant, but nothing rules out the
Simply from the definition of o-minimality, knowing that a given structure is o-
minimal can have striking consequences. For example, under various natural hypothe-
ses, if
B := {a ∈ Rn : |a| ≤ 1}
and f : B → B is a real analytic function with a fixed point at the origin, then there
is a function Φ : B × [1, ∞) → B definable in Ran,exp so that for a ∈ B and n ∈ Z+
one has Φ(a, n) = f ◦n (a). It then follows that for such an f if Y ⊆ B is a real analytic
subvariety and a ∈ B, then either the f -orbit of a is eventually constrained to lie in Y
or it meets Y in only finitely many points since the set {z ∈ [1, ∞) : Φ(a, z) ∈ Y } is
a finite union of points and intervals so that if {n ∈ Z+ : f ◦n (a) ∈ Y } is infinite, it
contains all numbers beyond some point [69].
While the immediate deductions from the definition of o-minimality may be inter-
esting, the real strength of the condition of o-minimality is that from a hypothesis
about the simplicity of the structure of definable subsets of the line one may deduce
strong regularity properties of the definable sets in any dimension.
The fundamental theorem of o-minimality, the cell decomposition theorem, will ap-
pear both explicitly and implicitly throughout our account of the Pila-Wilkie counting
Convention 3.29. – To avoid some technical issues, we shall insist that every o-
minimal structure we consider be an expansion of an ordered field. While there can
be good reasons to drop this hypothesis, as, for example, tropical geometry may be
regarded as the study of definablity in the structure (R, <, +, 0) of the real numbers
considered as an ordered abelian group, some of the basic results in o-minimality
require qualification when stated for weaker structures. Treating our o-minimal
structure (R, <, +, ·, . . .) as a topological space with respect to the order topology,
it makes sense to speak of the continuity of a definable function. Using the field
structure and the usual definition of the derivative as a limit of ratios of partial



differences, one sees that it makes sense to speak of the derivative of a definable

Before we delve into the details of the cell decomposition theorem, let us observe
a very easy, but powerful, result about families of higher dimensional definable sets
in an o-minimal field: the existence of definable choice, or Skolem, functions.

Proposition 3.30. – If (R, <, +, ·, −, . . .) is an o-minimal expansion of a field and Y ⊆

Rn+m is a definable set regarded as a definable family of definable subsets of Rm
parametrized by Rn via
Yb := {a ∈ Rm : ha, bi ∈ Y },
then there is a definable function f : Rn → Rm so that for each b ∈ Rn if Yb 6= ∅,
then f (b) ∈ Yb . (Such a function is called a Skolem function for Y .)

Let us illustrate arguments in o-minimality by giving a complete (if very easy)

proof of Proposition 3.30.

Proof. – We work by induction on m with the case of m = 0 being trivial. For m = 1,

we break into cases. If Yb = R or Yb = ∅, then we define f (b) := 0. Otherwise, by
o-minimality ∂Yb , the boundary of Yb , is a nonempty finite set and thus has a least
element a which is clearly definable from b and Y . If a ∈ Yb , then we define f (b) := a.
If (−∞, a) ⊆ Yb but a ∈ / Yb , then define f (b) := a − 1, while if Yb = (a, ∞), define
f (b) := a + 1. Finally, by o-minimality, if none of the above conditions holds, then
for c the second point of ∂Yb , (a, c) ⊆ Yb and we may define f (b) := 12 (a + c). For the
inductive step from m to m + 1, consider first the definable set Z ⊆ Rn+m defined by
Z := {c ∈ Rn+m : (∃y)hc, yi ∈ Y }.
By induction, there is a Skolem function g : Rn → Rm for Z. Regard now Y as a
family of subsets of R parametrized by Rn+m . From the case of m = 1 we obtain
a Skolem function h : Rn+m → R for Y (so regarded). Define f : Rn → Rm+1
as f (b) := hg(b), h(b, g(b))i.

Let us define what is meant by a cell.

Definition 3.31. – Let (R, <, +, ·, . . .) be an o-minimal expansion of an ordered field.

We define the class of cells in Rn by recursion on n.
– The singleton R0 is a cell in R0 .
– If X ⊆ Rn is a cell and f : X → R is a definable, continuous function, then

Γ(f )X := {(x, y) ∈ Rn+1 : f (x) = y}

which is the graph of f , is a cell in Rn+1 .



– If X ⊆ Rn is a cell, f : X → R and g : X → R are definable, continuous

functions on X for which f (x) < g(x) for all x ∈ X, then
(f, g)X := {(x, y) ∈ Rn+1 : f (x) < y < g(x)}
is a cell.
– If X ⊆ Rn is a cell and f : X → R is a definable, continuous function, then the
infinite intervals (−∞, f )X , (f, ∞)X , and (−∞, ∞)X = X × R are all cells.

With Definition 3.31 in place, we may state the cell decomposition theorem.

Theorem 3.32. – Let (R, <, +, ·, −, . . .) be an o-minimal expansion of an ordered field

and Y1 , . . . , Ym be a finite sequence of definable subsets of Rn for some n ∈ N. Then
there is a cell decomposition of Rn subjacent to Y1 , . . . , Ym . That is, there is a finite
set C of cells in Rn so that each of the sets Yi is the disjoint union of those cells in C
which have nonempty intersection with Yi .

Remark 3.33. – Theorem 3.32 admits various refinements. For example, if the se-
quence of sets Y1 , . . . , Ym varies in a definable family, then the cell decompositions
may also be chosen uniformly from some definable family. In the course of the proof
of Theorem 3.32 one shows that every definable function is almost everywhere differ-
entiable. It follows that in Theorem 3.32 for any given degree k of smoothness, one
may choose the definable functions involved in the definition of the cells to be C k .
It is not true in all generality that the functions may be taken to be C ∞ . However,
each of the structures we have discussed, R, Rexp , Ran and Ran,exp , has analytic cell
decomposition by which we mean that the functions used to define the cells may be
taken to be real analytic. The key step in proving analytic cell decomposition for these
structures is to prove that every definable function f : R → R is analytic at all but
finitely many points and that, moreover, if f varies in a definable family, then the
number of points at which it is not analytic may be bounded uniformly across the

One proves Theorem 3.32 by induction on n. The nominal base case of n = 0 is

trivial, while the true base case of n = 1 follows immediately from the definition of
o-minimality. However, to carry out the induction one must interweave the proof of
cell decomposition with a second theorem on the continuity of definable function for
which the one variable case is the most difficult step.

Theorem 3.34. – Let (R, <, +, ·, −, . . .) be an o-minimal expansion of an ordered field

and f : Rn → R a definable function. Then there is a cell decomposition of the domain
so that the restriction of f to each cell is continuous. In fact, for any given k ∈ N one
may find a cell decomposition of the domain so that the restriction of f to each cell is
k-times continuously differentiable. If n = 1, after removing finitely many points, the
domain may be decomposed into finitely many open intervals on which f is continuous
and either strictly monotone or constant.



As we noted above, the most difficult part of the proof of Theorem 3.34 is to es-
tablish the piecewise monotonicity and continuity of univariate definable functions.
One argues by noting that various conditions, for example, continuity or f , are de-
finable so that if the lemma were false, then by o-minimality there would be open
intervals on which the undesirable property, e.g., discontinuity, obtains. Of course, it
is possible for a function to be everywhere discontinuous on an interval, but through
further considerations of definability one shows that such a condition is impossible
for a function definable in an o-minimal structure. Piecewise continuity (or even suf-
ficient smoothness) in dimension n > 1 follows from a fairly routine application of
cell decomposition in dimension n (which one must prove from Theorem 3.34 and
Theorem 3.32 in dimension < n and the monotonicity theorem).
Let us consider the inductive step from dimension n to n + 1 for Theorem 3.32. For
the sake of illustration, let us work with a single definable set Y ⊆ Rn+1 . We may
regard as Y as a family of definable subsets of R indexed by Rn . That is, for b ∈ Rn
Yb := {a ∈ R : hb, ai ∈ Y }.
By o-minimality, the boundary of each set Yb , ∂Yb , is finite. Thus, we have (partially
defined) definable functions fi : Rn → R (for i ∈ Z+ ) given by
b 7→ the ith element of ∂Yb
and g : Rn → R given by b 7→ max ∂Yb . From the dimension n case of Theorem 3.34
we know that g and the fi ’s are piecewise continuous. The key to this step of the
proof is to show that there is a finite bound on the cardinality of ∂Yb independent
of b. This is achieved by showing that for almost every b (meaning, outside the union
of finitely many lower dimensional cells) there is a neighborhood of b over which Y is
the disjoint union of the graphs of finitely many continuous functions. As in the proof
of piecewise continuity, one argues that if this result were false, then there would be
an open ball U in Rn so that this property would fail for every b ∈ U . With some
work, one then derives a contradiction.
It is hard to overstate the importance of the cell decomposition theorem, especially
for studying the geometry of sets definable in o-minimal structures. For example, it
follows that if (R, <, +, ×, −, . . .) is an o-minimal expansion of the ordered field of
real numbers, Y ⊆ Rn+m is a definable subset of Rn+m regarded as a definable family
of definable subsets of Rn via
Yb := {a ∈ Rn : ha, bi ∈ Y }
then there are only finitely many homemorphism types represented in this family and
for each such Yb the singular homology groups, for instance, are all finitely generated.
(Why? Cell decompose Rn+m subjacent to Y . This cell decomposition induces uni-
form cell decompositions of the fibers and one can read off the homeomorphism type
and algebraic topological invariants from a combinatorial description of the cell de-
composition.) Working in Rexp one recovers, qualitatively, a theorem of Khovanski on
bounding the number of connected components of systems of solutions of fewnomials,



that is systems of equations in a fixed number variables which range over R+ having
a fixed number of monomials but for which the coefficients and exponents are allowed
to vary.
We may deduce a simple topological characterization of finite definable sets in any
number of variables.

Proposition 3.1. – Let (R, <, +, ·, 0, 1, . . .) be an o-minimal structure and n ∈ Z+ a

natural number. Then a definable set X ⊆ Rn is finite if and only if X is discrete.

Proof. – By the cell decomposition Theorem 3.32, X may be expressed as a finite

union of cells. Clearly, X is finite if and only if each of those cells is finite and X is
discrete if and only if each of the cells is discrete. Arguing by induction on n, one sees
that if C ⊆ Rn is a cell, then it is finite if and only if it is a singelton if and only
if it is discrete. Indeed, for n = 1, a cell is either a singleton or an interval and this
claim is obvious in either case. For n + 1, if C = (f, g)D for some cell D ⊆ Rn and
continuous definable functions f : D → R and g : D → R with f < g on D, then C is
infinite and non-discrete. On the other hand, if C = Γ(f )D for some cell D ⊆ Rn and
continuous definable function f : D → R, then C is homeomorphic to D and is thus
by induction is finite if and only if it is discrete.

Proposition 3.1 has the curious consequence that finiteness is definable for definable
sets in o-minimal structures. More precisely, we have the following corollary.

Corollary 3.35. – Let T be an o-minimal theory extending the theory of real closed
fields in some language L = L (<, +, ·, −, 0, 1, . . .) and φ(x; y) be an L -formula in
the variables x = (x1 , . . . , xm ) and y = (y1 , . . . , yn ) for some natural numbers m and
n. Then there is a formula ϑ(y) so that in any model R |= T letting X = φ(M ) ⊆
M m × M n be the set defined by φ, the set F := {b ∈ Rn : Xb is finite } is defined
by ϑ.

Proof. – By Proposition 3.1, F = {b ∈ Rn : Xb is discrete }. We check that the

condition of being discrete relative to the topology induced by the product topology
of the order topology on the line is definable. Indeed, if X = ϕ(R) where ϕ(x; y) is
the formula defining X and x = (x1 , . . . , xm ) is a tuple of variables ranging over Rm
while y ranges over Rn , then F is defined by
ϑ(y) := (∀x1 , . . . , xm )[ϕ(x; y) →
(∃ε > 0)(∀z1 , . . . , zn )([ϕ(z; y) & |zi − wi | < ε] → z = x)].

Combining Corollary 3.35 with Proposition 3.14, we deduce that in any o-minimal
structure, if one has a uniformly definable family of finite sets, then there is a uniform
bound on the size of the sets in that family.
Let us isolate a specific consequence of the cell decomposition theorem required
in the sequel: for those o-minimal structures admitting analytic cell decomposition,



every definable set may be covered, up to finitely many points, by the images of
nonconstant, definable, real analytic functions on (−1, 1).

Lemma 3.36. – If X ⊆ Rn is a set definable in an o-minimal expansion of the ordered

field of real numbers admitting analytic cell decomposition, then for all but finitely
many points a ∈ X there is a nonconstant, definable, real analytic map γ : (−1, 1) →
X with a = γ(0).

Proof. – We work by induction on n. Of course, if n = 0, then the result is trivially

true. Analytically cell decompose X. We will show now that for each cell C in this
decomposition all but finitely many points are contained in some definable real an-
alytic curve entirely contained in C. If dim(C) = 0, then C itself is a singleton and
the result is trivial. Otherwise, C is the graph of a definable, real analytic function
f : C ′ → R where C ′ ⊆ Rn−1 is a cell of positive dimension or C = (f, g)C ′ where
C ′ ⊆ Rn−1 is a cell, f and g are real analytic definable functions with domain C ′
for which f (x) < g(x) for all x ∈ C ′ . In the first case, the images of the definable,
nonconstant, real analytic curves cover all but finitely many points in C ′ . The curves
of the form t 7→ (γ(t), f (γ(t))) where γ : (−1, 1) → C ′ is nonconstant, definable and
real analytic will then cover all but finitely many points in C. In the latter case, every
points in C is contained in a vertical line segment, which is clearly the image of a
nonconstant linear function.

Remark 3.37. – We shall use Lemma 3.36 only when X is semialgebraic, in which case
we may take the real analytic curves γ : (−1, 1) → X to be semialgebraic.

4. Pila-Wilkie counting theorem

In this section, we shall discuss the Pila-Wilkie counting theorem in some detail
breaking up the discussion into parts. We begin with a general presentation of the
theorem and an outline of its proof. We then embark on a more detailed account of
the parametrization theorem whereby it is shown that every bounded definable set
may be covered by the images of a small number of balls under maps with small
derivatives. We then discuss some results in diophantine approximation to the effect
that the rational points on sets admitting such parametrizations are contained in a
small number of hypersurfaces. Finally, we explain how to combine these results to
deduce the counting theorem and some of its refinements.
Our proof sketch follows the methods from [61] rather closely, especially with re-
gards to the parametrization theorem. The diophantine estimates required for this
theorem appear in a sequence of papers beginning with a paper of Bombieri and
Pila [8] and continuing in works of Pila [51, 52, 53]. A precursor to the general count-
ing theorem for rational points in definable sets appears in the work of Wilkie [85] on
diophantine properties of definable sets.



4.1. An overview of the counting theorem. – Let us begin by recalling what we mean
by counting rational points. To do so we first recall the notion of the height of a
rational number and then extend the height function to finite tuples.

Definition 4.1. – We define the multiplicative height of a rational number by

H(0) := 0 and H( ab ) := max{|a|, |b|} when a and b are coprime integers. For a tuple
x = (x1 , . . . , xn ) ∈ Qn we define H(x) := max{H(xi ) : 1 ≤ i ≤ n}.

Definition 4.2. – Let X ⊆ Rn be any set and t ∈ R+ a positive real number. We define
X(Q, t) := {x ∈ X ∩ Qn : H(x) ≤ t}. Note that X(Q, t) is always a finite set. We
define the counting function associated to X by N (X, t) := #X(Q, t).

The Pila-Wilkie counting theorem almost says that if X ⊆ Rn is definable in

some o-minimal expansion of the real field, then for any ε > 0 there is a constant
C = C(X, ε) so that N (X, t) ≤ Ctε for t ≫ 0. Of course, such an assertion is
plainly false as, for example, the whole space Rn is definable and N (Rn , t) grows
like a polynomial of degree n in t. There could be subtler reasons for X to contain
many rational points. For example, it may happen that X contains a relatively open
subset U of some semialgebraic set Y of dimension m > 1. If the semialgebraic
set Y admits a parametrization by rational functions defined over Q, then N (U, t)
will grow like a polynomial of degree k in t. More generally, it might happen that
Y contains many rational points for reasons unrelated to rational parametrizations
(though Lang’s conjectures predict that the presence of many rational points on Y
should be explained by the presence of an algebraic group. [See [39]]) We obtain the
counting theorem once we omit all semialgebraic subsets from X.

Definition 4.3. – We say that the set Y ⊆ Rn is semi-algebraic if it is definable (with

parameters) in the structure R = (R, <, +, ×) of the real numbers considered as an
ordered field.

Definition 4.4. – Given a set X ⊆ Rn we define the algebraic part of X, written X alg ,
to be the union of all infinite, connected semialgebraic subsets Y ⊆ X of X. The
transcendental part of X is X tr := X \ X alg .

If X is a connected, infinite semialgebraic set, then obviously X = X alg . There

are other sets which are equal to their algebraic parts. For example, suppose that
Z ⊆ Rn is any definable set and X := Z × R ⊆ Rn+1 , then X = X alg . In a different
direction, if Y is an infinite, connected semialgebraic set and X ⊆ Y is a relatively
open subset of Y , then X = X alg . Sets of this last kind play an important role in a
refinement of the counting theorem, as we shall see at the end of Section 4.5.

Remark 4.5. – It need not be the case that the algebraic part of a definable set is
itself definable. For example the following set is definable in Rexp .
X := {hx, y, zi ∈ R3 : x > 0 & xy = z}.



However, its algebraic part consists of those triples hx, y, zi for which y is rational.
Indeed, for each rational number r, the curve
{hx, r, zi : xr = z}
is clearly semialgebraic, infinite and connected. To see that every point in X alg is
contained in such a curve, one should invoke a functional version of the Gelfond-
Schneider theorem.

With our definitions in place, we may state the counting theorem.

Theorem 4.6 (Pila, Wilkie). – Let X ⊆ Rn be definable in some o-minimal expansion

of the real field and let ε > 0 be a positive real number. Then there exists a constant
C = C(X, ε) > 0 so that for t ≥ 1 we have N (X tr , t) ≤ Ctε .

The proof of Theorem 4.6 passes through two main steps.

First, we prove a general theorem about parametrizations of definable sets in o-
minimal expansions of real closed fields.

Definition 4.7. – Let k ∈ Z+ be a positive integer and let X ⊆ Rn be a definable set.

We say that the definable function φ : (0, 1)m → X is a strong partial k-parametriza-
tion of X if m = dim(X), φ ∈ C k and |φ(α) (x)| ≤ 1 for all x ∈ (0, 1)m and multi-indices
α with |α| ≤ k. A strong k-parametrization of X is a finite set S of strong partial
k-parametrizations of X for which X = φ∈S φ(0, 1)m .

Theorem 4.8. – For every k ∈ Z+ every definable set X ⊆ (0, 1)n admits a strong

Remark 4.9. – Theorem 4.8 is inspired by similar results of Yomdin [89, 88] (extended
by Gromov [28]) about parametrizations in real algebraic geometry. Strictly speaking,
the Gromov-Yomdin theorems are not applicable since we will remove the algebraic
part of a definable set before counting the rational points, but as with many arguments
in o-minimality, the proof methods in the semialgebraic case extend to the general
o-minimal setting.

On the face of it, such a result for definable subsets of Rn is an easy consequence
of the cell decomposition theorem. Indeed, since by the cell decomposition theorem
we may express X as a finite union of cells, it suffices to consider the case that X is
itself a cell defined by C k definable functions. From the description of cells, it is easy
to see how to express such a bounded cell as the image of a ball under a function with
bounded derivatives. Decomposing the domain into finitely many pieces and making
a change of variables, we may arrange that the bound for these derivatives is one.
However, in Section 4.3 we shall establish a version of this parametrization theo-
rem for every o-minimal structure. We then deduce from the compactness theorem
a uniform version which has nontrivial content even when we restrict to o-minimal
expansions of the real numbers.



To achieve the counting theorem, we prove a general result about rational points
on sets parametrized by functions with small derivatives.

Theorem 4.10. – Given m < n, and d ∈ Z+ there is a positive integer k and positive
constants ε = ε(m, n, d) and C = C(m, n, d) so that if φ : (0, 1)m → Rn is a C k
function with image X satisfying |φ(α) (x)| ≤ 1 for all multi-indices α with |α| ≤ k,
then for any t ≥ 1 the set X(Q, t) is contained in the union of at most Ctε (not
necessarily irreducible) hypersurfaces of degree d. Moreover, ε(m, n, d) → 0 as d → ∞.

On its own, Theorem 4.10 has nothing to do with o-minimal structures. However,
we shall obtain Theorem 4.6 by applying Theorem 4.10 to the functions parametrizing
the definable set X provided by Theorem 4.8.

4.2. Reductions in the parametrization theorem. – Let us now establish some basic
reductions and then explain how Theorem 4.6 follows from Theorems 4.8 and 4.10.
As we noted above, if we knew Theorem 4.8 only for subsets of Rn , then the result
would be of very little value, but because it will be proven for definable sets in any
o-minimal field, a uniform version follows. Let us prove now this formal implication.
In the following proposition, and, indeed, throughout the rest of this section, we
work in a general o-minimal structure (R, <, +, ·, −, 0, 1, . . .) expanding a real closed
field. In particular, the underlying real closed field R need not be isomorphic to R.

Proposition 4.11. – Theorem 4.8 implies that if {Xb }b∈B is a definable family of de-
finable subsets of (0, 1)n and k ∈ Z+ then there are finitely many definable families of
definable functions
{φi,b : (0, 1)ℓi → (0, 1)n }b∈B
so that for each b ∈ B for some choice of I, {φi,b }i∈I is a strong k-parametrization
of Xb .

Proof. – We shall prove an ostensibly weaker result: there is some N ∈ Z+ and

N families {φi,c }c∈Ci of definable functions so that for any b ∈ B there is some
I ⊆ {1, . . . , N } and some ci ∈ Ci so that {φi,ci }i∈I is a strong k-parametrization
of Xb .
We deduce the full result from this weaker version from the existence of Skolem
functions, Proposition 3.30. Indeed, for a given b ∈ B and I ⊆ {1, . . . , N } the condition
on (c1 , . . . , cN ) ∈ C1 × · · · × CN that {φi,ci }i∈I is a strong k-parametrization of Xb is
definable. Hence, there is a definable function ρI = (ρI,1 , . . . , ρI,N ) so that for any
b ∈ B if one can find c1 , . . . , cN so that {φi,ci }i∈I is a strong k-parametrization of Xb ,
then {φi,ρI,i (b) }i∈I is a strong k-parametrization of Xb . Define ψhi,Ii,b := φi,ρI,i (b) .
Then the conclusion of the proposition holds for {ψhi,Ii,b }b∈B .
Returning to our compactness argument, suppose that the weak version of unifor-
mity fails. Consider the following set Σ of sentences in the expanded language with a
constant symbol b for an element of B.
– Th(R) — the theory of R, every formal first-order sentence true in R



– b∈B
– for each finite sequence of formulae ϑj (x1 , . . . , xℓj , y1 , . . . , ym ; z1 , . . . , zsj ) (with
j ≤ N ) the assertion (∀c1,1 ) · · · (∀c1,s1 ) · · · (∀cN,1 ) · · · (∀cN,sN ) the sets defined
by ϑ1 (x, y; c1 ), . . . , ϑN (x, y; cN ) do not give a strong k-parametrization of b.

Of course, the expressions in the last item for Σ are not explicitly presented as
formal sentences. However, it is a routine matter to formalize such conditions as that
a given formula defines the graph of a function, that the derivatives of that function
up to some given finite order are bounded by 1 and that Xb is the union of the images
of these functions.
Let us check that Σ is satisfiable.
Given any finite subset of Σ we would have to consider only finitely may formulae
of the form ϑ(x1 , . . . , xℓ , y1 , . . . , yn , z1 , . . . , zs ).
Let us note that given ϑ(x1 , . . . , xℓ , y1 , . . . , yn , z1 , . . . , zs ) from the family of defin-
able sets {Θb }b∈Rs , where Θc = {hx, yi ∈ Rℓ+n : R |= ϑ(x, y, c)} we may define the
C := {c ∈ Rs : Θc is the graph of a function with domain (0, 1)ℓ }.

By our hypothesis, there is some b ∈ B(R) for which no subcollection of the

functions possibly defined by these finitely many ϑ give a strong k-parametrization
of Xb . Therefore, Σ is consistent and we may find some elementary extension R∗ of R
and a point b ∈ B(R∗ ) satisfying Σ.
The structure R∗ is still o-minimal (though it is almost certainly non-archimedian).
Hence, by Theorem 4.8 the set Xb admits a strong k-parametrization. For each de-
finable function in R∗ there is some formula ϑ(x, y, z) (here the variables may be
tuples) and a choice of a parameter c from R∗ for which ϑ(x, y; c) defines the graph
the function. However, since b satisfies Σ one cannot find a finite list of formulae for
which by specializing parameters in R∗ one obtains a strong k-parametrization of Xb .
With this contradiction, we conclude the proof.

As a simpler reduction, we allow ourselves to replace the condition in the defini-

tion of a strong k-parametrization that the derivatives are bounded by one with the
condition that they are merely bounded.

Definition 4.12. – We say that a set X ⊆ Rn is strongly bounded if there is a positive

integer N ∈ Z+ so that X ⊆ [−N, N ]n . We say that a function is strongly bounded if
its graph is strongly bounded.

Remark 4.13. – If R ⊆ R, then for X ⊆ R there is no distinction between X being

bounded (meaning that there is some a ∈ R with X ⊆ [−a, a]) and X being strongly
bounded. The difference becomes apparent only for non-archimedian models.



Definition 4.14. – Let X ⊆ Rn be a definable set with dim(X) = ℓ. For a given

positive integer k ∈ Z+ we say that the partial parametrization φ : (0, 1)ℓ → X is
a partial k-parametrization if φ is C k and for each multi-index α ∈ Nℓ with |α| ≤ k
the map φ(α) is strongly bounded. A k-parametrization of X is a finite set of partial
k-parameterizations of X the union of whose images covers X.
Arguing as above when we noted that through appropriate changes of variables
that every bounded definable set in Rn admits a strong k-parametrization, we see
that to prove the existence of strong k-parametrizations, it suffices to prove that
k-parametrizations exists.
Proposition 4.15. – A definable set X ⊆ Rn admits a strong k-parametrization if and
only if it admits a k-parametrization.
Remark 4.16. – Proposition 4.15 will permit us some flexibility in our proof of The-
orem 4.8. Ultimately, it is essential that we work with strong k-parametrizations as
the condition that a finite sequence of functions gives a strong k-parametrization is
definable in families, but the condition that it gives k-parametrization is not.
Let us now outline the key steps in the proof Theorem 4.8. In order to carry
out an inductive argument, we simultaneously prove a theorem about the regularity
of definable functions with an especially strong form of the regularity theorem for
functions of a single variable. Recall that in the case of the cell decomposition theorem,
the analogous regularity theorem took the form of the theorems that every unary
definable function is piecewise monotone and in general that every definable function
is piecewise continuous where the pieces of the domain are cells. For Theorem 4.8, the
regularity theorem concerns reparameterizations of definable functions.
Definition 4.17. – Let X ⊆ Rm be a definable set, Φ : X → Rn a definable function
and S a k-parametrization of X. We say that S is a k-reparametrization of Φ if for
each φ ∈ S the function Φ ◦ φ is C k and for each multi-index α with |α| ≤ k the
function (Φ ◦ φ)(α) is strongly bounded.
Remark 4.18. – The definition of a k-reparametrization of Φ is almost equivalent to
asking that {Φ ◦ φ : φ ∈ S} be a k-parametrization of the image of X under Φ. The
difference appears when Φ collapses dimensions in the sense that the image of X
under Φ has dimension strictly less than that of X.
The reparametrization theorem takes the following form.
Theorem 4.19. – For every k ∈ Z+ every strongly bounded definable function admits
a k-reparametrization.
As we indicated above, the proof of Theorem 4.8 is organized as an induction
with which we interweave a proof of Theorem 4.19 starting with a particularly strong
form of Theorem 4.19 in dimension one. Let us outline the structure of the proof.
For n, m, k ≥ 1 consider the following assertions.



B(k): If F : (0, 1) → M is a definable function, then there is a k-reparametrization

of F so that for each φ in the reparametrization either φ or F ◦φ is a polynomial.
R(m,n,k): Every strongly bounded function F : (0, 1)n → M m admits a k-
P(n,k): Every strongly bounded definable set X ⊆ M n admits a k-parametrization.
Note that B(k) is a refined form of R(1,1,k) and that Theorem 4.8 is the assertion
that for every n and k the condition P(n,k) holds while Theorem 4.19 is the assertion
that for every n, m and k the condition R(n,m,k) holds.
One begins with the observation that P(1,k) is a trivial consequence of the defini-
tions. One then proves B(k) by induction on k (thereby establishing R(1,1,k) for all
k). For the base case of B(1) one considers a simple linear change of variables. The
inductive case uses a trick to improve the number of derivatives which are strongly
bounded through a quadratic change of variables. Through an induction on n one
shows that to prove R(m,n,k) it suffices to prove R(1,n,k). One then completes the
core of the inductive argument by showing (∀k)P (n, k) → (∀k)R(n + 1, 1, k) and
(∀k, n)R(m, n, k) → (∀k)P (n + 1, k).

4.3. The parametrization theorem in more detail. – Let us now spell out some of the
details of the proof of Theorem 4.8.
We wish to establish B(k) for all k and we do so in steps. The key to bootstrapping
the order of smoothness is a very elementary lemma about precomposing with the
squaring function. While I shall omit many of the technical details from the proofs of
various lemmata required for the proof of Theorem 4.8, since the proof of this lemma
is so clean I cannot resist repeating it.
In the sequel, we shall say that a function f of one variable is weakly increasing if
x ≤ y ⇒ f (x) ≤ f (y) while f is weakly decreasing if x ≤ y ⇒ f (x) ≥ f (y).

Lemma 4.20. – Let f : (0, 1) → M be a definable function with f ∈ C k . Suppose

that for each j < k the function f (j) is strongly bounded and that the function x 7→
|f (k) (x)| is weakly decreasing. Define g : (0, 1) → M by g(x) := f (x2 ). Then g (j) is
strongly bounded for all j ≤ k.

Proof. – Using the chain rule, by induction on j we compute

g (j) = ρi,j (x)f (i) (x2 )

where each ρi,j (x) ∈ Z[x] is a polynomial with integer coefficients and ρj,j = 2j xj .
Clearly, each ρi,j is strongly bounded on (0, 1) and by hypothesis each f (i) is strongly
bounded with the possible exception of f (k) . The class of strongly bounded func-
tions forms a ring. Hence, to finish the proof of this lemma, we need only show that
2k xk f (k) (x2 ) is strongly bounded.
Take c ∈ Z+ so that |f (k−1) (x)| < c for all x ∈ (0, 1). I claim that |f (k) (x)| ≤ 4c/x
for all x ∈ (0, 1). Assume for the moment that this claim is false. Let x∗ ∈ (0, 1) satisfy



|f (k) (x∗ )| > 4c/x∗ . By the mean value theorem there would be a point ξ ∈ [ x2 , x∗ ]
so that f (k−1) (x∗ ) − f (k−1) (x∗ /2) = f (k) (ξ) · (x∗ − x∗ /2). We have assumed that
|f (k) | is weakly decreasing. Thus, |f (k) (ξ)| ≥ |f (k) (x∗ )| > 4c/x∗ . Combining these
observations we see:
2c ≥ |f (k−1) (x∗ ) − f (k−1) (x∗ /2)|
> (4c/x∗ )|x∗ − x∗ /2|
= 2c.
This contradiction establishes the claim. Hence,
|2k xk f (k) (x2 )| ≤ 2k xk 4c/x ≤ 2k+2 cxk−1 ≤ 2k+1 c
for x ∈ (0, 1).

Using Lemma 4.20 one proves B(k), that every strongly bounded one variable
function admits a k-reparametrization either by polynomials or for which the
reparametrized function is a polynomial.

Lemma 4.21. – Let k ∈ Z+ and f : (0, 1) → M be a definable strongly bounded func-

tion. Then f has a k-reparametrization by functions φ : (0, 1) → (0, 1) for which
either φ or f ◦ φ is a polynomial with strongly bounded coefficients.

The proof of Lemma 4.21 is also elementary, but requires more bookkeeping than
does Lemma 4.20. Allow me simply to indicate the main ideas. One works by induction
on k with the case of k = 1 following easily from the cell decomposition and mono-
tonicity theorems: we decompose (0, 1) into finitely many intervals (a, b) on which f is
strictly monotone (or constant) and |f ′ (x)| ≤ 1 or |f ′ (x)| > 1. If |f ′ (x)| ≤ 1 on (a, b),
then φ(x) := a + (b − a)x parametrizes (a, b) and |(f ◦ φ)′ (x)| < 1. If |f ′ (x)| > 1, then
we see that o-minimality together with boundedness shows that c := limx→a+ f (x)
and d := limx→b− f (x) exist. If we define φ(x) := f −1 (c + (d − c)x), then |(f ◦ φ)′ | < 1.
In the inductive case, we use the inductive hypothesis together with the cell decompo-
sition and monotonicity theorems to arrange that the composites of f with the various
k-reparametrization functions have monotone (k + 1)st derivatives on each interval in
the decomposition. Reversing the parametrization of the intervals if need be, we may
assume that Lemma 4.20 applies and thereby obtain a (k + 1)-parametrization by
precomposing with the squaring function.
With B(k) established for all k, namely that if F : (0, 1) → M is a definable func-
tion, then there is a k-reparametrization of F so that for each φ in the reparametriza-
tion either φ or F ◦ φ is a polynomial, we have the base case for Theorem 4.19. On
the other hand, the base case for Theorem 4.8, namely (∀k)P (1, k): Every strongly
bounded definable set X ⊆ M admits a k-parametrization, is an immediate conse-
quence of o-minimality.
To complete the proof, one argues through strong induction showing that
(∀k)(∀i ≤ n)R(m, i, k) → (∀k)P (n + 1, k) and that (∀k)(∀i ≤ n)P (i, k) →



(∀k)R(m, n, k). That is, one shows that the reparametrization theorem in di-
mension n implies the parametrization theorem in dimension n + 1 which thereby
implies the reparametrization theorem in dimension n + 1.
Deducing the parametrization theorem in dimension n + 1 from the reparametriza-
tion and parametrization theorems in dimension n is straightforward, once one has
established the technical, though elementary, fact that if one knows how to find
k-reparametrizations of functions into R, then one can find k-reparametrizations for
functions into Rm for any m.
Using the cell decomposition theorem, one reduces to the case of finding a
k-parametrization for a cell, X. The case of X = (f, g)Y , that is, X is an interval over
the ℓ-cell Y in n-space, is slightly more difficult than the case of X being the graph
of a strongly bounded function on some cell. By the inductive hypothesis, we can
find a k-parametrization of Y and then for each function φ in that parametrization
we can find reparametrizations of hf ◦ φ, g ◦ φi. Taking the functions
(x1 , . . . , xℓ , xℓ+1 ) 7→ hφ(x1 , . . . , xℓ+1 ), f ◦ φ ◦ ψ(x1 , . . . , xℓ ) + xℓ+1 g ◦ φ ◦ ψ(x1 , . . . , xℓ )i
as φ ranges through the functions in a k-parametrization on Y and ψ ranges through
the functions in a k-reparametrization of hf ◦ φ, g ◦ φi gives the desired k-parametriza-
tion of X.
The more difficult step is to prove the reparametrization theorem in dimension
n + 1. Using cell decomposition and induction, one reduces to the problem of finding
a k-reparametrization of some strongly bounded definable function f : (0, 1)n+1 → R.
Treating the (n + 1)st variable as a parameter, we may regard f as a definable
family {fu : (0, 1)n → R}u∈R of strongly bounded functions of n variables de-
fined by fu (x1 , . . . , xn ) := f (x1 , . . . , xn , u). By induction and a compactness ar-
gument like that for Proposition 4.11, one shows that there is a uniform family
of k-reparametrizations φu : (0, 1)n → (0, 1)n of fu . Returning to the original function
f , we have a something like a reparametrization of f given by φe : (x1 , . . . , xn , xn+1 ) 7→
(φxn+1 (x1 , . . . , xn ), xn+1 ), in the sense that the partial derivatives of f ◦ φe of order up
to k with respect to x1 , . . . , xn are strongly bounded. Our work is to increase the order
of strong boundedness with respect to the last variable. Ideas from o-minimality are
used throughout, including some we have already seen (existence of Skolem functions,
cell decomposition, compactness to deduce uniformities) and one of a different char-
acter: o-minimality implies strong regularity properties of limits. The specific result
used is the following lemma.

Lemma 4.22. – Let {Ft }t∈(0,1) be a definable family of strongly bounded functions Ft :
X → R. Suppose that each Ft is C k and that the derivatives of Ft of order up to
and including k are strongly bounded. Then the rule F0 (x) := limt→0+ Ft (x) defines a
function of class C k−1 all of whose derivatives up to order k − 1 are strongly bounded.

The key observation for the proof Lemma 4.22 is that for any x ∈ X, the function
t 7→ Ft (x) is a strongly bounded one-variable function so that by the monotonicity



theorem, limt→0+ Ft (x) ∈ R and therefore F0 : X → R is a well-defined, definable

function. The rest of the proof is elementary analysis.
Remark 4.23. – Lemma 4.22 may be regarded as part of the theory of definably Ba-
nach spaces as developed by Thomas [77].
To finish the proof of the reparametrization theorem, it suffices to show that pos-
sibly at the cost of restricting to a dense, open, definable subset of the domain, one
may reparametrize, changing only the last coordinate, so as to guarantee that the
reparametrized function has strongly bounded first derivatives. The general result we
require follows by applying this result to the derivatives.
Lemma 4.24. – Suppose that U ⊆ (0, 1)m+1 is a dense, open definable subset of the
open box (0, 1)m+1 and that f : U → RN is a definable strongly bounded function
having the property that for each i ≤ m (NB: not necessarily i = m + 1) we know
that ∂x i
is continuous and strongly bounded on U . Then for each k ≥ 2 there is a
k − 1-parametrization Sk of (0, 1) and a dense, open definable set V ⊆ U such that for
any φ ∈ Sk if Iφ (x1 , . . . , xm+1 ) := (x1 , . . . , xm , φ(xm+1 )), we know that Iφ (V ) ⊆ U ,
fφ := f ◦ Iφ ∈ C 1 (V ), and all of the first derivatives of fφ are strongly bounded.
Proof. – To ease notation, we shall work with N = 1.
By o-minimality, we may find a dense, open definable W ⊆ U for which the re-
striction of f to W is C 1 .
For t and y from (0, 1) let
Wt (y) := {x ∈ (0, 1)m : dist(x, [0, 1]m × {y} \ W ) ≥ t}.
Note that Wt (y) is a relatively closed subset of a closed box. Thus for fixed y and
t, the function x 7→ | ∂x∂f
(x, y)| is defined, continuous, and takes a maximum value
(provided that Wt (y) 6= ∅). Using the definability of Skolem functions, there is a
definable function st (y) (of the two variables t and y) so that if Wt (y) 6= ∅, then
x 7→ | ∂x∂f
(x, y)| attains its maximal value at x = st (y).
Note that for every t ∈ (0, 1), y ∈ (0, 1) and x ∈ Wt (y) we have
∂f ∂f
| (st (y), y)| ≥ | (x, y)|.
∂xm+1 ∂xm+1
Consider now the definable family of definable functions
{gt : (0, 1) → (0, 1)m × R}t∈(0,1)
given by
gt (y) := hst (y), f (st (y), y)i.
(When st is undefined, output h 21 , . . . , 12 i.)
As each gt is a function of a single variable and strongly bounded at that (as
st (y) takes values in (0, 1)m and f is itself strongly bounded), for each t we have a
k-reparameterization St of gt . Arguing again by compactness, we may assume that
the functions making up St vary in a definable family.



Let now S0 be the limit of St . Then by Lemma 4.22, S0 is a (k −1)-parametrization

of a cofinite subset of (0, 1). Lemma 4.22 gives that all of the derivatives of (the
components of) S0 up to order k − 1 are strongly bounded. That the images cover
a cofinite subset of (0, 1) requires an additional argument. Each function in St is
piecewise continuous as a two variable function. It follows that S0 omits at most
finitely many points.
It is now a routine matter using cell decomposition and induction to deduce the
reparametrization theorem from Lemma 4.24.

4.4. Diophantine approximation. – As we noted above, there are two fundamentally

distinct parts of the counting theorem: the parametrization theorem in o-minimal
theories and then some general results about the distribution of rational points in
sets which admit parametrizations. In this section, we shall discuss these diophantine
approximation arguments.
Let us introduce some basic notation and some relevant combinatorial quantities.
Notation 4.25. – If µ = hµ1 , . . . , µn i ∈ Nn is a multi-index and x ∈ Rn , then we write
Qn Pn
xµ for i=1 xµi i . We define |µ| := i=1 µi .
Note that
P a polynomial in n-variables of total degree at most d may be expressed
as a sum |α|≤d cα xα .

Notation 4.26. – Given n, d ∈ N we define D(n, d) to be the dimension of the space

of polynomials of total degree at most d in n variables. Equivalently,
D(n, d) = #{α ∈ Nn : |α| ≤ d}.
We define L(n, d) to be the dimension of the space of polynomials of total degree
exactly d in n variables. We define
V (n, d) := L(n, i)i.

The quantities L(n, d) and D(n, d) admit other descriptions.

  X d
D(n, d) = = L(n, i),
d i=0
L(n, d) = .
Definition 4.27. – Given m, n, d ∈ Z+ there is a unique b := b(m, n, d) for which
D(m, b) ≤ D(n, d) < D(m, b + 1). We define
X b
B(m, n, d) := L(m, i)i + (D(n, d) − L(m, i))(b + 1)
i=0 i=0
= V (m, b) + (D(n, d) − D(m, b))(b + 1).



For us, it the limiting behaviors of these quantities which are relevant.
With m and n fixed, as d → ∞ we have
m!dn 1
b(m, n, d) = ( ) m (1 + o(1)),
1 m!
B(m, n, d) = ( )(m+1)/m dn(m+1)/m (1 + o(1)),
(m + 1)(m − 1)! n!
V (n, d) = dn+1 (1 + o(1)).
(n + 1)(n − 1)!
In particular that if we define
dD(n, d)
ε(m, n, d) :=
B(m, n, d)
then provided m < n, we have limd→∞ ε(m, n, d) = 0.
Let us note a very easy but useful linear algebraic proposition.

Proposition 4.28. – Let R be a field, n and d two positive integers and S ⊆ Rn . We

suppose that for each subset S0 ⊆ S of cardinality D(n, d) the determinant of the
matrix (Qµ ) whose columns are indexed by multi-indices µ with |µ| ≤ d and whose rows
are indexed by Q ∈ S0 vanishes. Then there is a nonzero polynomial f ∈ R[x1 , . . . , xn ]
of total degree at most d which vanishes on every Q ∈ S.

Proof. – Without loss of generality, we may assume that #S ≥ D(n, d).

Let V be the vector space R{µ∈N : |µ|≤d} ∼ = RD(n,d) and let W be the subspace of V
generated by (Q ){µ∈Nn : |µ|≤d} as Q ranges over S. Our hypothesis is that dim W <
D(n, d). Let S0 ⊆ S so that {(Qµ ) : Q ∈ S0 } is a basis for W . Let S1 k S0 be a
subset of S containing S0 and having #S1 = D(n, d). Since det(Qµ ) = 0 the columns
of this matrix must be dependent. That is, we can find (cµ ) ∈ V \ {(0, . . . , 0)} so that
for each Q ∈ S1 we have cµ Qµ = 0. That is, if we let f (x1 , . . . , xn ) := cµ xµ ∈
R[x1 , . . . , xn ], then f vanishes on each Q ∈ S1 . Let now P be an arbitrary element of S.
Then as {(Qµ ) : Q ∈ S0 } is a basis for W , then there are scalars λQ ∈ R for Q ∈ S0
so that (P µ ) = λQ (Qµ ). Thus, f (P ) = cµ P µ = |µ|≤d cµ Q∈S0 λQ Q
P P µ
Q∈S0 Q λ c
|µ|≤d µ Q = Q∈S0 Qλ f (Q) = 0.

Remark 4.29. – The converse to Proposition 4.28 holds as well: If there is a nonzero
polynomial f ∈ R[x1 , . . . , xn ] of total degree at most d which vanishes on every
element of the set S, then for every S0 ⊆ S of cardinality D(n, d) the determinant of
the matrix (Qµ ) as Q ranges through S0 and µ ranges through the multi-indices with
|µ| ≤ d vanishes. Indeed, writing f = cα xα we see that the vector (cα ) witnesses a
linear dependence amongst the columns of this matrix.

With the next lemma we show that points on the image of a set parametrized
by a function with small derivatives must be very close to lying on an algebraic



In the midst of the proof we use an elementary fact that while the determinant of a
sum of linear maps cannot be computed in terms of the determinants of the individual
maps, it can be expressed using exterior products. (I thank Emmanuel Breuillard for
drawing my attention to the papers [1] and [67] in which formulae for determinants
of sums are worked out explicitly.) Recall that if L : V → V is a linear map from an
n-dimensional vector space back to itself, then Λn (L) = (det(L)) idΛn V . Suppose now
that ψi : V → V (for i ≤ r) is a finite sequence of linear maps on this vector space,
Xr X
(1) Λn ( ψi ) = ψτ1 ∧ · · · ∧ ψτn .
i=1 τ ∈{1,...,r}n

Taking into account the ranks of each of the maps ψi , we see that the term corre-
sponding to τ is nonzero only if #{i : τi = j} ≤ rank(ψj ) for each j ≤ r.
To read Equation 1 in terms of determinants of matrices one should fix a basis
P (i)
e1 , . . . , en of V , and write ψi (ej ) = aj,k ek to obtain the following expression.
(i) (τ )
(2) det( (aj,k )) = det((aj,kj )).
i=1 τ ∈{1,...,r}n

Combining Equation 2 with our observation about ranks, we obtain a simplified

expression for the determinant of a sum.
Xr X
(i) (τ )
(3) det( (aj,k )) = det((aj,kj )).
i=1 τ ∈{1,...,r}n
#{ℓ : τℓ =i}≤rank((aj,k ))
for all i≤r

With these observations in place we may prove our key estimate.

Proposition 4.30. – Let m, n, d ∈ Z+ and set k := b(m, n, d) + 1. Then there is a

constant K = K(m, n, d) so that if f : (0, 1)m → Rn is a strong k-parametrization of
its image, r ∈ (0, 1) is a positive real number less than one, and Q0 , Q1 , . . . , QD(n,d) ∈
(0, 1)m are points for which the distance between Qi and Q0 is at most r, then the
absolute value of the determinant of the matrix (f (Qi )µ ) whose rows are indexed
by 1 ≤ i ≤ D(n, d) and whose columns are indexed by µ ∈ Nn with |µ| ≤ d is at most
KrB(m,n,d) .

Proof. – Expanding each f (Qi ) as a Taylor polynomial around Q0 up to order b and

then with an order b + 1 remainder term, we see that f (Qi ) may be expressed as a
polynomial in (Qi − Q0 ) of total degree b + 1 with coefficients bounded by one. It
then follows that for any µ ∈ Nn with |µ| ≤ d we may express f (Qi )µ as a polynomial
in (Qi − Q0 ) with coefficients bounded by a constant depending only on n and d (dn
Pb+1 (j)
would do). Let us write the matrix as (f (Qi )µ ) = ( j=0 Ri,µ ) where for j < b+1 each
entry of R(j) is a homogeneous polynomial of degree j in (Qi − Q0 ) and each entry
of R(b+1) is a sum of homogenous polynomials of degree greater than b. Observe that



for each j ≤ b the matrix R(j) has rank at most L(m, j) as the space of homogeneous
polynomials of degree j in m variables has dimension L(m, j).
From Equation 3 we see that
X (τ )
det(f (Qµi )) = det((Ri,µi )).
τ ∈{0,...,b+1}D
#{ℓ : τℓ =j}≤L(m,j)
for all j≤b

In general, the contribution from τ is bounded by a constant (depending just on m,

n, and d) times r|τ | . The smallest that this exponent could be is when #τ −1 {j} =
L(m, j) for all j ≤ b. That is, when the exponent is
jL(m, j) + (b + 1)(D(n, d) − D(m, b)) = B(m, n, d).

Taking the constants we have considered thusfar and multiplying by (b + 1)n , for
instance, we obtain the desired result.

Combining Propositions 4.28 and 4.30 we prove that the rational points in the
image of a strong k-parametrization are constrained to a small number of algebraic

Theorem 4.31. – Given m < n ∈ Z+ and d ∈ Z+ . Then there exists a number

k = k(m, n, d) ∈ Z+ and constants ε(m, n, d) (as defined above) and C = C(m, n, d)
so that whenever f : (0, 1)m → Rn is a strong k-parametrization of its image, called
X, and t ∈ Z+ , then X(Q, t) is contained in the union of Ctε (possibly reducible)
hypersurfaces of degree d.
−dD(n,d) −1
Proof. – Let K be the constant of Lemma 4.30. Given t, set r := t B(m,n,d) K B(m,n,d) .
Let us observe that if Q1 , . . . , QD(n,d) ∈ (0, 1)m are points for which f (Qi ) ∈ X(Q, t),
then there is an integer s with |s| ≤ tdD(n,d) so that det(f (Qi )µ ) ∈ 1s Z. In particular,
if we further require the Qi ’s to belong to a ball of radius r, then this determinant
would have size bounded by KrB < ( 1t )dD(n,d) by Lemma 4.30. Hence, this determi-
nant vanishes. We may cover (0, 1)m by a constant multiple of r1m , or if you prefer, a
constant multiple of t m balls of radius r. For each such ball, we know by Propo-
sition 4.28 there is a single hypersurface of degree d containing all rational points of
height at most t which are in the image of that ball.

4.5. Completing the proof of the counting theorem and its refinements. – We conclude
the discussion of the Pila-Wilkie counting theorem. In this section, we finish its proof
by combining Theorems 4.8 and 4.31.
To carry out the induction to prove Theorem 4.6, it is better to prove a uniform



Theorem 4.32. – Let {Xb }b∈B be a definable family of definable subsets of Rn in some
o-minimal expansion of the real field and let ε > 0 be any real number. Then there
is a definable family of sets {Yb }b∈B and a constant C depending just on ε and the
family so that for every b ∈ B we have Yb ⊆ Xbalg and N (Xb \ Yb , t) ≤ Ctε for t ≥ 1

Let us note what we may conclude by combining Proposition 4.11 with Theo-
rem 4.31.

Proposition 4.33. – Given a definable family {Xb }b∈B of definable subsets of (0, 1)n
each of dimension strictly less than n and ε > 0 there is a number d ∈ Z+ and
a constant C depending only on ε and the family so that for each b ∈ B the set
Xb (Q, t) is contained in the union of Ctε hypersurfaces of degree d.

Proof. – Let us prove Theorem 4.32 by induction n and then on the fiber dimension
of {Xb }b∈B .
Through some elementary considerations of the invariance of the height function
under additive and multiplicative inverses, one sees that it suffices to consider the
case that Xb ⊆ (0, 1)n .
Using uniform cell decomposition, one sees that it suffices to consider the case that
each Xb is a cell. Considering projections and cell decompositions again, one sees that
it suffices to consider the case that Xb = Γ(fb )Zb , the graph of a definable continuous
function fb : Zb → (0, 1) where Zb ⊆ Rn−1 is an open cell.
By Theorem 4.31 there is a number d ∈ Z+ and a constant C depending just on
the family and on ε so that for each b ∈ B and t ≥ 1 the set Xb (Q, t) is contained in
the union of Ct 2 hypersurfaces of degree d.
The family of hypersurfaces of degree d is naturally a definable family itself
{Hc }c∈B ′ (parametrized by PD(n,d)−1 (R), for example).
Let us note that if Xb is contained in some hypersurface, then Xb = Xbalg as
necessarily fb would be the restriction of an algebraic function to an open set. Thus,
we may assume that for each hypersurface Hc the intersection Hc ∩ Xb has dimension
strictly smaller than dim(Xb ). Thus, by induction there is some constant C ′ and a
definable family of definable sets
{Yb,c ⊆ (Hc ∩ Xb )alg }b,c
for which N ((Hc ∩ Xb ) \ Yb,c , t) ≤ C ′ t 2 . Define Yeb := Yb,c , then Yeb ⊆ Xbalg , is

ε ε
definable, and N (Xb \ Yb , t) ≤ (Ct 2 )(C ′ t 2 ) = (CC ′ )tε , as required.

In our applications of Theorem 4.6, refinements in two different directions will be

required. First, we will need to count algebraic points, not merely rational points.
Secondly, sometimes we need to bound the rational points in a definable set even
when it has a large algebraic part. In fact, these two refinements are not unrelated
as the most natural way to study algebraic points is to use a restriction of scalars
construction which tends to produce sets having no transcendental part.



Definition 4.34. – Let H : Qalg → R be the multiplicative height function on the alge-
braic numbers. We extend H to n-tuples by H(x1 , . . . , xn ) := max{H(xi ) : i ≤ n}.
For a positive integer k and set X ⊆ Rn , we define
X(k, t) := {(x1 , . . . , xn ) ∈ X : [Q(xi ) : Q] ≤ k & H(xi ) ≤ t for each i ≤ n}
and N (X, k, t) := #X(k, t).

Remark 4.35. – In line with our earlier notation, X(1, t) = X(Q, t).

The direct generalization of Theorem 4.6 to bounding N (X, k, t) holds. That is, Pila
has shown [55] that for any o-minimally definable set X ⊆ Rn , positive number ε > 0,
and positive integer k, there is a constant C = C(X, k, ε) for which the inequality
N (X tr , k, t) ≤ Ctε holds. The proof of this version of the counting theorem passes
through an analysis of algebraic blocks.

Definition 4.36. – A block X ⊆ Rn in some o-minimal expansion of the real field is

an infinite, connected, definable set for which there is a connected semialgebraic set
Y ⊆ Rn for which X is contained in the nonsingular locus of Y and X agrees with Y
in some neighborhood of each point of X.

As we have seen in the proof of Theorem 4.6, the rational points on definable
sets may be confined to a small number of algebraic hypersurfaces. In the course of
proving the extension of the counting theorem to algebraic points, one shows that
the algebraic points of fixed degree may be confined to few blocks by mixing the
earlier result on rational points with considerations of how algebraic points may be
understood in terms of rational points on some associated definable set.
There are examples of sets X definable in Ran for which N (X tr , t) grows faster
than every polynomial in log(t). Indeed, it is not hard to achieve this with restricted
analytic functions f : [0, 1] → R by constructing highly lacunary power series so
that f takes rational values at many rational arguments. On the other hand, no such
sets definable in Rexp are known to exist, and Wilkie conjectures that, in fact, for
any set X ⊆ Rn definable in Rexp (or more generally, in RPfaff , the expansion of R
by all Pfaffian functions) there are constants C and K so that for t ≫ 1 one has
N (X tr , t) ≤ C(log(t))K . This conjecture has been proven for curves in the plane by
Pila [54], under some additional hypotheses for surfaces by Jones and Thomas [31],
and for algebraic points in surfaces definable in Rexp by Butler [10], but remains open
in higher dimension. The definable sets which arise in the diophantine geometric ap-
plications of the counting theorem are for the most part not definable in RPfaff , but
they are defined using functions which do satisfy differential equations. As the known
restricted analytic functions giving many rational points are differentially transcen-
dental, one might speculate that a generalization of Wilkie’s conjecture might hold
for sets definable in o-minimal expansions of the real field by functions satisfying a
more general class of differential equations than merely Pfaffian equations, but I am
loth to formulate this speculation as a conjecture. If one knew such bounds, then one



would need only prove weaker Galois theoretic lower bounds in order to apply the
counting theorem to diophantine problems.

5. Applications of the counting theorem to diophantine geometry

In this section we shall explain several theorems in diophantine geometry proven
using the Pila-Wilkie counting theorem. We shall begin with the Pila-Zannier re-
proof of the Manin-Mumford conjecture followed by Pila’s unconditional proof of the
André-Oort conjecture (and some generalizations) for products of modular curves.
The generalizations Pila considers, namely for which the ambient varieties are prod-
ucts of modular curves and certain split semiabelian varieties, are in the direction
of Pink’s conjectures on mixed Shimura varieties. With the theorem of Masser and
Zannier on simultaneous torsion in the Legendre family of elliptic curves, we see an
instance of the Zilber-Pink conjectures on anomalous intersections where unlike the
cases of the Manin-Mumford and André-Oort conjectures rather than considering
merely special points, that is special subvarieties of dimension zero, we study inter-
sections with collections of higher dimensional special subvarieties. The theorem of
Habegger and Pila on some unlikely intersections in powers of the j-line is an explicit
attempt at the Pink conjecture in the case of Shimura varieties. The theorems we have
chosen to expose do not exhaust the known results in diophantine geometry which
have been proven using the Pila-Zannier strategy but they do indicate the scope of
the method.

5.1. Manin-Mumford conjecture. – The Manin-Mumford conjecture, first proven by

Raynaud using p-adic methods [66], asserts that if a closed subvariety of an abelian
variety over C contains a Zariski dense set of torsion points, then that subvariety must
be a translate by a torsion point of an abelian subvariety (where for this statement
we consider the trivial subgroup as an abelian subvariety). Pila and Zannier offered
a new proof of Raynaud’s theorem under the additional hypothesis that the abelian
variety in question is defined over a number field. Presumably, either a specialization
argument or a refinement of Masser’s theorems on the Galois action on torsion points
to a transcendental base could be used to extend their argument to the general case.
However, in keeping with my promise not to disfigure the Theorems I am exposing
by introducing my own “improvements,” I will restrict myself to the case of abelian
varieties over number fields.
The main theorem of [62] reads as follows.

Theorem 5.1. – Let k be a number field, A be an abelian variety over k, and X ⊆ A

be a closed, irreducible subvariety. We suppose that the set
{ξ ∈ X(C) : (∃n ∈ Z+ )[n]A (ξ) = 0}
of torsion points of A(C) lying on X is Zariski dense in X. Then X is a translate by
a torsion point of an abelian subvariety of A.



To prove Theorem 5.1 we shall employ some standard reductions; some of which
will appear in other arguments, but some of which lack natural analogs outside the
context of abelian varieties.
First, we have already assumed A to be defined over a number field. It follows from
Lagrange interpolation that since all of the torsion points are algebraic, the variety X
must be defined over a number field as well. Thus, we may assume that both A and
X are defined over k. Secondly, we may assume that the stabilizer of X in A is trivial.
Indeed, if S = StabA (X) is the stabilizer of X in A, π : A → A/S is the quotient
map, and X = π(X) is the image of X under π, then A/S is an abelian variety, X(C)
meets (A/S)(C)tor in a Zariski dense set, the stabilizer of X is trivial, and if X were
a translate by a torsion point of an abelian subvariety, then X = π −1 X would also
be a translate by a torsion point of an abelian subvariety of A. For the last reduction
we recall the notion of the special locus, or what is sometimes called the Ueno locus.
Let us define the special locus at the level of its C-valued points
SpL(X)(C) : {a ∈ X(C) : a + B ⊆ X
for some positive dimensional algebraic subgroup B ≤ A}.
While we have defined SpL(X) as a set of points, it is, in fact, a closed subvariety
of X. The proof of this fact follows by a fairly easy induction on dim(X) provided
that one proves a stronger uniform version to the effect that if X is allowed to vary in
a constructible family of subvarieties of A, then SpL(X) also varies in a constructible
family of subvarieties and that, moreover, for X irreducible and positive dimensional,
SpL(X) = X if and only if the stabilizer of X is positive dimensional. Given such a
constructible family {Xb }b∈B of subvarieties of A, via a base change if necessary, one
reduces to the case that each Xb is irreducible and then considers a further family
{(a + Xb ) ∩ Xb }(a,b)∈A×B . Apply induction and the observation that if c ∈ SpL(Xb )
and Xb has a finite stabilizer, then there is some a ∈ A with c ∈ SpL(Xb ∩ (a + Xb ))
to complete the argument.
With the introduction of the special locus, we have our third reduction: it suffices
to show that there are only finitely many torsion points in X \ SpL(X). We shall now
convert this to an analytic problem. Let π : Cg → A(C) express the compact complex
Lie group A(C) as a quotient of Cg by some lattice Λ ≤ Cg . As a real vector space,
we have Cg = R ⊗ Λ. Using a basis of Λ as an R-basis of Cg , we regard Cg as R2g so
that π : R2g → A(C) is a real analytic function. While this choice of real coordinates
differs from the usual presentation of C in terms of real and imaginary parts, since
we can move from one to the other by a real linear change of variables, the question
of whether some subset of Cg is semialgebraic does not depend upon our choice of
coordinates. Of course, the map π : R2g → A(C) is not o-minimally definable, but if
we restrict it to the fundamental domain D := [0, 1)2g , which is semialgebraic, then
because π ↾ [0, 1]2g is the restriction of a globally analytic function to a compact box,
the resulting function π e := π ↾ [0, 1)2g is definable in Ran .
With respect to our choice of real coordinates, the torsion points in A(C) are in
bijection with Q2g ∩ D via π e. Let X := π e−1 (X(C)) and let S := π e−1 (SpL(X)). Our



charge is to show that (X \ S) ∩ Q2g is finite. To apply Theorem 4.6 to X we must

first determine its algebraic part.

Proposition 5.2. – We have Xalg = S.

More than one proof of Proposition 5.2 is available to us: one based on differential
algebra, as explicated by Marker [41], and a second proof using o-minimality, including
a second application of Theorem 4.6. One expects the differential algebraic arguments
to generalize, but to date, it is only the o-minimal approach which has been applied
successfully to compute the algebraic parts of the definable sets arising in the other
applications of this method. For all such arguments, one begins by arguing that the
algebraic part may be computed by considering the complex algebraic part rather
than the real algebraic part. More precisely, we have the following lemma.

Lemma 5.3. – Let Y ⊆ Cn be an irreducible complex analytic subset of Cn for some

n ∈ Z+ . We write ∆ := {z ∈ C : |z| < 1} for the open unit disk. Define
Y ca := γ(∆)
γ:∆→Y (C)
nonconstant complex analytic
and complex algebraic
Y ra := γ(−1, 1).
γ:(−1,1)→Y (C)
nonconstant real analytic
and semialgebraic

Then Y ca = Y ra .

Remark 5.4. – In saying that γ : (−1, 1) → Y (C) is real analytic and semialgebraic,
we are regarding Cn with its real structure, thus, as R2n , whereas when we say that γ :
∆ → Y (C) is complex analytic and complex algebraic, we treat Cn as n-dimensional.

Proof. – The containment Y ca ⊆ Y ra follows easily from the observation that if

γ : ∆ → Y (C) is nonconstant complex analytic and algebraic, then its image is equal
to the union of the images of the restriction of γ to each line through the origin and
each such function is a nonconstant real analytic, semialgebraic function.
For the other inclusion, consider some nonconstant real analytic, semialgebraic
function γ : (−1, 1) → Y (C). Express this function in coordinates as
t 7→ (γ1,R (t) + iγ1,I (t), . . . , γn,R (t) + iγn,I (t)).
zj (t) := γj,R (t) + iγj,I (t).
Note that I am not asserting that zj is complex analytic. Since tr. degR (R(γ(t))) = 1
and C(z1 (t), . . . , zn (t)) ⊆ R(γ(t))alg , we conclude that tr. degC (C(z1 (t), . . . , zn (t)) = 1.
Hence, there is an irreducible affine algebraic curve X ⊆ AnC for which X(C) ∩ Y (C) is
infinite. As Y is an analytic variety, X ⊆ Y . To complete the argument, use the fact
that a complex algebraic curve may be covered by complex analytic charts.



We shall now employ an abelian analog of a transcendence theorem of Ax [3] to

complete the proof of Proposition 5.2. Schanuel has conjectured that if α1 , . . . , αn are
Q-linearly independent complex numbers, then tr. degQ (Q(α1 , . . . , αn , eα1 , . . . , eαn ) ≥ n.
While some notable special cases of Schanuel’s conjecture are known, for example
the Lindemann-Weierstraß theorem [40, 83] for which the numbers α1 , . . . , αn are all
assumed to be algebraic and Baker’s theorem on linear forms in logarithms in which
the numbers eα1 , . . . , eαn are all algebraic [4], as a whole, the conjecture remains
wide open. However, Ax has proven a functional version of the conjecture best stated
in terms of differential fields.

Theorem 5.5 (Ax). – Let K be a field of characteristic zero with a derivation ∂ :

K → K having field of constants C := {a ∈ K : ∂(a) = 0}. Suppose that
α1 , . . . , αn , β1 , . . . , βn ∈ K be elements of K satisfying the differential equations
∂αi = .
Suppose moreover that 1, α1 , . . . , αn are C-linearly independent. Then
tr. degC (C(α1 , . . . , αn , β1 , . . . , βn )) ≥ n + 1.

Specializing to the case of C = C, K = C((t)), ∂ = ∂t , and α1 (t), . . . , αn (t) ∈ tC[[t]]
P∞ 1
which are Q-linearly independent, and βj (t) := exp(αj (t)) = n=0 n! αj (t)n , one re-
covers a formal version of the Schanuel conjecture. For the problem under considera-
tion, one requires a generalization of Ax’s theorem to the Weierstraß ℘-functions, due
to Brownawell and Kubota [9].

Remark 5.6. – Further generalizations of Ax’s theorem to semiabelian varieties which

are not necessarily defined over the constants have been proven by Bertrand and
Pillay [6]. The elliptic case has been studied by several other authors. See, for example,
[13, 34, 33].

Let us now complete the characterization of Xalg . First, we observe that S ⊆ Xalg
as the preimage of a translate of an abelian variety contained in X is the intersection
with D of an affine space entirely contained in π −1 X(C).
For the other inclusion, we observe that if a ∈ Xalg , then π(a) ∈ SpL(X). Indeed,
by Lemma 5.3 we may find γ : ∆ → X a nonconstant complex analytic and algebraic
map with γ(0) = a. Let β := π ◦ γ : ∆ → X(C). Taking K to be the field of meromor-
phic functions on ∆, we may regard γ as a K-valued point of Te A and β as a K-valued
point of X. Differentiating the equation β = π(γ), we see that ∂ logA (β) = ∂(γ). By al-
gebraicity of γ we have tr. degC (C(γ)) = 1 while tr. degC (C(β)) ≤ dim(X) < dim(A).
Hence, the elliptic transcendence theorem of Brownawell and Kubota implies that
there is some proper algebraic group B < A with β ∈ π(a) + B(K). As β is noncon-
stant, dim(B) > 0. Minimizing dim(B), translating and applying the transcendence
theorem again with A replaced by B, we see that β is generic in π(a) + B. Since
β ∈ X(K), we conclude that π(a) + B ⊆ X so that π(a) ∈ SpL(X) as claimed.



To finish the proof of Theorem 5.1 we shall invoke a theorem of Masser [42] on the
Galois action on torsion points.
Theorem 5.7 (Masser). – Let A be an abelian variety over a number field k. Then there
are constants C = C(A, k) and η = η(A, k) so that for any torsion point ξ ∈ A(k alg )
of exact order n one has
[k(ξ) : k] ≥ Cnη .
Remark 5.8. – Masser’s theorem gives much more precise information on the
constants C and η and holds even for families of abelian varieties over some
fixed number field. The coarse bounds suffice for our applications.
Let us make one final observation before finishing the proof. If x ∈ Q2g ∩ D, then
H(x) and the order of x in the group (R/Z)2g , or, what is the same thing, the order
of π(x) in A(C), which we shall write as o(π(x)), are related by
H(x) ≤ o(π(x)) ≤ H(x)2g .
Indeed, if we write  
p1 p2g
x= ,...,
q1 q2g
where 0 ≤ pi ≤ qi are integers with qi in lowest terms, then (as long as x 6= 0)
H(x) = max{qi : 1 ≤ i ≤ 2g}
o(π(x)) = lcm({qi : 1 ≤ i ≤ 2g}.
We finish the proof now. Let C and η be the constants from Theorem 5.7. Let C ′ be
the constant from Theorem 4.6 with ε = η2 so that N (Xtr , t) ≤ C ′ tε . If X(C) \ SpL(X)
contained infinitely many torsion points, then one could find such a torsion point ξ of
exact order n > (C ′ /C) η . As X and SpL(X) are defined over k, if σ ∈ Gal(k alg /k),
then σ(ξ) ∈ X(C)\SpL(X) as well. Taking into account the inequality H(x) ≤ o(π(x))
for x ∈ D and the fact that π induces a bijection between Q2g ∩ Xtr and the set of
torsion points in X(C)\SpL(X), we see from Theorem 5.7 that N (Xtr , n) ≥ Cnη while
Theorem 4.6 gives N (Xtr , n) ≤ C ′ n 2 From our choice of n, these two inequalities are

5.2. Pila’s André-Oort theorem. – Overall, Pila’s proof of the André-Oort conjecture
for products of curves follows the strategy of the Pila-Zannier reproof of the Manin-
Mumford conjecture with some notable changes. First, to obtain the definability of
the relevant analytic covering maps, we must work in Ran,exp ; restricted analytic
functions do not suffice. Secondly, the lower bounds on the sizes of Galois orbits are
obtained from Siegel’s theorem on the class number of quadratic imaginary fields.
The requisite bounds for general Shimura varieties are not yet known uncondition-
ally, though Tsimerman has produced such bounds for the coarse moduli spaces of
principally polarized abelian varieties of any dimension [78]. Finally, a differential al-
gebraic transcendence theorem analogous to the Ax-Lindemann-Weierstraß theorem



is not known for the j-function. Consequently, the characterization of the algebraic
part of definable sets arising as pullbacks of algebraic varieties requires a different
argument based on o-minimality. It bears noting that the proof of Proposition 5.2
in [62] employs similar considerations rather than the differential algebraic methods
we used.
Pila’s theorem is often cited as an unconditional version of the André-Oort con-
jecture in the case where the ambient Shimura variety is AnC regarded as the nth
Cartesian power of the j-line. However, he proves a stronger theorem, namely that
some cases of Pink’s generalized André-Oort + Manin-Mumford conjecture [65] hold
for varieties expressible as products of modular curves, elliptic curves defined over a
number field, and powers of the multiplicative group. Let us give a precise formulation
before we begin its proof. We begin by defining the special points.

Definition 5.9. – We regard A1 as the (coarse) moduli space of elliptic curves. If Y =

An × A is a product of some Cartesian power of affine space with a commutative
algebraic group A, then by a special point on Y we mean a C-valued point of the
(ξ1 , . . . , ξn , ζ) ∈ (A1 × · · · × A1 × A)(C)
where each ξi is a moduli point of an elliptic curve with complex multiplication and
ζ ∈ A(C) is a torsion point.

Let us say now what we would mean by a special subvariety of a product of affine
lines and algebraic groups.

Definition 5.10. – By a weakly special subvariety of An we mean a component of a

variety defined by systems of equations of the form ΦN (xi , xj ) = 0 and xk = ξ where
ΦN is the N th modular polynomial (the case of N = 1 is allowed) and ξ is some fixed
point. If we require that ξ be a special point, then the variety is a special subvariety.
A subvariety of a product of An with a commutative algebraic a group is (weakly)
special if it is a product of a (weakly) special subvariety of An with a translate by a
torsion point (by a general point) of an algebraic subgroup of A.

With these definitions in place we may state Pila’s theorem.

Theorem 5.11 (Pila). – Let N ∈ N be a natural number and A an algebraic group over
a number field which is expressible as a product of elliptic curves and a Cartesian
power of the multiplicative group. If Y ⊆ X := AN × A is an irreducible subvariety
for which the set
{a ∈ Y (C) : a ∈ (AN × A)(C) is a special point }
is Zariski dense in Y , then Y is a special subvariety.



As with the proof of the Manin-Mumford conjecture, we shall prove Theorem 5.11
by fixing an o-minimally definable analytic covering of π : X → AN (C) × A(C) for
which the special points come from arithmetically simple points in D and then consider
the set of such points on X := π −1 (X(C)).
Of course, the j-function is not o-minimally definable as a function on all of the
upper half-space
h := {z ∈ C : Im(z) > 0}
but if one restricts j to a fundamental domain, say, the standard fundamental domain
−1 1
D := {z ∈ C : ≤ Re(z) < and |z| ≥ 1},
2 2
then the resulting function is definable in Ran,exp (relative to the usual presentation
of C via real and imaginary parts). Indeed, it is well known that j(z) = J(exp(2πiz))
where J is a meromorphic function on the open unit disk with a simple pole at the
origin whose first few terms are given by
J(q) = + 744 + 196884q + 21493760q 2 + 864299970q 3 + · · ·
The map z 7→ exp(2πiz) restricted to D is o-minimally definable as
z 7→ exp(−2π Im(z))(cos(2π Re(z)) + i sin(2π Re(z)).
While the trigonometric functions over the full real line are not definable in Ran,exp ,
since the real part of z is bounded between −1 1
2 and 2 on D, only the restrictions of
sine and cosine to a compact interval are required, and these are clearly restricted
analytic. The image of D under z 7→ exp(2πiz) is contained in Bexp(−√3π) (0), the disk

of radius exp(− 3π) about the origin, thus, we may express j ↾ D as
j(z) = (J ↾ Bexp(−√3π) (0))(exp(2πiz)).
The restriction of J to Bexp(−√3π (0) is the quotient of a restricted analytic function
by a polynomial, and is thus definable in Ran,exp , showing that the restriction of j
to D is definable.
From the analytic theory of elliptic curves, we know that the elliptic curve
Ej(τ ) (C) = C/(Z + Zτ )
has complex multiplication if and only if [Q(τ ) : Q] = 2. Thus the prespecial points
in D, by which we mean the points in D which map to special points by our given
analytic covering map, namely the j-function, are the quadratic imaginary numbers
in D.
As we have already discussed when considering the Manin-Mumford conjecture,
if B is a connected commutative algebraic group over C, then its universal covering
space is Cg , where g = dim(G). More specifically, if B is an abelian variety, then
by restricting the covering map to a fundamental domain and taking a basis of the
kernel as a basis for Cg as an R-vector space, the we may think of this covering map
as π : [0, 1)2g → B(C) where π is the restriction to a semialgebraic set of a restricted



analytic function and is therefore definable in Ran . In this case, the prespecial points,
namely the points mapping to torsion points, are the rational points in the domain
of π. When B = Gm is the multiplicative group, then our covering map π : C →
Gm (C) is given by z 7→ exp(2πiz). As noted above, by restricting this map to the
fundamental domain
{z ∈ C : 0 ≤ Re(z) < 1}
the complex exponential map becomes definable in Ran,exp .
Using these various analytic covering maps as the coordinates of a single covering
map we obtain an analytic covering map π e → X(C) where X
e :X e = hN × Cg with
g = dim A and then by restricting to a fundamental domain X, we obtain an o-
minimally definable covering map π : X → X(C) for which the prespecial points
in the coordinates corresponding to A1 are the quadratic imaginary numbers and
in the other coordinates are (some of) the rational points relative to the choice of
real coordinates noted above. We have thus converted the problem of describing the
special points in Y (C) to that of describing the prespecial points in Y := π −1 Y (C).
As with the Manin-Mumford conjecture, we define a special locus for Y and then
reduce to showing that there are only finitely many special points in Y not contained
in its special locus. However, unlike the case of abelian varieties, our proof that the
special locus is constructible uses the analytic covering in an essential way. The key
observation is that the (weakly) special subvarieties come from geodesic analytic sub-
varieties of X.
The map π e:X e → X(C) expresses X(C) as a quotient of X by an arithmetic group.
The domain X e is a homogenous space for the group G(R) := PSL2 (R)N ×G2g (R) and,
again relative to our choice of real coordinates, we may regard X(C) as Γ\X e where
Γ = H(Z) for a certain algebraic subgroup of G. Here the group H is a product of
the algebraic groups PSL2 for each A1 factor of X, G2a for each elliptic factor, and
Ga × {0} for each multiplicative group factor.
If Y ⊆ X were a special variety and Y e were a component of π e−1 Y (C), then Ye
would be a product of an analytic subvariety of h defined by equations of the form
zi = γzj or zk = ξ for some γ ∈ PSL2 (Q) or prespecial point ξ and an affine subspace
of Cg (which relative to the real coordinates comes from one defined over Q).

Definition 5.12. – In general, we say that an analytic subvariety of X e is weakly

geodesic if it is of the form U × V where U ⊆ h is defined by equations of the form
xi = γxj or xk = ξ for an arbitrary γ ∈ PSL2 (R) or point ξ ∈ h and V ⊆ Cg is
a translate of some subspace. If the elements γ come from PSL2 (Q) and π(V ) is a
translate of an algebraic subgroup of A, then we say that U × V is geodesic.

Let us note that if Y is a subset of a proper geodesic subvariety of hN × Cg , then

we may pass to an appropriate quotient without changing the hypothesis that Y (C)
contains a Zariski dense set of special points but is not a special variety. Thus, it
suffices to consider the case that no proper geodesic variety contains Y. We define
the special locus of Y , SpL(Y ) to be the union of all positive dimensional irreducible



weakly special subvarieties of Y . On the face of it, this is a countable union of algebraic
varieties. However, after reducing to the case that Y is not contained in a proper
geodesic subvariety of hN × Cg and Y is not special, we show that Yalg = π −1 SpL(Y )
and that SpL(Y ) is a proper subvariety of Y . This fact may be regarded as an analog of
the Ax-Lindemann-Weierstraß theorem, but its proof has resisted differential algebraic
treatments and occupies three sections of [56].
One obtains this characterization of the algebraic part of Y in stages.
e be a component of π −1 Y (C) which meets X in a set of full dimension.
First, let Y
We argue that if Z ⊆ Y e is a (positive dimensional) maximal algebraic subvariety
e then Z is contained in a geodesic subvariety X
of Y, e which is contained in Y. e Sec-
ondly, invoking Lemma 5.3 we conclude that Yalg is covered by geodesic subvarieties.
Finally, using the compactness theorem and the fact that there are only countably
many shapes of geodesic varieties, we show that π(Yalg ) = SpL(Y ) is a proper closed
subvariety of Y .
Let us explain how the first step works. Translating by an element of H(Z) if need
be, we may assume that Z(C)∩X is Zariski dense in Z. We then consider two definable
BZ := {γ ∈ H(R) : dim(γZ ∩ X) = dim Z}
e = dim(Z)}.
CZ := {γ ∈ H(R) : dim(γZ ∩ X ∩ Y)
The set CZ is definable in Ran,exp while BZ is semialgebraic, but they share many
integral points in common. Indeed, if Γ := {γ ∈ H(Z) : γ Y e = Y},
e then Γ ∩ BZ = Γ ∩
CZ . Using the fact that Y is a component of a positive dimensional H(Z)-periodic set
and some easy estimates on the number of translates of X which meet Z in a dense set,
one shows that number of points in BZ ∩ Γ of height up to t outstrips the Pila-Wilkie
bounds. Thus, CZ must contain an infinite, connected semialgebraic set S. It must be
the case that S stabilizes Z for otherwise, for any s0 ∈ S Z ( s−1 e
0 · S · Z ⊆ Y violating
the maximality of Z as we have observed that the semialgebraic part of a complex
analytic variety is equal to its complex algebraic part. Thus, Z is a homogeneous space
for a positive dimensional semialgebraic group. Using a description of the algebraic
subgroups of G, one shows that some weakly geodesic relation holds on Z. Through
further considerations of the structure of H, it follows that, in fact, a geodesic relation
holds on Z. The analysis continues in much the same way as in the proof of the
Manin-Mumford conjecture. It is shown that either a geodesic relation holds on all
e or that the algebraic part of Y
of Y e is contained in an analytic set of strictly smaller
dimension. In the case that a geodesic relation holds on Y, e one passes to a quotient
while in the latter case, we have reached the desired conclusion.

Remark 5.13. – This basic strategy for determining the algebraic part of the pullback
of a subvariety Y (C) under an analytic covering map π : X → X(C) expressing a
variety X(C) as a quotient Γ\X of a homogeneous space X works more generally. By



comparing the word metric in Γ to the Euclidean metric in X, Ullmo and Yafaev [82]
have shown that if X(C) = Γ\X is a Shimura variety for which Γ is co-compact, then
for any algebraic variety Y ⊆ X, the maximal algebraic subvarieties of π −1 (Y (C)) are
geodesic. Pila and Tsimerman have proven the Ax-Lindemann-Weierstraß theorem
for A g [59]. A general treatment of this problem is given by Klingler, Ullmo and
Yafaev [35].

Remark 5.14. – In later work, Pila and Habegger [30] showed that if one were to
define the special locus of a subvariety Y ⊆ An to be the union of all of the positive
dimensional weakly special subvarieties of Y , then as in the case of abelian varieties,
the special locus is actually a closed subvariety.

One concludes the proof of Theorem 5.11 almost exactly as with the proof of
the Manin-Mumford conjecture, with the minor change that the lower bound on the
Galois orbits of special points is obtained from Siegel’s theorem on the class number of
quadratic imaginary fields rather than Masser’s theorem on torsion points on abelian

Lemma 5.15. – There is a constant C so that for any prespecial ξ ∈ X one has
[k(π(ξ)) : k] ≥ CH(ξ) 2 .

Proof. – For an elliptic curve Eτ with complex multiplication, [Q(τ ) : Q] is equal

p to
the class number of Z[τ ] which is bounded below by a constant multiple of H(τ )
by Siegel’s class number formula [72]. For an elliptic curve E defined over a number
field k, we know from Theorem 5.7 that the degree of the field generated by a torsion
point grows faster than some constant multiple of a power of its order. Finally, from
the theory of cyclotomic field extensions, we know that if ζ is a root of unity of order
N , then [Q(ζ) : Q] = ϕ(N ) where ϕ is Euler’s totient function. It is elementary to
see that for any positive ε < 1, one has ϕ(N ) > 12 N ε . In particular, we could take
ε = 12 .

Arguing exactly as in the case of the Manin-Mumford conjecture, if Theorem 5.11

were false, then we could reduce to considering Y ⊆ X an irreducible subvariety
defined over a number field k having infinitely many special points not contained in
its special locus. We then observe that if ξ ∈ Y were a prespecial point not living
in the preimage of the special locus, then each of the Gal(k alg /k) conjugates of π(ξ)
would also correspond to a distinct prespecial point of Y outside of its algebraic
part but of bounded height. By choosing the order of the group component, that is
the projection of π(ξ) to A(C), or the discriminant of the modular component high
enough, we would contradict Theorem 4.6.



5.3. Simultaneous torsion. – The diophantine theorems we have discussed up to this

point have taken the form that a subvariety of a special variety containing a Zariski
dense set of special points must be a special variety. With the theorem of Masser and
Zannier on simultaneous torsion in the Legendre family of elliptic curves we encounter
an instance of the more general Zilber-Pink conjectures on unlikely intersections in
higher dimension. Let me state the Masser-Zannier theorem and then explain how it
fits into the Zilber-Pink framework.

Theorem 5.16 (Masser-Zannier).

p – There are ponly finitely many complex numbers λ for
which the points [2 : 2(2 − λ) : 1] and [3 : 6(3 − λ) : 1] are both torsion points on
the elliptic curve defined as a subvariety of P2 by the equation zy 2 = x(x − z)(x − λz).

Remark 5.17. – We have stated Theorem 5.16 in the striking form (which appears
in [45]) that the abscissas are restricted to be 2 and 3. The proof works equally well
for any two constant abscissas provided that the points are linearly independent
p on
the generic
p fiber. (We leave it to the reader to verify that the points [2 : 2(2 − λ) : 1]
and [3 : 6(3 − λ) : 1] are indeed linearly independent generically.) With additional
work (as shown in [43]) the restriction to constant abscissas may be dropped.

Remark 5.18. – Stoll has given a direct proof of Theorem 5.16, showing the stronger
result that there are no exceptional λ [75].

Let us reformulate Theorem 5.16 as a result about intersections of curves with

special varieties. Let us take our ambient special variety X to be the square of the
Legendre family over the λ-line. That is, we present X as a closed subvariety of (A1 \
{0, 1}) × P2 × P2 defined by the equations z1 y12 = x1 (x1 − z1 )(x1 − λz1 ) and z2 y22 =
x2 (x2 − z2 )(x2 − λz2 ) where λ ranges over A1 \ {0, 1}, [x1 : y1 : z1 ] are the homogenous
coordinates on the first P2 factor and [x2 : y2 : z2 ] are the homogenous coordinates on
the second P2 factor. In so doing, via the projection onto the first coordinate, we may
regard π : X → (A1 \ {0, 1}) as an abelian scheme 1
p over A \ {0, 1}, each p fiber being
the square of an elliptic curve. The points [2, 2(2 − λ) : 1] and [3 : 6(3 − λ) : 1]
determine a curve C in X defined p by the equations x1 −2z p 1 = 0 and x2 −3z2 = 0. The
numbers λ for which both [2, 2(2 −p λ) : 1] and [3 : 6(3 p − λ) : 1] are torsion, are
exactly the numbers λ for which ([2, 2(2 − λ) : 1], [3 : 6(3 − λ) : 1]) ∈ Xλ (C)tor .
To put it another way, they are the points in (A1 \ {0, 1})(C) which lie in the image
under π of (C ∩X[N ])(C) for some N ∈ Z+ where X[N ] is the kernel of multiplication
by N in the abelian scheme X. As it is clearly the case that C cannot contain infinitely
many torsion points on a fixed fiber (as, for instance, there are at most four points
in C on any fiber of π), Theorem 5.16 may be re-expressed as the assertion that the
set [
C(C) ∩ X[N ](C)
N ∈Z+

is finite.



The varieties X[N ] are special in the sense that they are subgroup schemes of X
and because dim(C) + dim(X[N ]) = 1 + 1 < 3 = dim(X), one expects C ∩ X[N ] to be
empty. The conjectures of Zilber-Pink type (note that I did not say “the Zilber-Pink
conjecture” as the experts have yet to settle on a final formulation) assert that if X is
a special variety and Y ⊆ X is a subvariety of dimension d not contained in a proper
special subvariery of X, then the set
Y ∩ Z
Z⊆X special
codimX (Z)<d

is not Zariski dense in Y . There is some ambiguity as to which subvarieties of our X,

obtained as the square of the Legendre family over the λ-line, should be considered as
special. One natural choice would be to regard any component of a subgroup scheme
to be special as well as any component of an algebraic subgroup of a fiber of X over a
CM-point. In any case, it is easy to see that Theorem 5.16 is a theorem of Zilber-Pink
Let us now sketch a proof of Theorem 5.16. Letting X e := h × C2 , we have a natural
analytic covering map π e
e : X → X(C). Here the map π takes the form
(τ, z1 , z2 ) 7→ (j2 (τ ), [℘(z1 , τ ) : ℘′ (z1 , τ ) : 1], [℘(z2 , τ ) : ℘′ (z2 , τ ) : 1])
where j2 : h → A1 (C) \ {0, 1} expresses A1 (C) \ {0, 1} as Γ0 (2)\h and ℘ is the
Weierstraß ℘-function. Of course, π(τ, z1 , z2 ) is a torsion point on Xj2 (τ ) if and only if
z1 ∈ Q + Qτ and z2 ∈ Q + Qτ . Identifying h × R4 with h × C2 via (τ, x1 , x2 , x3 , x4 ) 7→
(τ, x1 + τ x2 , x3 + τ x4 ), we see that a point (τ, x1 , x2 , x3 , x4 ) ∈ h × R4 is sent to a
torsion point in Xj2 (τ ) just in case xi ∈ Q for each i ≤ 4.
The definability in Ran,exp of the restriction of j2 to a fundamental domain follows
on similar grounds to the definability of j (restricted to a fundamental domain). For
fixed τ , we have already used the definability of (the restriction to a fundamental
domain) of the function z 7→ ℘(z, τ ). That the two variable function is definable
in Ran,exp was established by Peterzil and Starchenko [48]. Again, the reasoning is
similar to the case of the j-function. It is a classical result that, writing ∆ for the
open unit disk, there is a meromorphic function expressing the universal elliptic curve
over Y0 (2) as a quotient of ∆ × ∆. The function E : (τ, z) 7→ (exp(2πiτ ), exp(2πiz))
takes a fundamental domain ℘ into a compact subset of ∆ × ∆ and the function E
restricted to this fundamental domain is definable. Hence, the composite is definable.
Thus, upon restricting π e to some fundamental domain X we have that π := π e ↾ X is
definable and that relative to an appropriate choice of coordinates, the points mapping
to torsion points are those whose last coordinates are rational.
Let p : h × C2 → C2 be the natural projection map and consider C := pπ −1 C(C).
The set C is definable, being the projection of a definable set. Masser and Zannier
show that Calg = ∅ by invoking known results on the algebraic independence of theta
functions. Thus, one is left with the problem of showing that there are only finitely
many torsion points on C or equivalently that there are only finitely many rational
points on C.



One obtains the lower bounds on the size of Galois orbits of torsion points through
two theorems. First, as a consequence of work of David [14] and of Masser [42] on the
Galois action on
p the torsion points onpabelian varieties we may bound the order of
the points [2 : 2(2 − λ) : 1] and [3 : 6(3 − λ) : 1] by a function of the height of λ
and the degree of λ over Q.

p 5.19. – There ispa constant C so that for any algebraic number λ if [2 :
2(2 − λ) : 1] or [3 : 6(3 − λ) : 1] is torsion point of exact order n on the el-
liptic curve Eλ defined as a subvariety of P2 by the equation zy 2 = x(x − z)(x − λz),
then n ≤ c[Q(λ) : Q]2 (1 + h(λ)).

The second result is a consequence of Silverman’s specialization theorem [73].

Lemma 5.20. – There is a constant C ′ so that if either [2 :
p 2(2 − λ) : 1] or [3 :
6(3 − λ) : 1] is torsion on Eλ , then h(λ) ≤ C ′ .

p Lemmata 5.19 and p 5.20, we see that there is a constant D so that if
either [2 : 2(2 − λ) : 1] or [3 : 6(3 − λ) : 1] is torsion of exact order n on Eλ , then
[Q(λ) : Q] ≥ Dn 2 .
We use this conclusion to complete the argument. If there were infinitely many
torsion points on C, then we could find such torsion points ξ of arbitrarily high order
n. Any Galois conjugate of ξ would also have order n and lie on C, but from our above
observation we know that ξ has at least Dn 2 conjugates. The height of pπ −1 (ξ) (and of
each conjugate) is at most n. By uniform finiteness in the o-minimal structure Ran,exp
we see that there is a uniform finite bound B on the size of the sets π −1 C(C)∩(D×{a})
as a ranges through p(X). Thus, there are at least (D/B)n 2 points in C of height at
most n, contradicting our hypothesis that there are infinitely many torsion points
on C and thereby completing our sketch of the proof of Theorem 5.16.
One might ask whether a variant of the Masser-Zannier theorem holds for higher
dimensional families of abelian varieties. Habegger took up precisely that challenge
for the Weierstraß family of elliptic curves. For a pair of numbers (a, b), the equation
zy 2 = x3 + az 2 x + bz 3
cuts out an elliptic curve E(a,b) in P2 provided that 4a3 + 27b2 6= 0. From dimension
considerations, one sees that one must specify at least three abscissa values in order
to expect there to be only finitely many specializations for which all the points are
torsion. Habegger proves that this is in fact the case for the points with abscissa 1, 2
and 3 [29].

Theorem 5.21 (Habegger). – There are only finitely many pairs of complex numbers
(a, b) with 8a3 + 27b2 6= 0 for which the following three points are all torsion in E(a,b) :
√ √ √
[1 : 1 + a + b : 1], [2 : 8 + 2a + b : 1], and [3 : 27 + 3a + b : 1].



While the proof of Theorem 5.21 follows a similar strategy to that of Theorem 5.16,
there are some notable novelties. First, while Masser and Zannier could make do with
Pila’s theorem on counting rational points in subanalytic surfaces [52], the definable
sets implicated by Theorem 5.21 are complex surfaces, and, hence, four dimensional as
definable sets. Thus, the counting theorem for more general o-minimally definable sets
makes an essential appearance. Secondly, the transcendence results on theta functions
used to show that the definable sets appearing in the proof of Theorem 5.16 have
trivial algebraic parts are not strong enough to prove the corresponding theorem in
this case. Indeed, some related transcendence theorems of Bertrand [5] are used to
prove that certain curves have trivial algebraic parts. The counting theorem is then
applied in the refined form about the algebraic points being confined to blocks.

5.4. Unlikely intersections in Shimura varieties. – Several theorems along the lines of
the Zilber-Pink conjectures have been proven using the methods we have outlined.
Of these, the one having the most distinctive character is a theorem of Habegger and
Pila [30] on unlikely intersections in An .

Theorem 5.22 (Habegger, Pila). – Suppose that C ⊆ An is an algebraic curve which is

asymmetric in the sense that there is at most one pair i < j ≤ n of integers for which
deg(πi ↾ C) 6= deg(πj ↾ C) where πi : An → A1 (respectively, πj ) is the projection
onto the ith (respectively, j th ) coordinate. If C is not contained in a proper special
subvariety, then the following set is finite:
C(C) ∩ S(C).
S special

Remark 5.23. – The hypothesis that the curve is asymmetric is used in the proof, but
does not appear to be necessary.

The special subvarieties of codimension two in An are components of varieties

defined by two equations of the form ΦN (xi , xj ) = 0 where ΦN is the N th modular
polynomial and xk = ξ where ξ is a special point. Thus, one may convert the problem
of describing the intersection C with the codimension two special varieties to that of
the intersection of the preimage under the j-function (or, really, the function π : h →
An (C) which is given by the j-function coordinatewise) of C(C) with the geodesic
varieties in hn defined by two equations of the form γτi = τj or τk = ξ where γ ∈
PSL2 (Q) and ξ is quadratic imaginary. We do not repeat the work from [30], but will
rather simply note a couple of interesting points from the proof.
The key transcendence result they prove is dual to the Lindemann-Weierstraß
theorems appearing earlier, being a functional modular analog of Baker’s theorem on
linear forms in logarithms [4].



Theorem 5.24 (Habegger, Pila). – If γ : ∆ → hn is a nonconstant, analytic function

for which (j, . . . , j) ◦ γ : ∆ → An (C) is an algebraic function whose image is not
contained in any proper special subvariety, then the image of γ is Zariski dense.

The proof of Theorem 5.24 passes through an analysis of the monodromy of the
j-function. This theorem is used to show that it cannot happen that the preimage
of C(C) is contained in a weakly geodesic subvariety of hn . Thus the intersection of
the preimage of C(C) with any weakly geodesic variety is necessarily finite.
A second remarkable feature of the proof of Theorem 5.22 is that the refined count-
ing theorem on the number of blocks containing the algebraic points is required since
the definable sets in question naturally have the structure of homogeneous spaces for
algebraic groups and therefore are equal to their own algebraic parts.
Using similar methods, Pila and Tsimerman have generalized both the Ax-
Lindemann-Weierstraß theorem and Theorem 5.24 with an Ax-Schanuel-style
theorem for the j-function [60]. In fact, generalizing an earlier result of Pila [57]
strengthening the hyperbolic Ax-Lindemann-Weierstraß theorem to include a tran-
scendence statement for the derivatives of j, the hyperbolic Ax-Schanuel theorem
also takes into account the derivatives of the j-function.

5.5. Further results and prospects. – Other theorems in the vein of the Zilber-Pink
conjectures have been proven using the Pila-Zannier strategy. Shortly after the strat-
egy became widely known, several results were obtained. Peterzil and Starchenko
reproved the Manin-Mumford conjecture for semiabelian varieties using essentially
the methods we have described [49]. Daw and Yafaev proved the André-Oort conjec-
ture for Hilbert modular surfaces [15] and Pila and Tsimerman proved the André-Oort
conjecture for the moduli space of principally polarized abelian surfaces [58].
It is not unreasonable to hope that these methods may be extended to give an un-
conditional proof of the André-Oort conjecture for all Shimura varieties, and, in fact,
the strategy has been carried out for, arguably, the most important class of Shimura
varieties: the coarse moduli spaces A g of principally polarized abelian varieties of
dimension g for g ∈ Z+ .
Peterzil and Starchenko established definability in Ran,exp of the relevant covering
maps. Pila and Tsimerman proved the Ax-Lindemann-Weierstraß theorem for A g
in [59], noting at the time that the André-Oort conjecture for A g had thereby been
reduced to the problem of proving suitable lower bounds on the size of Galois orbits
of special points. Tsimerman completed the proof [78] by making use of the aver-
age Colmez conjecture proven by two separate groups of mathematicians, Andreatta,
Goren, Howard and Madapusi-Pera [2], and Yuan and Zhang [90].
There are no obvious obstructions to extending this method to prove the André-
Oort conjecture for general Shimura varieties. Ullmo presented a detailed proof schema
for the André-Oort conjecture in [79]. He shows that once one has established the o-
minimal definability of the covering maps and the Ax-Lindemann-Weierstraß theorem,
then a weak form of the André-Oort conjecture follows. That is, if S is a Shimura



variety, Y ( S is an irreducible subvariety which is not expressible as S ′ × Y ′ where

S is realizable as S ′ × S ′′ with S ′ and S ′′ Shimura subvarieties and Y ′ ⊆ S ′′ , then the
union of all positive dimensional special subvarieties of Y is not Zariski dense in Y .
Klingler, Ullmo and Yafaev have established the definability in Ran,exp of all of the
relevant covering maps when restricted to suitable fundamental domains as well as
the appropriate analog of the Ax-Lindemann-Weierstraß theorem for all arithmetic
varieties, that is, varieties whose complex points may be expressed in the form Γ\X
where X is Hermitian domain and Γ is an arithmetic group, and in particular, for
all Shimura varieties [35]. The proofs in [35] follow the general form of Pila’s more
concrete version of the hyperbolic Ax-Lindemann-Weierstraß theorem, but the more
general form requires more intrinsic, geometric arguments. Whereas the definability
of the j-function was deduced from an explicit computation (as is the definability of
the covering maps for A g in [50]) as are the relations between heights and hyperbolic
distances, such explicit formulae are unavailable in general.
In related work, Ullmo and Yafaev have characterized the weakly special subvari-
eties of Shimura varieties as exactly those varieties for which each complex analytic ir-
reducible component of its preimage under the natural covering map is algebraic [80].
Yafaev has given an alternative characterization of weakly special varieties [87]: If
π : X → S(C) is the map expressing the Shimura variety S as a quotient of the Her-
mitian domain X by the action of an arithmetic group, then a subvariety Y ⊆ S is
weakly special if and only if each component of π −1 Y (C) is definable in some o-
minimal expansion of R.
The problem of producing the requisite lower bounds on the sizes of Galois orbits in
general is still open, but under the assumption of the Generalized Riemann Hypothe-
sis, Ullmo and Yafaev have shown that polynomial lower bounds hold for all Shimura
varieties [81]. This result on the Galois orbits of special points plays an important
rôle in the proof by Klingler and Yafaev of the André-Oort conjecture conditionally
upon GRH [36]. On the other hand, the necessary upper bounds on the heights of
pre-special points have been established by Daw and Orr [?]. Thus, to complete the
proof of the André-Oort conjecture using this strategy, it remains to prove polynomial
lower bounds on the size of Galois orbits of special points.
As we have seen with the test cases of simultaneous torsion and curves in products
of the j-line, the Pila-Zannier method is well-suited to studying Zilber-Pink-style
problems on anomalous intersections with special varieties. More generally, the use
of Theorem 5.24 in the proof of an Ax-Schanuel theorem for the j-function, suggests
that a an Ax-Schanuel theorem for all arithmetic varieties will be useful in attacking
Zilber-Pink-type conjectures.
Orr has employed this method to prove some instances of the André-Pink conjec-
ture, a restriction of the Zilber-Pink conjectures [46, 47]. The André-Pink conjecture
predicts that if S is a Shimura variety, Σ ⊆ S(C) is the (generalized) Hecke orbit of
some point, and Y ⊆ S is an irreducible subvariety for which Σ∩Y (C) is Zariski dense
in Y , then Y must be a weakly special variety. Orr has verified this conjecture in the
case that S is a Shimura variety of abelian type and Y is a curve. More generally, he



has shown that unless Y is a point, it must take the form S ′ × Y ′ where S ′ and S ′′ are
Shimura varieties, dim S ′ > 0, S ′ × S ′′ ֒→ S is a weakly special subvariety of S, and
Y ′ ⊆ S ′′ is a subvariety of S ′′ . One might expect that by passing to a quotient or to
a smaller ambient Shimura variety, the argument could be completed by induction.
However, there are some complications in implementing this strategy. First, the pre-
sentation of S ′ × S ′′ as a product may be incompatible with the structure of S as a
Shimura variety. Secondly, one cannot simply replace S with S0 , the smallest Shimura
subvariety of S containing Y , because it may happen that S0 ∩ Σ decomposes into
infinitely many generalized Hecke orbits in S0 . Orr deals successfully with the first
difficulty, but the second obstruction remains.
Generalizing both the André-Oort and André-Pink conjectures, Gao has imple-
mented the Pila-Zannier strategy for mixed Shimura varieties [23]. Specifically, he has
established the Ax-Lindemann-Weierstraß theorem for mixed Shimura varieties [26]
and has shown that the generalization of the André-Oort conjecture for mixed Shimura
varieties follows from the existence of suitable lower bounds on the size of Galois or-
bits of special points on the associated pure Shimura varieties [24]. Specializing to the
case of universal abelian schemes over fine moduli spaces, Gao proves a generalization
of Orr’s theorem describing those subvarieties which meet a generalized Hecke orbit
in a Zariski dense set [25].
Even after this flurry of activity, there remain many cases of the Zilber-Pink con-
jecture to which the Pila-Zannier strategy should apply. Methods from o-minimal ge-
ometry have become important tools in diophantine geometry. I expect that in time
several further theorems towards the Zilber-Pink conjectures and related problems
will be proven following these ideas.

[1] S. A. Amitsur – “On the characteristic polynomial of a sum of matrices”, Linear and
Multilinear Algebra 8 (1979/80), p. 177–182.
[2] F. Andreatta, E. Z. Goren, B. Howard & K. Madapusi-Pera – “Faltings heights
of abelian varieties with complex multiplication”, preprint arXiv:1508.00178.
[3] J. Ax – “On Schanuel’s conjectures”, Ann. of Math. 93 (1971), p. 252–268.
[4] A. Baker – “Linear forms in the logarithms of algebraic numbers. I, II, III”, Mathe-
matika 13 (1966), 204-216; ibid. 14 (1967), 102-107; ibid. 14 (1967), p. 220–228.
[5] D. Bertrand – “Extensions de D-modules et groupes de Galois différentiels”, in p-
adic analysis (Trento, 1989), Lecture Notes in Math., vol. 1454, Springer, Berlin, 1990,
p. 125–141.
[6] D. Bertrand & A. Pillay – “A Lindemann-Weierstrass theorem for semi-abelian
varieties over function fields”, J. Amer. Math. Soc. 23 (2010), p. 491–533.
[7] E. Bierstone & P. D. Milman – “Semianalytic and subanalytic sets”, Publ. Math.
IHÉS 67 (1988), p. 5–42.
[8] E. Bombieri & J. Pila – “The number of integral points on arcs and ovals”, Duke
Math. J. 59 (1989), p. 337–357.



[9] W. D. Brownawell & K. K. Kubota – “The algebraic independence of Weierstrass

functions and some related numbers”, Acta Arith. 33 (1977), p. 111–149.
[10] L. Butler – “The density of algebraic points in sets definable in o-minimal structures”,
Ph.D. Thesis, University of Bristol, 2012.
[11] A. Chambert-Loir & F. Loeser – “A non-archimedean Ax-Lindemann theorem”,
preprint arXiv:1511.03259.
[12] R. Cluckers, G. Comte & F. Loeser – “Non-Archimedean Yomdin-Gromov
parametrizations and points of bounded height”, Forum Math. Pi 3 (2015), e5, 60.
[13] R. F. Coleman – “On a stronger version of the Schanuel-Ax theorem”, Amer. J. Math.
102 (1980), p. 595–624.
[14] S. David – “Points de petite hauteur sur les courbes elliptiques”, J. Number Theory 64
(1997), p. 104–129.
[15] C. Daw & A. Yafaev – “An unconditional proof of the André-Oort conjecture for
Hilbert modular surfaces”, Manuscripta Math. 135 (2011), p. 263–271.
[16] J. Denef & L. van den Dries – “p-adic and real subanalytic sets”, Ann. of Math.
128 (1988), p. 79–138.
[17] L. van den Dries – “Remarks on Tarski’s problem concerning (R, +, ·, exp)”, in Logic
colloquium ’82 (Florence, 1982), Stud. Logic Found. Math., vol. 112, North-Holland,
Amsterdam, 1984, p. 97–121.
[18] , “A generalization of the Tarski-Seidenberg theorem, and some nondefinability
results”, Bull. Amer. Math. Soc. (N.S.) 15 (1986), p. 189–193.
[19] , Tame topology and o-minimal structures, London Mathematical Society Lec-
ture Note Series, vol. 248, Cambridge Univ. Press, Cambridge, 1998.
[20] L. van den Dries, A. Macintyre & D. Marker – “The elementary theory of
restricted analytic fields with exponentiation”, Ann. of Math. 140 (1994), p. 183–205.
[21] L. van den Dries & C. Miller – “On the real exponential field with restricted
analytic functions”, Israel J. Math. 85 (1994), p. 19–56.
[22] A. M. Gabrièlov – “Projections of semianalytic sets”, Funkcional. Anal. i Priložen.
2 (1968), p. 18–30.
[23] Z. Gao – “The mixed Ax-Lindemann theorem and its applications to the Zilber-Pink
conjecture”, Ph.D. Thesis, Université Paris-Sud and Universiteit Leiden, 2014.
[24] , “About the mixed André-Oort conjecture: reduction to a lower bound for
the pure case”, preprint http://webusers2.imj-prg.fr/~ziyang.gao/ziyang_gao_
en.html, 2015.
[25] , “A special point problem of André-Pink-Zannier in the universal family of
abelian varieties”, Annali della Scuola Normale Superiore di Pisa (2015), doi:10.2422/
[26] , “Towards the André-Oort conjecture for mixed Shimura varieties: the Ax-
Lindemann theorem and lower bounds for Galois orbits of special points”, J. reine
angew. Math. (2015), doi://10.1515/crelle-2014-0127.
[27] K. Gödel – “Die Vollständigkeit der Axiome des logischen Funktionenkalküls”,
Monatsh. Math. Phys. 37 (1930), p. 349–360.
[28] M. Gromov – “Entropy, homology and semialgebraic geometry”, Séminaire Bourbaki,
vol. 1985/1986, exposé no 663, Astérisque 145-146 (1987), p. 225–240.



[29] P. Habegger – “Torsion points on elliptic curves in Weierstrass form”, Ann. Sc. Norm.
Super. Pisa Cl. Sci. 12 (2013), p. 687–715.
[30] P. Habegger & J. Pila – “Some unlikely intersections beyond André-Oort”, Compos.
Math. 148 (2012), p. 1–27.
[31] G. O. Jones & M. E. M. Thomas – “The density of algebraic points on certain
Pfaffian surfaces”, Q. J. Math. 63 (2012), p. 637–651.
[32] A. G. Khovanskiı̆ – Fewnomials, Translations of Mathematical Monographs, vol. 88,
Amer. Math. Soc., Providence, RI, 1991.
[33] J. Kirby – “Corrigendum to “A Schanuel condition for Weierstrass equations” ”, J. Sym-
bolic Logic 70 (2005), p. 1023.
[34] , “A Schanuel condition for Weierstrass equations”, J. Symbolic Logic 70 (2005),
p. 631–638.
[35] B. Klinger, E. Ullmo & A. Yafaev – “The hyperbolic Ax-Lindemann-Weierstraß
conjecture”, Publ. math. de l’IHÉS 123 (2016), p. 333–360.
[36] B. Klingler & A. Yafaev – “The André-Oort conjecture”, Ann. of Math. 180 (2014),
p. 867–925.
[37] J. F. Knight, A. Pillay & C. Steinhorn – “Definable sets in ordered structures.
II”, Trans. Amer. Math. Soc. 295 (1986), p. 593–605.
[38] J. Ł oś – “The algebraic treatment of the methodology of elementary deductive sys-
tems”, Studia Logica 2 (1955), p. 151–212.
[39] S. Lang – Number theory. III, Encyclopaedia of Math. Sciences, vol. 60, Springer,
Berlin, 1991.
[40] F. Lindemann – “Ueber die Zahl π”, Math. Ann. 20 (1882), p. 213–225.
[41] D. Marker – “Model theory for algebra and algebraic geometry”, lectures at Orsay
http://homepages.math.uic.edu/~marker/orsay/, 2010.
[42] D. W. Masser – “Small values of the quadratic part of the Néron-Tate height on an
abelian variety”, Compositio Math. 53 (1984), p. 153–170.
[43] D. W. Masser & U. Zannier – “Torsion anomalous points and families of elliptic
curves”, Amer. J. Math. 132 (2010), p. 1677–1691.
[44] , “Torsion points on families of squares of elliptic curves”, Math. Ann. 352 (2012),
p. 453–484.
[45] D. Masser & U. Zannier – “Torsion anomalous points and families of elliptic curves”,
C. R. Math. Acad. Sci. Paris 346 (2008), p. 491–494.
[46] M. Orr – “La conjecture d’André-Pink : Orbites de Hecke et sous-variétés faiblement
spéciales”, thèse de doctorat, Université Paris-Sud, 2013.
[47] , “Families of abelian varieties with many isogenous fibres”, J. reine angew. Math.
705 (2015), p. 211–231.
[48] Y. Peterzil & S. Starchenko – “Uniform definability of the Weierstrass ℘ functions
and generalized tori of dimension one”, Selecta Math. (N.S.) 10 (2004), p. 525–550.
[49] , “Around Pila-Zannier: the semiabelian case”, preprint, 2009.
[50] , “Definability of restricted theta functions and families of abelian varieties”,
Duke Math. J. 162 (2013), p. 731–765.
[51] J. Pila – “Density of integral and rational points on varieties”, Astérisque 228 (1995),
p. 4, 183–187, Columbia University Number Theory Seminar (New York, 1992).



[52] , “Integer points on the dilation of a subanalytic surface”, Q. J. Math. 55 (2004),

p. 207–223.
[53] , “Rational points on a subanalytic surface”, Ann. Inst. Fourier (Grenoble) 55
(2005), p. 1501–1516.
[54] , “The density of rational points on a Pfaff curve”, Ann. Fac. Sci. Toulouse Math.
16 (2007), p. 635–645.
[55] , “On the algebraic points of a definable set”, Selecta Math. (N.S.) 15 (2009),
p. 151–170.
[56] , “O-minimality and the André-Oort conjecture for Cn ”, Ann. of Math. 173
(2011), p. 1779–1840.
[57] , “Modular Ax-Lindemann-Weierstrass with derivatives”, Notre Dame J. Form.
Log. 54 (2013), p. 553–565.
[58] J. Pila & J. Tsimerman – “The André-Oort conjecture for the moduli space of abelian
surfaces”, Compos. Math. 149 (2013), p. 204–216.
[59] , “Ax-Lindemann for A g ”, Ann. of Math. 179 (2014), p. 659–681.
[60] , “Ax-Schanuel for the j-function”, Duke Math. J. 165 (2016), p. 2587–2605.
[61] J. Pila & A. J. Wilkie – “The rational points of a definable set”, Duke Math. J. 133
(2006), p. 591–616.
[62] J. Pila & U. Zannier – “Rational points in periodic analytic sets and the Manin-
Mumford conjecture”, Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 19 (2008),
p. 149–162.
[63] A. Pillay & C. Steinhorn – “Definable sets in ordered structures. I”, Trans. Amer.
Math. Soc. 295 (1986), p. 565–592.
[64] , “Definable sets in ordered structures. III”, Trans. Amer. Math. Soc. 309 (1988),
p. 469–476.
[65] R. Pink – “A combination of the conjectures of Mordell-Lang and André-Oort”, in
Geometric methods in algebra and number theory, Progr. Math., vol. 235, Birkhäuser,
2005, p. 251–282.
[66] M. Raynaud – “Sous-variétés d’une variété abélienne et points de torsion”, in Arith-
metic and geometry, Vol. I, Progr. Math., vol. 35, Birkhäuser, 1983, p. 327–352.
[67] C. Reutenauer & M.-P. Schützenberger – “A formula for the determinant of a
sum of matrices”, Lett. Math. Phys. 13 (1987), p. 299–302.
[68] J.-P. Rolin, P. Speissegger & A. J. Wilkie – “Quasianalytic Denjoy-Carleman
classes and o-minimality”, J. Amer. Math. Soc. 16 (2003), p. 751–777.
[69] T. Scanlon – “A Euclidean Skolem-Mahler-Lech-Chabauty method”, Math. Res. Lett.
18 (2011), p. 833–842.
[70] , “The André-Oort conjecture via o-minimality (after J. Pila, A. Wilkie, and U.
Zannier)”, Séminaire Bourbaki. vol. 2010/2011, exp. no 1037, Astérisque 348 (2012).
[71] , “Counting special points: logic, Diophantine geometry, and transcendence
theory”, Bull. Amer. Math. Soc. (N.S.) 49 (2012), p. 51–71.
[72] C. L. Siegel – “Über die Classenzahl quadratischer Zahlkörper”, Acta Arith. 1 (1935),
p. 83–86.
[73] J. H. Silverman – “Heights and the specialization map for families of abelian varieties”,
J. reine angew. Math. 342 (1983), p. 197–211.



[74] P. Speissegger – “The Pfaffian closure of an o-minimal structure”, J. reine angew.

Math. 508 (1999), p. 189–211.
[75] M. Stoll – “Simultaneous torsion in the Legendre family”, preprint arXiv:1410.7070.
[76] A. Tarski – A Decision Method for Elementary Algebra and Geometry, RAND Cor-
poration, Santa Monica, Calif., 1948.
[77] M. E. M. Thomas – “Convergence results for function spaces over o-minimal struc-
tures”, J. Log. Anal. 4 (2012), Paper 1, 14.
[78] J. Tsimerman – “A proof of the André-Oort conjecture for A g ”, preprint
[79] E. Ullmo – “Applications du théorème d’Ax-Lindemann hyperbolique”, Compos. Math.
150 (2014), p. 175–190.
[80] E. Ullmo & A. Yafaev – “A characterization of special subvarieties”, Mathematika
57 (2011), p. 263–273.
[81] , “Galois orbits and equidistribution of special subvarieties: towards the André-
Oort conjecture”, Ann. of Math. 180 (2014), p. 823–865.
[82] , “Hyperbolic Ax-Lindemann theorem in the cocompact case”, Duke Math. J.
163 (2014), p. 433–463.
[83] C. Weierstraß – “Zu Lindemanns Abhandlung: “Über die Ludolph’sche Zahl” ”, Berl.
Ber. (1885), p. 1067–1086.
[84] A. J. Wilkie – “Model completeness results for expansions of the ordered field of real
numbers by restricted Pfaffian functions and the exponential function”, J. Amer. Math.
Soc. 9 (1996), p. 1051–1094.
[85] , “Diophantine properties of sets definable in o-minimal structures”, J. Symbolic
Logic 69 (2004), p. 851–861.
[86] , “o-minimal structures”, Séminaire Bourbaki, vol. 2007/2008, exposé no 985,
Astérisque 326 (2009), p. 131–142.
[87] A. Yafaev – “An o-minimal characterization of special subvarieties”, Bull. Lond. Math.
Soc. 46 (2014), p. 732–736.
[88] Y. Yomdin – “C k -resolution of semialgebraic mappings. Addendum to: “Volume growth
and entropy” ”, Israel J. Math. 57 (1987), p. 301–317.
[89] , “Volume growth and entropy”, Israel J. Math. 57 (1987), p. 285–300.
[90] X. Yuan & S.-W. Zhang – “On the averaged Colmez conjecture”, preprint

Thomas Scanlon, Department of Mathematics, University of California, Berkeley, Evans Hall,

Berkeley, CA 94720-3840, USA • E-mail : scanlon@math.berkeley.edu


Panoramas & Synthèses
52, 2017, p. 167–242



Philipp Habegger

Abstract. – Let X be an irreducible closed subvariety defined over Q of the algebraic

torus Gn m . We give an overview on what is known on upper bounds for the height
when intersecting X with an algebraic subgroup of Gn m that has dimension n−dim X.
Early general results in this directy were obtained by Bombieri-Zannier if X is a
hypersurface and Bombieri-Masser-Zannier if X is a curve. Such height bounds are
useful in the context of the Zilber-Pink Conjecture. The author proved a height bound
for X of arbitrary dimension in 2009. In this paper we give an effective and explicit
height upper bound.
Résumé (Bornes effectives pour la hauteur sur les tores algébriques). – Soit X une sous-
variété fermée, irréductible, définie sur Q, dans le tore algébrique Gn m . Nous donnons
un survol des majorations de la hauteur d’un point de X, qui est contenu dans un
sous-groupe algébrique de dimension n − dim X. Les premiers résultats dans cette
direction ont été obtenus par Bombieri-Zannier, dans le cas où X est une hypersurface,
et par Bombieri-Masser-Zannier quand X est une courbe. Les majorations de ce type
sont utiles pour résoudre quelques cas de la conjecture de Zilber-Pink. L’auteur a
démontré une borne pour la hauteur, quand X est de dimension quelconque, en 2009.
Nous explicitons ici une majoration effective.

0. Introduction

The main emphasis of this article is on attaining height upper bounds in the con-
text of Boris Zilber and Richard Pink’s conjectures. These open problems are often
subsumed under the name of Zilber-Pink Conjecture. In the first section we briefly
recount the development of the previous years while concentrating on situation in
the algebraic torus. In Sections 2 through 10 we state and prove an effective and
completely explicit version of the Bounded Height Conjecture, proved originally by

2010 Mathematics Subject Classification. – 11G50; 14K15, 14G40, 14J20, 14T05.

Key words and phrases. – Heights, subvarieties of the algebraic torus, explicit bounds, unlikely inter-
sections, algebraic subgroups, tropical geometry.

© Panoramas et Synthèses 52, SMF 2017


the author [31]. We use, among other things, a recent result of Sturmfels and Tevelev
from Tropical Geometry.
The first appendix gives a short overview of known results in the abelian case
of abelian varieties. The second appendix contains a few height bounds in Shimura

1. A Brief Historical Overview in the Toric Setting

In 1999, Bombieri, Masser, and Zannier proved the following result for curves inside
the algebraic torus Gnm . By coset we mean the translate of an algebraic subgroup of
the ambient group variety.

Theorem 1 (Bombieri, Masser, and Zannier [9]). – Let C be an irreducible algebraic

curve inside Gnm and defined over Q, an algebraic closure of Q. Suppose that C is
not contained in a proper coset, that is the translate of a proper algebraic subgroup.
Then the height of points on C that are contained in a proper algebraic subgroup is
bounded from above uniformly.

The adjective uniformly refers to the fact that the bound for the height does not
depend on the algebraic subgroup. It may and will depend on the curve C. Algebraic
subgroups of the algebraic torus Gnm are classified by subgroups of Zn , see Chapter 3.2
[7]. The difficulty in proving Bombieri, Masser, and Zannier’s theorem arises from the
fact that Gnm has infinitely many connected algebraic subgroups of codimension 2.
Typically, C contains infinitely many points that are on a proper algebraic sub-
group. After combining the height upper bound from Theorem 1 with a height lower
bound due to Amoroso and David [1] in the spirit of Lehmer’s problem, the authors
obtained the following finiteness statement.

Theorem 2 (Bombieri, Masser, and Zannier [9]). – Let C be as in Theorem 1. There are
only finitely many points on C that are contained in an algebraic subgroup of codi-
mension at least 2.

This finiteness result is a special case, in dimension one, of a conjecture formu-

lated by Boris Zilber [70] a few years later. His original conjecture, sometimes called
the Conjecture on Intersection with Tori or short CIT, is a stronger version of the
following conjecture.

Conjecture 1. – Let X be an irreducible closed subvariety of Gnm defined over C. We

suppose that X is not contained in a proper algebraic subgroup of Gnm . Then the set of
points on X that are contained in the union of all algebraic subgroups of codimension
at least 1 + dim X is not Zariski dense in X.



Points considered in this conjecture are in the intersection of a variety and a sub-
group whose codimension is too small to expect non-empty intersection. Such inter-
sections are deemed unlikely but are certainly not impossible. In fact, Zilber’s full
conjecture governs also subvarieties of X that are contained in a surprisingly small
algebraic subgroup. It is also expected to hold for the wider class of semi-abelian
varieties, which includes algebraic tori and abelian varieties. Finally, Pink [49, 48] has
proposed a related conjecture for mixed Shimura varieties which implies the André-
Oort Conjecture. It also contains Conjecture 1 above; many conjectures in this setting
are sometimes called Zilber-Pink Conjecture.

Example. – We exemplify the situation on the example of a line in G3m . The line is
parametrized by
(1.1) (αt + α′ , βt + β ′ , γt + γ ′ )
with α, β, γ, α′ , β ′ , γ ′ ∈ Q fixed. To guarantee that our line is not contained in a
proper coset of G3m we ask that
α′ β ′ γ ′
αβγ 6= 0 and , , are pair-wise distinct.
α β γ
Theorem 1 implies that there is a constant B with the following property. Suppose
t ∈ Q such that no coordinate of (1.1) vanishes and such that there exist (a, b, c) ∈ Z3
(1.2) (αt + α′ )a (βt + β ′ )b (γt + γ ′ )c = 1
then the height of t is at most B.
The exponent vector (a, b, c) is allowed to vary in (1.2). It determines a proper
algebraic subgroup of G3m . Conversely, any such subgroup arises in this way.
In order to obtain finiteness of the set of t as in the second result of Bombieri,
Masser, and Zannier we must impose a second condition. More precisely, there are
only finitely many t with (1.2) such that there is (a′ , b′ , c′ ) ∈ Z3 linearly independent
of (a, b, c) with
′ ′ ′
(αt + α′ )a (βt + β ′ )b (γt + γ ′ )c = 1.
The two monomial equations determined by (a, b, c) and (a′ , b′ , c′ ) define an alge-
braic subgroup of G3m of codimension 2.

Bombieri, Masser, and Zannier [9] remarked that any curve contained in a proper
coset invariably leads to unbounded height. So this condition cannot be dropped from
their theorem. On the other hand, it remained unclear if the restriction was necessary
in order to achieve finiteness in the situation of unlikely intersections. The authors
posed the following question.

Question 1. – Suppose C ⊂ Gnm is an irreducible algebraic curve defined over Q that

is not contained in a proper algebraic subgroup. Is the set of points on C that are
contained in an algebraic subgroup of codimension 2 finite?



First progress was made in 2006 when the same group of authors obtained a partial
answer by making a detour to surfaces if n = 5.

Theorem 3 (Bombieri, Masser, and Zannier [10]). – Suppose n ≤ 5. Let C be an irre-

ducible algebraic curve inside Gnm and defined over Q. Suppose that C is not contained
in a proper algebraic subgroup. There are only finitely many points on C that are con-
tained in an algebraic subgroup of codimension at least 2.

In the most interesting case n = 5 they constructed an algebraic surface S ⊂ G3m

derived from the curve. In order to answer their question for C, a bounded height
result akin to Theorem 1 was needed for points on S lying in an algebraic subgroup of
codimension dim S = 2, i.e., of dimension 1. Luckily, height bounds on the intersection
of a fixed variety with varying one dimensional algebraic subgroups were known to
follow from earlier work of Bombieri and Zannier.

Theorem 4 (Bombieri and Zannier [68]). – Suppose X ⊂ Gnm is an irreducible alge-

braic subvariety defined over Q. Let X o be the complement in X of the union of
all cosets of positive dimension that are contained in X. Then the height of points
on X o that are contained in an algebraic subgroup of dimension at most 1 is uni-
formly bounded.

The construction for S used by the three authors works for n > 5 too and always
yields a surface in some Gnm . However, recovering (3) for n > 5 would require a height
bound on the intersection of S with algebraic subgroups of dimension greater than
one. Thus Theorem 4 is no longer applicable.
One interesting aspect of Theorem 3 is that its proof is effective, provided an effec-
tive height bound in Theorem 4 is available. The author [29] proved a generalization
of Theorem 4 that is effective and completely explicit. The height bound for the points
considered in Theorem 4 depended on n and the degree and height of X.
In 2008, and using a different approach, Maurin gave a positive answer to Ques-
tion 1 for all n.

Theorem 5 (Maurin [39]). – Let C be an irreducible algebraic curve inside Gnm and
defined over Q. Suppose that C is not contained in a proper algebraic subgroup. There
are only finitely many points on C that are contained in an algebraic subgroup of
codimension at least 2.

Maurin first proves that the height is bounded from above. But his method differed
substantially from the one used in the proofs of Theorems 1 and 3. It relied on
generalization of Vojta’s inequality by Rémond [52] which accounts for the varying
algebraic subgroups. The original Vojta inequality appeared prominently in a proof
of Faltings’ Theorem, the Mordell Conjecture.
Maurin’s Theorem holds for curves defined over Q. But its statement makes no
reference to algebraic numbers. Having it at their disposal Bombieri, Masser, and
Zannier applied specialization techniques to obtain the following result.



Theorem 6 (Bombieri, Masser, and Zannier [13]). – Let C be an irreducible algebraic

curve inside Gnm and defined over C. Suppose that C is not contained in a proper
algebraic subgroup. There are only finitely many points on C that are contained in an
algebraic subgroup of codimension at least 2.

For curves this theorem implies Conjecture 1. It also resolves, in the case of
curves, the related Torsion Finiteness Conjecture stated by Bombieri, Masser, and
Zannier [11].
In the mean time, progress was being made on boundedness of height for surfaces
by Bombieri, Masser, and Zannier. Their result requires the definition of a Zariski
open subset X oa of an irreducible closed subvariety X ⊂ Gnm , where boundedness of
height is expected to hold. We will give a proper definition further down near (2.1).
Roughly speaking, one must remove from X subvarieties that lie in an exceptionally
small coset. Deducing Zariski openness from the definition requires work.
If C is a curve then C oa = C if and only if C is not contained in a proper coset.
Otherwise, we will have C oa = ∅. So Theorem 1 can be reformulated succinctly as
follows. Say C ⊂ Gnm is an irreducible algebraic curve defined over Q. Then any point
on C oa contained in a proper algebraic subgroup has height bounded from above

Theorem 7 (Bombieri, Masser, and Zannier [12]). – Let P be a plane inside Gnm and
defined over Q. Then P oa is Zariski open in P . The height of points on P oa that
are contained in a algebraic subgroup of codimension at least 2 is bounded from above

For X of dimension strictly greater than 1 the subset X oa cannot be described as

easily as for curves. Their complete result also contains a precise description of P oa
and in particular a necessary and sufficienty condition for P oa 6= ∅.
These three authors expected boundedness of height to hold for general subvari-
eties of Gnm and thus formulated the Bounded Height Conjecture [11]. By heuristic
observations a height bound can only hold if the sum of the dimensions of the fixed
variety and the algebraic subgroup is at most n. In other words, one must intersect
with algebraic subgroups whose codimension is at least dim X.
For arbitrary X, the following result of Bombieri, Masser, and Zannier controls X oa .

Theorem 8 (Bombieri, Masser, and Zannier [11]). – Let X ⊂ Gnm be an irreducible

closed subvariety defined over C. Then X oa is Zariski open in X.

In fact they prove a stronger structure theorem for X oa .

Later in 2009, the author showed boundedness of height for arbitrary subvarieties
of Gnm .

Theorem 9 ([31]). – Let X ⊂ Gnm be an irreducible closed subvariety defined over Q.

The height of points on X oa that are contained in an algebraic subgroup of codimension
at least dim X is bounded from above uniformly.



This height bound is now sufficiently general to prove height bounds on surfaces
arising from the strategy devised by Bombieri, Masser, and Zannier in their proof of
Theorem 3. In joint work with this group, the author gave a new proof of Maurin’s
Theorem [8]. All arguments in this proof were effective except for the step invoking
Theorem 9 for a surface.
The purpose of this article is to provide an effective and fully explicit version of
Theorem 9. We will state the revelant result in the next section. In combination with
the methods presented in [8] we obtain an effective version of Maurin’s Theorem.
In more recent work, Maurin obtained a height bound when the algebraic subgroups
in question have codimension at least 1 + dim X but are enlarged by a subgroup of
finite type.

Theorem 10 (Maurin [40]). – Let X ⊂ Gnm be an irreducible closed subvariety defined

over Q and let Γ ⊂ Gnm (Q) be the division closure of a finitely generated subgroup.
The set of points ab ∈ X oa with a ∈ Γ and b in an algebraic subgroup of codimension
at least 1 + dim X has uniformly bounded height.

From this height bound, he is able to deduce the following theorem.

Theorem 11 (Maurin [40]). – Let X ⊂ Gnm be an irreducible closed subvariety defined

over Q and let Γ ⊂ Gnm (Q) be the division closure of a finitely generated subgroup.
Suppose X oa 6= ∅. The set of points ab ∈ X oa with a ∈ Γ and b in an algebraic
subgroup of codimension at least 1 + dim X is not Zariski dense in X.

After writing this paper, but before it went to press, Bays and the author [5] used
a height inequality of Rémond [51] to prove a weak version of Conjecture 1 for a class
of surfaces X for which X oa = ∅.
To attack the full conjecture when X oa = ∅ requires more powerful height upper
bounds. One interesting advance in this direction was made by Amoroso, Masser, and
Zannier [2].
Finally, we remark that the direct analog of the height bounds in Theorems 1,
4 or 9 fail in the additive group Gna . Indeed, any point in Gna generates by scalar
multiplication a one dimensional subgroup. So being contain in a one dimensional
subgroup does not pose a restriction. However, a weak height bound exists when re-
stricting to a certain class of algebraic subgroups of Gnm ×Gna . This was demonstrated
by Bainbridge, Möller, and the author [4] with applications to algebraically primitive
Teichmüller curves in the moduli space of genus 3 curves.

Acknowledgments. – I would like to thank Eric Katz for pointing me towards Sturm-
fels and Tevelev’s work. I am also grateful to Jenia Tevelev for answering tropically
related questions and to Sam Payne for providing useful comments regarding the ex-
ample in Section 8. Finally, it is my pleasure to thank Gaël Rémond and Emmanuel
Ullmo for organizing the 2011 workshop at the CIRM in Luminy and providing a
stimulating atmosphere for a broad range of researchers.



2. An Effective Height Bound

In order to state the explicit version of the Bounded Height Conjecture we define
X oa for an irreducible closed subvariety X ⊂ Gnm defined over C following Bombieri,
Masser, and Zannier [11, 13].
Let s ≥ 0 be an integer. An irreducible closed subvariety Z ⊂ X is called s-anoma-
lous if there exists a coset H ⊂ Gnm containing Z such that
dim Z ≥ max{1, s + dim H − n + 1}.
If s = dim X then Z is called anomalous. We define X oa,[s] to be the complement
in X of the union of all s-anomalous subvarieties of X. Furthermore, we define
(2.1) X oa = X oa,[dim X] .
Any s-anomalous subvariety Z of X clearly satisfies dim Z ≤ dim H with H the
coset from the definition. Therefore, dim H ≥ s+dim H −n+1 which implies s ≤ n−1.
This implies X oa,[n] = X.
The largest interesting value for s is thus n−1. A subvariety of X is (n−1)-anoma-
lous if and only if it is a connected coset. Hence X oa,[n−1] = X o .
On the other hand, if X is positive dimensional and if s ≤ dim X − 1, then taking
H = Gnm we find that X is s-anomalous in X. In this case we have X oa,[s] = ∅.
As the X oa,[s] become larger as s increases, the discussion above yields
∅ = X oa,[0] = · · · = X oa,[dim X−1] ⊂ X oa,[dim X] ⊂ · · · ⊂ X oa,[n−1] = X o ⊂ X oa,[n] = X
if dim X ≥ 1.
We also set [
(Gnm ) = H(Q)
H⊂Gn m
codim H≥s

where the union is over all algebraic subgroups H of Gnm that have codimension at
least s. We remark that all algebraic subgroups of Gnm are defined over Q.
Our main result is the following explicit version of the Bounded Height Theorem.
In Section 3.2 we describe the choice of height function used in the next result; it
is sometimes called the absolute logarithmic Weil height with l2 -norm at the infinite
Theorem 12. – Let n ≥ 1 and let X ⊂ Gnm be an irreducible closed subvariety defined
over Q of dimension r and say s ≥ 0 is an integer. We set C = (600n7 (2n)n )r .
There exists a Zariski closed subset Z ⊂ X with the following properties.
(i) We have X oa,[s] ⊂ X \ Z.
(ii) Each irreducible component V of Z satisfies
deg(V ) ≤ (2deg(X))C
h(V ) ≤ (2deg(X))C (1 + h(X)).
The number of irreducible components of Z is at most (2deg(X))C .



(iii) If p ∈ (X \ Z)(Q) ∩ (Gnm ) , then
h(p) ≤ (2deg(X))C (1 + h(X)).

The general proof strategy is similar to the one used by the author to prove the
original Bounded Height Conjecture. For example, Ax’s Theorem [3] still plays a
pivotal role. Although there is one significant different. The first proof relied ultimately
on a compactness argument to bound from below a certain intersection number. This
ruled out an effective or even explicit result. In the current proof we use instead a
recent result of Sturmfels and Tevelev [62] from Tropical Geometry and an effective
version of Łojasiewicz’s inequality by Rémond [55] to make everything explicit.
Going the other way, we obtain a curious corollary on the tropical variety T (X) ⊂
Qn of an irreducible closed subvariety of Gnm defined over C. The proof and a review
of the tropical vocabulary are in Section 8. It suffices to say here that T (X) is a
finite union of rational polyhedral cones of dimension dim X. We let T (X) denote
the topological closure of T (X) inside Rn . The following corollary shows that the
configuration of cones determining T (X) satisfy a rationality condition with respect
to linear maps to Rdim X . It will not play a role in the proof of Theorem 12.

Corollary 1. – Let X ⊂ Gnm be an irreducible closed subvariety defined over C of

dimension r. If there is ϕ0 ∈ Matr,n (R) of rank r with ϕ0 ( T (X)) 6= Rr then there
exists ϕ ∈ Matr,n (Q) of rank r with ϕ( T (X)) 6= Qr .

This rationality property is a non-void restriction on the configuration of vector

spaces spanned by the cones of T (X) as portrayed by an example in Section 8.
There we exhibit four two-dimensional vector subspaces L1,2,3,4 ⊂ Q4 and a surjective
ϕ0 ∈ Mat2,4 (R) such that dim ϕ0 (Li ) < 2 for 1 ≤ i ≤ 4 but with
ϕ(L1 ∪ L2 ∪ L3 ∪ L4 ) = Q2
for all rational surjective ϕ ∈ Mat2,4 (Q).
Below, X denotes a subvariety of Gnm with dimension r ≥ 1 as in Theorem 12. We
give a brief overview of the proof in the important case s = r. The following steps
do not reflect the formal layout of the argument as it is given. Rather, we present a
simplified account which stays true to the general idea.
Step I. – Suppose ϕ : Gnm → Grm is a homomorphism of algebraic groups. We will see
that ϕ can be represented uniquely by an n × r matrix with integral coefficients. The
morphism ϕ is surjective if and only if the associated matrix has rank r and we shall
assume this. We let | · | denote any fixed norm on the vector space of n × r-matrices
in real coefficients. The restriction ϕ| of ϕ to X is a morphism with a certain degree
∆(ϕ) ≥ 0.
In Section 6 we will prove a general height inequality on correspondences in Pn ×Pr .
If we apply it to the Zariski closure of the graph of ϕ| in Pn × Pr we obtain two
constants c1 > 0 and c2 (ϕ) ≥ 0 with the following properties. First, c1 and c2 (ϕ) are



completely explicit and given in terms of the height of X, the degree of X, and n
where only c2 (ϕ) is allowed to depend on ϕ. Second, the lower bound
(2.2) h(ϕ(p)) ≥ c1 |ϕ| h(p) − c2 (ϕ)
holds for all algebraic points p in a Zariski open and dense subset of X (which de-
pends on ϕ). Moreover, the complement of said Zariski open set can be effectively
determined. This means that we can bound the height and degree of each irreducible
component as well as their number in terms of X and ϕ. Much of the work involved
in deducing this inequality goes into making all estimates explicit.
We observe that if ϕ(p) is the unit element, then the left-hand side of (2.2) vanishes.
If ϕ is surjective, then the kernel of ϕ is an algebraic subgroup of codimension r.
Moreover, any algebraic subgroup of codimension r arises as such a kernel. So if p is
inside the Zariski open subset and if ∆(ϕ) > 0 we obtain
c2 (ϕ) 1 |ϕ|r
(2.3) h(p) ≤ .
c1 |ϕ| ∆(ϕ)

This is indeed a height upper bound. But it is not clear if it implies a uniform
height upper bound: the right-hand side seems to depend heavily on ϕ. Even worse,
the Zariski open set on which it holds also depends on ϕ.

Step II. – In the second step we get a hold on the degree ∆(ϕ) of ϕ| . This is an
integer and it cannot be negative. It vanishes if and only if all fibers of ϕ| : X → Grm
have positive dimension. Each such fibers arises as the intersection of X with the
translate of an algebraic subgroup of codimension r. So if ∆(ϕ) = 0 we find that X is
covered by anomalous subvarieties, so X oa,[r] = ∅. In this case, Theorem 12 is void.
So we may assume without loss of generality that ∆(ϕ) > 0 for all surjective ϕ.
Next we transform this non-vanishing statement into a sufficiently strong and ex-
plicit lower bound in terms of ϕ. This was also a key step in the first proof of the
Bounded Height Conjecture. The main tool there was Ax’s Theorem combined with
a compactness argument. In the current approach we will still need Ax’s Theorem.
But the compactness argument is replaced by a result in Tropical Geometry in our
Section 8. The tropical variety associated to X is a finite union of r-dimensional
polyhedral cones. This data can be determined effectively in terms of X. The trop-
ical variety associated to the kernel of ϕ is quite simply a vector subspace of Qn of
dimension n − r. Determining ∆(ϕ) essentially amounts to intersecting the tropical
variety of X with a generic translate of this vector subspace and counting the points
on the tropical intersection with correct multiplicities. The Theorem of Sturmfels
and Tevelev enables us to determine these multiplicities. This leads to a lower bound
for ∆(ϕ) in terms of a certain polynomial in the entries of ϕ. Ax’s Theorem is used
to show that this polynomial does not vanish when evaluated on real n × r matrices
of maximal rank. This information in conjunction with a compactness argument is



enough to provide a qualitative lower bound for this polynomial. Using an explicit ver-
sion of Łojasiewicz’s inequality due to Rémond [55] we can transform this qualitative
bound into a quantitative one. The overall effect will be
(2.4) ∆(ϕ) ≥ c3 |ϕ|r
with c3 > 0 explicit and independent of ϕ, at least for ϕ not too close to a matrix
of rank less than r. From this inequality we see that the factor |ϕ|r /∆(ϕ) in (2.3) is
Step III. – There remains the issue that ϕ depends on the algebraic subgroup of Gnm .
Recall that c2 (ϕ) and the Zariski open set on which inequality (2.2) holds both depend
on ϕ. In order to ensure that our height inequality remains valid for all possible
algebraic subgroups we would have to restrict to the intersection of infinitely many
Zariski open sets. This is not a wise idea. Luckily, this problem can be resolved using
a rather simple trick found in Section 9. We relax the condition on ϕ. Instead of
asking that ϕ(p) is the unit element and hence forcing the left-hand side of (2.2) to
vanish, we instead only want h(ϕ(p)) to be bounded above linearly in terms of h(p).
The constant involved will depend only on n. This can be achieved by replacing the
matrix whose kernel defines the algebraic subgroup containing p by a sufficiently good
approximation. The payoff is that we may choose ϕ from a fixed finite set depending
only on X. So we will only need to take a finite intersection to apply (2.2). Moreover,
the constant c2 (ϕ) in this inequality becomes harmless. The right-hand side of (2.2)
involves |ϕ|r+1 /∆(ϕ). Compared with (2.4) we get an extra factor |ϕ|. This factor will
be used to defeat the factor in front of h(p) appearing in the upper bound for h(ϕ(p)).
Amalgamating steps 1, 2 and 3 yields the Generically Bounded Height Theorem
stated below as Theorem 14. Roughly speaking, it states that if X oa,[r] 6= ∅, then there
is a non-empty Zariski open subset U of X on which any point lying in (Gnm ) has
height bounded from above. The bound for the height of p is given explicitly and so
are bounds for height, degree, and number of the irreducible components of X \ U .
Step IV. – The fourth and final step deals with passing from the unspecified U
to X oa,[r] itself. The idea here is to work with the irreducible components of X \ U
and apply induction on the dimension. This step is carried out in Section 10. The
cost of this descent argument becomes apparent when one compares the bounds in
Theorem 14 and in our main result, Theorem 12.

3. Notation
3.1. Generalities. – This section serves as a reference for general notation used
throughout the whole article.
We use N to denote the positive integers {1, 2, 3, . . .} and N0 for the non-negative
integers N ∪ {0}.
Let R be a commutative unitary ring and p = (p1 , . . . , pn ) a tuple of elements
in R. If α = (α1 , . . . , αn ) ∈ Nn0 , we set pα = pα αn
1 · · · pn where our convention is



00 = 1. For k ∈ N0 we define pk = (pk1 , . . . , pkn ). If all pi are in R× , the group of

units of R, then we allow α to have negative entries and k ∈ Z. It is convenient to set
|α|1 = α0 + · · · + αn . Say I is an ideal of R. If R is graded by the integers, then Ia
will denote the homogeneous elements in I with degree a ∈ Z. If R is bigraded by Z2
then I(a,b) denotes the elements in I with bidegree (a, b) ∈ Z2 .
If A is any matrix, then AT is its transpose and rk(A) is its rank.
We fix Q to be the algebraic closure of Q in C, the field of complex numbers.
Throughout this paper, and if not stated elsewise, n, r ∈ N are fixed integers
and X = (X0 , . . . , Xn ), Y = (Y0 , . . . , Yr ) are collections of independent variables.
We often abbreviate Q[X0 , . . . , Xn ] by Q[X] and Q[Y0 , . . . , Yr ] by Q[Y]. These rings
have a natural grading and Q[X, Y] has a natural bigrading. In our notation we have
Xα ∈ Q[X]|α|1 for α ∈ Nn+1 0 .

If α is as before, then the multinomial coefficient |α| α
is α0|α| 1!
!···αn ! .
For a rational prime p we let | · |p denote the p-adic absolute value on Q. Let [x]
denote the greatest integer at most x ∈ R.

Remark 3.1. – Say k = |α|1 , it is well-known that

   
  X       X
k  k α0 αn   
log = − e
− e − · · · − e  log p ≥ −  n + 1 log p
α p e≥1
p p p e≥1
pe ≤k pe ≤k
log k
=− (n + 1) log p ≥ −(n + 1) log k.
log p
Thus we obtain the estimate
k k −(n+1) if p ≤ k,
(3.1) ≥
α p 1 otherwise.
It will provide useful in many of our estimates.

Let for the moment K be an algebraically closed field contained in C. For a ∈ N0

we define an isomorphism of K-vector spaces
ι : K[X]a → K ( a )
by setting ι(Xi ) = ai ei for i ∈ Nn+1
0 with |i|1 = a; here (ei )i is the standard
basis of K ( a ) ordered lexicographically. We get an analog isomorphism ι on K[Y]a .
If b ∈ N0 , these linear maps induce an isomorphism between K[X, Y](a,b) and the
appropriate power K. They also induce isomorphisms between finite direct sums
of K[X, Y](a,b) and the appropriate power if K. By abuse of notation, all these iso-
morphisms will be denoted by ι. Elements in the target will be considered as row or
column vectors according to our needs.
Finally, we introduce some notation in connection with the algebraic torus Gnm .



A homomorphism Gnm → Grm will always mean a homomorphism of algebraic

groups. In particular, it sends the unit element to the unit element. Each homomor-
phism Gnm → Grm is uniquely determined by a matrix ϕ ∈ Matr,n (Z) with rows
ϕ1 , . . . , ϕr ∈ Zn . Indeed, the homomorphism is given as x 7→ (xϕ1 , . . . , xϕr ). We will
often use the same symbol ϕ for the matrix and corresponding homomorphism. Any
algebraic subgroup of Gnm with codimension r is the kernel of some ϕ ∈ Matr,n (Z) of
rank r, cf. Corollary 3.2.15 [7].
It will be necessary to compactify Gnm . Thus we fix the open immersion Gnm ֒→ Pn
given by (p1 , . . . , pn ) 7→ [1 : p1 : · · · : pn ] and consider Gnm as an open subvariety
of Pn .

3.2. Heights of an Algebraic Point. – We now spend some time defining the height of
algebraic numbers and also algebraic points in projective space.
Let K be a number field. We let MK denote the set of places of K. Let v ∈ MK .
We will identify v with an absolute value on K which when restricted to Q is | · |p for
some rational prime p or the complex absolute on Q. We call v finite if it satisfies the
ultrametric triangle inequality and we call v infinite if it does not.
If v is a finite place we let Kv denote a completion of K with respect to v and let
σv be the embedding K ֒→ Kv . We also fix Cv , a completion of an algebraic closure
of Kv , together with an embedding K ֒→ Cv , which by abuse of notation we also call
σv . We write | · |v for the v-adic absolute value on Cv .
An infinite place v corresponds to an embedding of K into R or C; in the latter
case the embedding is only determined up-to complex conjugation. We take Kv = R
or Kv = C and σv , accordingly. Moreover, we always set Cv = C in the infinite case.
We sometimes abbreviate | · | = | · |v for the standard absolute value on C;
By abuse of notation we let Qv denote Qv|Q .
If p = (p0 , . . . , pn ) ∈ Cn+1
v , we set
( P
( i=0 |pi |2 )1/2 : if v is infinite,
|p|v =
max0≤i≤n |pi |v : if v is finite.

Now let us assume p = (p0 , . . . , pn ) ∈ K n+1 \ {0}. We define the height of p as

1 X
h(p) = [Kv : Qv ] log |p|v .
[K : Q]

This height is invariant under multiplication of p by a non-zero scalar and under a

finite field extension of K. The proof of these statements is similar as the argument
for heights with the sup-norm at the infinite places given in Chapter 1.5 [7]. Hence
we obtain a well-defined height function
h : Pn (Q) → [0, ∞).



Using the open immersion from Section 3.2 we obtain a height function Gnm (Q) →
[0, ∞); for which we use the same letter h. In addition to this height function with
l2 -norm at infinite places we will use the height function
hs : Gnm (Q) → [0, ∞)
with the sup-norm at infinite places, cf. Chapter 1.5 [7]. This height has the advantage
that it plays along nicely with the group law on Gnm (Q). For example, in the case n = 1
and if p, q ∈ Gm (Q) then hs (pk ) = |k|hs (p) for all k ∈ Z and hs (pq) ≤ hs (p) + hs (q).
Both statements follow from the definition of hs and for the first one needs the product
formula if k < 0. If p = (p1 , . . . , pn ) ∈ Gnm (Q), then
(3.2) max{hs (p1 ), . . . , hs (pn )} ≤ hs (p) ≤ hs (p1 ) + · · · + hs (pn )
is also a consequence of the definition. We conclude that hs (pu ) ≤ nkukhs (p) with
k · k the sup-norm on Rn . Finally, hs (p) ≤ h(p) because the sup-norm is always at
most the l2 -norm and h(p) ≤ 21 log(n + 1) + hs (p) from a standard norm inequality.
Moreover, if k ∈ N0 then hs (pk ) = khs (p). In the following, these inequalities and
statements will be refered to as basic height properties.
Say V is a finite direct sum of various Q[X]a and Q[Y]b and Q[X, Y](a,b) with
a, b ∈ Z. Then ι as described above defines an isomorphism of V with some power
of Q. If P ∈ V we define h(P ) = h(ι(P )). Moreover, if the coefficients of ι(P ) are
in K we set |P |v = |ι(P )|v for any place v of K. Then we obtain a height function,
also denoted by h, defined on non-zero elements of V .
We also need a height function defined on MatM,N (Q), the vector space of M × N
matrices with algebraic coefficients. Let A ∈ MatM,N (K) where K is a finite extension
of Q. If 1 ≤ t ≤ rk(A) is an integer and if v is an infinite place of K we define the
local height of A as
1 X
hv,t (A) = log | det A′ |2v
2 ′ A
where the sum runs over all t × t submatrices A′ of A. If v is a finite place of K we
define the local height as
hv,t (A) = log max

| det A′ |v

again the A run over all t × t submatrices of A. The height of A is then
1 X
ht (A) = [Kv : Qv ]hv,t (A).
[K : Q] v

The following lemma provides a useful inequality concerning local heights of ma-

Lemma 3.1. – Let A and K be as above and B a matrix with N rows and coefficients
in K. Then hv,t (AB) ≤ hv,t (A) + hv,t (B) for all integers 1 ≤ t ≤ rk(AB) and all
places v of K.



Proof. – This is a direct consequence of the Cauchy-Binet formula together with the
Cauchy-Schwarz inequality for infinite v and the ultrametric triangle inequality for
finite v.

We proceed by defining the height of an N -dimensional vector subspace V ⊂ Q .
Indeed, let A ∈ MatM,N (K) be a matrix whose column constitute a basis of V .
We define hAr (V ) = hN (A). Then hAr (V ) is independent of the choice of basis, cf.
Chapter 2.8 [7].

Remark 3.2. – This height behaves well with certain constructions typical for vector
spaces. If V ⊂ QM and W ⊂ Q are two vector subspaces. Then the subspace

V × W ⊂ QM +M satisfies

(3.3) hAr (V × W ) ≤ hAr (V ) + hAr (W )

by Remark 2.8.9 [7].

If W ⊂ Q , then by a theorem of Schmidt we have

(3.4) hAr (V ∩ W ) ≤ hAr (V ) + hAr (W ),

cf. Theorem 2.8.13 [7].

Finally, by Proposition 2.8.10 [7] the height of a vector space equals the height of
its orthogonal complement. In other words,
(3.5) hAr ({(u1 , . . . , uM ) ∈ Q ; ui vi = 0 for all (v1 , . . . , vM ) ∈ V }) = hAr (V ).

Using the notation introduced up until now we are able to define the height of a
vector subspace V of finite direct sums of various Q[X]a and Q[Y]b and Q[X, Y](a,b)
with a, b ∈ N0 . Indeed, we set hAr (V ) = hAr (ι(V )).
Let X ⊂ Pn be an irreducible closed subvariety defined over Q with homogeneous
ideal I ⊂ Q[X]. The arithmetic and geometric Hilbert functions of X are defined as

H a (a; X) = hAr (Ia ) and H g (a; X) = dim Q[X]a /Ia ,

Let Z ⊂ Pn × Pm be an irreducible closed subvariety defined over Q with biho-
mogeneous ideal I ⊂ Q[X, Y]. The arithmetic and geometric Hilbert functions of Z
are defined as

H a (a, b; Z) = hAr (I(a,b) ) and H g (a, b; Z) = dim Q[X, Y](a,b) /I(a,b) ,




3.3. Height of a Projective Variety. – We will briefly describe the definition of the
height of an irreducible closed subvariety X ⊂ Pn defined over Q as it is given by
Philippon [43].

Say d = (d0 , . . . , dr ) ∈ Nr+1 . In this section we use Vi to denote an Ni = n+d di
ple of independent variables Ui0 , . . . , Ui,Ni −1 . Each packet Vi corresponds to coeffi-
cients of a homogeneous polynomial in n + 1 variables of degree di .
Let f ∈ K[V0 , . . . , Vr ] \ {0} be homogeneous of degree degVi (f ) in the variables
Vi for 0 ≤ i ≤ r.
If v is a finite place of K we define mv (f ) to be the logarithm of maximum of the
absolute values of coefficients of f with respect to v.
Say v is an infinite place of K and σ = σv : K → C a corresponding embedding.
We set
Z Xr NXi −1
mv (f ) = log |σ(f )(u0 , . . . , ur )|dµ0 (u0 ) · · · dµr (ur )+ degVi (f )
SN0 ×···×SNr i=0 j=1

where SNi is the unit sphere in CNi on which µi is the measure, invariant under the
unitary group, of total mass 1.

Remark 3.3. – It is known that

(3.6) [Kv : Qv ]mv (f ) ≥ 0.

Let us briefly indicate the proof.

The left-hand side of (3.6) remains unchanged when replacing K by a larger number
field. By the product formula, cf. Chapter 1.4 [7], it also remains unchanged when
replacing f by a multiple with factor in K × . After replacing K by a larger number
field we may find λ ∈ K × such that log |λ|v + mv (f ) = 0 for all finite places v. We
P f by λf , which has coefficients in the ring of integers of K. It suffices to show
that v infinite [Kv : Qv ]mv (f ) ≥ 0. So say v is an infinite place of K. By Lelong’s
Théorème 4 [37] the value mv (f ) is at least the logarithmic Mahler measure of σv (f ).
Because the Mahler measure is multiplicative, v infinite [Kv : Qv ]mv (f ) is at least the
logarithmic Mahler measure of v infinite σv (f )[Kv :Qv ] . This is a non-zero polynomial
in integer coefficients. But the logarithmic Mahler measure of a non-zero polynomial
in integer coefficients is non-negative. Our claim (3.6) follows.

Let r = dim X and let K be a number field over which X is defined.

We let fX,d denote the elimination or Chow form of X associated to d. For an
in-depth treatment of Chow forms and their properties stated below, we refer to
Philippon’s article [45]. It is uniquely defined up-to multiplication by a scalar in K ×
and is homogeneous in each Vi of degree deg(X)d0 · · · dr /di .
Now we are ready to define the height of X. It is
1 X [Kv : Qv ]
(3.7) h(X) = mv (fX,d ).
d0 · · · dr [K : Q]



This value is independent of d0 , . . . , dr , the choice of number field K, and the choice
of fX,d . This height is sometimes called the Faltings height [14].
From (3.6) we deduce h(X) ≥ 0.
Recall that we have fixed an open immersion Gnm ֒→ Pn . If X ⊂ Gnm is an irre-
ducible closed subvariety defined over Q, then deg(X) and h(X) are defined to be the
degree and height of the Zariski closure of X in Pn , respectively. Similarly, the height
of a point in Gnm (Q) is the height of its image in Pn (Q).

4. Estimates for Hilbert Functions

4.1. The Geometric Hilbert Function. – Let Z be an irreducible closed subvariety

of Pn × Pr . The purpose of this section is to estimate H g (a, b; Z) explicitly in terms
of H(a, b; Z). The upper bound for the geometric Hilbert function in terms of the
Hilbert polynomial given in Lemma 4.3 follows arguments of Bertrand and Kollár [6].
It is known that if min{a, b} is large enough, then H g (a, b; Z) is the value at (a, b)
of a polynomial depending only on Z. This uniquely determined polynomial is called
the Hilbert polynomial of Z. We define H(T1 , T2 ; Z) ∈ Q[T1 , T2 ] to be (dim Z)! times
the highest degree homogeneous part of the Hilbert polynomial. Section 3 [41] contains
a treatment of Hilbert polynomials used here.
All the intersection theory needed in this article is developed in Fulton’s book [26].
Let π1 : Pn × Pr → Pn and π2 : Pn × Pr → Pr denote the projection onto the
two factors. Let O (1) denote the dual of the tautological line bundle on any projective
space. Then
XZ dim Z 
(4.1) H(T1 , T2 ; Z) = (π1∗ O (1)i π2∗ O (1)dim Z−i [Z])T1i T2dim Z−i

where [Z] is the class of cycles on Pn × Pr which are linearly equivalent to Z.

Let U be an (n + 1)(r + 1)-tuple of independent variables (Uij ) where 0 ≤ i ≤ n
and 0 ≤ j ≤ r. For any field K we define the Segre homomorphism
s∗ : K[U] → K[X, Y]
by setting s∗ (Uij ) = Xi Yj . By abuse of notation we also let s∗ denote the restriction
K[U]k → K[X, Y](k,k) for all k ∈ N0 .
The Segre homomorphism defines a morphism s : Pn × Pr → Pnr+n+r of varieties.
We define
deg(Z) = deg(s(Z)) and h(Z) = h(s(Z)) if Z is defined over Q
where the degree of a subvariety of projective space is the degree of the cycle class
obtained by intersecting the variety the appropriate number of times with O (1).
By abuse of notation, s∗ will also denote the induced homomorphism between the
Picard groups of Pnr+n+r and Pn × Pr .



Next we define the Veronese maps. Let a ∈ N and let X e be the n+a -tuple (X eγ )
where γ runs through all vectors in N0 with |γ|1 = a. We define the twisted
Veronese homomorphism
e → K[X]
va∗ : K[X]

by setting va∗ (Xeγ ) = a 1/2 Xγ ; of course, v ∗ is only defined if K contains all roots
γ a

a 1/2
γ . The choice of the square root will be irrelevant in our applications. By abuse
of notation we also let va∗ denote the restriction K[X] e k → K[X]ak .
The Vernose homomorphism va∗ induces a closed immersion va : Pn → P( a )−1
n+a r+b
of varieties. If b ∈ N, then the product v : Pn × Pr → P( a )−1 × P( b )−1 is also
a closed immersion.
By abuse of notation, va∗ will also denote the induced homomorphisms between
Picard groups of P( a )−1 and of Pn . Indeed, these two groups are canonically iso-

morphic to Z and the induced homomorphism is multiplication by a. We also use vab
to denote the homomorphism between the corresponding Picard groups.

Lemma 4.1. – We have H(1, 1; Z) = deg(Z) and H(a, b; Z) ≤ max{a, b}dim Z deg(Z)
for a, b ∈ N.

Proof. – By definition we have deg(s(Z)) = ( O (1)dim Z [s(Z)]). The projection for-

mula, and the fact that s is a closed embedding imply deg(s(Z)) = (s∗ O (1)dim Z [Z]).
Since s∗ O (1) = π1∗ O (1) ⊗ π2∗ O (1) we deduce
X dim Z 
deg(s(Z)) = (π1∗ O (1)i π2∗ O (1)j [Z]) = H(1, 1; Z).
i+j=dim Z

The first statement of the lemma follows.

The second statement follows from the first one and (π1∗ O (1)i π2∗ O (1)j [Z]) ≥ 0.

Lemma 4.2. – We have H(1, 1; vab (Z)) = H(a, b; Z) for a, b ∈ N.

Proof. – For this lemma we write π1′ and π2′ for the first and second projection
n+a r+b
on P( a )−1 × P( b )−1 , respectively. By definition and since [vab (Z)] = vab∗ ([Z])
we have
X dim Z  ∗ ∗
H(1, 1; vab (Z)) = (π1′ O (1)i π2′ O (1)j vab∗ [Z])
i+j=dim Z
X dim Z 
∗ ′∗ ∗ ′∗
= (vab π1 O (1)i vab π2 O (1)j [Z])
i+j=dim Z

where we used the projection formula. We note π1′ ◦ vab = va ◦ π1 and vab ∗ ′
π1 O (1) =
′ ∗ ∗ ∗ ∗ ∗ ⊗a ∗ ′∗
(π1 ◦ vab ) O (1) = (va ◦ π1 ) O (1) = π1 va O (1) = π1 O (1) . Similarly, vab π2 O (1) =
π2∗ O (1)⊗b . The lemma follows.

Lemma 4.3. – Assume Z is a curve, then H g (a, b; Z) ≤ 1 + H(a, b; Z) for a, b ∈ N.



Proof. – Lemma 1.1 [6] implies H g (a, b; Z) − 1 ≤ deg(s(vab (Z))). So H g (a, b; Z) ≤

1 + H(1, 1; vab (Z)) by Lemma 4.1. We conclude the current lemma by referring to
Lemma 4.2.

We now generalize this bound to higher dimension using a Bertini-type argument.

Lemma 4.4. – Say dim Z ≥ 1. We have

dim Z + k
H g (ak, bk; Z) ≤ H(a, b; Z)
dim Z
for a, b, k ∈ N.

Proof. – We prove the lemma by induction on d = dim Z. If d = 1, then Lemma 4.3

leads to H g (ak, bk; Z) ≤ 1 + H(ak, bk; Z) = 1 + H(a, b; Z)k because the Hilbert
polynomial is homogeneous of degree 1. But H(a, b; Z) ≥ 1 because it is a positive
integer by (4.1). Hence H g (ak, bk; Z) ≤ H(a, b; Z)(1+k) = H(a, b; Z) 1+k 1 as desired.
So let us assume d ≥ 2.
Let I ⊂ R = Q[X, Y] be the bihomogeneous prime ideal of Z. By Bertini’s Theo-
rem, c.f. corollaire 6.11 (2) and (3), page 89 [36] there is F ∈ R(a,b) \ I(a,b) such that
I + F · R is again a prime ideal of a variety Z ′ ⊂ Pn × Pr of dimension d − 1. If k ≥ 1,
0 → R(a(k−1),b(k−1)) /I(a(k−1),b(k−1)) → R(ak,bk) /I(ak,bk) → R(ak,bk) /(I + F · R)(ak,bk) → 0
is an exact sequence, the second arrow being multiplication by F . So H g (ak, bk; Z) =
H g (a(k − 1), b(k − 1); Z) + H g (ak, bk; Z ′ ). By induction on k we have

H g (ak, bk; Z) = H g (aj, bj; Z ).

We have dim Z ′ = d − 1 and by induction H g (aj, bj; Z ′ ) ≤ d−1+j ′
d−1 H(a, b; Z ) if

j 6= 0. This upper bound also holds for j = 0 since H g (0, 0; Z ) = 1. So
d−1+j ′ d+k
H g (ak, bk; Z) ≤ H(a, b; Z ) = H(a, b; Z ′ )
d − 1 d

by properties to binomial coefficients.

Philippon’s lemme 3.1 [41] implies H(a, b; Z ′ ) = H(a, b; Z) and this completes the

Now we come to lower bounds.

Lemma 4.5. – Let ∆ = (π2∗ O (1)dim Z [Z]). We have

dim Z + b − ∆
H g (a, b; Z) ≥ ∆
dim Z
for all a, b ∈ N with b ≥ ∆.



Proof. – Since ∆ is a non-negative integer we may assume ∆ ≥ 1. For brevity, we

write d = dim Z. By Bertini’s Theorem we find linear forms l0 , . . . , ld ∈ Q[Y] which
define a rational map [l0 : · · · : ld ] : Pn × Pr → Pd whose restriction Ψ to Z is a
morphism of degree ∆. We may suppose that the form l0 does not vanish identically
on Z. The morphism Ψ induces an extension of function fields Q(Z)/Ψ∗ Q(Pd ) of
degree ∆.
We shall assume that the projective coordinates X0 and Y0 do not vanish identically
on Z. Otherwise, the argument given below goes through when working with some
other pair Xi and Yj .
We apply the Primitive Element Theorem to find a rational linear combination
γ of X1 /X0 , . . . , Xn /X0 , Y1 /Y0 , . . . , Yr /Y0 which, when considered as an element
of Q(Z), generates the field extension Q(Z)/Ψ∗ Q(Pd ).
We set b′ = b − ∆ ≥ 0 and let P0 , . . . , P∆−1 ∈ Q[Y0 , . . . , Yj ]b′ . Let us consider
X  !
k l1 ld ′
(4.2) γ Pk 1, , . . . , X0a Y0∆ l0b
l0 l0

as an element of Q[X, Y](a,b) . The sum in brackets is a rational function on Z. Since

γ has degree ∆ over Ψ∗ Q(Pi ×Pj ) we see that (4.2) vanishes on Z if and only if all Pk
are zero. The current lemma follows from this and dim Q[Y0 , . . . , Yd ]b′ = d+b−∆
d .

4.2. The Arithmetic Hilbert Function. – In this subsection we bound from above the
arithmetic Hilbert function of an irreducible closed subvariety X ⊂ Pn defined over Q.
We begin by citing a result of David and Philippon [24].
Say V is a subvariety of projective space defined over a field K. If σ : K → L is
an embedding of K into another field L, then Vσ denotes the induced subvariety of
projective space defined over L.
Lemma 4.6. – Let V be a non-trival vector subspace of Q . If ε > 0 there is a linear
form l on Q which does not vanish completely on V such that
X [Kv : Qv ] dim
X V −1 X
|σ(l)(p)|v hAr (V ) 1 1
log sup ≤− + +ε
[K : Q] p∈Vσv (Cv ) |p|v dim V dim V i=1 j=1

where K is a number field containing the coefficients of l.

Proof. – This is corollaire 4.9 [24] in the case R = Q.
We now bound the arithmetic Hilbert function from above explicitly in terms of
the height and degree of a variety. We essentially follow the argumentation given by
Philippon in the proof of théorème 7 [44]. Our inequality is absolute in the sense that
the bound is independent of a field of definition.
Proposition 4.1. – If k ∈ N, then
h(X) 1
H a (k; X) ≤ H g (k; X) k + log H g (k; X) .
deg(X) 2



Proof. – By definition we have H a (k; X) = hAr (Ik ) where I ⊂ Q[X0 , . . . , Xn ] is the

ideal of X.

Say N = n+k k , this is the maximal number of monomials in a homogeneous
polynomial of degree k with n + 1 variables. We will apply Lemma 4.6 to
V = {v ∈ Q ; v T · ι(P ) = 0 for all P ∈ Ik } ⊂ Q .
Equality (3.5) implies that the height of V is H a (k; X). Its dimension is dim V =
H g (k; X) ≥ 1.
Say ε > 0. By Lemma 4.6 there is a linear form l, which we may identify with an
element of Q , that does not vanish identically on V with
H g (k;X)−1 i
X [Kv : Qv ] |σv (l)(p)|v H a (k; X) 1 X X 1
log sup ≤− + +ε
[K : Q] eσ (Cv )
|p|v H g (k; X) H g (k; X) 2j
v∈MK v i=1 j=1

for a number field K ⊂ Q containing the coefficients of l and all of the finitely many
algebraic numbers appearing in this proof.
P There is aλ homogeneous P ∈ Q[X] of degree k with l = ι(P ). We write P =
|λ|1 =k Pλ X .
Let f = fX,(1,...,1,k) ∈ K[V0 , . . . , Vr ] be a Chow form of X. In the notation of
Section 3.3, Vr is an N -tuple of variables corresponding each to a monomial of degree
k in n + 1 variables. Let ρ(f ) ∈ K[V0 , . . . , Vr−1 ] be the form obtained by specializing
the variables Vr to equal the corresponding coefficients of P .
Let v ∈ MK and say σ = σv : K → Cv is the embedding choosen in Subsection 3.2.
We assume first that v is infinite. By Lemma 4.1 [45] there is a measure Ω of total
mass deg(X) on Xσ (C) with
|σ(P )(p)|
(4.4) mv (ρ(f )) − mv (f ) = log Ω(p).
Xσ (C) |p|k

Let p = (p0 , . . . , pn ) ∈ Cn+1 such that [p0 : · · · : pn ] ∈ Xσ (C). For λ ∈ Nn+1 0 with

k 1/2 λ N
|λ|1 = k we set qλ = σ( λ )p and q = (qλ )λ ∈ C . Then q ∈ Vσ (C). Moreover,
we have
X X  −1/2 !
λ k
σ(P )(p) = σ(Pλ )p = σ(Pλ )σ qλ = q T · σ(ι(P )) = σ(l)(q).
|λ|1 =k |λ|1 =k

We evaluate
X k  X
|p|2k = |pλ |2 = |qλ |2 = |q|2
|λ|1 =k |λ|1 =k

and thus conclude

|σ(P )(p)| |σ(l)(q)| |σ(l)(q ′ )|
= ≤ sup .
|p| |q| q ′ ∈Vσ (C) |q ′ |



Using (4.4) we obtain

|σ(l)(q ′ )|
(4.5) mv (ρ(f )) − mv (f ) ≤ deg(X) log sup .
q ′ ∈Vσ (C) |q ′ |

Now we assume that v is finite. By lemme 2 [42] we have

|σ(P )(p)|v
(4.6) mv (ρ(f )) − mv (f ) = log Ωv (p),
Xσ (Cv ) |p|kv

with a measure Ωv on Xσ (Cv ) of mass deg(X).

Say p = (p0 , . . . , pn ) ∈ Cn+1
v with [p0 : · · · : pn ] ∈ Xσ (Cv ). As in the case where
v is infinite we have σ(P )(p) = σ(l)(q) where q ∈ CN v is defined in a similar manner.
This time |q|v = maxλ {|qλ |v } ≤ maxλ {|p |v } = max{|p0 |v , . . . , |pn |v }k = |p|kv , so

|σ(P )(p)|v |σ(l)(q)|v

≤ .
|p|v |q|v
By (4.6) we deduce
(4.7) mv (ρ(f )) − mv (f ) ≤ deg(X) log sup .
y∈Vσ (Cv ) |y|v

We multiply (4.5) and (4.7) with [Kv : Qv ]/[K : Q] and the take the sum over all
v ∈ MK . Using the definition of h(X) given in (3.7) we obtain
X [Kv : Qv ] X [Kv : Qv ] |σ(l)(q)|v
−kh(X)+ mv (ρ(f )) ≤ deg(X) log sup .
[K : Q] [K : Q] q∈Vσv (Cv ) |q|v
v∈MK v∈MK
P [Kv :Qv ]
Recall that v∈MK [K:Q] mv (ρ(f )) ≥ 0 by (3.6). Using (4.3) we bound the right-
hand side to get
 
H g (k;X)−1 i
H a (k; X) 1 X X 1
(4.8) deg(X) ≤ kh(X) +  + ε deg(X).
H g (k; X) H g (k; X) 2j
i=1 j=1

If T ≥ 1 is an integer, then elementary inequalities lead to

X −1 X
i T
X −1 Z T
(4.9) ≤ (1 + log i) ≤ T − 1 + log(i)di = T log T.
i=1 j=1
j i=1 1

From (4.8) we conclude

h(X) 1
H a (k; X) ≤ k H g (k; X) + H g (k; X) log H g (k; X) + ε H g (k; X).
deg(X) 2
The proposition follows since ε > 0 was arbitrary.



5. More on Segre and Veronese

This section is on height inequalities in connection with Segre and Veronese mor-
phisms. Both were defined in Section 4.1.
Let K be a field equipped with an automorphism τ : K → K of order at most 2.
Let V and be a finite dimensional vector space over K. A function h·, ·i : V × V → K
is called a τ -inner product, or short inner product, if it satisfies the following three
(i) It is K-linear in its first variable.
(ii) We have hv, wi = τ (hw, vi) for all w, v ∈ V .
(iii) If v ∈ V and hv, wi = 0 for all w ∈ V , then v = 0.
If W is a vector subspace of V , then W ⊥ is the orthogonal complement of W , i.e.,

W = {v ∈ V ; hv, wi = 0 for all w ∈ W }. Property (iii) in the definition implies
dim W + dim W ⊥ = dim V and so W ⊥⊥ = W .
Now assume W is a second finite dimensional vector space over K with a τ -inner
product h·, ·i′ . We call a linear map f : V → W an isometry if
(5.1) hf (v), f (v ′ )i′ = hv, v ′ i for all v ∈ (ker f )⊥ and v ′ ∈ V.
If f is injective, then our notion of isometry is the usual one.

Remark 5.1. – We claim that ker f ∩ (ker f )⊥ = 0. Indeed, if v lies in this intersection,
then 0 = h0, f (v ′ )i = hf (v), f (v ′ )i′ = hv, v ′ i for all v ′ ∈ V . So v = 0 because of
condition (iii) in the definition of h·, ·i.

On V ⊗ W we have a natural τ -inner product determined by hv ⊗ v ′ , w ⊗ w′ i′′ =

hv, wihv ′ , w′ i′ .
To ease notation we sometimes use h·, ·i to denote inner-products on multiple vector
The next lemma is a simple application of linear algebra.

Lemma 5.1. – Let K and τ be as above and assume V, W, V ′ , and W ′ are finite dimen-
sional vector spaces over K, each one equipped with a τ -inner product. If f : V → W
and f ′ : V ′ → W ′ are isometries, then so is f ⊗ f ′ : V ⊗ V ′ → W ⊗ W ′ .

Proof. – We write h·, ·i for any inner product in this proof. The lemma formally
follows from (ker f )⊥ ⊗ (ker f ′ )⊥ = (ker f ⊗ f ′ )⊥ which we P now show. To prove the
inclusion “⊂” we let v ∈ (ker f )⊥ , v ′ ∈ (ker f ′ )⊥ , and u = i ui ⊗ u′i ∈ ker f ⊗ f ′ .
So hv ⊗ v ′ , ui = i hvP ⊗ v ′ , ui ⊗ u′i i = i hv, ui ihv ′ , u′i i. But f and f ′ are isometries,
therefore hv⊗v ′ , ui = i hf (v)⊗f ′ (v ′ ), f (ui )⊗f ′ (u′i )i = hf (v)⊗f ′ (v ′ ), (f ⊗f ′ )(u)i = 0.
It follows that v ⊗v ′ ∈ (ker f ⊗f ′ )⊥ since u was arbitrary. The desired inclusion holds.
Now dim(ker f )⊥ ⊗ (ker f ′ )⊥ = (dim V − dim ker f )(dim V ′ − dim ker f ′ ). More-
over, dim(ker f ⊗ f ′ )⊥ = dim V ⊗ V ′ − dim ker f ⊗ f = dim f (V ) ⊗ f ′ (V ′ ) =
dim f (V ) dim f ′ (V ′ ). We conclude that (ker f )⊥ ⊗ (ker f ′ )⊥ and (ker f ⊗ f ′ )⊥ have
equal dimension, so they coincide.



Remark 5.2. – Let K be a field of √characteristic 0 together

√ with an involution τ . We

shall assume that if k ∈ N and k ∈ K then τ ( k) = k. We fix a ∈ N0 . An
important example of a τ -inner product on K[X]a is defined in the following manner.
P γ
P γ n+1
If P = γ Pγ X and Q = γ Qγ X where γ runs over elements in N0 with
|γ|1 = a, then
X a−1
hP, Qi = Pγ τ (Qγ ) ∈ K.

If b ∈ N0 , then we may identify K[X, Y](a,b) with K[X]a ⊗ K[Y]b . Thus we obtain
a τ -inner product on K[X, Y](a,b) .

In the next two lemmas, K is an algebraically closed field of characteristic 0, τ is

an involution on K, and h·, ·i is the τ -inner product as given by Remark 5.2.
We recall that Segre and Veronese homomorphisms were defined in Subsection 4.1.

Lemma 5.2. – The Segre homomorphism s∗ : K[U]k → K[X, Y](k,k) is a surjective

isometry for all k ∈ N.

Proof. – Surjectivity holds because elements in the target are bihomogeneous of bide-
gree (k, k).
For brevity we set N = (n + 1)(r + 1). Let P, Q ∈ K[U]k and P ∈ (ker s∗ )⊥ , we
must show hs∗ (P ), s∗ (Q)i = hP, Qi. We write P = γ Pγ Uγ and Q = γ Qγ Uγ ,
where here and below the sum is over all γ ∈ NN0 with |γ|1 = k.
We call γ, γ0 ∈ NN 0 with |γ|1 = |γ0 |1 = k equivalent, and write γ ∼ γ0 , if and
only if s∗ (Uγ ) = s∗ (Uγ0 ). Let R ⊂ NN
0 be a set of representatives of the equivalence
Say γ ∼ γ0 . Then P ∈ (ker s∗ )⊥ implies hP, Uγ i = hP, Uγ0 i, so
 −1  −1
k k
(5.2) Pγ = Pγ 0 .
γ γ0
We have hs∗ (P ), s∗ (Q)i = γ0 ∈R h
∗ γ
γ∼γ0 Pγ s (U ),
∗ γ
γ∼γ0 Qγ s (U )i because
∗ γ ∗ γ0
s (U ) and s (U ) are orthogonal if γ 6∼ γ0 . Equality (5.2) gives
! !
∗ ∗
hs (P ), s (Q)i = Pγ τ (Qγ ) hs∗ (Uγ0 ), s∗ (Uγ0 )i
γ0 ∈R γ∼γ0 γ∼γ0
! !
X  k −1 X k  X
= Pγ 0 τ (Qγ ) hs∗ (Uγ0 ), s∗ (Uγ0 )i.
γ0 γ∼γ
γ γ∼γ0
γ0 ∈R 0

Say s∗ (Uγ0 ) = Xδ Yδ with δ ∈ Nn+1 0 , δ ∈ Nr+1
0 , and |δ|1 = |δ ′ |1 = k. By definition
′ ′ −1 k −1
we have hs∗ (Uγ0 ), s∗ (Uγ0 )i = hXδ , Xδ ihYδ , Yδ i = kδ δ′ . On exanding both



P P P k

sides of s∗ (( ij Uij )k ) = ( ij Xi Yj )k and comparing coefficients we find γ∼γ0 γ =
  P  ∗ γ
k k k
δ δ ′ . Therefore, γ∼γ0 γ hs (U 0 ), s∗ (Uγ0 )i = 1 and (5.3) implies

X X  k −1
hs∗ (P ), s∗ (Q)i = Pγ0 τ (Qγ ).
γ0 ∈R 0

But the right-hand side is hP, Qi because of (5.2).

We can state an analog result for the Veronese homomorphism. The proof goes
along similar lines.

e k → K[X]ak is a surjective isometry for

Lemma 5.3. – The Veronese map va∗ : K[X]
all a, k ∈ N.

Proof. – Surjectivity follows immediately. Let P, Q ∈ K[X] e k and P ∈ (ker v ∗ )⊥ , we

∗ ∗
must show hva (P ), va (Q)i = hP, Qi.

For brevity let N = n+a e
n . We recall that X is an N -tuple of independent variables
(Xγ ) where γ runs over elements of N0 with |γ|1 = a. We use γ to index elements
of NN N
0 . If δ ∈ N0 with |δ|1 = k then

Y aδγ /2
e δ ) = Xα(δ)
va∗ (X

for some α(δ) ∈ Nn+1

0 , here and below γ runs over all elements of Nn+1
0 with |γ|1 = a.
We call δ, δ0 ∈ NN 0 with |δ|1 = |δ0 |1 = k equivalent, and write δ ∼ δ0 , if and only
e δ ) and v ∗ (X
if α(δ) = α(δ0 ). I.e. if and only if va∗ (X e δ0 ) are equal up-to a factor in K × .
Let R ⊂ N0 be a set of representatives of the equivalence classes.
P e δ and Q = P Qδ X e δ where here and below δ runs over all elements
Let P = Pδ X
δ δ
of NN
0 with |δ|1 = k.
Say δ ∼ δ0 . Our assumption P ∈ (ker va∗ )⊥ implies
* + * +
Y a−δγ /2 Y a−δ0γ /2

P, X = P, X e δ0 .
γ γ

So ! !
 −1 Y a−δγ /2  −1 Y a−δ0γ /2
k k
Pδ τ = Pδ 0 τ
δ γ
γ δ0 γ
and because τ acts trivially on roots of positive integers we obtain
 −1 Y  −δγ /2  −1 Y  −δ0γ /2
k a k a
(5.4) Pδ = Pδ0 .
δ γ
γ δ 0 γ



We note that hva∗ (Xe δ ), v ∗ (X

e δ0 )i = 0 if δ 6∼ δ0 and evaluate
* +
∗ ∗ ∗ eδ ∗ eδ
hva (P ), va (Q)i = Pδ va (X ), Qδ va (X )
δ0 ∈R δ∼δ0 δ∼δ0
* +
X Pδ0 X k  Y  a  δγ X Y aδγ /2
=  Q aδ0γ /2 Xα(δ0 ) ,X α(δ0 )

k δ γ γ γ
δ0 ∈R δ0 γ γ δ∼δ0 δ∼δ0

after applying (5.4). The definition of the inner product shows that hva∗ (P ), va∗ (Q)i
X  −1 X   Y  δγ ! X Y aδγ /2
Pδ 0 ak k a
  τ (Qδ ) .
k Q a δ0γ /2 α(δ0 ) δ γ γ γ
δ0 ∈R δ0 γ γ δ∼δ0 γ δ∼δ0
 k  P k
a 1/2 e a
 Pn ak
We evaluate both sides of va∗ γ γ X γ = γ X
= ( i=0 Xi )
k Q

a δγ ak

and compare coefficients to deduce δ∼δ0 δ γ γ = α(δ 0)
. Hence
X Pδ 0 X Y aδγ /2 X Pδ τ (Qδ )
hva∗ (P ), va∗ (Q)i =  Q aδ0γ /2 τ (Qδ ) = k

γ δ
δ0 ∈R δ0 γ γ δ∼δ0 δ

where the second inequality follows from (5.4). But the right-hand side is just hP, Qi
by definition.

Let a, b ∈ N and let Ye be the r+b -tuple (Yeγ ) where γ runs through all elements
in Nr+1
0 with |γ|1 = b. A consequence Lemmas 5.1 and 5.3 is that the linear map

vab e Y]
= va∗ ⊗ vb∗ : K[X, e (k,k) → K[X, Y]ak,bk

e k ⊗ K[Y]
is a surjective isometry; we identified K[X] e k = K[X,
e Y]
e (k,k) and K[X]ak ⊗
K[Y]bk = K[X, Y](ak,bk) .
The next lemma is an application to an irreducible closed subvariety Z ⊂ Pn × Pr
defined over Q. We recall that s is the Segre morphism defined in Subsection 4.1.

Lemma 5.4. – We have

H a (k, k; Z) ≤ H a (k; s(Z)) and H g (k, k; Z) = H g (k; s(Z)).
for all k ∈ N.

Proof. – Let I ⊂ Q[X, Y] be the ideal of Z and J ⊂ Q[U] the ideal of s(Z). Then
(5.5) s∗ −1 (I(k,k) ) = Jk .

Remark 5.2 gives us a τ -inner product h·, ·i on Q[X, Y](k,k) and Q[U]k with τ the
identity on Q.



We now fix a basis {Q1 , . . . , Qt } of Jk⊥ where t = H g (k; S(Z)) ≥ 1. We define

A = [ι(Q1 ), . . . , ι(Qt )] ∈ Mat(nr+n+r+k),t (Q) and

C = [ι(s∗ (Q1 )), . . . , ι(s∗ (Qt ))] ∈ Mat(n+k)(r+k),t (Q).

k k

Let us remark that ker s∗ ⊂ Jk by (5.5). This implies (ker s∗ )⊥ ⊃ Jk⊥ and hence
Qi ∈ (ker s∗ )⊥ . We claim
(5.6) s∗ (Jk⊥ ) = I(k,k)

Indeed, if P ∈ I(k,k) then there is Q ∈ Jk with s∗ (Q) = P . Therefore, hs∗ (Qi ), P i =
hQi , Qi = 0 for all i because s∗ is an isometry by Lemma 5.2. Hence s∗ (Qi ) ∈ I(k,k) ⊥

because P was arbitrary. This shows that the left side of (5.6) is contained in the right
side. Equality (5.5) implies dim Jk = dim ker s∗ + dim I(k,k) . Moreover, dim ker s∗ =
dim Q[U]k − dim Q[X, Y](k,k) since s∗ is surjective. It follows that Jk⊥ and I(k,k)

∗ ⊥ ∗ ∗ ⊥
equal dimension. But ker s ∩ Jk ⊂ ker s ∩ (ker s ) = 0 by the comment shortly
after (5.1). So s∗ |Jk⊥ is injective and hence dim s∗ (Jk⊥ ) = dim I(k,k)

. This settles our
claim (5.6) and the equality involving the geometric Hilbert function in the assertion.
We also remark that C and A have equal rank t.
Let K ⊂ Q be a finite normal extension of Q containing all of the finitely many
algebraic numbers which are involved in the proof below. Let v ∈ MK .
Say v is infinite and let σ = σv : K → C be an associated embedding. Since K is
normal over Q there is an automorphism η of K with σ(η(x)) = σ(x) for all x ∈ K.
By the Cauchy-Binet formula we have
exp 2hv,t (A) = det(σ(A) σ(A)) = det[σ(ι(Qi )) σ(ι(Qj ))]1≤i,j≤t
= σ(det[ι(Qi ) η(ι(Qj ))]ij ).
All coefficients involved in ι are totally real algebraic numbers; hence invariant under
η. We obtain exp 2hv,t (A) = σ(det[hQi , η(Qj )i]ij ). Together with the Cauchy-Binet
formula we also get
exp 2hv,t (C) = det(σ(C) σ(C)) = det[σ(ι(s∗ (Qi ))) σ(ι(s∗ (Qj )))]ij
= σ(det[ι(s∗ (Qi )) η(ι(s∗ (Qj )))]ij ) = σ(det[hs∗ (Qi ), s∗ (η(Qj ))i]ij ).
But s∗ is an isometry so exp 2hv,t (C) = σ(det[hQi , η(Qj )i]ij ), hence
(5.7) hv,t (C) = hv,t (A).

Now say v is finite. If B is a matrix with m rows and 1 ≤ i1 < · · · < it ≤ m are
integers, we let Bi1 ...it denote the submatrix of B consisting of the rows i1 , . . . , it . We
fix i1 , . . . , it with | det Ci1 ...it |v = exp hv,t (C). For 1 ≤ i ≤ t we may find polynomials
Qe i ∈ K[U]k whose terms are also terms of Qi with the following property. The rows
i1 , . . . , it of Ce = [ι(s∗ (Q
e 1 )), . . . , ι(s∗ (Q
e t ))] equal the corresponding rows of C and all
other rows are 0. The Cauchy-Binet formula implies det(C T C) e = det(Ci ...i )2 .
1 t



e = det[hs∗ Qi , s∗ Q
On the other hand, we have det(C T C) e j i]ij = det[hQi , Q
e j i]ij
∗ Te T e e e e t )].
because s is an isometry. So det(C C) = det(A A) with A = [ι(Q1 ), . . . , ι(Q
Now we apply the Cauchy-Binet formula to evaluate
e =
det(AT A) ei′ ...i′ ).
det(Ai′ ...i′ ) det(A1 t 1 t
i′1 <···<i′t

Since a row of A e either equals the corresponding row of A or is 0 we see that

det(Aei′ ...i′ ) is either det(Ai′ ...i′ ) or 0. The ultrametric triangle inequality im-
1 t 1 t
e v = | det(AT A)|
plies | det Ci1 ...it |2v = | det C T C| e v ≤ maxi′ <···<i′ | det Ai′ ...i′ |2v =
1 t 1 t
exp(2hv,t (A)). We conclude
(5.8) hv,t (C) ≤ hv,t (A).
We multiply (5.7) and (5.8) with [Kv : Qv ]/[K : Q] and take the sum over all
places of K to obtain
(5.9) ht (C) ≤ ht (A).
By definition we have H a (k, k; Z) = hAr (I(k,k) ). We know how the height behaves
under taken the orthogonal complement, see (3.5) in Remark 3.2. So H a (k, k; Z) =
⊥ ⊥
hAr (I(k,k) ). The columns of C are a basis of ι(I(k,k) ) by (5.6), so H a (k, k; Z) = ht (C).
On the other hand, H a (k, s(Z)) = hAr (Jk ) = hAr (Jk⊥ ) = ht (A) by similar arguments.
The proof follows from (5.9).

Lemma 5.5. – We have

(5.10) H a (ak, bk; Z) ≤ H a (k, k; vab (Z)) and H g (ak, bk; Z) = H g (k, k; vab (Z))
for a, b, k ∈ N.

Proof. – Let I be the ideal of Z ⊂ Pn × Pr and let J be the ideal of the closed
n+a r+b
subvariety vab (Z) ⊂ P( a )−1 × P( b )−1 . Following the convention that vab

the restriction of the Veronese homomorphism to polynomials of fixed bidegree, we
∗ −1
vab (I(ak,bk) ) = J(k,k) .
We mainly follow the lines of the proof of Lemma 5.4. Remark 5.2 gives us a τ -inner

product h·, ·i on source and target of vab with τ the identity on Q. Let us fix a basis

{Q1 , . . . , Qt } of J(k,k) with t = H g (k, k; vab (Z)). We also introduce matrices
A = [ι(Q1 ), . . . ι(Qt )] ∈ Mat (n+a)−1+k (r+b)−1+k (Q) and
( a k )( b k ),t
∗ ∗
C = [ι(vab (Q1 )), . . . , ι(vab (Qt ))] ∈ Mat(n+ak)(r+bk),t (Q).
ak bk

∗ ⊥ ∗ ⊥ ∗ ⊥
We have J(k,k) ⊃ so
ker vab , ⊂
J(k,k) and hence Qi ∈ (ker vab
(ker vab ) ) .

As in the proof of Lemma 5.4 we use the fact that vab is an isometry, cf. Lemma 5.3,
to deduce
∗ ⊥ ⊥
vab (J(k,k) ) = I(ak,bk)



as well as the second claim of the current lemma and also that C has rank t.
Again we let K be a finite normal extension of Q which contains all algebraic
numbers which follow. Let v ∈ MK .
Say v is infinite. Just as in Lemma 5.4 we have
hv,t (C) = hv,t (A);

in order to show this we need to use the fact that vab is an isometry but also that its
coefficients are totally real numbers. Now say v is finite. Using a similar argument as
in Lemma 5.4 we find
hv,t (C) ≤ hv,t (A).
As in the proof of Lemma 5.4, we conclude (5.10) from these inequalities.

6. Correspondences and Height Inequalities

The goal of this section is to prove a height inequality on correspondences.
Let Z ⊂ Pn × Pr be an irreducible closed subvariety of positive dimension defined
over Q. Recall that s : Pn × Pr → Pnr+n+r is the Segre morphism. We define the
height h(Z) and degree deg(Z) of Z as height and degree of s(Z). Recall that π1 and
π2 are the two projections Pn × Pr → Pn and Pn × Pr → Pr . We may attach to Z
a (1 + dim Z)-tuple of bidegrees
∆i (Z) = (π1∗ O (1)i π2∗ O (1)dim Z−i [Z]) ≥ 0 for i ∈ {0, . . . , dim Z}.
In this notation and by (4.1), the Hilbert polynomial of Z is
XZ dim Z 
(6.1) H(T1 , T2 ; Z) = ∆i (Z)T1i T2dim Z−i .

We introduce two restrictions on Z.

(i) We suppose ∆0 (Z) > 0. This is equivalent to stating that π2 |Z : Z → Pr is
generically finite by the projection formula.
(ii) We suppose there exists i ∈ {1, . . . , dim Z} with ∆i (Z) > 0.
Property (i) implies dim Z ≤ r. Property (ii) excludes examples such as Z =
{p} × Z ′ for some irreducibe closed subvariety Z ′ ⊂ Pr .
If Z satisfies conditions (i) and (ii) above, we define
(  1/2  1/d )
∆0 (Z) ∆0 (Z) ∆0 (Z)
(6.2) κ(Z) = min , ,..., .
∆1 (Z) ∆2 (Z) ∆d (Z)
Note that certain quotients can be infinity. But the minimum is always a positive real
number by (i) and (ii).
We come to the main result explicitly relating the height of the two coordinates
in Pn and Pr of a point on Z. We will prove the following two propositions in this



Proposition 6.1. – Let Z ⊂ Pn × Pr be an irreducible closed subvariety defined over Q

of dimension d ≥ 1. We assume that Z satifies conditions (i) and (ii) above. Let κ =
κ(Z) and ∆0 = ∆0 (Z). For brevity, we introduce the constant
d d−1 1 if κ ≥ 17dn and
k0 = max{17n3 d!∆0 , deg(Z)} ×
100 dn
κ otherwise.
There exist a, b ∈ N with max{a, b} ≤ k0 and
a=b if κ ≥ 17dn
and F ∈ Q[X, Y](a,b) with
max{1, κ}d+1
h(F ) ≤ 400n max{n, r}2 (h(Z) + deg(Z)) + 5ddeg(Z) k0
such that the following properties hold. The polynomial F does not vanish identically
on Z and if (p, q) ∈ Z(Q) then we are in one of the following cases.
(i) We have F (p, q) = 0 or the first projective coordinate of Pn vanishes at p.
(ii) We have the inequality
max{1, κ}d+1
κh(p) ≤ 25 dnh(q) + 214 n2 r max{n, r}2 (h(Z) + deg(Z)) + 28 nr2 deg(Z).

For our application a slightly modified version of the previous proposition will be
of central importance.

Proposition 6.2. – Let Z ⊂ Pn × Pr be an irreducible closed subvariety defined

over Q of dimension d ≥ 1. We assume that Z satifies conditions (i) and (ii)
above. Let κ = κ(Z) and ∆0 = ∆0 (Z). We shall assume κ ≥ 17dn and set
k0 = max{17n3d d!∆d−1 0 , deg(Z)}. There is a finite collection of irreducible closed
subvarieties V1 , . . . , VN ⊂ π1 (X) ⊂ Pn defined over Q with
dim Vi = d − 1,
deg(Vi ) ≤ k0 deg(Z), and
9 2 2 3 3 κd+1
h(Vi ) ≤ 2 max{n r , nr , n r} max 1, (h(Z) + deg(Z))deg(Z)k0 ,
and such that the following property holds. Let (p, q) ∈ Z(Q), then we are in one of
the following cases.
(i) The first projective coordinate of Pn vanishes at p or (p, q) is not isolated
in π1 |−1
Z (p).
(ii) There is 1 ≤ i ≤ N with p ∈ Vi (Q).



(iii) We have
κh(p) ≤ 25 dnh(q) + 215 max{n4 r, n2 r3 } max 1, (h(Z) + deg(Z)).

6.1. Height Lower Bounds. – Let a, b ∈ N0 Recall that X = (X0 , . . . , Xn ) and Y =

(Y0 , . . . , Yr ) and that we defined a height of (n + 1)-tuples
F = (F0 , . . . , Fn ) ∈ (Q[X, Y](a,b) )n+1
in Section 3.2.
Until the end of Section 6 we will use the following notation. We let Z ⊂ Pn ×Pr be
an irreducible closed subvariety defined over Q of dimension d ≥ 1. We suppose that
Z satisfies conditions (i) and (ii) introduced at the beginning of Section 6. We assume
additionally that X0 does not vanish identically on Z; otherwise we are in case (i) of
Propositions 6.1 and 6.2. Finally, for brevity we set ∆i = ∆i (Z) for 0 ≤ i ≤ d.
The main tool for the height inequality below is the product formula.

Lemma 6.1. – Suppose I ⊂ Q[X, Y] is the ideal of Z. Let F = (F0 , . . . , Fn ) be an

(n + 1)-tuple as above such that each Fi is bihomogeneous of bidegree (a, b) with
a, b ∈ N. We assume that there is a positive integer c such that
Xic F0 − X0c Fi ∈ I for 1 ≤ i ≤ n.
Let (p, q) ∈ Z(Q) where p = [p0 : · · · : pn ] and assume that p0 6= 0 and F0 (p, q) 6= 0.
(c − a)h(p) ≤ bh(q) + h(F ) + log(n + 1).
Proof. – We assume that the number field K contains all of the finitely many al-
gebraic numbers implicit in the subsequent proof. It will be convenient, but harm-
less, to fix projective coordinates and consider p = (p0 , . . . , pn ) ∈ K n+1 \ {0} and
q = (q0 , . . . , qn ) ∈ K r+1 \ {0}.
Let us define z = (F0 (p, q), . . . , Fn (p, q)) ∈ K n+1 \ {0}. For v ∈ MK we set
|p|av |q|bv
λ(v) = log .
The definition of |Fi |v was given in Section 3.2. The Cauchy-Schwarz inequality
gives |Fi (p, q)|v ≤ |Fi |v |p|av |q|bv if v is an infinite place of K. The same inequality
holds for finite v by the ultrametric triangle inequality. For infinite v we have |z|v =
(|F0 (p, q)|2v + · · · + |Fn (p, q)|2v )1/2 ≤ (|F0 |2v + · · · + |Fn |2 )1/2 |p|av |q|bv = |F |v |p|av |q|bv . And
for finite v the corresponding statement is |z|v = max{|F0 (p, q)|v , . . . , |Fn (p, q))|v } ≤
|F |v |p|av |q|bv .
These bounds imply
(6.4) λ(v) ≥ − log |F |v
regardless if v is finite or not.



The hypothesis implies pci F0 (p, q) = pc0 Fi (p, q) for 0 ≤ i ≤ n, therefore

z = F0 (p, q)p−c c c
0 (p0 , . . . , pn ).

pc0 |p|a |q|b
λ(v) = log + log c v vc .
F0 (p, q) v |(p0 , . . . , pn )|v
If v is finite, then |(pc0 , . . . , pcn )|v = |p|cv and if v is infinite we may estimate |p|2c
v =
( i=0 |pi |2v )c ≤ (n + 1)c |(pc0 , . . . , pcn )|2v .
Now we sum over all places of K weighted with the appropriate local degress to
X [Kv : Qv ] X [Kv : Qv ] pc0
λ(v) ≤ log
[K : Q] [K : Q] F0 (p, q) v
v∈MK v∈MK
X [Kv : Qv ] X [Kv : Qv ] c
+ log |p|a−c b
v |q|v + log(n + 1).
[K : Q] [K : Q] 2
v∈MK v infinite

The first term on the right side of the inequality is zero by the product formula.
The second term is (a − Pc)h(p) + bh(q) by the definition of our height. The final term
is c/2 log(n + 1) since v infinite [Kv : Qv ] = [K : Q]. We use (6.4) to bound the left
side of the inequality from below. This completes the proof.

6.2. Dimension Inequalities. – For brevity we set R = Q[X, Y]. Let I ⊂ R be the
ideal of Z ⊂ Pn × Pr .
By our convention, stated in Section 3.1, Q is a subfield of C. We now take τ to
be complex conjugation restricted to Q. It acts trivially on square roots of positive
integers. So it satifies the restrictions imposed in Remark 5.2
In the following sections, h·, ·i is the τ -inner product as in said remark on vector
spaces of polynomials with coefficients in Q.
Remark 6.1. – Suppose F ∈ I(a,b) . Since τ is the restriction of complex conjugation,
the inner product hF, F i vanishes if and only if F = 0. Therefore, we have I(a,b) ∩

I(a,b) = 0.
Until the end of this section we treat D, E, k ∈ N as parameters. They will be
chosen later on. We set

(6.5) WDEk = {(F0 , . . . , Fn ) ∈ (I(k,Ek) )n+1 ; XiDk F0 − X0Dk Fi ∈ I for 1 ≤ i ≤ n}.
Any F = (F0 , . . . , Fn ) ∈ WDEk satisfies the hypothesis of Lemma 6.1 with (a, b) =
(k, Ek) and c = Dk.
Our general strategy is a classical step in many proofs in diophantine approxi-
mation. We shall find a non-zero element of small height in WDEk . We carry out
this strategy by applying an absolute version of Siegel’s Lemma due to Zhang. Said
element will then be used to in Lemma 6.1.
Of course, we can only find non-zero elements in WDEk if this vector space is
non-trivial. Our first task will be to bound the dimension of WDEk from below.



Lemma 6.2. – We have dim WDEk ≥ (n + 1) H g (k, Ek; Z) − n H g ((D + 1)k, Ek; Z).

Proof. – The vector space WDEk is the kernel of

(I(k,Ek) )n+1 → R((D+1)k,Ek) /I((D+1)k,Ek)
(F0 , . . . , Fn ) 7→ (XiDk F0 − X0Dk Fi )1≤i≤n .
Hence we have the dimension inequality
⊥ ⊥
1 dim WDEk ≥ (n + 1) dim I(k,Ek) − n dim I((D+1)k,Ek)
= (n + 1) H g (k, Ek; Z) − n H g ((D + 1)k, Ek; Z).

We will use the bounds developed in Section 4.1 to estimate the dimension of WDEk
in terms of the bidegree ∆0 . Recall that d = dim Z.

Lemma 6.3. – We assume k ≥ ∆0 and

D+1 1
≤ κ(Z).
E 4dn
(6.6) H(D + 1, E; Z) ≤ 1+ ∆0 E d
1 1 kd
dim WDEk ≥ − 4ned ∆d−1
0 k d−1
∆0 E 2 d!
where e = 2.7182 . . . is Euler’s number.

Proof. – We begin by showing (6.6). We use (6.1) to estimate values of the Hilbert
polynomial. It suffices to show the inequality in
X d    i
1 d D+1 ∆0
(6.7) H(D + 1, E; Z) − ∆0 = ∆i ≤ .
Ed i=1
i E 2n

We set δi = (∆0 /∆i )1/i if ∆i 6= 0; by hypothesis we have (D + 1)/E ≤ δi /(4dn).

We deduce
Xd    i Xd   Xd  
d D+1 d i 1 d 1
∆i ≤ ∆i δ i i
≤ ∆0 i
i E i=1
i (4dn) i=1
i (4dn)
∆i 6=0

It suffices to show that the right-hand side is at most ∆0 /(2n). We have

Xd    d  
d 1 1 1
= 1+ − 1 ≤ exp −1
i (4dn) 4dn 4n
1 d
since (1 + 4dn ) is increasing in d with limit exp(1/(4n)). Elementary estimates show
e − 1 ≤ 1/(2n). Our claim (6.7) and thus (6.6) follow.



We come to the second part of the lemma. By Lemma 4.5 we have

d + Ek − ∆0 ∆0
H g (k, Ek; Z) ≥ ∆0 ≥ (Ek − ∆0 )d .
d d!
Expanding the expression on the right and isolating the term (Ek)d gives
(Ek)d X d
H g (k, Ek; Z) ≥ ∆0 + (Ek)i (−∆0 )d−i
d! i=0
d d−1  
(Ek) d (Ek)d
≥ ∆0 − (Ek)d−1 ∆d−i
0 ≥ ∆ 0 − (Ek)d−1 (2∆0 )d .
d! i=0
i d!

On the other hand, Lemma 4.4 implies the upper bound

H g ((D + 1)k, Ek; Z) ≤ H(D + 1, E; Z).
Using the basic inequality
d+k kd
(6.9) ≤ + ed k d−1
d d!
we obtain H g ((D + 1)k, Ek; Z) ≤ kd! + ed k d−1 H(D + 1, E; Z). If we apply in-
equality (6.8) to the conclusion of Lemma 6.2 we get
1 1
dim WDEk ≥ H g (k, Ek; Z) + n 1+ H g (k, Ek; Z) − H g ((D + 1)k, Ek; Z)
2 2n
∆0 (Ek)d kd 1 d
≥ +n 1+ ∆0 E − H(D + 1, E; Z)
2 d! d! 2n
− (n + 1)(Ek)d−1 (2∆0 )d − ned k d−1 H(D + 1, E; Z).
Because of the first statement of this lemma, the second term on the very right of the
inequality is non-negative. This statement also controls the remaining H(D + 1, E; Z),
∆0 (Ek)d
dim WDEk ≥ − (n + 1)(Ek)d−1 (2∆0 )d − ned k d−1 H(D + 1, E; Z)
2 d!
∆0 (Ek)d d−1 d 1 d d−1
≥ − (n + 1)(Ek) (2∆0 ) − n + e k ∆0 E d .
2 d! 2
The proof follows from (n+1)(Ek)d−1 (2∆0 )d +(n+1/2)ed k d−1 ∆0 E d ≤ 4ned ∆d0 E d k d−1 .

In particular, if D and E satisfy the lemma’s hypothesis, then WDEk 6= 0 for

large k.



6.3. Bounding the Height of WDEk . – In order to apply Siegel’s Lemma to WDEk we
must also bound its height from above. It turns out to be easier to work with a vector

space WDEk closely related to WDEk which we proceed to define.
For each i ∈ {0, . . . , n} we set

Vi = {XiDk F ; F ∈ I(k,Ek) } ⊂ R((D+1)k,Ek)

and note that dim Vi = dim I(k,Ek) = H g (k, Ek; Z). We also define
n Yn
G′1 G′n o

WDEk = (G1 , G′1 , . . . , Gn , G′n ) ∈ V0 × Vi ; Gi − G′i ∈ I for 1 ≤ i ≤ n, Dk = · · · = Dk .
X1 Xn

There is a homomorphism Ψ : WDEk → WDEk defined by
′ ′ G1 G1 G2 Gn
(6.10) (G1 , G1 , . . . , Gn , Gn ) 7→ , , , . . . , Dk .
X1Dk X0Dk X0Dk X0
It is readily checked to be injective. Moreover it has a right-inverse given by
(F0 , . . . , Fn ) 7→ (F1 X0Dk , F0 X1Dk , F2 X0Dk , F0 X2Dk , . . . , Fn X0Dk , F0 XnDk ).

So Ψ is an isomorphism and dim WDEk = dim WDEk .

We proceed by bounding the height of WDEk . One way to do this is to write our
vector space as an intersection

WDEk = W1 ∩ W2 ∩ W3
and bound the height of each Wi separately. Schmidt’s Theorem (3.4) then provides

a bound for the height of WDEk .
Explicitly, we set
W1 = V0 × Vi ,
W2 = {(G1 , G′1 , . . . , Gn , G′n ) ∈ R((D+1)k,Ek)
; Gi − G′i ∈ I for 1 ≤ i ≤ n}, and
W3 = {(G1 , G′1 , . . . , Gn , G′n ) ∈ 2n
R((D+1)k,Ek) ; X1Dk G′i = XiDk G′1 for 1 ≤ i ≤ n}.

Below we will proceed slightly differently and replace W3 by a different vector space
to improve on the height bound.

A preliminary step in bounding the heights of the Wj is to relate the height of I(a,b)
with the value of the arithmetic Hilbert function at (a, b). Later is just the height
of I(a,b) . The connection is a simple as one could hope for.
We recall that h·, ·i is defined using the restriction of complex conjugation
to Q ⊂ C.

Lemma 6.4. – We have hAr (I(a,b) ) = H a (a, b; Z) for all a, b ∈ N.



Proof. – We fix a basis {Q1 , . . . , Qt } of I(a,b) . A polynomial P lies in I(a,b) if and only if
T ⊥
hP, Qi i = ι(P ) · τ (ι(Qi )) = 0 for all 1 ≤ i ≤ t. So ι(I(a,b) ) is the kernel of the matrix

A with s columns given by τ (ι(Qi )). By (3.5) the height ht (A) is hAr (ι(I(a,b) )) =

hAr (I(a,b) ). On the other hand, ht (A) = ht (τ (A)). The columns of τ (A) come from a
basis of I(a,b) since τ (τ (ι(Qi ))) = ι(Qi ). Hence ht (τ (A)) = hAr (I(a,b) ) = H a (a, b; Z)
and the proof is complete.

Lemma 6.5. – We have

hAr (W1 ) ≤2n H a (k, Ek; Z) + 20n max{n, r}2 max{D, E} H g (k, Ek; Z)k.
Proof. – Since W1 = i=1 V0 × Vi we use (3.3) to deduce
(6.11) hAr (W1 ) ≤ nhAr (V0 ) + hAr (Vi ) ≤ 2n max{hAr (V0 ), . . . , hAr (Vn )}.

We continue by bounding the height of each Vi .

⊥ ⊥
Let t = dim(I(k,Ek) ) = H g (k, Ek; Z) ≥ 1 and let P1 , . . . , Pt be a basis of I(k,Ek) .
We define A to be the matrix whose columns are ι(P1 ), . . . , ι(Pt ).
A basis of Vi is given by XiDk P1 , . . . , XiDk Pt . Hence we may realize a basis for ι(Vi )
as the columns of the product BA where
B ∈ Mat(n+(D+1)k)(r+Ek),(n+k)(r+Ek) (Q)
n r n r

is a transformation matrix. The image of a monomial under the homomorphism P 7→

XiDk P is also a monomial. So each row of B has at most one non-zero entry. This
entry is of the form
 1/2  −1/2
k (D + 1)k
α α′
here α, α′ ∈ Nn+1
0 correspond to monomials and satisfy |α|1 = k and |α′ |1 = (D +1)k.
Let K ⊂ Q be a number field containing the finitely many algebraic numbers which
appear in this proof and let v ∈ MK .
Say v is infinite. The absolute value of (6.12) with respect to v is at most (n+1)k/2 .
If B ′ is a t×t submatrix of B, then | det B ′ |v ≤ (n+1)tk/2 . The number of possibilities
for B ′ is
 n+(D+1)k r+Ek n+k r+Ek  t  t  2t
n r n r n + (D + 1)k n+k r + Ek

t t n n r
≤ (n + (D + 1)k)nt (n + k)nt (r + Ek)2rt .
The triangle inequality implies
tk nt
hv,t (B) ≤ log(n + 1) + log((n + (D + 1)k)(n + k)) + rt log(r + Ek).
2 2



Say v is finite place and let p be the rational prime with |p|v < 1. Statement (3.1)
 1/2  −1/2 (
k (D + 1)k ((D + 1)k)(n+1)/2 if p ≤ (D + 1)k,

α α′ 1 otherwise.

From the description of the entries of B given around (6.12) we deduce that
t n+1
2 log((D + 1)k) : if p ≤ (D + 1)k,
hv,t (B) ≤
1 : else wise.

Now for arbitrary v we have hv,t (BA) ≤ hv,t (B) + hv,t (A) by Lemma 3.1. We
multiply the local heights with the corresponding local degrees and sum over all
places of K to obtain
tk nt
ht (BA) ≤ (n + 1) + log((n + (D + 1)k)(n + k)) + rt log(r + Ek)
2 2
+t π((D + 1)k) log((D + 1)k) + ht (A),
where π((D+1)k) denotes the number of rational primes at most (D+1)k. It is known
that π((D + 1)k) log((D + 1)k) ≤ 2(D + 1)k, see for example the work of Rosser and
Schönfeld [58]. Using basic inequalities such as n + 1 ≤ 2n and log k ≤ k we estimate
tk nt
ht (BA) ≤ (n + 1) + log((n + (D + 1)k)(n + k)) + rt log(r + Ek)
2 2
+ (n + 1)(D + 1)tk + ht (A)
≤ ntk + log(6n2 Dk 2 ) + rt log(2rEk) + 4nDtk + ht (A)

≤ nt log( 6nDk) + rt log(2rEk) + 5nDtk + ht (A)

≤ nt log( 6nD) + ntk + rt log(2rE) + rtk + 5nDtk + ht (A).

We recall (6.11), together with ht (BA) = hAr (Vi ) this implies

hAr (W1 ) ≤ 2n2 t log( 6nD) + 2n2 tk + 2nrt log(2rE) + 2nrtk + 10n2 Dtk + 2nht (A).

Since ht (A) = hAr (I(k,Ek) ) = H a (k, Ek; Z) by Lemma 6.4 we have

hAr (W1 ) ≤ 2n H a (k, Ek; Z) + (2n log( 6nD) + 2n + 2r log(2rE) + 2r + 10nD)ntk.
The lemma follows since t = H g (k, Ek; Z) and

2n log( 6nD) + 2n + 2r log(2rE) + 2r + 10nD ≤ 2n2 D + 2n + 2r2 E + 2r + 10nD
≤ (2n2 + 2n + 2r2 + 2r + 10n) max{D, E} ≤ 18 max{n, r}2 max{D, E}.

Lemma 6.6. – We have

hAr (W2 ) ≤ n H a ((D + 1)k, Ek; Z) + n H g ((D + 1)k, Ek; Z).



Proof. – For brevity set t = H g ((D + 1)k, Ek; Z) and let P1 , . . . , Pt denote a basis

of I((D+1)k,Ek) .
Since I((D+1)k,Ek) = I((D+1)k,Ek) we may write W2 as

{(G1 , G′1 , . . . , Gn , G′n ) ∈ R((D+1)k,Ek)

; hGi , Pj i = hG′i , Pj i for 1 ≤ i ≤ n, 1 ≤ j ≤ t}.

Let A ∈ MatN,t (Q) be the matrix whose columns are ι(τ (P1 )), . . . , ι(τ (Pt )); here
N = n+(D+1)k
n r . Then ι(W2 ) is the kernel of the rank nt matrix
 
AT −AT 0
 .. 
B=  .  ∈ Matnt,2nN (Q).

0 AT −AT

Let K ⊂ Q be a number field containing the finitely many algebraic numbers which
appear in this proof and let v ∈ MK .
If v is infinite and σ = σv : K → C the Cauchy-Binet formula implies
exp 2hv,nt (B) = det(σ(B)σ(B) ). We obtain a block-diagonal matrix
 T 
2σ(A) σ(A) 0
T  .. 
σ(B)σ(B) =   . .

0 2σ(A) σ(A)
In total there are n blocks and so det(σ(B)σ(B) ) = 2nt det(σ(A) σ(A))n . If we
apply the Cauchy-Binet formula again we arrive at
(6.13) hv,nt (B) = nhv,t (A) + log 2.
Say v is finite. We fix a t × t submatrix A′ of AT with | det A′ |v maximal. In
particular, det A′ 6= 0. It follows that hv,t (A′−1 AT ) = hv,t (AT ) − log | det A′ |v = 0. We
observe that the entries of A′−1 AT are v-integers. Consider the rank nt matrix
(6.14)   
A′−1 0 A′−1 AT −A′−1 AT 0
 ..   .. 
C=  . B = 
  . .

0 A′−1 0 A′−1 AT −A′−1 AT
| {z }
n blocks

We have hv,nt (C) ≤ 0. The block matrix in the middle of (6.14) has determinant
(det A′ )−n . This shows the equality in
hv,nt (B) − n log | det A′ |v = hv,nt (C) ≤ 0.
We obtain
(6.15) hv,nt (B) ≤ nhv,t (A).



We multiply (6.13) and (6.15) with [Kv : Qv ]/[K : Q] and sum over all places to
hnt (B) ≤ nht (A) + log 2.

Now ht (A) is the height of ι(I((D+1)k,Ek) ); indeed, applying the automorphism τ
does not change the height. So ht (A) = H a ((D + 1)k, Ek; Z) by Lemma 6.4. The
lemma follows because (3.5) implies hAr (W2 ) = hnt (B).

We will not bound the height of W3 directly. Rather we construct a larger space

of controlled height which, together with W1 and W2 , still cuts out WDEk .

Lemma 6.7. – There exists a vector subspace W3′ of R((D+1)k,Ek) such that

WDEk = W1 ∩ W2 ∩ W3′
hAr (W3′ ) ≤ 20n max{n, r}2 max{D, E} H g (k, Ek; Z)k.

Proof. – For brevity we set M = dim R((D+1)k,Ek) = n r . By the defi-
nition of W3 we see that ι(W3 ) ⊂ Q is cut out by nM linear equations; for each
monomial in R((D+1)k,Ek) we need n equations. And each linear equation comes from
one of the n equations
XiDk G′1 − X1Dk G′i = 0.
With respect to the usual basis, a typical linear equations has coefficients
 1/2  1/2
(D + 1)k (D + 1)k
and − with α, α′ ∈ Nn+1
0 , |α| = |α′ | = (D + 1)k.
α α′
Among these nM linear equations we can find t ≤ dim WDEk linearly independent

ones such that if ι(W3′ ) is their common kernel then WDEk = W1 ∩ W2 ∩ W3′ . Let A be
a t × 2nM matrix whose rows are precisely these chosen linear equations. Hence the
kernel of A is ι(W3′ ) and each row has at most two non-zero entries of the form (6.16).
Let K ⊂ Q be a number field containing the finitely many algebraic numbers which
appear in this proof and let v ∈ MK .
Say v is infinite. The absolute value of the multinomials in (6.16) is at most
(n + 1)(D+1)k/2 . Let A′ be a t × t submatrix of A. By the discussion above we obtain
| det A′ |v ≤ (2(n + 1)(D+1)k/2 )t
from the Leibniz formula for the determinant. Now the number of possible t × t
submatrices of A is
   t  t
2nM (D + 1)k + n Ek + r
≤ (2nM )t = (2n)t
t n r
≤ (2n)t ((D + 1)k + n)nt (Ek + r)rt .



By definition of the local height of A we get

1 t 
hv,t (A) ≤ tk(D+1) log(n+1)+t log 2+ log(2n)+n log((D+1)k+n)+r log(Ek+r) .
2 2
If v is finite then hv,t (A) ≤ 0 since the coefficients of A are algebraic integers.
We use this observation, multiply (6.17) with [Kv : Qv ]/[K : Q], and sum over all
places to obtain
1 t 
ht (A) ≤ tk(D+1) log(n+1)+t log 2+ log(2n)+n log((D+1)k+n)+r log(Ek+r) .
2 2

Now t ≤ dim WDEk ≤ dim W1 = 2n dim I(k,Ek) = 2n H g (k, Ek; Z). So ht (A) is at

nk(D + 1) log(n + 1) + n(log(8n) + n log((D + 1)k + n) + r log(Ek + r)) H g (k, Ek; Z).
Again, (3.5) implies hAr (W3′ ) = ht (A). The lemma follows from the following ele-
mentary inequalities
nk(D + 1) log(n + 1) + n(log(8n) + n log((D + 1)k + n) + r log(Ek + r))
≤ 2n2 Dk + 8n2 + 2n2 Dk + n3 + nrEk + nr2
≤ 20n max{n, r}2 max{D, E}k.

We need explicit bounds for the arithmetic Hilbert function H a (ak, bk; Z) for large
values of k. Our tools are Proposition 4.1 and Zhang’s inequality for the essential
minimum for a subvariety of Pn . We recall that s and vab denote the Segre and
Veronese morphism, respectively. Also, degree and height of a subvariety of Pn ×Pr is
the degree and height of its embedding into Pnr+n+r under the Segre morphism,

Lemma 6.8. – We have

h(vab (Z)) ≤ (1 + d) max{a, b}d+1 h(Z)
for a, b ∈ N.

Proof. – If X ⊂ Pn is an irreducible closed subvariety defined over Q, then its essen-

tial minimum is

µess (X) = inf θ ∈ R; {z ∈ X(Q); h(z) ≤ θ} is Zariski dense in X .
Let ε > 0, then

z ∈ s(Z)(Q); h(z) ≤ µess (s(Z)) + ε is Zariski dense in s(Z).
Any z in this set is of the form s(p, q) with (p, q) ∈ Z(Q). By Section 1.5.14 [7]
we have h(z) = h(p) + h(q). An elementary local estimate shows h(va (p)) ≤ ah(p)
and h(vb (a)) ≤ bh(q). We have vab (z) = (va (p), vb (q)), so h(s(vab )(z)) = h(va (p)) +
h(vb (q)) ≤ ah(p)+bh(q) ≤ max{a, b}h(z). The set of s(vab (z)) thus obtained is Zariski



dense in s(vab (Z)). We get µess (s(vab (Z))) ≤ max{a, b}(µess (s(Z)) + ε) for all ε > 0.
Letting ε go to zero gives
(6.18) µess (s(vab (Z))) ≤ max{a, b}µess (s(Z)).
Zhang’s inequality [69] states
h(X) h(X)
(6.19) ≤ µess (X) ≤
(1 + dim X)deg(X) deg(X)
for a subvariety of any projective space X defined over Q.
We use his inequality to bound µess (s(vab (Z))) from below and µess (s(Z)) from
above. On recalling the convention h(s(Z)) = h(Z) and deg(s(Z)) = deg(Z), inequal-
ity (6.18) implies
h(vab (Z)) h(Z)
≤ µess (s(vab (Z))) ≤ max{a, b}µess (s(Z)) ≤ max{a, b} ;
(1 + d)deg(vab (Z)) deg(Z)
we note dim s(vab (Z)) = d. Lemmas 4.1 and 4.2 give deg(vab (Z)) = H(1, 1; vab (Z)) =
H(a, b; Z) ≤ max{a, b}d deg(Z). The current lemma follows from (6.20).

Lemma 6.9. – If k ≥ deg(Z), then

H a (ak, bk; Z) ≤ 2r max{a, b}d+1 (h(Z) + deg(Z)) k
for a, b ∈ N.

Proof. – By Lemma 5.5 we deduce H a (ak, bk; Z) ≤ H a (k, k; vab (Z)). For brevity,
we set X = s(vab (Z)) ⊂ Pnr+n+r and use Lemma 5.4 to estimate H a (k, k; vab (Z)) ≤
H a (k; X). Hence

H a (ak, bk; Z) ≤ H a (k; X).

We apply Proposition 4.1 to bound the arithmetic Hilbert function of X and obtain
h(X) 1
(6.21) H a (ak, bk; Z) ≤ H g (k; X) k + log H g (k; X) .
deg(X) 2
We continue by bounding the height of X. Lemma 6.8 implies
h(X) ≤ (d + 1) max{a, b}d+1 h(Z).
We insert this into (6.21) to get
H g (k; X) 1
H a (ak, bk; X) ≤ (d + 1) max{a, b}d+1 k h(Z) + H (k; X) log H g (k; X).
deg(X) 2 g
Chardin’s bound for the geometric Hilbert function [18] states
H g (k; X) ≤ deg(X) .



d+1 d+k 1 d+k
H a (ak, bk; X) ≤ (d+1) max{a, b} h(Z) k+ deg(X) log H g (k; X).
d 2 d

Lemmas 4.1 and

 4.2 give deg(X) = deg(vab (Z)) = H(a, b; Z) ≤ max{a, b}d deg(Z).
d+k d
Inequality d ≤ (ek) certainly holds for d = 1 and follows easily from (6.9) if
d ≥ 2. Hence log H g (k; X) ≤ log(deg(X)(ek)d ) ≤ d log(e max{a, b}deg(Z)k). We use
k ≥ deg(Z) to see that

log H g (k; X) ≤ d log(e max{a, b}k 2 ) ≤ 2d log(e max{a, b}k) ≤ 2d max{a, b}k.

We apply this and the bound for deg(X) from above to (6.23) and obtain
d+1 d+k d+1 d+k
H a (ak, bk; X) ≤ (d + 1) max{a, b} h(Z) k + d max{a, b} deg(Z) k.
d d
The lemma follows since d + 1 ≤ 2d ≤ 2r.

We now bound the height of WDEk from above explicitly in terms of h(Z), deg(Z),
and the parameters D, E, and k.

Lemma 6.10. – If k ≥ deg(Z), then

hAr (W1 ) ≤ 24n max{n, r}2 max{D, E}E d (h(Z) + deg(Z)) k,
hAr (W2 ) ≤ 3nr max{D + 1, E}d+1 (h(Z) + deg(Z)) k, and
hAr (W3′ ) ≤ 20n max{n, r}2 max{D, E}E d deg(Z) k.

Proof. – The inequalities

(6.24) H a (k, Ek; Z) ≤ 2rE d+1 (h(Z) + deg(Z)) k,
H g (k, Ek; Z) ≤ H(1, E; Z)
follow from Lemmas 6.9 and 4.4, respectively. Lemma 4.1 gives the bound
H(1, E; Z) ≤ E d deg(Z), so
d d+k
(6.25) H g (k, Ek; Z) ≤ E deg(Z) .



The same lemmas and Lemma 4.1 imply

H a ((D + 1)k, Ek; Z) ≤ 2r max{D + 1, E}d+1 (h(Z) + deg(Z)) k,
d+k d d+k
H g ((D + 1)k, Ek; Z) ≤ H(D + 1, E; Z) ≤ max{D + 1, E} deg(Z) .
d d
First, we bound hAr (W1 ). By the estimate in Lemma 6.5 together with (6.24) and
(6.25) we get
hAr (W1 ) ≤ 4nrE d+1 (h(Z) + deg(Z)) k
+ 20n max{n, r}2 max{D, E}E d deg(Z) k
≤ (4nr + 20n max{n, r}2 ) max{D, E}E d (h(Z) + deg(Z)) k
≤ 24n max{n, r}2 max{D, E}E d (h(Z) + deg(Z)) k.
This is the bound for hAr (W1 ) in the lemma.
Next, we bound hAr (W2 ). For this we need Lemma 6.6 which, together with the
bounds (6.26) and (6.27), gives
hAr (W2 ) ≤ 2nr max{D + 1, E}d+1 (h(Z) + deg(Z)) k
+ n max{D + 1, E}d deg(Z)
≤ 3nr max{D + 1, E}d+1 (h(Z) + deg(Z)) k
and so the second bound in the assertion.
Finally, we give a bound for hAr (W3′ ). Applying Lemma 6.7 and (6.25) leads to the
final bound
hAr (W3′ ) ≤ 20n max{n, r}2 max{D, E}E d deg(Z) k.

By Lemmy 6.7, the vector space WDEk is the intersection W1 ∩ W2 ∩ W3′ , this
enables us to bound its height.

Lemma 6.11. – If k ≥ deg(Z), then

′ 2 d+1 d+k
hAr (WDEk ) ≤ 50n max{n, r} max{D + 1, E} (h(Z) + deg(Z)) k.



Proof. – A theorem of Schmidt, cf. (3.4) in Remark 3.4, implies hAr (WDEk ) ≤
hAr (W1 ) + hAr (W2 ) + hAr (W3′ ). Adding the bounds provided by the previous lemma
leads to the desired inequality.

6.4. Proof of Propositions 6.1 and 6.2. – We continue working with the notation intro-
duced in the preceeding subsections. We recall that κ(Z) was defined in (6.2).
We will need some preparatory estimates.

Lemma 6.12. – We have

κ(Z) ≤ ∆0 (Z) ≤ deg(Z).
Proof. – Indeed, Lemma 4.1 and (6.1) imply deg(Z) = i=0 di ∆i (Z) ≥ ∆0 (Z). We
may assume κ(Z) ≥ 1. By definition there is 1 ≤ i ≤ d with ∆i (Z) 6= 0 and κ(Z) =
(∆0 (Z)/∆i (Z))1/i ≤ ∆0 (Z)/∆i (Z) ≤ ∆0 (Z) ≤ deg(Z) and our lemma holds.

The next lemma bounds the value of Ψ, defined near (6.10), from above.
Lemma 6.13. – Let G = (G1 , G′1 , . . . , Gn , G′n ) ∈ i=1 V0 × Vi be non-zero, then
h(Ψ(G)) ≤ h(G) + ( D+1
2 log(n + 1) + n + 1)k.

Proof. – By the convention introduced in Section 3.2, the height of G is the height
of ι(G).
Tracing through the definition of ι we see that each coordinate of ι(Ψ(G)) is some
coordinate of ι(G) times a factor of the form
 1/2  −1/2
(D + 1)k k
with α, α′ ∈ Nn+10 and |α|1 = (D + 1)k, |α′ |1 = k.
α α′
Let K ⊂ Q be a number field containing all algebraic numbers which appear below
and let v ∈ MK .
Say v is infinite. Then the absolute value of the expression (6.28) with respect to v
is bounded by (n + 1)(D+1)k/2 . It follows that
(D + 1)k
(6.29) log |Ψ(G)|v ≤ log |G|v + log(n + 1).
Now say if v is finite and let p be the rational prime with |p|v < 1. The v-adic
absolute value of (6.28) is at most k (n+1)/2 if p ≤ k and at most 1 if p > k, cf. (3.1).
It follows that
2 log k if p ≤ k,
(6.30) log |Ψ(G)|v ≤ log |G|v +
0 otherwise.
Multiplying the expressions (6.29) and (6.30) with the corresponding local degrees
and taking the sum over all places gives
D+1 n+1
h(Ψ(G)) ≤ h(G) + k log(n + 1) + π(k) log k
2 2



here, as in the proof of Lemma 6.5, π(k) denotes the number of rational primes at
most k. We recall π(k) log k ≤ 2k which completes the proof.
The following absolute version of Siegel’s Lemma follows from work of Zhang. Roy
and Thunder [59] proved a variant of the absolute Siegel Lemma which could also be
used at this point.
′ ′
Lemma 6.14. – Suppose dim WDEk ≥ 2. There exists a non-zero G ∈ WDEk such that

hAr (WDEk ) ′
h(G) ≤ ′ + log dim WDEk .
dim WDEk
Proof. – This is a consequence of David and Philippon’s lemme 4.7 [24] which is based
Pd−1 Ps
on a result of Zhang. We note that s=1 t=1 1/t ≤ d log d by (4.9). The artificial

hypothesis dim WDEk ≥ 2 allows us to avoid the ε in the reference.
This variant of Siegel’s Lemma is needed in the next lemma.
Lemma 6.15. – We assume
D+1 1
≤ κ(Z)
E 4dn
k ≥ max{[17nd!ed ∆d−1
0 ], deg(Z)}.
There exists a non-zero F ∈ WDEk such that
1 max {1, κ(Z)}
h(F ) ≤ 400n max{n, r}2 (h(Z) + deg(Z)) + 5ddeg(Z).
Ek ∆0

Proof. – Recall that Ψ given by (6.10) defines an isomorphism between WDEk and
WDEk .
Let us assume that k is as in the hypothesis. Then k ≥ 16nd!ed ∆d−1
0 and so
1 kd 1 kd
− 4ned ∆d−1
0 k d−1 ≥ .
2 d! 4 d!
Lemma 6.3 implies
′ 1 kd
dim WDEk = dim WDEk ≥ ∆0 E d ;
4 d!

this implies dim WDEk ≥ 2 by our choice of k.

A calculation involving (6.9) shows d+k
d ≤ 2k d /d! since k ≥ d!ed . So
′ 1 d+k
dim WDEk ≥ ∆0 E d .
8 d

Because of Lemmas 6.14 and 6.11 there exists a non-zero G ∈ WDEk with

hAr (WDEk ) ′
h(G) ≤ ′ + log dim WDEk
dim WDEk
max{D + 1, E}d+1 ′
≤ 400n max{n, r}2 (h(Z) + deg(Z))k + log dim WDEk .
∆0 E d



We need to bound dim WDEk = dim WDEk from above in order to get a handle on

the logarithm. Indeed, by definition (6.5) we have dim WDEk ≤ (n+1) H g (k, Ek; Z) ≤
2n H g (k, Ek; Z). Just as around (6.25) in the proof of Lemma 6.10 we have
d d+k
H g (k, Ek; Z) ≤ E deg(Z) ≤ 2E d deg(Z)k d /d!,

log dim WDEk ≤ log(4nE d deg(Z)k d ) ≤ d log(4nEdeg(Z)k).
We obtain
d log(4nEdeg(Z)k) d log(4n) d log E d log deg(Z) d log k
= + + +
Ek Ek Ek Ek Ek
≤ 1 + 1 + d + d ≤ 4d
from k ≥ 16dn and k ≥ deg(Z). Thus
log dim WDEk ≤ 4dEk.

We set F = Ψ(G) 6= 0. Its height is bounded from above by Lemma 6.13, indeed
h(F ) ≤ h(G) + log(n + 1) + n + 1 k ≤ h(G) + 3nDk
max{D + 1, E}d+1
≤ 400n max{n, r}2 (h(Z) + deg(Z))k + 4dEk + 3nDk.
∆0 E d
We use the bound (D + 1)/E ≤ κ(Z)/(4dn) ≤ κ(Z) to estimate
1 max{1, κ(Z)}d+1
h(F ) ≤ 400n max{n, r}2 (h(Z) + deg(Z)) + 4d + κ(Z).
Ek ∆0
Lemma (6.12) implies 4d + κ(Z) ≤ 5ddeg(Z) and the current lemma follows.

Proof of Proposition 6.1. – In order to prove the proposition we may assume that X0
does not vanish identically on Z. Indeed, otherwise we are in case (i).
Let us assume for the moment that κ < 17dn. For Q ≥ 1 there are integers x, y ∈ Z
with 1 ≤ y ≤ Q such that |yκ/(8dn) − x| ≤ Q−1 ; this follows easily from Dirichlet’s
Box Principle as employed on the first page of Cassels’ book [16].
We take Q = max{1, 16dn/κ}. Then |x/y| ≤ κ/(8dn) + 1/(yQ) ≤ κ/(8dn) +
κ/(16dn) ≤ κ/(4dn) and |x/y| ≥ κ/(8dn)−1/(yQ) ≥ κ/(8dn)−κ/(16dn) = κ/(16dn).
Finally, x ≥ 1; indeed, otherwise we would have yκ/(8dn) − x ≥ κ/(8dn) > Q−1 and
this is a contradiction.
We set D = 4x − 1 and E = 4y. Hence D, E are positive integers with
κ D+1 κ
(6.31) D ≥ 3, E ≤ 4 max{1, 16dn/κ}, and ≤ ≤ .
16dn E 4dn
If κ ≥ 17dn, we set D = [κ/(4dn)]−1 and E = 1. So they also satisfy all inequalities
in (6.31).



We pick k = max{[17nd!ed ∆d−1 0 ], deg(Z)} in accordance with Lemma 6.15. Let

F = (F0 , . . . , Fn ) ∈ WDEk be as provided by this lemma. We note that
(6.32) Ek ≤ k0 .

Some Fi is non-zero. As an element of I(k,Ek) \ {0}, it does not vanish identically
on Z by what was stated in Remark 6.1. It follows from (6.5), the definition of WDEk ,
and from the fact that X0 does not vanish identically on Z that F0 does not vanish
identically on Z. We take F in the assertion of the current proposition to be F0 . Note
that it is bihomogeneous of bidegree (a, b) = (k, Ek).
The desired bounds for a and b follow from our choice of k. Moreover, if κ ≥ 17dn,
then E = 1 and so a = b. The bound for h(F0 ) follows from h(F0 ) ≤ h(F ) =
h(F0 , . . . , Fn ), from (6.32), and from Lemma 6.15.
Say (p, q) ∈ Z(Q) and let us assume that we are not in case (i) of the proposition.
We are in the position to apply Lemma 6.1 with (a, b) as above and c = Dk. We
D−1 1 D 1 κ
h(p) ≤ h(q) + h(F ) + log(n + 1) ≤ h(q) + h(F ) +
E Ek 2E Ek 8d
where we used D/E ≤ κ/(4dn) from (6.31) and log(n + 1) ≤ n.
The bound for h(F ) given by Lemma 6.15 implies
D−1 max {1, κ} κ
h(p) ≤ h(q) + 400n max{n, r}2 (h(Z) + deg(Z)) + 5ddeg(Z) + .
E ∆0 8d
Since D ≥ 3 we have (D − 1)/E ≥ (D + 1)/(2E) and so (D − 1)/E ≥ κ/(32dn) by
(6.31). Hence
max{1, κ}d+1
κh(p) ≤ 25 dnh(q) + 12800dn2 max{n, r}2 (h(Z) + deg(Z))
+ 160d2 ndeg(Z) + 4nκ.
The inequality in part (ii) of the assertion follows from d ≤ r and κ ≤ deg(Z), cf.
Lemma 6.12.
Lemma 6.16. – Let a ∈ N and say P ∈ Q[X, Y](a,a) . There is Q ∈ Q[U]a with
s∗ (Q) = P and
h(Q) ≤ h(P ) + (n + r + 2)a.
Proof. – Just for this proof we let h·, ·i be the inner product attached to the identity
on Q as in Remark 5.2.
We know that s∗ : Q[U]a → Q[X, Y](a,a) is a surjective isometry by Lemma 5.2.
It follows that ker s∗ ∩ (ker s∗ )⊥ = 0 by Remark 5.1. So ker s∗ + (ker s∗ )⊥ = Q[U]a .
Therefore, s∗ |(ker s∗ )⊥ : (ker s∗ )⊥ → Q[X, Y](a,a) is surjective. There is Q ∈ (ker s∗ )⊥
P (n+1)(r+1)
with s∗ (Q) = P . We write Q = γ Qγ Uγ where γ runs over elements in N0
with |γ|1 = a. It remains to bound the height of Q from above.
Let K ⊂ Q be a finite normal extension of Q containing all of the finitely many
algebraic numbers that appear in the proof below. Let v ∈ MK .



(n+1)(r+1) −1/2
If v is finite, there is γ0 ∈ N0 with |Q|v = γa0 Qγ0 . We have
a −1 γ0 ∗ γ0 ∗
γ0 Q γ0 = hQ, U i = hP, s (U )i since s is an isometry. This inner product
a −1 a −1 n+1 r+1
equals α β Pαβ with α ∈ N0 and β ∈ N0 and where Pαβ is a coefficient
of P . Hence
 −1/2  1/2  −1  −1    −1/2
a a a a a a
|Q|v = Qγ0 = Pαβ ≤ |P |v .
γ0 γ0 α β α β v
v v
Together with (3.1) we have
a(n+r+2)/2 if p ≤ a,
(6.33) |Q|v ≤ |P |v ·
1 otherwise,
where p is the rational prime with |p|v < 1.
Recall that τ is complex conjugation restricted to Q. If v is infinite and σ = σv ,
then there is an automorphism η of K such that σ ◦ η = τ ◦ σ. We have |Q|2v =
ι(σ(Q)) · τ (ι(σ(Q))) = σ(hQ, η(Q)i). But Q ∈ ker s∗ ⊥ and s∗ is an isometry, so
|Q|2v = σ(hs∗ (Q), s∗ (η(Q))i) = σ(hs∗ Q, η(s∗ Q)i) = σ(hP, η(P )i) = |P |2v . Therefore,
(6.34) |Q|v = |P |v .
We multiply the logarithm of (6.33) and (6.34) with [Kv : Qv ]/[K : Q] and sum
over all places of K to obtain
h(Q) ≤ h(P ) + π(a) log a
where, as usual, π(a) is the number of rational primes at most a. The lemma follows
from π(a) log a ≤ 2a, an inequality we have already used twice.
We now prove Proposition 6.2.
For brevity set β(Z) = h(Z) + deg(Z).
Let a, b, and F be as in Proposition 6.1; we note that b = a since κ ≥ 17dn by
Say (p, q) is as in the proposition. If some projective coordinate of p vanishes or if
p is not isolated in π1 |−1
Z (p), then we are in case (i). So let us assume the contrary.
If F (p, q) 6= 0 then we are in case (ii) of Proposition 6.1. The height bound for h(p)
κh(p) ≤ 25 dnh(q) + 214 n2 r max{n, r}2 β(Z) + 28 nr2 deg(Z)
∆0 (Z)
5 14 2 2 κ
≤ 2 dnh(q) + 2 n r max{n, r} + 1 β(Z).
∆0 (Z)
The inequality in part (iii) now follows easily.
It remains to treat the case F (p, q) = 0. Then F will determine the obstruction
variety V as follows. Let Ve1 , . . . , VeN be the irreducible components of the intersection
of Z with the zero set of F . Of course, these are independent of (p, q). Then dim Vei =



d − 1 because F does not vanish identically on Z. We may omit those Vi for which
π1 |Vei has degree zero since (p, q) is isolated in π1 |Z (p). Let us set Vi = π1 (Vei ). Our
point (p, q) is contained in some Vei . By dimension theory of varieties, cf. Exercise
II.3.22 [34]oor Theorem 7, Chapter I.3 [61], Vi has dimension d − 1 and π1 | e : Vei →
Vi is generically finite.
We apply Lemma 6.16 to obtain Q ∈ Q[U]a with s∗ (Q) = F and
(6.35) h(Q) ≤ h(F ) + (n + r + 2)a.

The images s(Vei ) are irreducible components of the intersection of s(Z) with
the zero-set of Q. By Bézout’s Theorem, cf. Example 8.4.6 [26], we estimate
PN e PN e
i=1 deg(Vi ) = i=1 deg(s(Vi )) ≤ adeg(s(Z)) = adeg(Z).
By Lemma 4.1 we have ∆d−1 (Vei ) ≤ deg(Vei ) for 1 ≤ i ≤ N . The projection formula
(6.36) deg(Vi ) = deg(π1 (Vei )) ≤ ∆d−1 (Vei ) ≤ deg(Vei )
deg(Vi ) ≤ deg(Vei ) ≤ adeg(Z)
i=1 i=1
The bound for a from Proposition 6.1 leads to the bound (6.3).
It remains to bound each h(Vi ) from above. For brevity we set V = Vi and Ve = Vei
for some valid i.
Let K ⊂ Q be a number field containing all of the finitely many algebraic numbers
that appear in the proof below and let v ∈ MK .
If v is infinite, then the Cauchy-Schwarz inequality implies |σv (Q)(x)| ≤
|ι(Q)|v |x|v for all x ∈ C(n+1)(r+1) . Therefore,
X [Kv : Qv ] nr+n+r
X 1
mv (Q) ≤ h(Q) + deg(Q) .
[K : Q] j=1

with mv (Q) as in Section 3.3 with r = 0 and d0 = 1. We recall deg(Q) = a. If

W is the hypersurface defined by Q in Pn , then deg(W ) = a and h(W ) ≤ h(Q) +
Pnr+n+r Pi 1
a i=1 j=1 2j by the comment on the top of page 347 [43]. Using (4.9) we
(6.37) h(W ) ≤ h(Q) + (n + 1)(r + 1) log((n + 1)(r + 1))
≤ h(Q) + 2anr log(4nr) ≤ h(F ) + (n + r + 2)a + 2anr log(4nr)
≤ h(F ) + 6anr log(4nr)

where the bound for h(Q) came from (6.35). Since s(Ve ) is an irreducible component
of s(Z) ∩ W we have
h(Ve ) = h(s(Ve )) ≤ ah(Z) + h(W )deg(Z) + cadeg(Z)



by the Arithmetic Bézout Theorem, Théorème 3 [43]; here

X nr+n+r
nr+n+r X 1
c ≤ (n + 1)(r + 1) log 2 +
i=0 j=0
2(i + j + 1)
1 X 1
≤ (n + 1)(r + 1) log 2 + (n + 1)(r + 1)
2 j=1
X 1
≤ 4nr log 2 + 2nr ≤ 4nr log 2 + 4nr log(4nr) ≤ 8nr log(4nr).
This implies
(6.38) h(Ve ) ≤ ah(Z) + h(W )deg(Z) + 8anr log(4nr)deg(Z).
By definition, for any ε > 0 there is a Zariski dense set of points (p′ , q ′ ) ∈ Ve (Q)
with h(p′ ) + h(q ′ ) = h(s(p′ , q ′ )) ≤ µess (s(Ve )) + ε. The resulting set of p′ lies Zariski
dense in V , hence µess (V ) ≤ µess (s(Ve )) after letting ε go to 0. Zhang’s inequality
deg(V ) e deg(V ) e
(6.19) implies h(V ) ≤ (dim V + 1) deg( e ) h(V ) ≤ d deg(V
V e ) h(V ). Using (6.36) we get

h(V ) ≤ dh(Ve ). Moreover, (6.38) gives

h(V ) ≤ adh(Z) + dh(W )deg(Z) + 8adnr log(4nr)deg(Z)
≤ 14adnr log(4nr)β(Z) + dh(F )deg(Z),
where we used (6.37) to bound h(W ) in terms of h(F ). The bound for h(F ) and the
inequalities κ ≥ 1 and a ≤ k0 show
h(V ) ≤ 14dnr log(4nr)β(Z)k0 + d 400n max{n, r}2 β(Z) + 5ddeg(Z) deg(Z)k0

≤ d 14nr log(4nr) + 400n max{n, r}2 deg(Z) + 5ddeg(Z) β(Z)k0 .
We estimate log(4nr) = log(2n) + log(2r) ≤ n + r ≤ 2 max{n, r} and recall d ≤ r.
Inequality (6.39) yields
2 2 3 3 κd+1
h(V ) ≤ max{n r , nr , n r} 28 + 400 deg(Z) + 5deg(Z) β(Z)k0
9 2 2 3 3 κd+1
≤ 2 max{n r , nr , n r} max 1, β(Z)deg(Z)k0 .

7. Degree and Height Upper Bounds for Compactifications

Throughout this subsection let X ( Gnm be an irreducible closed subvariety defined
over Q of dimension 1 ≤ r ≤ n − 1. Moreover, let ϕ : Gnm → Grm be a homomorphism.
Using the open immersion Gnm ֒→ Pn introduced in Section 3.1 we consider the
algebraic torus as an open subvariety of projective space. We let X denote the Zariski



closure of X in Pn . Similarly we may consider Gnm × Grm as an open subvariety

of Pn × Pr . We let X denote the Zariski closure in Pn × Pr of the graph of ϕ| :
X → Grm . Then X is an irreducible closed subvariety of Pn × Pr of dimension r.
There are open immersions X → X and X → X . The same compactification was
used in the earlier paper [31].
As in previous sections π1 and π2 denote the projections Pn × Pr → Pn and
P × Pr → Pn , respectively. We end up with a commutative diagramm

X ←−−−− X −−−−X
→ Grm
 
(7.1)  
y y
X ←−−−− X −−−−→ Pr
π1 |X ϕ π2 |X ϕ

of morphisms.
The purpose of this section is to bound degree and height of X in terms of X
and ϕ. We will later apply these bounds together with the height estimates from the
previous section to eventually prove Theorem 12. Recall that the degree of X is by
definition the degree of s(X ) ⊂ Pnr+n+r where s is the Segre morphism. The height
ϕ ϕ ϕ
of X is the height of s(X ) as a subvariety of Pnr+n+r . Moreover, ∆i (X ) are the
bidegrees introduced in Section 6.
We also use k · k to denote the sup-norm of any matrix with real coefficients.
Homomorphisms Gnm → Grm can be identified with n × r matrices in integer coef-
ficients. Therefore, kϕk is well-defined. It is non-zero if and only if ϕ is non-constant.
Lemma 7.1. – If ϕ is non-constant, then
(7.2) deg(X ) ≤ (4nkϕk)r deg(X),
(7.3) ∆i (X ) ≤ (4n)r kϕkr−i deg(X) for all 0 ≤ i ≤ r, and
ϕ r
(7.4) deg(ϕ| ) = ∆0 (X ) ≤ (4nkϕk) deg(X).

Proof. – We essentially follow the argument given in Lemma 3.3 [31]. The l2 -norm
on Matn,r (R) was used in the reference, but here we work with the sup-norm. There
it is shown that X is an irreducible component of (X × Pr ) ∩ Y where Y is the set
of common zeros of bihomogeneous polynomials whose bidegrees are at most (D, 1)
with D ≤ nkϕk.
By Philippon’s version of Bézout’s Theorem, Proposition 3.3 [41], we bound
H(D, 1; X ) ≤ H(D, 1; X × Pr )
2r i 2r−i
(7.5) = (π1∗ O (1) π2∗ O (1) [X × Pr ])Di .
Commutativity of intersection products and the projection formula imply
i 2r−i 2r−i i
(π1∗ O (1) π2∗ O (1) [X × Pr ]) = O (1) π2∗ (π1∗ O (1) [X × Pr ]) .



If i > r = dim X, then the intersection number on the right vanishes. On the other
hand, if 2r − i > r then it vanishes too because
i 2r−i i 2r−i
(π1∗ O (1) π2∗ O (1) [X × Pr ]) = O (1) π1∗ (π2 ∗ O (1) [X × Pr ]) .

So only the term i = r survives in (7.5) and we obtain

ϕ 2r r r 
H(D, 1; X ) ≤ π1∗ O (1) π2∗ O (1) [X × Pr ] Dr .
The intersection number on the right is deg(X) and we conclude
ϕ 2r
H(D, 1; X ) ≤ deg(X)Dr .
Inserting the definition of ∆i (X ) from Section 6 leads us to
X r    
r ϕ i ϕ 2r
∆i (X )D = H(D, 1; X ) ≤ deg(X)Dr ≤ 4r deg(X)Dr .
i r
ϕ ϕ
We note that the ∆i (X ) cannot be negative. By Lemma 4.1 we have deg(X ) =
Pr r ϕ
i=0 i ∆i (X ). So (7.2), (7.3), and the inequality of (7.4) follow from 1 ≤ D ≤
ϕ ϕ
We have ∆0 (X ) = (π2∗ O (1)r [X ]) by definition. The projection formula implies
ϕ ϕ ϕ
∆0 (X ) = ( O (1)r π2∗ [X ]) = deg(π2 |X ϕ )( O (1)r [π2 (X )]).
We have deg(π2 |X ϕ ) = deg(ϕ| ) since the all vertical arrows in (7.1) are birational
morphisms. The equality in (7.4) certainly holds if deg(ϕ| ) = 0. Otherwise, π2 |X ϕ :
ϕ ϕ ϕ
X → Pr has generically finite fibers and we have dim π2 (X ) = dim X = r by
ϕ ϕ
the basic dimension theorem of varieties. Hence π2 (X ) = Pr and so ∆0 (X ) =
deg(π2 |X ϕ ), as desired.
We need information on κ(X ), as defined in (6.2). Recall that we only defined
ϕ ϕ
this quantity if ∆0 (X ) > 0 and ∆i (X ) > 0 for some 1 ≤ i ≤ r.
ϕ ϕ
Lemma 7.2. – We assume deg(ϕ| ) ≥ 1. Then ∆0 (X ) ≥ 1, ∆r (X ) ≥ 1, and we
kϕk deg(ϕ| ) ϕ
≤ κ(X ) ≤ deg(ϕ| ).
(4n) deg(X) kϕkr
r X

Proof. – Positivity of ∆0 (X ) follows from Lemma 7.1. By the projection formula we
ϕ ϕ ϕ
have ∆r (X ) = deg(π1 |X ϕ )( O (1)r [π1 (X )]). Recall that X ⊂ Pn × Pr is the Zariski
closure of the graph ϕ| : X → Grm . This implies deg(π1 |X ϕ ) = 1 and π1 (X ) = X.
So ∆r (X ) = deg(X) ≥ 1.
The upper bound for κ = κ(X ) follows from Lemma 6.12 and (7.4).



ϕ ϕ ϕ
To get the lower bound fix 1 ≤ i ≤ r with ∆i (X ) > 0 and κ = (∆0 (X )/∆i (X ))1/i .
Then (7.3) and (7.4) give
!1/i !1/i
∆0 (X ) deg(ϕ| ) deg(ϕ| )
κ= ϕ ≥ kϕk r r
≥ kϕk ,
∆i (X ) (4n) kϕk deg(X) (4n)r kϕkr deg(X)

in the second inequality we used again (7.4).

In Section 3.2 we introduced a height function hs : Gnm (Q) → [0, ∞) with sup-norm
at the infinite places.
We now bound the height of X .

Lemma 7.3. – If ϕ 6= 0, then h(X ) ≤ (4n)n+2 kϕkr+1 h(X) + kϕk .

Proof. – For any p ∈ Gnm (Q) we have hs (ϕ(p)) ≤ nrkϕkhs (p) by the discussion
around (3.2). Therefore, h(ϕ(p)) ≤ 12 log(n + 1) + nrkϕkhs (p) ≤ n + nrkϕkh(p) from
the comparison estimates between the two heights. Let ε > 0. We may find a Zariski
dense set of p ∈ X(Q) with h(p) ≤ µess (X) + ε. Recall that s is the Segre morphism.
We have h(s(p, ϕ(p))) = h(p) + h(ϕ(p)) ≥ h(p), so
h(s(p, ϕ(p))) ≤ µess (X) + ε + n + nrkϕkh(p) ≤ n + (1 + nrkϕk)(µess (X) + ε).
The resulting set of points (p, ϕ(p)) lies Zariski dense in X . So
µess (s(X )) ≤ n + 2nrkϕk(µess (X) + ε)
and letting ε tend to zero gives
(7.6) µess (s(X )) ≤ n + 2nrkϕkµess (X).

We use once more Zhang’s inequality (6.19) to compare essential minimum with
the height and degree of a variety. More precisely, we have
ess ϕ h(X ) h(X)
µ (s(X )) ≥ ϕ and µess (X) ≤ .
(1 + r)deg(X ) deg(X)
Combining these two with (7.6) gives
h(X ) h(X)
ϕ ≤ n + 2nrkϕk
(1 + r)deg(X ) deg(X)
and so
ϕ ϕ deg(X )
h(X ) ≤ n2 deg(X ) + 2n3 kϕk h(X)
after using r ≤ n − 1. Lemma 7.1 implies deg(X ) ≤ (4nkϕk)r deg(X) and this
completes the proof.



8. Tropical Geometry and Degree Lower Bounds

Recall that n and r are positive integers. As usual, we identify elements of Matr,n (Z)
with homomorphisms of algebraic groups Gnm → Grm . If ϕ is such a matrix and
X ⊂ Gnm is an irreducible closed subvariety defined over C of dimension r, then
deg(ϕ| ) is the degree of the restriction ϕ| : X → Grm . In this section we use
techniques from Tropical Geometry to evaluate deg(ϕ| ) in terms of ϕ and the tropical
variety of X, to be defined further down in (8.1).
Although a ϕ ∈ Matr,n (Q) need not determine a homomorphism of algebraic
groups we can make sense of deg(ϕ| ) by killing denominators, cf. Lemma 3.1(iii)
[31]. The degree turns out to be homogeneous in the sense that
deg(λϕ| ) = |λ|r deg(ϕ| )
for all ϕ ∈ Matr,n (Q) and λ ∈ Q.
Let s be an integer with r ≤ s ≤ n. Let ε > 0, then ϕ0 ∈ Mats,n (R) is called
ε-regular if for any ϕ ∈ Mats,n (R) with rank(ϕ) < s we have kϕ0 − ϕk ≥ ε. In other
words, the distance of ϕ0 to the set of matrices of non-full rank is at least ε.
Let Πrs denote the set of r × s matrices which represent projections Qs → Qr onto
r distinct coordinates of Qs .

Proposition 8.1. – Let X ( Gnm be an irreducible closed subvariety defined over C

with dim X = r ≥ 1. Let s be an integer with r ≤ s ≤ n. One of the following two
cases holds.
(i) There exists an algebraic subgroup H ⊂ Gnm such that dimp X ∩pH ≥ max{1, s+
dim H − n + 1} for all p ∈ X(C).
(ii) If ε ∈ (0, 1] and if ϕ ∈ Mats,n (Q) is ε-regular, there is π ∈ Πrs with
−50n5 (2n)n
− 12 (n−r)(r+1+(r+3)(sn+1)(2r)sn ) ε
deg(πϕ| ) ≥ 2 deg(X) .
X max{1, kϕk}

8.1. Preliminaries on Tropical Geometry. – Let X ⊂ Gnm be an irreducible closed

subvariety defined over C of dimension r ≥ 1. One can associate to X a set T (X) ⊂
Qn , called the tropical variety of X, in the follow manner.
Let K be the field of puiseux series in a single variable with complex coefficients.
This is an algebraically closed field equipped with a surjective valuation ord : K →
Q ∪ {+∞}. We also use ord : K n → (Q ∪ {+∞})n to denote the n-fold product. We
(8.1) T (X) = {ord(x); x ∈ X(K)} ⊂ Qn .
There is more information attached to the tropical variety of X. One can define
a locally constant function mX : T (X) → N called the multiplicity function, cf.
Definition 3.7 [62]. In addition to this, the set T (X) can also be equipped with a fan
structure which will play no role in the current paper.



The closure of T (X) in Rn coincides with the so-called Bieri-Groves set of X, see
the work of Einsiedler, Kapranov, and Lind [25] for a proof. It follows from Einsiedler,
Kapranov, and Lind’s Theorem 2.2.5 that T (X) is a rational polyhedral set, i.e., it
is a finite union of rational convex polyhedral. Moreover, it is pure of dimension r
which means that its maximal polyhedra have dimension r.
In our particular situation, the variety X is defined over C. We claim that T (X) is
a cone. Indeed, X is cut out by finitely many polynomials f ∈ C[X1 , . . . , Xn ]. Each
coordinate of a point x ∈ X(K) is a puiseux series in a variable T , say, and f (x) = 0.
For any rational ν > 0 we substitute T for T ν ∈ K in x and obtain x(T ν ). Moreover,
f (x(T ν )) = 0 and therefore x(T ν ) ∈ X(K). As ord(x(T ν )) = νord(x) we conclude
that ν T (X) ⊂ T (X).
Therefore, T (X) is a cone, as claimed and it follows that T (X) is a finite union
of sets
{(x1 , . . . , xn ) ∈ Qn ; ai1 x1 + · · · + ain xn ≥ 0 for 1 ≤ i ≤ n}
with aij ∈ Z; cf. Convention 1.3 [25].
We call v ∈ T (X) regular if some neighborhood v in T (X) coincides with the
neighborhood of a vector subspace of Qn . In this case the vector subspace is uniquely
determined and we denote it by Lv . We define T (X) ⊂ T (X) to be the set of
regular points. It follows that dim Lv = dim X for v ∈ T (X). We define the set
Σ(X) = {Lv ; v ∈ T (X)},
it is finite as T (X) is given by a finite set systems of linear inequalities.

Remark 8.1. – We have T (Gnm ) = Qn , this is clear from our characterization (8.1).
Hence T (Gnm ) = Qn too. If v ∈ Qn , then mGnm (v) = 1 by Corollary 3.15 [62].

Our main tool from Tropical Geometry is a special case of a result of Sturmfels
and Tevelev [62]. It allows us to determine deg(ϕ| ) for varying ϕ (and fixed X).
In the formulation below we regard ϕ ∈ Matr,n (Z) simultaneously as a homomor-
phism Gnm → Grm and a linear map Qn → Qr .
By Remark 2.1 [62] tropicalization commutes with ϕ since
(8.2) T (ϕ(X)) = ϕ( T (X)).

Theorem 13 (Sturmfels, Tevelev). – Let X, n, Σ(X) = {Lv }, and r be as above and

let ϕ ∈ Matr,n (Z) such that the restriction ϕ| : X → Grm is dominant with degree
deg(ϕ| ). Then ϕ| T (X) : T (X) → Qr is surjective. Moreover, assume w ∈ Qr such
that ϕ|−1
T (X)
(w) is a finite subset of T (X), then
(8.3) deg(ϕ| ) = mX (v)[Zr : ϕ(Lv ∩ Zn )].
T (X)



Proof. – This follows from Theorem 3.12 [62]. We remark that ϕ| : X → Grm is
generically finite since it is dominant and dim X = r. Moreover, mGnm (w) = 1 for all
w ∈ Qn by Remark 8.1.

Remark 8.2. – Let v be as in the sum (8.3) and v ′ ∈ Lv ∩ Zn with ϕ(v ′ ) = 0. Then
v + λv ′ ∈ T (X) for λ ∈ Q sufficiently small. Since ϕ|−1 T (X)
(w) is finite we must

have v = 0. Hence ϕ|Lv ∩Zn is injective and therefore ϕ(Lv ∩ Zn ) has rank equal
to dim Lv = dim X = r. In particular, ϕ(Lv ∩ Zn ) has finite index in Zr , and the sum
above is well-defined.
A similar argument shows that if the sum in (8.3) contains terms corresponding to
two different v and v ′ , then Lv 6= Lv′ .

In order to get explicit estimates from this theorem we need to get a grip on Σ(X)
and the multiplicity function for a given X.
We recall that deg(X) is the degree of the Zariski closure of X in Pn .
Lemma 8.1. – Let v ∈ T (X), then mX (v) ≤ deg(X).

Proof. – Let Y be the Zariski closure of ϕ(X) in Grm . By (8.2) the set T (Y ) contains
the image of a neighborhood of v in Lv . Hence dim Y = dim T (Y ) = r and we
conclude that Y = Grm . Therefore, ϕ| is dominant.
Since mX is locally constant on T (X) it suffices to prove the inequality for some
′ 0
v ∈ T (X) sufficiently close to v. We note also that Lv = Lv′ has dimension r.
Let ϕ ∈ Matr,n (Z) be a projection onto r distinct coordinates with ϕ|Lv bijective.
We want to apply Theorem 13 to ϕ and an appropriate w ∈ Qr which we proceed
to choose. The fiber ϕ|−1
Lv (w) is finite by our choice of ϕ regardless of w. We recall
that T (X) is contained in a finite union of vector subspaces of Qn . Hence for v ′ ∈
Lv ∩ T (X) sufficiently close to v such that w = ϕ(v ′ ) avoids a finite number of
proper vector subspaces of Qr we may suppose that ϕ|−1 T (X)
(w) satifies the conditions
of the theorem. Now (8.3) implies deg(ϕ| ) ≥ mX (v)[Zr : ϕ(Lv ∩ Zn )] ≥ mX (v).
An application of Bézout’s Theorem leads to deg(ϕ| ) ≤ deg(X) and the lemma
Lemma 8.2. – We have #Σ(X) ≤ 25n deg(X)(r+1)(n−r) and if L ∈ Σ(X) there is
ψ ∈ Matn−r,n (Z) with L = ker ψ ⊂ Qn and kψk ≤ 2ndeg(X).

Proof. – We may assume r = dim X ≤ n − 1, otherwise X = Gnm and then Σ(X)

contains only Qn .
For an index set I = {i1 < · · · < ir+1 } ⊂ {1, . . . , n} we let ϕI : Gnm → Gr+1 m
denote the projection onto the coordinates i1 , . . . , ir+1 . The Zariski closure of ϕI (X)
in Gr+1
m has dimension at most r. Moreover, as in the proof of Lemma 8.1 its degree
is at most deg(X). Hence it is in the zero set of a non-constant polynomial fI in r + 1
variables and degree at most ndeg(X); for the latter statement we refer to Chardin’s
corollaire 2, cf. Exemple 1 [18].



Say v ∈ T (X). So there is x ∈ X(K) with v = ord(x).

We have fI (ϕI (x)) = 0. Because the coefficients of fI have valuation zero we
must have ord(xvI ) = 0 with vI ∈ Zr+1 \ {0} the difference of two distinct elements
in the support of fI . On letting I vary we find n − r independent vI ∈ Zn with
ord(xvI ) = 0. These define the rows of ψ ∈ Matn−r,n (Z) with rank r whose kernel
contains ord(x). In total there are r+1n
possibilities for I and there are (n−r
r+1) ≤

n n−r n(n−r)
r+1 ≤ 2 possibilities to choose n − r different I. The sup-norm of the
difference of two elements in the support of fI is bounded by 2deg(fI ) ≤ 2ndeg(X).
This leaves us with at most (1 + 4ndeg(X))r+1 possibilities for vI . In total we obtain
at most 2n(n−r) (1 + 4ndeg(X))(r+1)(n−r) different ψ. Using r ≥ 1 and r ≤ n − 1 we
2n(n−r) (1 + 4ndeg(X))(r+1)(n−r) ≤ 2n(n−r) (8ndeg(X))(r+1)(n−r)
≤ 24n(n−r) n(r+1)(n−r) deg(X)(r+1)(n−r)
≤ 24n(n−r)+n(r+1)(n−r) deg(X)(r+1)(n−r)
≤ 25n deg(X)(r+1)(n−r) .
Since v ∈ T (X) was arbitrary we conclude that T (X) is contained in a union of
at most 25n deg(X)(r+1)(n−r) vector subspaces of Qn determined by a ψ as above.
The lemma follows since each L ∈ Σ(X) has the same dimension as the kernel of
a ψ.
If L ∈ Σ(X), then L ∩ Zn ⊂ Zn is a subgroup of rank r. In the next lemma we find
a lattice basis for L ∩ Zn with controlled entries.

Lemma 8.3. – For L ∈ Σ(X) there is BL ∈ Matn,r (Z) whose columns v1 , . . . , vr are a
basis for L ∩ Zn with kv1 k · · · kvr k ≤ 2n r!n2n deg(X)n−r .

Proof. – Lemma 8.2 supplies us with ψ ∈ Matn−r,n (Z) of rank r such that
ker ψ = L ⊂ Qn and kψk ≤ 2ndeg(X). By Corollary 2.9.9 Qr [7] there are independent
v1′ , . . . , vr′ ∈ Zn with ψ(v1′ ) = · · · = ψ(vr′ ) = 0 and k=1 kvk′ k ≤ n(n−r)/2 kψkn−r .
We note that our reference works with the multiplicative projective height. Since our
coefficients are integers, we may compare this height to the sup-norm k · k. This is
possible since we suppose, as we may, that the entries of each vk′ are coprime. After
permuting the vk′ we may suppose kv1′ k ≤ · · · ≤ kvr′ k. By a result of Mahler there is
a basis (v1 , . . . , vk ) of ker ψ with kvk k ≤ kkvk′ k, cf. Lemma 8 in Chapter V.4 [17].
We conclude k=1 kvk k ≤ r!n(n−r)/2 kψkn−r ≤ 2n r!n2n deg(X)n−r as desired.
In the following proposition we work with a BL provided by the previous lemma.

Proposition 8.2. – Let ϕ ∈ Matr,n (Z).

(i) We have
(8.4) deg(ϕ| ) ≤ deg(X)#Σ(X) max {| det(ϕBL )|}.
X L∈Σ(X)



(ii) If L ∈ Σ(X) then

deg(ϕ| ) ≥ | det(ϕBL )|.

Proof. – In the proof of the proposition we will use

[Zr : ϕ(L ∩ Zn )] = | det ϕBL |
for L ∈ Σ(X) where we define the index to be 0 if ϕ(L ∩ Zn ) has rank less than r.
We begin with part (i). We may assume that ϕ| is dominant. We note that
mX (v) ≤ deg(X) for all v ∈ T (X) by Lemma 8.1. Inequality (8.4) follows from
Sturmfels and Tevelev’s result if there exists w ∈ Qr such that ϕ|−1
T (X)
(w) is a finite
subset of T (X). By a similar argument as in the proof of Lemma 8.1 we fix w ∈ Qr
such that the fiber ϕ|−1
T (X)
(w) does not meet any L′ ∈ Σ(X) with ϕ|L′ non-injective
or any points of T (X) \ T (X).
Let us now prove part (ii). Without loss of generality we may assume det(ϕBL ) 6= 0.
In other words, ϕ|L : L → Qr is bijective.
We remark that the tropical variety of the Zariski closure of ϕ(X) is all Qr by
(8.2). In particular, ϕ| is dominant.
In view of the Sturmfels and Tevelev’s result, it suffices to show that there is
w ∈ Qr such that ϕ|−1 T (X)
(w) is a finite subset of T (X). This is the case by the
same argument we gave in the proof of part (i).

8.2. Ax’s Theorem and Degree Lower Bounds. – The following proposition is a special
case of the author’s Proposition 7.3 [31]. Its proof relies on Ax’s Theorem [3].

Proposition 8.3. – Let X be an irreducible closed subvariety of Gnm defined over C

of dimension 1 ≤ r ≤ n − 1. Let s be an integer with r ≤ s ≤ n. Assume ϕ0 ∈
Mats,n (R) has rank s. Then one of the following two cases holds.
(i) There exists an algebraic subgroup H ⊂ Gnm such that dimp X ∩pH ≥ max{1, s+
dim H − n + 1} for all p ∈ X(C).
(ii) There exist ε > 0 and an open neighborhood U of ϕ0 in Mats,n (R) such that
maxπ∈Πrs deg(πϕ| ) ≥ ε for all ϕ ∈ U ∩ Mats,n (Q).

Proof. – Take K = {ϕ0 } in Proposition 7.3 [31].

Using the results from Tropical Geometry in the previous subsection we will even-
tually transform the qualitative lower bound in (ii) into a quantitative one. At first
we show a non-vanishing result.
Throughout this subsection, and if not stated otherwise, we keep the notation of
Proposition 8.3.

Lemma 8.4. – Let us assume part (i) of Proposition 8.3 does not hold for X. If ϕ0 ∈
Mats,n (R) has rank s, then there exist L ∈ Σ(X) and π ∈ Πrs with
det(πϕ0 BL ) 6= 0.



Proof. – Let U ⊂ Mats,n (R) be the neighborhood of ϕ0 from Proposition 8.3. Let ϕ ∈
U ∩ Mats,n (Q) and λ ∈ N with λϕ ∈ Mats,n (Z).
We have maxπ∈Πrs deg(λπϕ| ) = λr maxπ∈Πrs deg(πϕ| ) ≥ λr ε. On the other
hand, Proposition 8.2(i) implies
deg(λπϕ| ) ≤ deg(X)#Σ(X) max | det(λπϕBL )|
X L∈Σ(X)
= deg(X)λ #Σ(X) max | det(πϕBL )|

for all π ∈ Πrs . We cancel λ and conclude

max max | det(πϕBL )| ≥ >0
π∈Πrs L∈Σ(X) deg(X)#Σ
for all ϕ ∈ U ∩ Matr,n (Q).
The right side of this inequality is independent of ϕ. By continuity and since
U ∩ Matr,n (Q) lies dense in U we have det(πϕ0 BL ) 6= 0 for some L and π.

The following corollary is a consequence of the lemma above. It will be of no further

relevance for the current article. Although it would be interesting to know if it could
be proved using only the general properties of tropical varieties and without referring
of Ax’s Theorem.
Let us now prove Corollary 1 which is stated in Section 2.

Proof. – For ϕ0 as in the hypothesis, Lemma 8.4 implies that we are in alternative
(i) of Proposition 8.3. Let H be the algebraic subgroup mentioned there. We fix a
surjective homomorphism ϕ′ : Gnm → Gm n−dim H
with kernel H.
Say n − dim H ≥ r. Then we compose ϕ′ with the projection onto the first r
n−dim H
coordinates of Gm and obtain a surjective homomorphism ϕ : Gnm → Grm . Each
fiber of ϕ| has dimension at least max{1, s + dim H − n + 1}. By dimension theory
of varieties the Zariski closure of ϕ(X) has dimension at most dim X − max{1, s +
dim H − n + 1} < dim X. If we consider ϕ as a matrix in Matr,n (Q), then it has rank
r. Moreover, by (8.2) we have ϕ( T (X)) 6= Qr .
Now let us assume n − dim H < r. We remark that
s + dim H − n + 1 ≥ r + dim H − n + 1 > 1.
r−(n−dim H)
We take the product of ϕ′ with some homomorphism Gnm → Gm in general
position to obtain a surjective homomorphism ϕ : Gnm → Grm . By dimension theory,
the fibers of ϕ| have dimension at least

s + dim H − n + 1 − (r − (n − dim H)) = s − r + 1 ≥ 1.

As before, ϕ(X) does not lie Zariski dense in Grm and we also conclude ϕ( T (X)) 6= Qr .



Example. – The previous corollary shows that the collection of Q-vector spaces {Lv }
associated to X satisfy a certain rationality condition. Indeed, it can be reformulated
as follows. Let Lv be the closure of Lv in Rn or equivalently, the vector subspace
of Rn generated by Lv . If there exists a vector subspace V0 ⊂ Rn of dimension n − r
Lv ∩ V0 6= 0 for all v
then there exists a vector subspace V ⊂ Qn of dimension n − r with
Lv ∩ V 6= 0 for all v.
We exhibit four 2-dimensional vector subspaces in Q4 that do not satisfy this
rationality condition. The four bases

(1, 0, 1, 0), (0, −2, 0, 1) ,

(1, −1, 0, 0), (0, 0, 1, 1) ,

(0, 1, 0, 0), (0, 0, 1, 0) , and

(1, 0, 0, 0), (0, 0, 0, 1)
determine four planes L1 , L2 , L3 , and L4 in Q4 , respectively.
Say V ⊂ Q4 is an arbitrary 2-dimensional vector subspace of Q4 . One can verify
that V ∩ Li = 0 for some i ∈ {1, 2, 3, 4}.
On the other hand, each Li meets the vector subspace of R4 with basis
√ √ 
(0, 2, 1, 0), (− 2, 0, 0, 1)
In particular, Σ(X) 6= {L1 , L2 , L3 , L4 } for all irreducible surfaces X ⊂ G4m . Sam
Payne has pointed out to the author that this also follows from the fact that the
tropicalization of a variety is connected in codimension one. Indeed, the pairwise
intersection of the Li is trivial.
Let Mij be independent variables for 1 ≤ i ≤ s and 1 ≤ j ≤ n. They are entries of
the s × n matrix M = (Mij ). We define the polynomial
DX = det(πM BL )2 ∈ Z[Mij ].
π∈Πrs L∈Σ(X)

Lemma 8.4 tells us that if X is not as in alternative (i) of Proposition 8.3 then
(8.5) ϕ0 ∈ Mats,n (R) with DX (ϕ0 ) = 0 implies rank(ϕ0 ) < s.
This polynomial is closely related to the degree map ϕ 7→ deg(ϕ| ). It has the
advantage that it can be evaluated for ϕ with real entries. Recall that deg(ϕ| ) has
no straightforward interpretation for irrational ϕ.
Since we can contain the vanishing locus of DX we will obtain an explicit lower
bound for its values. To do this we must first bound the degree and coefficients of DX .
For a polynomial P in any number of variables and integer coefficients we let kP k
denote the largest absolute value of any coefficient.



Lemma 8.5. – (i) The polynomial DX is homogeneous of degree 2r.

(ii) We have kDX k ≤ 220n deg(X)(r+3)(n−r) .

Proof. – Part (i) follows from properties of the determinant.

We turn to part (ii). First we remark that if P1 , . . . , Pk are polynomials in any
number of variables, then kP1 +· · ·+Pk k ≤ kP1 k+· · ·+kPk k by the triangle inequality.
The product can bounded using Lemma 1.6.11 [7] as kP1 · · · Pk k ≤ 2d kP1 k · · · kPk k
where d is the sum of the partial degrees of P1 · · · Pk .
Say L ∈ Σ(X) and π ∈ Πrs . Let v1 , . . . , vr ∈ Zn be the columns of a BL as provided
by Lemma 8.3. An entry in the j-th column of πM BL is a linear form with coefficients
among the coefficients of vj . Each term in the Leibniz formula for det(πM BL ) is a
polynomial in at most nr distinct Mij with each partial degree at most 1. Since there
are r! such terms we obtain k det(πM BL )k ≤ 2nr r!kv1 k · · · kvr k. Each partial degree
of det(πM BL )2 is at most 2 and at most nr variables appear, so k det(πM BL )2 k ≤
22nr k det(πM BL )k2 ≤ 24nr r!2 kv1 k2 · · · kvr k2 . The bound from Lemma 8.3 leads to
(8.6) k det(πM BL )2 k ≤ 24nr r!2 (2n r!n2n deg(X)n−r )2 .

Now DX consists of #Πrs #Σ = rs #Σ ≤ 2s #Σ terms for the form det(πM BL )2 .
We use the bound for #Σ ≤ 25n deg(X)(r+1)(n−r) from Lemma 8.2 and (8.6) to
kDX k ≤ 2s 25n deg(X)(r+1)(n−r) 24nr r!2 (2n r!n2n deg(X)n−r )2
≤ 2s+5n +4nr+2n 4n
n r!4 deg(X)(r+1)(n−r)+2(n−r)
3 2
≤ 212n 28n deg(X)(r+3)(n−r)
where we used r, s ≤ n, r! ≤ n! ≤ nn ≤ 2n , and n ≤ 2n .

We now prove Proposition 8.1.

Let us assume that we are not in alternative (i). Then we are not in alternative (i)
of Proposition 8.3 and the conclusion of Lemma 8.4 holds.
By (8.5) we know that the set of zeros of DX is contained in the set of matrices
of Mats,n (R) with non-full rank.
Let ϕ and ε be as in the hypothesis. We apply Rémond’s explicit Łojasiewicz
inequality [55] to bound DX (ϕ) from below.
Recall that DX is a polynomial of degree 2r in sn variables Mij . Rémond’s in-
equality and Lemma 8.5(i) imply
n2 (2r)sn sn
DX (ϕ) = |DX (ϕ)| ≥ (e4rsn kDX k)−(sn+1)(2r) δ ≥ 2−12rs kDX k−(sn+1)(2r) δ
where for brevity we set
δ= ≤ 1.
max{1, kϕk}



Next we use the bound for kDX k given by Lemma 8.5(ii); using nn ≤ 2n we find
n2 (2r)sn −20n3 (sn+1)(2r)sn sn
DX (ϕ) ≥ 2−12rs deg(X)−(sn+1)(2r) (r+3)(n−r)
The exponent of 2 is
3 2 2
12rs2 n2 (2r)sn + 20n3 (sn + 1)(2r)sn ≤ (12 + 20)n5 (2n)n ≤ 50n5 (2n)n
where we used s, r ≤ n and n ≥ 2. We conclude
5 2
(2n)n sn
(8.7) DX (ϕ) ≥ 2−50n deg(X)−(sn+1)(2r) (r+3)(n−r)
By definition of DX there exist L ∈ Σ(X) and π ∈ Πrs with
DX (ϕ) ≤ #Πrs #Σ(X) det(πϕBL )2 .
Lemma 8.2 gives
3 3
DX (ϕ) ≤ 2s 25n deg(X)(r+1)(n−r) det(πϕBL )2 ≤ 210n deg(X)(r+1)(n−r) det(πϕBL )2 .
Together with (8.7) we conclude
5 2
(2n)n sn
(8.8) det(πϕBL )2 ≥ 2−100n deg(X)−(r+1)(n−r)−(sn+1)(2r) (r+3)(n−r)
Say λ ∈ N such that λϕ ∈ Matr,n (Z). We apply Proposition 8.2(ii) to get
deg(λπϕ| ) ≥ | det(λπϕBL )| = λr | det(πϕBL )|.
Since deg(λπϕ| ) = λr deg(πϕ| ) we have deg(πϕ| ) ≥ | det(πϕBL )|. The proposi-
tion now follow from (8.8) and δ 1/2 ≥ δ.

9. Generically Bounded Height

As usual, let r, s, n ∈ N. For brevity we introduce a constant
µ(r, s, n) = (r2 + r + 1) 1 + (n − r) (r + 1 + (r + 3)(sn + 1)(2r)sn ) + r.
It is convenient to allow r or s to be zero and set µ(r, s, n) = 0 in this case.
The case of curves will correspond to r = 1. For example, if also s = 1, then
µ(1, 1, n) = 6(n2 − 1)2n + 3n + 1.
Theorem 14. – Let n ≥ 1 and let X ⊂ Gnm be an irreducible closed subvariety defined
over Q and say s ≥ 0 is an integer. Then one of the following two cases holds.
(i) There exists an algebraic subgroup H ⊂ Gnm such that
dimp X ∩ pH ≥ max{1, s + dim H − n + 1}
for all p ∈ X(Q).
7 n2
(ii) We set C = 2200n (2n) and µ = µ(dim X, s, n). There is a non-empty Zariski
open subset U ⊂ X such that if p ∈ U (Q) ∩ (Gnm ) , then
h(p) ≤ Cdeg(X)µ (1 + h(X)).



Say p ∈ (Gnm ) . Our approach is to find a surjective homomorphism Gnm → Gsm
from a finite set that maps p to a point of height bounded linearly in h(p). Recall
that we identify elements of Mats,n (Z) with homomorphisms Gnm → Gsm .

Lemma 9.1. – Suppose 1 ≤ s ≤ n and let Q ≥ 2s! be a real number. If p ∈ (Gnm )
there exists ψ ∈ Mats,n (Z) with
kπψk ≥ Q for all π ∈ Πrs , kψk < Q + 1, h(ψ(p)) ≤ log(n + 1) + (sn)h(p),
and such that ψ/Q is 1/(2s!)-regular.

Proof. – There is ψ0 ∈ Mats,n (Z) of rank s whose kernel contains p.

An s×s submatrix of ψ0 whose discriminant has maximal absolute value among all
s×s submatrices is invertible. We let α−1 denote such a submatrix, then α ∈ Mats (Q).
By our choice kαψ0 k = 1 and some s × s submatrix of αψ0 is the identity matrix.
There is ψ ∈ Mats,n (Z) with kQαψ0 − ψk < 1 such that the sup-norm of each row
of ψ is at least Q. So ψ satisfies the first property.
The second property follows from kψk ≤ kQαψ0 − ψk + kQαψ0 k < Q + 1.
To prove the third claim we set δ = αψ0 − ψ/Q and fix λ ∈ N with λα, λδ ∈
Mats,n (Z). If u1 , . . . , us ∈ Zn are the rows of −λδ, then basic height properties imply
hs ((−λδ)(p)) = hs (pu1 , . . . , pus ) ≤ hs (pu1 ) + · · · + hs (pus )
≤ n(ku1 k + · · · + kus k)hs (p) ≤ snk − λδkhs (p) = snλkδkhs (p).

By construction we have kδk ≤ 1/Q and hence

(9.1) hs ((−λδ)(p)) ≤ sn hs (p).
But λψ = Qλαψ0 −Qλδ and ψ0 (p) = 1, so λhs (ψ(p)) = hs ((λψ)(p)) = Qhs ((−λδ)(p))
by basic height properties. Using (9.1) we obtain hs (ψ(p)) ≤ snhs (p). The third
property follows from
1 1 1
h(ψ(p)) ≤ log(n + 1) + hs (ψ(p)) ≤ log(n + 1) + snhs (p) ≤ log(n + 1) + snh(p).
2 2 2
We turn to the final property. Let φ ∈ Mats,n (R) satisfy kφk ≤ ε with ε ≤ 1/2 and
rank(ψ/Q + φ) < s. The matrix ψ/Q+φ = αψ0 −(δ −φ) has an s×s-submatrix which
equals 1 − (δ ′ − φ′ ) where 1 is the unit matrix and δ ′ and φ′ are s × s submatrices of δ
and φ, respectively. We have kδ ′ − φ′ k ≤ kδk + kφk ≤ 1/Q + ε ≤ 1. Using the Leibniz
expansion for the determinant we conclude | det (1 − (δ ′ − φ′ )) − 1| ≤ s!kδ ′ − φ′ k ≤
s!(1/Q + ε) ≤ 1/2 + s!ε because Q ≥ 2s!. If ε < 1/(2s!), then det (1 − (δ ′ − φ′ )) 6= 0
and in this case ψ/Q + φ has full rank, contradicting our assumption on φ. Thus we
must have ε ≥ 1/(2s!). It follows that ψ/Q is 1/(2s!)-regular as desired.



Proposition 9.1. – Let X ( Gnm be an irreducible closed subvariety defined over Q of

dimension r ≥ 1. Let s be an integer with r ≤ s ≤ n, for brevity we write µ = µ(r, s, n).
Then we are either in alternative (i) of Proposition 8.1 or the following statement
holds. There is a finite set of {V1 , . . . , VN } of irreducible closed subvarieties of X with
dim Vi = r − 1,
(2n)n (r+1) 1+r r2µ−r
deg(V1 ) + · · · + deg(VN ) ≤ 2200n deg(X) +r+1 ,
7 n2 2r+1+(2r 2 +2r+1) r2µ−r
h(Vi ) ≤ 2300n (2n)
deg(X) +r+1 (1 + h(X)),
and such that if p ∈ (X \ (V1 ∪ · · · ∪ VN ))(Q) ∩ (Gnm ) then
7 n2
h(p) ≤ 2200n (2n)
deg(X)µ (1 + h(X)).

Proof. – We begin by choosing the parameter which appears in Lemma 9.1 as

5 2
Q = 2100n deg(X)χ
1 µ−r
χ = 1 + (n − r) (r + 1 + (r + 3)(sn + 1)(2r)sn ) = 2 ≥ 1.
2 r +r+1
Elementary estimates show Q ≥ 2n! ≥ 2s!.
Let p ∈ (Gnm ) and let ψ be given by Lemma 9.1 applied to p. We have kψk <
Q + 1 ≤ 2Q.
We apply Proposition 8.1 with ε = 1/(2s!) to ψ/Q. We remark kψ/Qk ≤ 2. Hence
there is π ∈ Πrs with
5 2
(2n)n sn
deg(ϕ/Q| ) ≥ 2−50n (4s!)−sn(2r) deg(X)−χ+1
2 2 2 2 2
(2n)n +2)n2 (2n)n 4
for ϕ = πψ. We bound (4s!)sn(2r) ≤ (4n!)n ≤ 2(n ≤ 23n
using r ≤ s ≤ n and 2n! ≤ 2nn ≤ 2n . So
5 2
(9.2) deg(ϕ/Q| ) ≥ 2−52n deg(X)−χ+1 .
We set Z = X as in Section 7. This is an irreducible closed subvariety of Pn × Pr
defined over Q with dimension r. Futher down we will apply Proposition 6.2 to Z.
But first we bound the various quantities associated to Z. Indeed, Lemma 7.2 and
Q ≤ |ϕ|∞ ≤ 2Q give
Q deg(ϕ| ) Q
κ≥ = deg(ϕ/Q| )
(4n)r deg(X) (2Q)r (8n)r deg(X) X

2 5 2
where κ = κ(Z). Using the crude bound (8n)r ≤ (8n)n ≤ 24n ≤ 22n together
−54n5 (2n)n −χ
with (9.2) we obtain κ ≥ 2 Qdeg(X) . On inserting our choice of Q we
5 2
(9.3) κ ≥ 246n .



Lemma 7.1 and (8n)r ≤ 24n enable us to bound
(9.4) ∆0 = ∆0 (Z) ≤ (4n)r (2Q)r deg(X) ≤ (8n)r Qr deg(X) ≤ 24n Qr deg(X).
Degree and height of Z are bounded by Lemmas 7.1 and 7.3. We have
deg(Z) ≤ (8n)r Qr deg(X) ≤ 24n Qr deg(X)
and from (8n)n+2 ≤ 2(n+3)(n+2) ≤ 212n also
deg(X) 2 deg(X)
h(Z) ≤ (8n)n+2 Qr+1 h(X) + ≤ 212n Qr+1 h(X) + .
Combining degree and height bounds yields
2 2deg(X) 2
h(Z) + deg(Z) ≤ 212n Qr+1 h(X) + ≤ 212n Qr+1 (1 + h(X))
since Q ≥ 2deg(X).
It is not difficult to verify κ ≥ 17n2 ≥ 17rn. So the hypothesis on κ in Proposi-
tion 6.2 applied to Z is satisfied. We let V1 , . . . , VN denote the non-empty intersections
with Gnm of the obstruction varieties given by this proposition.
Say k0 = max{17n3r r!∆0 (Z)r−1 , deg(Z)} is as in Proposition 6.2. We recall (9.4),
the bound for deg(Z), and r ≤ n − 1 to obtain
3 2
(9.5) k0 ≤ max{25+2n n!24n Qr(r−1) deg(X)r−1 , 24n Qr deg(X)}
≤ 212n max{Qr(r−1) deg(X)r−1 , Qr deg(X)}
3 2
≤ 212n Qr deg(X)r .
Now i=1 deg(Vi ) ≤ k0 deg(Z), so
X 2 3 2
deg(Vi ) ≤ 24n Qr deg(X)k0 ≤ 216n Qr +r
deg(X)r+1 .

Our choice of Q and r2 + r ≤ (n − 1)2 + n − 1 ≤ n2 implies

X 2
+100n7 (2n)n
deg(Vi ) ≤ 216n deg(X)(r+1)(1+rχ) .
This bound leads quickly to the desired estimate for sum over the degrees of the Vi .
We let V denote one of the obstruction varieties Vi . We must bound h(V ) too.
Proposition 6.2 and the bounds for h(Z) + deg(Z) and deg(Z) give
h(V ) ≤ 29 n4 max 1, (h(Z) + deg(Z))deg(Z)k0
≤ 230n Q2r+1 ∆r0 deg(X)(1 + h(X))k0
in the last equality we used κ ≤ ∆0 from Lemma 6.12). Furthermore, ∆0 is bounded
by (9.4); this gives
3 2
h(V ) ≤ 240n Qr +2r+1
deg(X)r+1 (1 + h(X))k0 .



With (9.5) we get

3 2
h(V ) ≤ 260n Q2r +2r+1
deg(X)2r+1 (1 + h(X)).
Since r ≤ n − 1 we have 2r2 + 2r + 1 ≤ 2n2 , so with our choice of Q we find
7 2 2
h(V ) ≤ 2300n deg(X)2r+1+(2r +2r+1)χ
(1 + h(X)),
as desired.
To complete the proof it remains to bound the height of p if, in addition to being
contained in (Gnm ) , satisfies p ∈ (X \ (V1 ∪ · · · ∪ VN ))(Q). Clearly, we may assume
that h(p) ≥ 1. No projective coordinate of p vanishes. If q = ϕ(p) then (p, q) is isolated
in π1 |Z ; indeed, locally at (p, q) the variety Z is the graph of ϕ : Gnm → Grm . Hence
we are in case (iii) of Proposition 6.2. Thus, on using r ≤ n we have
25 n 2 15 5 κr+1
h(p) ≤ h(q) + 2 n max 1, (h(Z) + deg(Z))
κ ∆0
≤ h(q) + 220n ∆r0 (h(Z) + deg(Z))
here we used κ ≤ ∆0 again. Upper bounds for ∆0 and h(Z) + deg(Z) were obtained
above; we conclude
27n 2 2 2
h(p) ≤ h(q) + 220n+4n r+12n Qr +r+1 deg(X)r (1 + h(X))
27n 3 2
≤ h(q) + 240n Qr +r+1 deg(X)r (1 + h(X))
Our choice of Q and r2 + r + 1 ≤ (n − 1)2 + (n − 1) + 1 ≤ n2 implies
27n 7 n2 2
h(p) ≤ h(q) + 2150n (2n) deg(X)(r +r+1)χ+r (1 + h(X)).
We note that (r2 + r + 1)χ + r = µ, so
27n 7 n2
h(p) ≤ h(q) + 2150n (2n) deg(X)µ (1 + h(X)) .
Lemma 9.1 tells us that h(q) ≤ h(ψ(p)) ≤ 12 log(n + 1) + n2 h(p) ≤ n + n2 h(p) ≤
2n2 h(p) ≤ 22n h(p) since h(p) ≥ 1. We obtain
210n 7 n2
1− h(p) ≤ 2150n (2n) deg(X)µ (1 + h(X)) .
Certainly, (9.3) implies κ ≥ 211n . So 1 − 210n κ−1 ≥ 1/2 and the proposition
Proof of Theorem 14. – We may suppose s ≤ n since (Gnm ) = ∅ otherwise. If r = 0,
then part (ii) holds with U = X because µ(0, s, n) = 0 and since the height of a point
is its height considered as a variety. So we assume r ≥ 1. If s < r, then we are in
case (i) with H = Gnm . So we may suppose r ≤ s. If s = n, then (Gnm ) is the set
n 1
of torsion points of Gm . The height of a torsion point is 2 log(n + 1) ≤ n and so



the height bound in part (ii) holds with U = X. So let us assume s ≤ n − 1. Then
1 ≤ r ≤ n − 1 and the theorem follows from the previous proposition.

10. Bounded Height

In this section we prove Theorem 12.

The first few reduction steps are similar as in the proof of Theorem 14.
We may suppose s ≤ n since (Gnm ) = ∅ otherwise. If r = 0, then part (ii)
holds with Z = ∅ because µ(0, s, n) = 0 and since the height of a point is its height
considered as a variety. So we assume r ≥ 1. If s < r, then X oa,[s] = ∅ and the theorem
follows with Z = X. So we may suppose r ≤ s. If s = n, then (Gnm ) is the set of
n 1
torsion points of Gm . The height of a torsion point is 2 log(n + 1) ≤ n and so the
height bound in part (iii) holds with Z = ∅. So let us assume s ≤ n − 1.
We have reduced to the case 1 ≤ r ≤ s ≤ n − 1.
For brevity, we set µ = µ(r, s, n). Elementary estimates lead to
1 2 2
(10.1) µ ≤ n2 1 + (n − 1) n + n2 (n + 2)(2n)n −n + n − 1 ≤ n6 (2n)n .
We remark µ ≥ 2 and r2 + r + 1 ≥ 2r. We use 1 ≤ r ≤ n − 1 and (10.1) to bound the
µ−r µ 2
(10.2) (r + 1) 1 + r 2 ≤n 1+ ≤ nµ ≤ n7 (2n)n ,
r +r+1 2
2 µ−r µ 2
(10.3) 2r + 1 + (2r + 2r + 1) 2 ≤ 2n + 5r2 ≤ 5nµ ≤ 5n7 (2n)n .
r +r+1 2r
that appear in the degree and height bound of Proposition 9.1, respectively.
The remainder of the proof is a somewhat technical descent argument. For 0 ≤
i ≤ dim X we will inductively construct irreducible closed subvarieties Vj1 ,...,ji of X
which satisfy certain properties to be described below; here (j1 , . . . , ji ) runs over a
finite index set
(1) (i−1)
(10.4) {(j1 , . . . , ji ); 1 ≤ j1 ≤ N (0) , 1 ≤ j2 ≤ Nj1 , . . . , 1 ≤ ji ≤ Nj1 ,...,ji−1 }.
The properties for the subvarieties are as follows
(10.5) dim Vj1 ,...,ji = dim X − i,
7 2 7 2
(i) (i) (2n)n )i (2n)n )i
deg(Vj1 ,...,ji−1 ,1 ) + · · · + deg(V (i−1) ) ≤ 2(300n deg(X)(n ,
j1 ,...,ji−1 ,Nj ,...,j
1 i−1

7 2 7 2
(i) (2n)n )i (2n)n )i
(10.7) h(Vj1 ,...,ji ) ≤ 2(600n deg(X)(6n (1 + h(X)),
(i) (i−1)
(10.8) Vj1 ,...,ji ⊂ Vj1 ,...,ji−1 if i ≥ 1.



For i = 0 we take V (0) = X. Clearly, (10.5), (10.6), and (10.7) are satisfied. So we
suppose i ≥ 1 and that Vj1 ,...,ji−1 has been constructed.
(i−1) (i−1)
If Vj1 ,...,ji−1 is as in alternative (i) of Proposition 8.1 then we set Nj1 ,...,ji−1 = 0 and
the construction stops. If i = r + 1, i.e., if Vj1 ,...,ji−1 is a point, then the constructions
stops as well.
Otherwise, we apply Proposition 9.1 to Vj1 ,...,ji−1 and set
(i) (i)
Vj1 ,...,ji−1 ,1 , . . . , V (i−1)
j1 ,...,ji−1 ,Nj
1 ,...,ji−1

to be the subvarieties V1 , . . . , VN constructed there with Nj1 ,...,ji−1 = N .
Properties (10.5) and (10.8) follow immediately from this proposition. It remains
to prove degree and height bounds; this is done by an elementary calculation.
We begin by verifying (10.6). To do this, we keep (10.2) in mind. By Proposition 9.1,
the left-hand side of (10.6) is at most
7 2 7 2 7 2 2 2 2
(2n)n (i−1) (2n)n (2n)n +(300n7 (2n)n )i−1 n7 (2n)n 7
(2n)n )i
2200n deg(Vj1 ,...,ji−1 )n ≤ 2200n deg(X)(n
on using the induction hypothesis. Elementary estimates and i ≥ 1 give
2 2 2 2
200n7 (2n)n + (300n7 (2n)n )i−1 n7 (2n)n ≤ (300n7 (2n)n )i .
So (10.6) follows.
Now we shall bound the height. We recall (10.3), so
7 2 7 2
(i) (2n)n (i−1) (2n)n (i−1)
h(Vj1 ,...,ji ) ≤ 2300n deg(Vj1 ,...,ji−1 )5n (1 + h(Vj1 ,...,ji−1 ))
by Proposition 9.1. We insert both degree and height bounds from the induction
hypothesis to find that h(Vj1 ,...,ji ) is at most
7 2 2 2 2
(2n)n +(300n7 (2n)n )i−1 5n7 (2n)n +(600n7 (2n)n )i−1
7 2 2 2
(2n)n )i−1 5n7 (2n)n +(6n7 (2n)n )i−1
× deg(X)(n (1 + h(X)).
Basic estimates and i ≥ 1 lead to
2 2 2 2 2
300n7 (2n)n + (300n7 (2n)n )i−1 5n7 (2n)n + (600n7 (2n)n )i−1 ≤ (600n7 (2n)n )i
as well as
2 2 2 2
(n7 (2n)n )i−1 5n7 (2n)n + (6n7 (2n)n )i−1 ≤ (6n7 (2n)n )i .
Hence claim (10.7) holds true.
We define
[ [ (i)
Z= Vj1 ,...,ji .
i=0 V (i) as in alt. (i)
j1 ,...,ji
of Proposition 8.1
It is a Zariski closed subset of X. This will be the Zariski closed set refered to in the



We have X = Z if and only if V (0) appears in the union above. The degree and
height bound for the irreducible components of Z follows from (10.6) and (10.7).
We now verify that the bound for the number of irreducible components of Z is
correct. If V (0) = X is an irreducible component of Z, then our bound certainly holds.
Otherwise, an irreducible component is of the form Vj1 ,...,ji for some 1 ≤ i ≤ r. For
fixed i and j1 , . . . , ji−1 , the number of possible ji is at most Nj1 ,...,ji−1 . This quantity
is bounded from above by (10.6). Recalling (10.4) we find that for fixed i there are at
7 2 2 2 2
(2n)n +···+(300n7 (2n)n )i 7
(2n)n +···+(n7 (2n)n )i
2300n deg(X)n
7 2 7 2
(2n)n )r (2n)n )r
≤ 2r(300n deg(X)r(n
possible Vj1 ,...,ji . To get a bound for all possible irreducible components we must sum
over 1 ≤ i ≤ r. This gives us the bound
7 2 7 2 7 2 7 2
(2n)n )r (2n)n )r (2n)n )r (2n)n )r
r2r(300n deg(X)r(n ≤ 2r+r(300n deg(X)r(n .
2 2
Part (ii) of the theorem follows since r + r(300n7 (2n)n )r ≤ (600n7 (2n)n )r and
2 2
r(n7 (2n)n )r ≤ (2n7 (2n)n )r .
We claim that X oa,[s] ⊂ X \ Z. This will imply part (i) of the theorem. So suppose
p ∈ Z(Q). By definition of Z there are i, j1 , . . . , ji and an algebraic subgroup H ⊂ Gnm
such that dimp Vj1 ,...,ji ∩ pH ≥ max{1, s + dim H − n + 1}. Certainly, this local
dimension is at most dimp X ∩ pH. So p 6∈ X oa,[s] and our claim is established.
Suppose p ∈ (X \ Z)(Q) with p ∈ (Gnm ) . It remains to bound h(p) as in (iii) of
the theorem.
By construction X = V (0) . We may choose 0 ≤ i ≤ r maximal, such that there are
indices j1 , . . . , ji with p ∈ Vj1 ,...,ji (Q). We split up into two cases.
First, let us assume i = r. This case is easy, since Vj1 ,...,ji = {p} holds by (10.5).
Now h(p) is the height of the variety {p}, so the desired height bound follows from
Now, we suppose 0 ≤ i ≤ r − 1. We remark that p 6∈ Z(Q) implies that Vj1 ,...,ji is
not as in alternative (i) of Proposition 8.1. In particular, Proposition 9.1 gives a height
bound for p providing it does not lie on
(i+1) (i+1)
Vj1 ,...,ji ,1 ∪ · · · ∪ V (i) .
j1 ,...,ji ,Nj
1 ,...,ji

But p cannot lie in this union because of the maximality of i. Recalling (10.1) gives
7 n2 (i) 6 n2 (i)
h(p) ≤ 2200n (2n) deg(Vj1 ,...,ji )n (2n) (1 + h(Vj1 ,...,ji )).
Our degree bound (10.6) and height bound (10.7) give
7 2 2 2 2 2 2 2
(2n)n +(300n7 (2n)n )i n6 (2n)n +(600n7 (2n)n )i 7
(2n)n )i n6 (2n)n +(6n7 (2n)n )i
2200n deg(X)(n (1 + h(X))



as a bound for h(p). The exponent of 2 is

2 2 2 2
200n7 (2n)n + (300n7 (2n)n )i n6 (2n)n + (600n7 (2n)n )i
≤ (200 + 300r−1 + 600r−1 )(n7 (2n)n )r ,
because i ≤ r − 1. Hence it is at most (600n7 (2n)n )r . The exponent of deg(X) is
2 2 2 2 2
(n7 (2n)n )i n6 (2n)n + (6n7 (2n)n )i ≤ (1 + 6r−1 )(n7 (2n)n )r ≤ (6n7 (2n)n )r .
7 2 7 2
(2n)n )r (2n)n )r
Therefore, h(p) ≤ 2(600n deg(X)(6n (1 + h(X)) and part (iii) of the
theorem holds.

Appendix A
The Case of Abelian Varieties
An abelian variety A defined over Q together with an ample symmetric line bun-
dle determines a height function called the Néron-Tate or canonical height. It is a
quadratic form and vanishes precisely on the torsion points of A. We refer to Chap-
ter 9 of Bombieri and Gubler’s book [7] for the necessary background.
The history of height upper bounds on subvarieties of abelian varieties runs parallel
to the history of height bounds on the algebraic torus. But we will only give a brief
account of what is known in the projective case and also of known cases of the Zilber-
Pink Conjecture for A.
An initial result was obtained by Viada [63] who proved the following analog of
Theorem 1.
Theorem 15 (Viada [63]). – Let A = E g where E is an elliptic curve defined over Q
and suppose that we have fixed a symmetric and line bundle, and thus a Néron-Tate
height, on A(Q). Let C ⊂ A be an irreducible algebraic curve that is not contained in
the translate of a proper algebraic subgroup of A. Then the height of points on C that
are contained in a proper algebraic subgroup is bounded from above uniformly.
Rémond [53] gave a systematic approach for passing from height upper bounds in
the spirit of Theorem 15 to finiteness result using Lehmer-type and relative Lehmer-
type height lower bounds. These inequalities remain conjectural for many abelian
varieties. For example, no sufficiently strong Lehmer-type height inequality is known
on a power of an elliptic curve without complex multiplication, or CM, to tackle
the abelian analog of Theorem 2 using Rémond’s approach. Viada [63] did obtain
a finiteness result akin to Theorem 2 when the elliptic curve in question has CM;
she mentioned to the author that her method also applies to products of CM elliptic
curves. In this setting the sufficiently strong Lehmer-type height lower bounds are
available thanks to work of David and Hindry [23].
The analog of Maurin’s Theorem for curves inside a power of an elliptic curve was
already obtained in 2003 by Rémond and Viada [57]. Again the elliptic curve was
assumed to have CM. As Maurin’s Theorem, Rémond and Viada’s Theorem relies



on Rémond’s Generalized Vojta Inequality [52]. Ratazzi [50] extended the Rémond-
Viada Theorem to when A is a power of a simple abelian variety with CM. This was
generalized by Carrizosa [15] to all abelian varieties with CM.
Advances made primarily by Galateau [27, 28] on Bogomolov-type height lower
bounds have had a important effect on the finiteness problems. His results hold for
a wide class of abelian varieties, including abelian surfaces and arbitrary powers of
elliptic curves. Viada [64] used them to prove a variant of Maurin’s Theorem for
curves inside a power of an arbitrary elliptic curve, see also [67]. Here the subgroups
are thickened using the Néron-Tate height and the method applies also to products
of elliptic curves.
Zannier devised a strategy that involves the Point Counting Theorem of Pila-Wilkie
[46] to give a new proof of the Manin-Mumford Conjecture in collaboration with Pila
[47]. Pila and the author show that a variant of the Point Counting Theorem can also
be used to attack problems of Zilber-Pink type [?]. We relied on a lower bound for
the Néron-Tate height due to Masser [38] for general abelian varieties that are defined
over Q. It yielded Zilber’s Conjecture in the case of a curve in an abelian variety when
everything is defined over Q.
Partial results for subvarieties of arbitrary dimension in an abelian variety are
known as well. Here the definition of X oa for a subvariety X ⊂ A is verbatim to the
toric case. The union A[s] of all algebraic subgroups of A of codimension at least s also
makes perfect sense. For example, the author proved [30] the full analog of Theorem 9.
That is, the Néron-Tate height is uniformly bounded from above on X oa (Q)∩A[dim X] .
Viada proved [66] that one cannot expect a reasonable result on boundedness of
height in the power of an elliptic curve if X oa is empty. She also compared several
variants of Conjecture 1 that involve thickened subgroups [65, 67] in general abelian
varieties. Joint work of Checcoli, Veneziano, and Viada [19] treats an effective variant
of the Zilber-Pink Conjecture for subvarieties of codimension 2 in the power of a
elliptic curve with CM. They also give effective and explicit bounds [20] in the non-
CM case with applications to effective cases of the Mordell Conjecture. Checcoli and
Viada [21] consider a related problem and attain effective results in certain abelian
varieties with CM. Hubschmid and Viada [35] prove a variant of Bombieri, Masser,
and Zannier’s Torsion Finiteness Conjecture for codimension 2 subvarieties of a power
of an elliptic curve without CM.
Rémond’s Generalized Vojta Inequality is powerful enough to treat, along with
varying algebraic subgroups, the division closure of a finite rank subgroup Γ ⊂ A(Q).
Indeed, he considers points on X contained in
A[s] + Γ = {h + γ; h ∈ A[s] and γ ∈ Γ}.
Theorem 16 (Rémond [56], cf. [54]). – Let A be an abelian variety defined over Q and
suppose we have fixed a Néron-Tate height on A. Let Γ ⊂ A(Q) be the division closure
of a finitely generated subgroup of A. Moreover, let X ⊂ A be an irreducible closed
subvariety defined over Q. Then the height of points in X oa (Q) ∩ (A[1+dim X] + Γ) is
bounded from above uniformly.



Maurin’s Theorem 10 is the toric version of this result. Pila and the author [?] used
Rémond’s result to prove the Zilber-Pink Conjecture for subvarieties of A that satisfy
X oa 6= ∅.

Appendix B
Height Bounds in Shimura Varieties

We refer to Emmanuel Ullmo’s chapter in this volume for the fundamentals of

Shimura varieties and Thomas Scanlon’s chapter for developments on the André-Oort
Conjecture. In this final section we will be mainly interested in modular curves.
The well-known analogy between semi-abelian varieties and Shimura varieties
which is underlined by the conceptual similarity of the Conjectures of Manin-
Mumford and André-Oort tempts us to formulate a Bounded Height Conjecture in
the moduli-theoretic setting. The role of algebraic subgroups on the abelian or toric
side is played by the special subvarieties on the side of Shimura varieties. Further-
more, the torsion points are replaced by special points. The sweeping conjecture
of Pink [48] on mixed Shimura varieties covers the Conjectures of Manin-Mumford
and André-Oort. By the comments in Bombieri, Masser and Zannier’s appendix
[13], Pink’s Conjecture implies Zilber’s Conjecture 1 [70] and Bombieri, Masser, and
Zannier’s Torsion Finiteness Conjecture [11].
However, a verbatim translation of the Bounded Height Conjecture to Shimura va-
rieties is false as was remarked by Bombieri, Masser, and Zannier [11]. Indeed, Colmez
[22] showed that the height of the j-invariant of an elliptic curve with complex mul-
tiplication can be arbitrary large. These j-invariants, which we call singular moduli,
are algebraic integers. The Shimura variety in question is Y (1), the modular curve
whose complex points correspond to the j-invariants of elliptic curves defined over C.
As a variety Y (1) equals the affine line.
The discriminant of a singular moduli is the discriminant of the endomorphism
ring of the corresponding elliptic curve.

Theorem 17 (Colmez [22]). – There exists absolute constants c1 > 0 and c2 ≥ 0 with
the following property. If j is a singular moduli whose discriminant ∆ is a fundamental
discriminant, then
h(j) ≥ c1 (log |∆|) − c2 .

Polynomial upper bounds in the discriminant are available using classical estimates
in analytic number theory. Pila and the author proved the following inequality.

Lemma B.1 (Lemma 4.3 [33]). – For any ε > 0 there exists a constant c > 0 with the
following property. If j is a singular moduli with discriminant ∆, then
h(j) ≤ c|∆|ε .



If the Generalized Riemann Hypothesis (GRH) is true, then one may replace |∆|ε
in this upper bound by log |∆|. We refer to Section 4 [32] for an even better conditional
The special subvarieties of the product Y (1)2 are known. Points whose coordinates
are both singular moduli are precisely the special points and Y (1)2 itself is the only
two-dimensional special subvariety. Among the special curves we find the vertical and
horizontal lines where the fixed coordinate is a singular moduli. The remain ones are
Y0 (N ) ⊂ Y (1)2 and given by the zero-sets of the classical N th modular transformation
polynomial for N ∈ N. A complex point on such a special curve corresponds to a pair
of elliptic curves that are linked by an isogeny of degree N with cyclic kernel.
If C ⊂ Y (1)2 is not a special curve then the author proved [32] that there is a
constant c > 0 such that C ∩ Y0 (p) contains a point of height at least c log p for all
primes p ≥ c−1 . Hence not even C ∩ N ≥1 Y0 (N ) has bounded height.
As there can be no such thing as a Bounded Height Conjecture in the Shimura
setting we must content ourselves with something less. In the particular case of curves
in Y (1)2 the author formulated the following conjecture.
If S ⊂ Y (1)2 is an irreducible curve defined over Q then we let degQ S denote
the degree of the union of all conjugates of S over Q. We observe that any point
p ∈ Y (1)2 is contained in a uniquely determined minimal special subvariety S (p) ⊂
Y (1)2 . For example, if p = (j, ∗) is a special point, then S (p) = {p} and degQ S (p) =
[Q(p) : Q] ≥ [Q(j) : Q]. If ε > 0 then, by the Siegel-Brauer Theorem, [Q(j) : Q] grows
at least of the order |∆|1/2−ε where ∆ is the discriminant of the singular moduli j.
Conjecture (Weakly Bounded Height Conjecture for Y (1)2 [32])
Let C ⊂ Y (1)2 be an irreducible algebraic curve defined over Q that is not spe-
cial. There exists a constant c > 0 with the following property. Suppose p ∈ C and
dim S (p) ≤ 1, then
(B.1) h(p) ≤ c log(1 + degQ S).
By Corollary 1.2(ii) [32] the GRH implies this conjecture for a class of curves satis-
fying a geometric restriction in addition to being non-special. Part (i) of this corollary
implies that we can still obtain a logarithmic height bound (B.1) without assuming
the GRH if we restrict to points satisfying S (p) = Y0 (N ) for some N ∈ N. GRH is
used solely to obtain an upper for the height of a singular moduli that is logarithmic
in terms of its discriminant. But as we have seen in Lemma B.1, polynomials upper
bounds with arbitrarily small exponent hold unconditionally.
The following, even weaker, bounded height conjecture could bail us out should
the GRH default.
Conjecture (Super Weakly Bounded Height Conjecture for Y (1)2 )
Let ε > 0 and let C ⊂ Y (1)2 be an irreducible algebraic curve defined over Q that is
not special. There exists a constant c > 0 with the following property. Suppose p ∈ C
and dim S (p) ≤ 1, then
h(p) ≤ c(degQ S)ε .



Already this conjecture has implications in direction of Pink’s Conjecture. Let

us suppose for the moment that it holds. Using arguments laid out in the author’s
joint work with Pila [33] one can show the following finiteness statement. Suppose
C ⊂ Y (1)n is an irreducible algebraic curve defined over Q that is not contained in
a proper special subvariety of Y (1)n . Then C contains only finitely many points that
are inside a special subvariety of Y (1)n of codimension at least 2.
Theorem 1 [33] implies this finiteness result unconditionally for curves satisfying
an additional geometric hypothesis.

[1] F. Amoroso & S. David – “Le problème de Lehmer en dimension supérieure”, J. reine
angew. Math. 513 (1999), p. 145–179.
[2] F. Amoroso, D. Masser & U. Zannier – “Bounded height in pencils of finitely
generated subgroups”, preprint arXiv:1509.04963.
[3] J. Ax – “Some topics in differential algebraic geometry. I. Analytic subgroups of alge-
braic groups”, Amer. J. Math. 94 (1972), p. 1195–1204.
[4] M. Bainbridge, P. Habegger & M. Möller – “Teichmüller curves in genus three
and just likely intersections in”, Publ. Math. IHÉS 124 (2016), p. 1–98.
[5] M. Bays & P. Habegger – “A note on divisible points of curves”, Trans. Amer. Math.
Soc. 367 (2015), p. 1313–1328.
[6] D. Bertrand – “Upper bounds for (geometric) Hilbert functions”, in Introduction to
algebraic independence theory, Lecture Notes in Math., vol. 1752, Springer, Berlin, 2001,
p. 143–148.
[7] E. Bombieri & W. Gubler – Heights in Diophantine geometry, New Mathematical
Monographs, vol. 4, Cambridge Univ. Press, Cambridge, 2006.
[8] E. Bombieri, P. Habegger, D. Masser & U. Zannier – “A note on Maurin’s
theorem”, Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 21 (2010), p. 251–260.
[9] E. Bombieri, D. Masser & U. Zannier – “Intersecting a curve with algebraic sub-
groups of multiplicative groups”, Int. Math. Res. Not. 1999 (1999), p. 1119–1140.
[10] , “Intersecting curves and algebraic subgroups: conjectures and more results”,
Trans. Amer. Math. Soc. 358 (2006), p. 2247–2257.
[11] , “Anomalous subvarieties—structure theorems and applications”, Int. Math.
Res. Not. 2007 (2007), Art. ID rnm057, 33.
[12] , “Intersecting a plane with algebraic subgroups of multiplicative groups”, Ann.
Sc. Norm. Super. Pisa Cl. Sci. 7 (2008), p. 51–80.
[13] , “On unlikely intersections of complex varieties with tori”, Acta Arith. 133
(2008), p. 309–323.
[14] J.-B. Bost, H. Gillet & C. Soulé – “Heights of projective varieties and positive
Green forms”, J. Amer. Math. Soc. 7 (1994), p. 903–1027.
[15] M. a. Carrizosa – “Petits points et multiplication complexe”, Int. Math. Res. Not.
2009 (2009), p. 3016–3097.
[16] J. W. S. Cassels – An introduction to Diophantine approximation, Cambridge Tracts
in Mathematics and Mathematical Physics, No. 45, Cambridge Univ. Press, New York,



[17] , An introduction to the geometry of numbers, Classics in Mathematics, Springer,

Berlin, 1997.
[18] M. Chardin – “Une majoration de la fonction de Hilbert et ses conséquences pour
l’interpolation algébrique”, Bull. Soc. Math. France 117 (1989), p. 305–318.
[19] S. Checcoli, F. Veneziano & E. Viada – “On torsion anomalous intersections”, Atti
Accad. Naz. Lincei Rend. Lincei Mat. Appl. 25 (2014), p. 1–36.
[20] , “On the explicit torsion anomalous conjecture”, Trans. Amer. Math. Soc., to
[21] S. Checcoli & E. Viada – “On the torsion anomalous conjecture in CM abelian
varieties”, Pacific J. Math. 271 (2014), p. 321–345.
[22] P. Colmez – “Sur la hauteur de Faltings des variétés abéliennes à multiplication com-
plexe”, Compositio Math. 111 (1998), p. 359–368.
[23] S. David & M. Hindry – “Minoration de la hauteur de Néron-Tate sur les variétés
abéliennes de type C. M”, J. reine angew. Math. 529 (2000), p. 1–74.
[24] S. David & P. Philippon – “Minorations des hauteurs normalisées des sous-variétés
des tores”, Ann. Scuola Norm. Sup. Pisa Cl. Sci. 28 (1999), p. 489–543.
[25] M. Einsiedler, M. Kapranov & D. Lind – “Non-Archimedean amoebas and tropical
varieties”, J. reine angew. Math. 601 (2006), p. 139–157.
[26] W. Fulton – Intersection theory, Ergebn. Math. Grenzg., vol. 2, Springer, Berlin, 1984.
[27] A. Galateau – “Le problème de Bogomolov effectif sur les variétés abéliennes”, Algebra
Number Theory 4 (2010), p. 547–598.
[28] , “Une minoration du minimum essentiel sur les variétés abéliennes”, Comment.
Math. Helv. 85 (2010), p. 775–812.
[29] P. Habegger – “Intersecting subvarieties of Gn m with algebraic subgroups”, Math.
Ann. 342 (2008), p. 449–466.
[30] , “Intersecting subvarieties of abelian varieties with algebraic subgroups of com-
plementary dimension”, Invent. math. 176 (2009), p. 405–447.
[31] , “On the bounded height conjecture”, Int. Math. Res. Not. 2009 (2009), p. 860–
[32] , “Weakly bounded height on modular curves”, Acta Math. Vietnam. 35 (2010),
p. 43–69.
[33] P. Habegger & J. Pila – “Some unlikely intersections beyond André-Oort”, Compos.
Math. 148 (2012), p. 1–27.
[34] R. Hartshorne – Algebraic geometry, Graduate Texts in Math., vol. 52, Springer,
New York-Heidelberg, 1977.
[35] P. Hubschmid & E. Viada – “The elliptic torsion anomalous conjecture in codimen-
sion 2”, preprint arXiv:1604.05741.
[36] J.-P. Jouanolou – Théorèmes de Bertini et applications, Université Louis Pasteur,
Département de Mathématique, Institut de Recherche Mathématique Avancée, Stras-
bourg, 1979.
[37] P. Lelong – “Mesure de Mahler et calcul de constantes universelles pour les polynômes
de n variables”, Math. Ann. 299 (1994), p. 673–695.
[38] D. W. Masser – “Small values of the quadratic part of the Néron-Tate height on an
abelian variety”, Compositio Math. 53 (1984), p. 153–170.



[39] G. Maurin – “Courbes algébriques et équations multiplicatives”, Math. Ann. 341

(2008), p. 789–824.
[40] , “équations multiplicatives sur les sous-variétés des tores”, Int. Math. Res. Not.
2011 (2011), p. 5259–5366.
[41] P. Philippon – “Lemmes de zéros dans les groupes algébriques commutatifs”, Bull.
Soc. Math. France 114 (1986), p. 355–383.
[42] , “Sur des hauteurs alternatives. II”, Ann. Inst. Fourier (Grenoble) 44 (1994),
p. 1043–1065.
[43] , “Sur des hauteurs alternatives. III”, J. Math. Pures Appl. 74 (1995), p. 345–365.
[44] , “Approximations algébriques des points dans les espaces projectifs. I”, J. Num-
ber Theory 81 (2000), p. 234–253.
[45] , “Diophantine geometry”, in Introduction to algebraic independence theory, Lec-
ture Notes in Math., vol. 1752, Springer, Berlin, 2001, p. 83–94.
[46] J. Pila & A. J. Wilkie – “The rational points of a definable set”, Duke Math. J. 133
(2006), p. 591–616.
[47] J. Pila & U. Zannier – “Rational points in periodic analytic sets and the Manin-
Mumford conjecture”, Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 19 (2008),
p. 149–162.
[48] R. Pink – “A Common Generalization of the Conjectures of André-Oort, Manin-
Mumford, and Mordell-Lang”, preprint, 2005.
[49] , “A combination of the conjectures of Mordell-Lang and André-Oort”, in Geo-
metric methods in algebra and number theory, Progr. Math., vol. 235, Birkhäuser, 2005,
p. 251–282.
[50] N. Ratazzi – “Intersection de courbes et de sous-groupes et problèmes de minoration
de dernière hauteur dans les variétés abéliennes C.M”, Ann. Inst. Fourier (Grenoble)
58 (2008), p. 1575–1633.
[51] G. Rémond – “Sur les sous-variétés des tores”, Compositio Math. 134 (2002), p. 337–
[52] , “Inégalité de Vojta généralisée”, Bull. Soc. Math. France 133 (2005), p. 459–
[53] , “Intersection de sous-groupes et de sous-variétés. I”, Math. Ann. 333 (2005),
p. 525–548.
[54] , “Intersection de sous-groupes et de sous-variétés. II”, J. Inst. Math. Jussieu 6
(2007), p. 317–348.
[55] , “Une inégalité de łojasiewicz arithmétique”, in Diophantine approximation,
Dev. Math., vol. 16, SpringerWienNewYork, Vienna, 2008, p. 339–345.
[56] , “Intersection de sous-groupes et de sous-variétés. III”, Comment. Math. Helv.
84 (2009), p. 835–863.
[57] G. Rémond & E. Viada – “Problème de Mordell-Lang modulo certaines sous-variétés
abéliennes”, Int. Math. Res. Not. 2003 (2003), p. 1915–1931.
[58] J. B. Rosser & L. Schoenfeld – “Approximate formulas for some functions of prime
numbers”, Illinois J. Math. 6 (1962), p. 64–94.
[59] D. Roy & J. L. Thunder – “An absolute Siegel’s lemma”, J. reine angew. Math. 476
(1996), p. 1–26.



[60] A. Schinzel – Polynomials with special regard to reducibility, Encyclopedia of Mathe-

matics and its Applications, vol. 77, Cambridge Univ. Press, Cambridge, 2000.
[61] I. R. Shafarevich – Basic algebraic geometry. 1, second ed., Springer, Berlin, 1994.
[62] B. Sturmfels & J. Tevelev – “Elimination theory for tropical varieties”, Math. Res.
Lett. 15 (2008), p. 543–562.
[63] E. Viada – “The intersection of a curve with algebraic subgroups in a product of elliptic
curves”, Ann. Sc. Norm. Super. Pisa Cl. Sci. 2 (2003), p. 47–75.
[64] , “The intersection of a curve with a union of translated codimension-two sub-
groups in a power of an elliptic curve”, Algebra Number Theory 2 (2008), p. 249–298.
[65] , “Nondense subsets of varieties in a power of an elliptic curve”, Int. Math. Res.
Not. 2009 (2009), p. 1213–1246.
[66] , “The optimality of the bounded height conjecture”, J. Théor. Nombres Bor-
deaux 21 (2009), p. 769–784.
[67] , “Lower bounds for the normalized height and non-dense subsets of subvarieties
of abelian varieties”, Int. J. Number Theory 6 (2010), p. 471–499.
[68] U. Zannier – “Appendix by Umberto Zannier in [60] (pp. 517-539)”, 2000.
[69] S. Zhang – “Positive line bundles on arithmetic varieties”, J. Amer. Math. Soc. 8
(1995), p. 187–221.
[70] B. Zilber – “Exponential sums equations and the Schanuel conjecture”, J. London
Math. Soc. 65 (2002), p. 27–44.

Philipp Habegger, Department of Mathematics and Computer Science, Spiegelgasse 1, 4051 Basel,
Switzerland • E-mail : philipp.habegger@unibas.ch


Panoramas & Synthèses
52, 2017, p. 243–284




Gaël Rémond

Résumé. – Nous proposons une présentation unifiée des différents énoncés de minora-
tions de hauteur qui trouvent leur source dans le problème de Lehmer. Elle englobe les
versions sur les tores multiplicatifs, les variétés abéliennes, les variantes dites relatives
ainsi que le problème de Bogomolov effectif. Cette approche suggère une conjecture
dont la formulation est nouvelle même dans le cadre classique des nombres algé-
briques. Nous examinons ensuite comment ces minorations de hauteur s’appliquent
à la conjecture de Zilber-Pink : quitte à retirer un ensembe exceptionnel convenable,
l’intersection considérée vérifie une propriété de Northcott et il suffit donc de borner
la hauteur pour montrer la finitude.
Abstract (Generalizations of the Lehmer problem and applications to the Zilber-Pink conjec-
After a classical introduction to heights, we discuss various generalisations of
Lehmer’s problem. The framework is that of normalized heights on abelian varieties
and tori. We include the study of obstruction indices, relative at the same time to
an arbitrary ground field and to an algebraic subgroup. We introduce the notion of
a Lehmer group to unify our statements. Usual examples correspond to the trivial
group (classical Lehmer’s problem), the torsion group (relative Lehmer’s problem)
or the whole group of algebraic points (effective Bogomolov’s problem) but we show
that also all finite rank subgroups are of interest, even in the one-dimensional case.
We then discuss the applications of such height lower bounds to the Zilber-Pink
conjecture. We show how all the variants quoted can be used to provide a crucial
step toward the conjecture: once one knows (by other methods) that the height of
the intersection under consideration is bounded, the Lehmer-like bounds allow to get

1. Introduction

a. Objectifs. – Ces notes poursuivent trois buts assez distincts.

Classification mathématique par sujets (2000). – 11G50, 11G10, 14K15.

Mots clefs. – Hauteurs, problème de Lehmer, variétés abéliennes, tores, conjecture de Zilber-Pink.

© Panoramas et Synthèses 52, SMF 2017


Dans un premier temps (partie 2), nous proposons une introduction à la notion de
hauteur. Celle-ci est tout à fait classique et ne prétend à aucune originalité. Le lecteur
ayant déjà manipulé des hauteurs peut la sauter sans remords tandis que le novice
devrait y trouver de quoi suivre le reste du texte (les autres prérequis se limitent, à
quelques exceptions près, à des connaissances de base en géométrie algébrique et sur
les variétés abéliennes).
Ensuite, nous présentons en partie 3 le classique problème de Lehmer sur la hauteur
des nombres algébriques puis toute une famille de généralisations à diverses hauteurs
normalisées. La formulation est nouvelle : basée sur un groupe Γ, elle englobe dans
une seule définition les problèmes de Lehmer en dimension supérieure (où Γ est trivial
ou égal au groupe des points de torsion) ainsi que le problème de Bogomolov effectif
(lorsque Γ est le groupe de tous les points algébriques). Nous montrons aussi que
toute conjecture absolue entraîne automatiquement une version plus fine, relative à
un sous-groupe algébrique (voir théorème 3.7).
Enfin nous examinons (partie 4) comment ces généralisations s’appliquent à la
conjecture de Zilber-Pink (précisément le cas constant sur une variété abélienne ou
un tore). En effet, même si le problème de Lehmer est toujours ouvert sous toutes
ses formes, nous connaissons dans de nombreux cas des versions faibles, généralisant
le théorème de Dobrowolski, quelquefois dites à ε près (ici nous dirons que Γ est un
groupe de Dobrowolski, voir définition 3.1). De plus, comme l’ont constaté les premiers
Bombieri, Masser et Zannier [12] sur les tores, ces versions faibles suffisent pour les
applications à la conjecture de Zilber-Pink. Nous décrivons ceci en deux temps : d’une
part une version Lehmer (Γ de type fini) et d’autre part une version Bogomolov (Γ les
points algébriques) qui débouche sur des énoncés de type Zilber-Pink plus Bogomolov.
Dans les deux cas, ces applications ne donnent que la moitié de la réponse puisque l’on
ne traite que les points de hauteur bornée ; il faut indépendamment montrer que la
hauteur est bornée sur les ensembles considérés, mais ceci fait l’objet du cours de Ph.
Habegger. Les résultats que nous démontrons dans cette partie sont essentiellement
déjà connus mais nous en présentons de nouvelles démonstrations et nous traitons de
la manière la plus proche possible les deux cas abélien et torique.
En appendice, nous avons regroupé quelques énoncés techniques qui servent dans
plusieurs démonstrations des parties 3 et 4, particulièrement au paragraphe c de la
partie 4. En épilogue, nous mentionnons quelques progrès réalisés entre l’écriture de
ce texte et sa publication.

b. Conventions. – Dans la plus grande partie du texte, nous nons placerons dans la
situation suivante.

Notations 1.1. – Soient k un corps de nombres et A un groupe algébrique connexe

sur k muni d’une compactification Ā sur k, elle-même équipée d’un faisceau inversible
ample L ∈ Pic(Ā). Nous supposons de plus être dans l’un des deux cas suivants :
(1) Cas abélien : A est une variété abélienne, Ā = A et L est symétrique.
(2) Cas torique : A = Gnm et Ā est une compactification équivariante lisse de A.



Dans le cas torique (2), les choix usuels sont Ā = Pn et Ā = (P1 )n . Comme nous
le verrons le choix d’une compactification n’aura pas d’influence sur nos énoncés ;
on peut donc se restreindre à l’un de ces deux exemples. Toutefois nous sommes
amenés dans les preuves à faire des éclatements et donc à faire intervenir d’autres
Le cadre naturel de notre étude est très probablement celui des variétés semi-
abéliennes, englobant (1) et (2), mais, en raison de diverses complications et en l’ab-
sence presque complète de résultats, nous repoussons un (rapide) examen du cas
général à la dernière partie de ce texte.
Afin d’unifier au maximum les cas (1) et (2), nous utilisons toujours une notation
additive sur A. Ainsi dans le cas torique 0 désignera le point (1, . . . , 1) et mx le point
(xm m
1 , . . . , xn ) si x = (x1 , . . . , xn ) et m ∈ Z. De la même façon, nous ne parlerons
pas de sous-variété abélienne dans le cas (1) ou de sous-tore dans le cas (2) mais
uniformément de sous-groupe algébrique connexe ou de sous-variété semi-abélienne.
Nous écrirons aussi souvent s = 2 dans le cas (1) et s = 1 dans le cas (2) de sorte que,
par exemple, A a N s dim A points de N -torsion et la hauteur normalisée est homogène
de degré s sur A. Enfin nous utiliserons la notation g = dim A même si g = n dans le
cas (2).
L’autre convention importante concerne le corps de base : nous travaillerons ma-
joritairement sur une clôture algébrique fixée k̄ de k. Pour cette raison nous nous
autorisons à écrire x ∈ A en lieu et place de x ∈ A(k̄) et, lorsque nous parlons
d’une sous-variété V de A, nous faisons toujours référence à une sous-variété de A
sur k̄ c’est-à-dire précisément un sous-schéma fermé intègre V de Ak̄ = A × Speck̄.
Lorsque V provient d’un sous-schéma fermé de AL = A × SpecL (notion cruciale
pour le problème de Lehmer) pour un sous-corps k ⊂ L ⊂ k̄, nous dirons que V est
définie sur L.
Nous supprimons également la référence à k̄ dans les notations suivantes : Γ ⊂ A si-
gnifie Γ ⊂ A(k̄) ; End(A) désigne toujours End(Ak̄ ) et, plus généralement, si A′ est un
autre groupe algébrique commutatif, Hom(A, A′ ) représente le groupe des morphismes
de groupes algébriques Ak̄ → A′k̄ .
Enfin, de par la nature même du problème de Lehmer, le texte regorge de
constantes. Elles dépendent généralement de (A, Ā, L ) et souvent du choix du groupe
Γ considéré mais pas des points ou sous-variétés α, x, V . . . introduits ensuite (ceci
sera précisé à chaque fois). Comme nous ne calculons quasiment aucune de ces
constantes, nous employons souvent la lettre générique c (toujours un réel strictement
positif) pour diverses quantités non significatives. En revanche, les constantes plus
individualisées, comme c0 , cΓ (ε), . . . ne changent pas, elles, de valeur au fil du temps.

2. Hauteur
a. Sur les nombres algébriques. – Nous introduisons la hauteur logarithmique abso-
lue de Weil qui est une fonction h : Q → R+ qui sert à « mesurer » les nombres



algébriques. Elle est très facile à définir sur Q : pour a, b ∈ Z premiers entre eux
avec b 6= 0, on pose
h(a/b) = log max(|a|, |b|).
Nous décrivons maintenant trois façons de définir l’extension à Q de cette fonction.
1. Procédé limite. On définit tout d’abord une hauteur naïve de la façon suivante.
Si α ∈ Q on note µα = i=0 ai X i son polynôme minimal dans Z[X] (avec ad > 0)
et l’on pose :
hnaïve (α) = log max |ai |.
d 0≤i≤d
La hauteur de Weil s’obtient par la formule :
h(α) = lim hnaïve (αn ).
n→+∞ n

Il faut bien sûr vérifier que la limite existe (nous le verrons plus bas) ce qui est l’in-
convénient d’utiliser cette approche comme définition. L’avantage est que ce procédé
est celui qui servira dans la suite pour obtenir des hauteurs normalisées plus sophis-
tiquées, comme la hauteur de Néron-Tate. Si l’on admet l’existence de la limite, on
voit immédiatement sur la définition que h(αn ) = nh(α) pour n ∈ N et même, en
utilisant hnaïve (α−1 ) = hnaïve (α), on trouve h(αn ) = |n|h(α) pour n ∈ Z et α 6= 0.
Par suite on note aussi que si α est une racine de l’unité alors h(α) = 0.
2. Mesure de Mahler. La deuxième définition possible, la plus facile à énoncer, se
rattache à la mesure de Mahler. Pour α ∈ Q on utilise son polynôme minimal µα
comme ci-dessus et l’on note α1 , . . . , αd les racines de µα (les conjugués de α). On
pose alors !
h(α) = log ad max(1, |αi |) .
d i=1
Avec cette définition la quantité exp(dh(α)) s’appelle la mesure de Mahler de µα . Par
la formule de Jensen, on trouve aussi :
1 1
h(α) = log |µα (e2iπt )|dt.
d 0
Si l’on majore dans cette formule |µα (e2iπt )| ≤ i=0 |ai | ≤ (d + 1) max0≤i≤d |ai |,
on trouve h(α) ≤ hnaïve (α) + log(d+1)
d . D’un autre côté, d’après les relations entre
coefficients et racines, on a
(∗) aj = ad (−αi )
Card(I)=d−j i∈I

où I désigne une partie de {1, . . . , d}. Ceci entraîne immédiatement

|aj | ≤ 2 ad max(1, |αi |)

puis hnaïve (α) ≤ h(α) + log 2.



En particulier nous avons |h(α) − hnaïve (α)| ≤ log 2, ce qui permet d’affirmer que h
hérite de hnaïve la propriété fondamentale de Northcott : il n’y a qu’un nombre fini de
nombres algébriques de degré et de hauteur bornés. Ceci était clair pour hnaïve puisque
l’on se ramenait à un ensemble fini de polynômes minimaux.

3. Place par place. La définition la plus utile en pratique mais sans doute la moins
parlante des trois utilise la notion de places d’un corps de nombres. Une place v
est une classe d’équivalence de valeurs absolues non triviales sur le corps et ici nous
choisissons toujours comme représentante la valeur absolue qui étend l’une des valeurs
absolues usuelles de Q ce qui peut se traduire par le fait que pour chaque nombre
premier p la quantité |p|v doit prendre l’une des trois valeurs p, 1 ou 1/p. Dans le
premier cas, la valeur absolue est dite archimédienne et la place est dite infinie. Dans
les deux autres cas, la valeur absolue est ultramétrique et la place finie. Si v est une
place d’un corps K, on note Kv le complété de K en v et Qv le complété de Q en la
place de Q induite par v (Qv est R ou un corps p-adique).
Maintenant, si α ∈ Q, on choisit un corps de nombres K qui contient α et l’on
X [Kv : Qv ]
h(α) = log max(1, |α|v )
[K : Q]
où la somme parcourt toutes les places de K. On vérifie que la sommation a un sens car
tous les termes sauf un nombre fini sont nuls (si α 6= 0 on a |α|v 6= 1 seulement pour
un nombre fini de places) et les propriétés d’extensions de valeurs absolues montrent
que la formule ne dépend pas du choix du corps K. Il est également clair sur cette
définition que h(αn ) = nh(α) pour n ∈ N.
Vérifions maintenant que les définitions 2 et 3 coï ncident. Tout d’abord si v est
une place ultramétrique d’un corps contenant les αi on constate que

X Y d
max (−αi ) = max(1, |αi |v )
Card(I)=d−j i∈I i=1

(la majoration ≤ est claire et, dans l’autre sens, l’une des sommes a un unique terme
dominant de valeur absolue le membre de droite). Comme les aj sont premiers entre
eux, (∗) montre que le membre de gauche ci-dessus vaut 1/|ad |v . En utilisant la formule
du produit pour ad on constate alors que la hauteur définie via la mesure de Mahler
1 XX
log max(1, |αi |p )
d p i=1
où la première somme porte sur les places de Q et où pour chaque telle place p on a
choisi une extension de |·|p à un corps contenant les αi . Il est alors possible d’identifier
terme à terme cette somme à la définition place par place avec le corps K = Q(α) car
les nombres |αi |p sont exactement les |α|v où v parcourt les places au-dessus de p, à
condition de répéter [Kv : Qv ] fois le nombre |α|v .



Faisons enfin le lien avec la première approche. Comme les deux autres coïncident,
nous savons à la fois que |hnaïve (α) − h(α)| ≤ log 2 et que h(αn ) = nh(α) pour n ∈ N.
Nous en déduisons immédiatement |(1/n)hnaïve (αn ) − h(α)| ≤ (log 2)/n pour n ≥ 1
et ceci prouve bien que la suite hnaïve (αn )/n a une limite qui est h(α). Les trois
approches donnent donc bien la même notion et toutes les propriétés mentionnées
valent donc pour cette unique hauteur de Weil.
Avant de passer à des hauteurs plus sophistiquées sur les variétés et groupes algé-
briques, nous donnons quelques propriétés supplémentaires de la hauteur de Weil. En
premier lieu, nous démontrons le théorème de Kronecker.
Lemme 2.1. – Soit α ∈ Q . On a h(α) = 0 si et seulement si α est une racine de
Démonstration. – Un sens a déjà été vu. Supposons ici que h(α) = 0. Alors tous les
nombres αn , n ∈ N, sont de hauteur nulle et de degré inférieur ou égal à celui de α.
Par la propriété de Northcott, il n’y a qu’un nombre fini de tels nombres donc il existe
en particulier des entiers naturels m < n tels que αm = αn . Par suite αn−m = 1.
Toujours à partir de la propriété de Northcott, nous pouvons démontrer une pro-
priété plus forte.
× ×
Lemme 2.2. – La hauteur h : Q → R+ se factorise en une norme Q ⊗Z R → R+ .
Démonstration. – L’inégalité triangulaire résultera de la formule h(αβ) ≤ h(α)+h(β)
pour α, β ∈ Q déduite de la définition 3. Lorsque ξ est une racine de l’unité h(αξ) =
h(α) pour tout α ∈ Q. Par suite, h se factorise à travers le quotient de Q par le
groupe des racines de l’unité, qui n’est autre que Q ⊗Z Q. L’application obtenue est
une norme sur ce Q-espace vectoriel qui s’étend en une semi-norme | · | sur Q ⊗ R
Pn ×
(de manière unique). Si | i=1 αi ⊗ xi | = 0 avec α1 , . . . , αn ∈ Q multiplicativement
indépendants et x1 , . . . , xn ∈ R, considérons pour N ∈ N l’entier Ni ∈ Z le plus
proche de N xi . Il vient
! n n
X X 1X
h αi ⊗ Ni ≤ αi ⊗ (Ni − N xi ) ≤ h(αi ).
i=1 i=1
2 i=1
Pn × Qn
Les nombres uN = i=1 αi ⊗ Ni qui s’écrivent dans Q plutôt uN = i=1 αiNi
appartiennent tous au corps de nombres Q(α1 , . . . , αn ) et leur hauteur est bornée in-
dépendamment de N . La propriété de Northcott entraîne la finitude de leur ensemble.
Par construction ceci n’est possible que si les xi sont tous nuls et cela montre bien
que | · | est une norme.
Notons encore ici que si α n’est pas un entier algébrique alors ad ≥ 2 dans les
notations ci-dessus donc, sur la définition 2, on constate h(α) ≥ (log 2)/d. D’un autre
côté, si α est le nombre 21/d de degré d, alors h(α) = (log 2)/d. Le problème de
Lehmer (voir partie suivante) est de savoir s’il existe des nombres de hauteur non
nulle beaucoup plus petite que cela (plus petite que c/d où c est une constante).



b. Sur les variétés. – Définissons maintenant la hauteur sur l’espace projectif Pn .

Nous généralisons de manière directe la définition place par place. Si x ∈ Pn (Q) nous
choisissons un système de coordonnées (x0 : · · · : xn ) pour x et un corps de nombres
K contenant les nombres x0 , . . . , xn . Nous posons alors
X [Kv : Qv ]
h(x) = log max |xi |v
[K : Q] 0≤i≤n

où v parcourt à nouveau les places de K. Ici encore la somme ne dépend pas du

choix de K et, par la formule du produit, elle ne dépend pas non plus du choix de
coordonnées pour x. La hauteur obtenue sur P1 correspond à celle définie précédem-
ment : la hauteur d’un nombre algébrique α ∈ Q coïncide avec celle du point projectif
(1 : α) ∈ P1 (Q) (en d’autres termes nous avons étendu h de Q à P1 (Q) en posant
h(∞) = 0). Remarquons encore que l’on a h(xm m
0 : · · · : xn ) = mh(x0 : · · · : xn )
lorsque m ∈ N. En revanche nous n’avons pas de formule lorsque m ∈ Z \ N
et n ≥ 2 ; par exemple avec m = −1 nous avons h(1 : 2k : 3ℓ ) = log max(2k , 3ℓ )
mais h(1 : 2−k : 3−ℓ ) = log(2k 3ℓ ) pour k, ℓ ∈ N.
Considérons ensuite une variété projective V sur Q. Chaque morphisme ϕ de V
dans un espace projectif Pn induit une hauteur hϕ : V (Q) → R+ en posant simple-
ment hϕ (x) = h(ϕ(x)). Ici la hauteur dépend du choix du morphisme ϕ mais l’on
peut montrer [42, p. 271] que si deux morphismes ϕ : V → Pn et ψ : V → Pm cor-
respondent au même faisceau inversible, c’est-à-dire si ϕ∗ O (1) ≃ ψ ∗ O (1), alors les
hauteurs diffèrent par une fonction bornée :
∃c ∈ R ∀x ∈ V (Q) |hϕ (x) − hψ (x)| ≤ c.
Ainsi, si L ∈ Pic(V ) est engendré par ses sections globales, nous pouvons définir
un élément h L ∈ RV (Q) /B où B est l’espace des fonctions bornées V (Q) → R. On
montre, à l’aide du plongement de Segre [42, p. 272], que l’on a h L ⊗ L ′ = h L + h L ′
dans cet espace ce qui permet, en écrivant un faisceau inversible comme différence de
deux faisceaux engendrés par leurs sections globales, d’étendre la hauteur par linéarité
en Pic(V ) → RV (Q) /B. Notons que, s’il est commode de disposer de cette extension,
on se restreint souvent aux hauteurs associées à des faisceaux amples car elles héritent
de Pn la propriété de Northcott. Par exemple lorsque l’on parle de points de hauteur
bornée on sous-entend toujours que la hauteur provient d’un faisceau ample.
Si l’on veut associer à L ∈ Pic(V ) une fonction hauteur h L : V (Q) → R bien
définie (et non seulement une classe modulo B), il faut impérativement une donnée
supplémentaire. Dans le cadre de la théorie d’Arakelov, elle consiste en un modèle
entier et une collection de normes hermitiennes sur les fibres des extensions de L à C
(ou en une collection de normes en toutes les places dans le point de vue adélique). Ici,
en vue d’aboutir à des hauteurs normalisées de groupes algébriques, nous ajoutons la
donnée d’un endomorphisme f : V → V tel que f ∗ L ≃ L avec q ∈ N \ {0, 1} (il
s’agit de la situation étudiée pour définir des hauteurs en dynamique algébrique). Nous
choisissons une hauteur h L : V (Q) → R quelconque associée à L (un représentant de



la classe de hauteurs) et posons pour x ∈ V (Q)

h L (f m (x))
ĥ L (x) = lim .
m→+∞ qm
On vérifie l’existence de cette limite en traduisant la trivialité de f ∗ L ⊗ L en une
majoration |h L (f (x)) − qh L (x)| ≤ c. Ceci entraîne pour n ≥ m
h L (f m (x)) h L (f n (x)) c c c
− ≤ n + · · · + m+1 ≤
qm qn q q (q − 1)q m
et donc que l’on a une suite de Cauchy. On a aussi |ĥ L (x) − h L (x)| ≤ c/(q − 1) qui
montre que ĥ L est également un représentant de la classe de hauteurs associée à L .
C’est le représentant normalisé par rapport à f c’est-à-dire le seul tel que ĥ L (f (x)) =
q ĥ L (x) pour tout x ∈ V (Q).
⊗q ⊗r
Si nous avons deux endomorphismes f, g : V → V avec f ∗ L ≃ L et g ∗ L ≃ L
pour q, r ∈ N \ {0, 1} nous pouvons définir deux hauteurs ĥ L ,f et ĥ L ,g normalisées
par rapport à f ou g. Lorsque f et g commutent, elles coïncident : en effet, en divi-
sant l’égalité ĥ L ,f (g m (f (x))) = q ĥ L ,f (g m (x)) par rm et en passant à la limite, on a
ĥ L ,g (f (x)) = q ĥ L ,g (x) d’où ĥ L ,f = ĥ L ,g .
Ce procédé général permet de réinterpréter la définition par limite de la hauteur de
Weil : la hauteur naïve était un représentant de la classe de hauteurs associée à O (1)
sur P1 et nous l’avons normalisée par rapport aux endomorphismes [m] : P1 → P1
donnés par [m](x0 : x1 ) = (xm m
0 : x1 ) si m ≥ 0 et [m](x0 : x1 ) = (x1 : x−m
0 ) sinon,
tous ces endomorphismes commutant entre eux et vérifiant [m]∗ O (1) = O (|m|). De
même la hauteur de Weil sur Pn est associée à O (1) et normalisée par rapport aux
[m] : Pn → Pn , (x0 : · · · : xn ) 7→ (xm m
0 : · · · : xn ) pour m ≥ 2.

c. Sur les variétés semi-abéliennes. – Si A est un groupe algébrique, les morphismes

de multiplication [m] : A → A, x 7→ mx où m ∈ Z forment une famille commutative
à laquelle on peut appliquer ce qui précède.
Plaçons-nous d’abord dans le cadre des notations 1.1. Dans le cas abélien, on
a [m]∗ L ≃ L pour tout m ∈ Z et la hauteur normalisée ĥ L associée à cette
famille d’endomorphismes est la célèbre hauteur de Néron-Tate. Elle vérifie ĥ L (mx) =
m2 ĥ L (x) = ms ĥ L (x) et on montre même grâce au théorème du cube que c’est une
forme quadratique sur A(k̄) [42, p. 274]. De plus, par les arguments des lemmes 2.1
et 2.2, on montre que ĥ L (x) = 0 équivaut à x ∈ Ators (points de torsion) et que ĥ L
induit une forme quadratique définie positive sur A(k̄) ⊗ R (autrement dit ĥ L est
une norme).
Dans le cas torique, le morphisme [m] : Gnm → Gnm (c’est-à-dire ici (x1 , . . . , xn ) 7→
(x1 , . . . , xm
m ∗
n )) ne s’étend en général en [m] : Ā → Ā que si m ≥ 0. On a alors [m] L ≃
L et donc à nouveau une hauteur normalisée ĥ L qui vérifie encore ĥ L (mx) =
ms ĥ L (x). Si Ā = Pn et L = O (1) on retrouve la hauteur de Weil sur Pn . Le choix
Ā = (P1 )n présente l’avantage de posséder des extensions [m] : Ā → Ā y compris



pour m < 0. Avec L = O (1, . . . , 1), la hauteur normalisée obtenue sur Gnm est la
somme des hauteurs de Weil des coordonnées. De ce fait, le lemme 2.2 implique
que ĥ L induit une norme sur A(k̄) ⊗ R. Dans certaines situations, nous serons amenés
à nous restreindre à ce cas plus agréable.
Sur une variété semi-abélienne qui n’est ni une variété abélienne ni un tore, la
situation est plus compliquée : les morphismes [m] : A → A (m ≥ 0) s’étendent sur
une compactification équivariante Ā mais il n’y a pas de faisceau ample L sur Ā tel
que [m]∗ L soit de la forme L (pour m ≥ 2). Au mieux on peut trouver L ample
⊗m ⊗m2
avec L = L lin ⊗ L quad où [m]∗ L lin ≃ L lin et [m]∗ L quad ≃ L quad pour m ≥ 0. Il faut
donc normaliser séparément les deux hauteurs et poser ĥ L = ĥ L lin + ĥ L quad (voir par
exemple la description de [18]). Ceci est suffisant en général (par exemple pour avoir
ĥ L (x) = 0 ⇐⇒ x ∈ Ators ) mais la hauteur obtenue n’est pas réellement normalisée
(pour un bon choix de Ā la fonction qui induit une norme est ĥ L lin + ĥ L quad ). Dans
le cas intermédiaire où A est le produit d’un tore A1 et d’une variété abélienne A2
(avec une compactification produit et une polarisation produit), la hauteur n’est pas
normalisée par rapport aux endomorphismes [m]A = [m]A1 × [m]A2 mais elle l’est
relativement aux [m2 ]A1 × [m]A2 pour m ≥ 0
Dans le reste du texte, toutes les hauteurs sont normalisées et sont simplement
notées h.

3. Minorations de hauteurs normalisées

a. Le problème de Lehmer. – Pour le formuler, nous utilisons la hauteur de Weil h
logarithmique et absolue sur Q (voir ci-dessus).

Conjecture 3.1. – Il existe un réel c > 0 tel que, pour tout nombre algébrique non nul
α qui n’est pas une racine de l’unité, on a [Q(α) : Q]h(α) ≥ c.

Depuis que Lehmer a soulevé la question en 1933 [35], elle résiste à toutes les
attaques, malgré de nombreux travaux. Il n’entre pas dans nos objectifs ici d’en dresser
une liste complète ou même représentative mais nous pouvons citer l’élégant résultat
de Smyth en 1971 [52] : si α est un nombre algébrique non nul non réciproque (ceci
signifie que α−1 ne fait pas partie des conjugués de α) alors [Q(α) : Q]h(α) ≥ [Q(θ) :
Q]h(θ) > 0 où θ est une racine de X 3 − X − 1. Rappelons aussi que, beaucoup plus
élémentairement, on montre [Q(α) : Q]h(α) ≥ log 2 si α n’est pas un entier algébrique.
En vertu de la relation h(α−1 ) = h(α), la même minoration vaut dès que α (non nul)
n’est pas une unité algébrique.
Pour les applications que nous visons, le résultat le plus important dans la direction
de la conjecture 3.1 s’avère être celui de Dobrowolski en 1979 [23].

Théorème 3.2. – Pour tout réel ε > 0, il existe un réel c(ε) > 0 tel que, pour
tout nombre algébrique non nul α qui n’est pas une racine de l’unité, on a
[Q(α) : Q]1+ε h(α) ≥ c(ε).



La forme que nous citons correspond à une version affaiblie de l’énoncé de Dobro-
wolski. La version forte comporte des facteurs logarithmiques : par exemple si α 6∈ Q
n’est pas une racine de l’unité
[Q(α) : Q](log[Q(α) : Q])3 h(α) > (log log[Q(α) : Q])3
où la valeur explicite de la constante 1/4 est due à Voutier [56]. De la même façon, dans
la suite, lorsque nous donnerons une minoration avec un exposant 1 + ε, il existera en
fait une forme plus précise avec des facteurs logarithmiques ; nous ne nous y attardons
pas car ce raffinement ne modifie pas les applications à la conjecture de Zilber-Pink.
Nous souhaitons maintenant considérer toute une série de généralisations de la
conjecture 3.1, particulièrement lorsqu’un résultat partiel généralisant le théorème 3.2
peut être établi. Pour ce faire, il convient tout d’abord de rattacher la situation de la
conjecture 3.1 au groupe multiplicatif Gm . En effet, nous reconnaissons :
– dans les nombres algébriques non nuls, les points de Gm (Q) ;
– dans les racines de l’unité, les points de torsion de Gm (Q) ;
– dans la hauteur h, une hauteur normalisée sur Gm (Q).
La première étape consiste donc à remplacer Gm par un autre groupe algébrique.
Dans ce cadre, on sait démontrer un analogue satisfaisant du théorème 3.2 pour :
les courbes elliptiques à multiplications complexes (Laurent 1983 [33]), le tore Gnm
(Amoroso-David 1999 [2]), les variétés abéliennes à multiplications complexes (David-
Hindry 2000 [20]). On obtient ensuite de nouvelles variations de la conjecture 3.1 en
substituant au point α de notre groupe algébrique A une sous-variété V de A. Dans
ce cas, selon que l’on mesure le degré de V de façon arithmétique ou géométrique, on
aboutit à un problème de Lehmer pour les variétés (voir Amoroso-David 2001 [3]) ou
au problème de Bogomolov effectif (voir détails plus bas). Une autre direction de gé-
néralisation, particulièrement importante ici, se trouve dans la littérature sous le nom
de problème de Lehmer relatif : il s’agit de remplacer le corps de base par le corps de
rationalité des points de torsion. Dans ce cadre, les résultats suscités de Dobrowolski,
Laurent, Amoroso-David 1999 et David-Hindry se sont vus respectivement généralisés
par Amoroso-Zannier 2000 [7], Ratazzi 2004 [46], Delsinne 2009 [22] et Carrizosa 2009
[17]. Enfin ceci suggère encore de nouvelles extensions que nous introduisons plus bas.
Dans ce texte, plutôt que d’énoncer une liste de résultats, nous avons choisi de
donner une présentation aussi unifiée que possible de toutes les variantes dans une
seule définition. Ainsi, au paragraphe suivant, nous introduisons toutes les notations
nécessaires avant de formuler le problème général puis de revenir aux cas particuliers
correspondant à la description ci-dessus.

b. Groupes de Lehmer. – Nous nous plaçons dans le cadre des notations 1.1 et nous
notons h la hauteur normalisée sur A associée. Rappelons que A remplace A(k̄) ou
Ak̄ dans les notations x ∈ A ou End(A).
Nous considérons un sous-groupe Γ de A et nous lui associons :



– son corps de rationalité KΓ = k(Γ), c’est-à-dire le plus petit sous-corps de k̄ sur

lequel tous les points de Γ sont rationnels ;
– son saturé Γsat = {x ∈ A | ∃N ∈ N \ {0} N x ∈ EndA · Γ} (EndA · Γ est le
sous-groupe engendré par les éléments de la forme ϕ(γ) où ϕ ∈ EndA et γ ∈ Γ).
Nous allons maintenant faire jouer le rôle du nombre α ∈ Gm (Q) du premier
paragraphe à une sous-variété V de A. Dans toute la suite, nous supposons toujours
V 6= A. Nous devons trouver des remplaçants pour les notions de degré et hauteur
de α ainsi que pour le fait d’être une racine de l’unité.
En guise de hauteur, nous utilisons le minimum essentiel µess (V ) : il s’agit du seuil
de hauteur à partir duquel les points deviennent denses dans V . Formellement on pose
(pour θ un réel) V (θ) = {x ∈ V | h(x) ≤ θ} et µess (V ) = inf{θ ∈ R | V (θ) = V }.
Bien sûr, si V est un singleton, on retrouve µess ({x}) = h(x).
Au lieu du degré, nous employons un indice d’obstruction. Pour un corps L tel
que k ⊂ L ⊂ k̄ nous posons

ωL (V ) = min{deg L (Z)1/(dim A−dim Z)

| Z fermé équidimensionnel défini sur L, V ⊂ Z ⊂ A}.
Ici le degré de Z relativement à L est celui de son adhérence Z̄ dans Ā : deg L Z =
· dim Z
L · Z̄.
Enfin nous dirons que V est de Γ-torsion s’il existe γ ∈ Γsat et un sous-groupe
algébrique connexe B de A avec V = γ + B. Pour Γ = {0} cette notion coï ncide
avec celle de variété de torsion utilisée dans la littérature. Ce n’est toutefois pas
cette notion de torsion qui généralise le fait d’être une racine de l’unité dans nos
énoncés. Nous dirons que V est Γ-transverse si elle n’est contenue dans aucune sous-
variété de Γ-torsion de A différente de A (lorsque Γ = A on dit simplement que V
est transverse). C’est cette hypothèse forte que nous utiliserons. Nous verrons au
paragraphe suivant (voir lemme 3.4) que cela correspond bien à une notion de torsion :
nous introduirons un anneau EΓ tel que V est de EΓ -torsion si et seulement si elle
n’est pas Γ-transverse.
Tous les ingrédients étant en place, nous pouvons donner les définitions qui visent
à généraliser le problème de Lehmer dans la direction qui nous intéresse.
Définition 3.1. – (1) On dit que Γ est un groupe de Lehmer s’il existe un réel cΓ > 0
tel que, pour toute variété Γ-transverse V , on a ωKΓ (V )µess (V ) ≥ cΓ .
(2) On dit que Γ est un groupe de Dobrowolski si pour tout réel ε > 0 il existe un réel
cΓ (ε) > 0 tel que, pour toute variété Γ-transverse V , on a ωKΓ (V )1+ε µess (V ) ≥ cΓ (ε).
Cette formulation avec un groupe Γ permet d’unifier les trois directions évoquées
plus haut :
– pour Γ = {0} (donc KΓ = k et Γsat = Ators ) on trouve le problème de Lehmer,
– pour Γ = Ators (Γsat = Γ) on trouve le problème de Lehmer relatif et
– pour Γ = A (donc KΓ = k̄ et Γsat = Γ) on trouve le problème de Bogomolov



Dans ces trois cas, l’on sait démontrer un analogue du théorème 3.2.

Théorème 3.3. – Si A est le tore Gnm ou une variété abélienne à multiplications com-
plexes alors les groupes {0}, Ators et A sont (faiblement) de Dobrowolski.

Démonstration. – Pour le tore voir respectivement [3, 22, 4]. Pour une variété abé-
lienne CM voir [20, 17, 26]. Voir aussi le paragraphe suivant pour l’équivalence entre
notre formalisme et celui de certains de ces articles.

La restriction introduite par le mot faiblement dans l’enoncé ne s’applique que

pour le groupe Γ = A dans le cas où A est une variété abélienne. Alors que, dans
tous les autres cas, le résultat connu correspond bien à la définition donnée plus
haut, le théorème de Galateau est un petit peu plus faible : il donne une minoration
de deg(V )ε ωk̄ (V )µess (V ) au lieu de ωk̄ (V )1+ε µess (V ). En contrepartie, tandis que
pour Γ = {0} ou Γ = Ators on ne sait pas aller au-delà de l’hypothèse de multiplication
complexe, en revanche, pour Γ = A, ces résultats de Galateau permettent de traiter
d’autres variétés abéliennes comme les produits de courbes elliptiques et de surfaces
abéliennes. En fait, il montre même qu’une conjecture de Serre sur la réduction de A
entraîne que A est faiblement de Dobrowolski. Notons aussi que cette version faible
suffit pour les applications à la conjecture de Zilber-Pink (voir proposition 4.8).
Bien entendu, ce théorème n’épuise pas le sujet : il existe des versions plus précises
(avec facteurs logarithmiques et quelquefois des constantes explicites) et d’autres ré-
sultats sont connus. D’une part, David et Philippon ont démontré des minorations
de µess (V ) inconditionnelles pour toute variété abélienne mais elles ne rentrent pas
dans notre cadre car elles sont d’ordre plus petit que ω(V )−1−ε (voir [21]). D’autre
part, on connaît aussi d’autres estimations intéressantes décrivant les points de petite
hauteur de V (voir [21] pour les variétés abéliennes et [5, 6] pour des résultats récents
sur les tores).
Maintenant, au vu des résultats qui concernent trois groupes particuliers, on peut
légitimement se demander comment caractériser les groupes de Lehmer ou de Dobro-
wolski. En général, cela semble loin d’être évident (notamment il existe des groupes
qui ne sont pas de Dobrowolski : il suffit de choisir Γ avec Γsat 6= A mais KΓ = k̄ ; par
exemple, dans Gm , le groupe Γ des unités de Q vérifie ceci) mais je voudrais proposer
la conjecture suivante.

Conjecture 3.4. – Tout groupe de rang fini est de Lehmer.

Naturellement, un problème plus réaliste serait de montrer qu’un tel groupe est
de Dobrowolski sous les hypothèses du théorème 3.3. Par exemple, comme cas (très)
particulier apparemment inconnu, ceci contient l’assertion suivante : il existe un réel
c > 0 tel que pour tout n ∈ 2N si x ∈ Qab (21/n )× n’est pas contenu dans le groupe
engendré par 21/n et les racines de l’unité alors h(x) ≥ c (à n fixé ceci découle de [7]).



c. Remarques. – Nous regroupons ici une série de commentaires et de variantes sur

nos définitions.
Tout d’abord, certains des résultats que nous avons cités utilisent en lieu et place
de l’indice d’obstruction introduit plus haut la variante suivante :

ωL (V ) = min{deg L (H) | H hypersurface de A définie sur L, V ⊂ H}.

Bien entendu, on a ωL (V ) ≤ ωL (V ). Il existe aussi une inégalité dans l’autre sens.

Lemme 3.1. – Il existe un réel κ tel que pour tout V on a ωL (V ) ≤ κωL (V ).

Démonstration. – Choisissons Z qui réalise le minimum définissant ωL (V ). Soit aussi

m ∈ N tel que L soit très ample. Un théorème de M. Chardin permet  d’estimer la
fonction de Hilbert HZ (ν) = dimL Γ(Z̄, L ) par HZ (ν) ≤ ν+dim
dim Z
deg ⊗m Z pour
1 ν+dim A
tout ν ∈ N (voir [19]). D’un autre côté, on peut écrire HA (ν) ≥ c dim A pour un
réel c > 0 du fait que HA (·) est une fonction strictement positive asymptotiquement
égale à un polynôme de degré dim A. Un rapide calcul montre alors que si ν + 1 >
(dim A)(c deg L ⊗m Z)1/(dim A−dim Z) alors HZ (ν) < HA (ν). Par suite, il existe σ ∈
Γ(Ā, L ) \ {0} avec σ|Z = 0 pour n ≤ m(dim A)(cmdim Z deg L Z)1/(dim A−dim Z) ≤
κωL (V ) pour un certain réel κ (indépendant de V ). Notons H l’hypersurface de degré

n de A définie par σ. On a V ⊂ Z ⊂ H et H est définie sur L. Par suite ωL (V ) ≤
deg L H = n ≤ κωL (V ).

De cette façon, l’emploi de l’un ou l’autre indice ne change pas nos définitions
(seules les constantes non spécifiées cΓ ou cΓ (ε) peuvent être modifiées). En revanche,
si l’on utilise la majoration triviale
ωL (V ) ≤ (deg L Gal(k̄/L)V )1/(dim A−dim V ) ,
on constate que les énoncés obtenus en remplaçant l’indice d’obstruction par le degré
sont plus faibles.
Voyons maintenant que le fait d’être de Lehmer ou de Dobrowolski ne dépend bien
que du groupe Γ (comme sous-groupe de A) et non des choix de Ā, L ou k faits
pour énoncer la définition. Comme ci-dessus ces choix influent uniquement sur les
constantes, en vertu du fait suivant.

Lemme 3.2. – Si deux choix (Ā, L , k) et (Ā′ , L , k ′ ) correspondent au même groupe
algébrique Ak̄ , il existe un réel c > 0 tel que pour toute sous-variété V de A on a
c−1 µess
(V ) ≤ µess
′ (V ) ≤ cµ
(V ) et c−1 ωKΓ , L (V ) ≤ ωKΓ′ , L ′ (V ) ≤ cωKΓ , L (V ).

Démonstration. – Pour la variation du corps de nombres, on peut supposer k ⊂ k ′ ;

alors KΓ ⊂ KΓ′ = k ′ (Γ) et [KΓ′ : KΓ ] ≤ [k ′ : k]. Si Z ⊂ A est défini sur KΓ , il
est a fortiori défini sur KΓ′ tandis que s’il est défini sur KΓ′ alors Gal(k̄/KΓ ) · Z
est défini sur KΓ et de degré au plus [KΓ′ : KΓ ] deg Z. Par suite, à L fixé, on a
ωKΓ′ (V ) ≤ ωKΓ (V ) ≤ [k ′ : k]ωKΓ′ (V ) tandis que µess (V ) ne dépend pas de k. Sup-
posons maintenant k fixé et faisons varier le couple (Ā, L ). Il nous suffit de vérifier



que les fonctions hauteur normalisée x 7→ h(x) et degré Z 7→ deg L Z sont multi-
pliées par des fonctions bornées (à valeurs dans un invervalle de la forme [c−1 , c]).

Dans le cas abélien, comme L et L sont amples sur Ā = Ā′ , il existe un entier
⊗m ′⊗−1 ⊗−1 ′⊗m
naturel non nul m tel que les faisceaux L ⊗ L et L ⊗ L soient en-
gendrés par leurs sections globales. Par suite, des hauteurs quelconques associées à
ces faisceaux sont minorées et les hauteurs normalisées sont donc positives, ce qui
donne m−1 h(x) ≤ h′ (x) ≤ mh(x) pour x ∈ A. De la même façon, cette propriété des
faisceaux entraîne m− dim Z deg L Z ≤ deg L ′ Z ≤ mdim Z deg L Z pour tout Z fermé
équidimensionnel de A. Dans le cas torique, la même idée se complique lorsque les
compactifications Ā et Ā′ diffèrent. On utilise un éclatement commun X, par exemple
l’adhérence du graphe de l’immersion diagonale A → Ā×Ā′ , muni des deux projections
π : X → Ā et π : X → Ā′ qui sont des isomorphismes au-dessus de A. On compare

alors les faisceaux π ∗ L et π ′∗ L (non nécessairement amples). Par amplitude de L , il
′⊗−1 ⊗m ′⊗−1 ⊗m
existe m ∈ N\{0} tel que π∗ (π ′∗ L )⊗ L ≃ π∗ (π ′∗ L ⊗π ∗ L ) soit engendré
′∗ ′⊗−1 ∗ ⊗m
par ses sections globales. Posons M = π L ⊗π L . Comme π ∗ π∗ M → M
est un isomorphisme sur l’ouvert A de X, on en déduit que les sections de Γ(X, M )
engendrent M |A . Ceci suffit pour montrer que toute hauteur associée à M est mi-
′ ⊗m · dim Y
norée sur A ainsi que (π ′∗ L )· dim Y · Y ≤ (π ∗ L ) · Y pour tout fermé Y de X
qui rencontre A. On conclut ensuite de même.

Penchons-nous ensuite sur la variation par isogénie.

Lemme 3.3. – Soient Γ un sous-groupe de Dobrowolski de A et f : A → A′ une isogé-

nie. Alors le groupe f (Γ) est de Dobrowolski et f (Γ)sat = f (Γsat ).

Démonstration. – Fixons une isogénie g : A′ → A telle que f ◦ g = [N ] pour N ∈

N \ {0}. Nous pouvons supposer que f , g et A′ sont définis sur k, que g s’étend

aux compactifications en g : Ā′ → Ā et que L = g ∗ L . Soit x ∈ f (Γ)sat et écrivons
x = f (y) avec y ∈ A. Par hypothèse il existe M ∈ N \ {0} tel que M x ∈ EndA′ · f (Γ).
Par suite M g(x) = M N y ∈ g · EndA′ · f (Γ) ⊂ EndA · Γ d’où y ∈ Γsat et x ∈
f (Γsat ). Réciproquement supposons x = f (y) avec y ∈ Γsat . Il existe M ∈ N \ {0}
tel que M y ∈ EndA · Γ donc M x ∈ f · EndA · Γ puis M N x ∈ f · EndA · N · Γ =
f ·EndA·g ·f ·Γ ⊂ EndA′ ·f (Γ) donc x ∈ f (Γ)sat . Soit maintenant V ′ ⊂ A′ une variété
f (Γ)-transverse. Nous posons V = g(V ′ ) ce qui donne en particulier f (V ) = [N ]V ′ .
Si V ⊂ γ + B avec γ ∈ Γsat alors [N ]V ′ ⊂ f (γ) + f (B) avec f (γ) ∈ f (Γsat ) =
f (Γ)sat puis V ′ ⊂ γ ′ + f (B) où N γ ′ = f (γ) donc γ ′ ∈ Γsat puis f (B) = A′ par
hypothèse sur V ′ donc B = A et ceci montre que V est Γ-transverse. Nous avons donc
ωKΓ (V )1+ε µess (V ) ≥ cΓ (ε). Comme Kf (Γ) ⊂ KΓ nous avons ωKΓ (V ) ≤ ωKf (Γ) (V ).

D’un autre côté, puisque L = g ∗ L donne h(g(x)) = h′ (x) pour x ∈ A′ , nous avons
µess (V ) = µess (V ′ ). Écrivons L = Kf (Γ) et choisissons Z ′ défini sur L, contenant
′ ′
V ′ tel que ωL (V ′ ) = (deg Z ′ )1/(dim A −dim Z ) . Par formule de projection deg Z ′ =
′ · dim Z ′ · dim Z ′
(g ∗ L )· dim Z · Z ′ = L · g∗ Z ′ ≥ L · g(Z ′ ) = deg g(Z ′ ). Comme g(Z ′ ) est

défini sur L et contient V , il vient ωL (V ) ≤ (deg g(Z ′ ))1/(dim A−dim Z ) ≤ ωL (V ′ ).



In fine nous avons alors ωL (V ′ )1+ε µess (V ′ ) ≥ cΓ (ε) ce qui montre que f (Γ) est de
Remarquons que si Γ est saturé alors f (Γ) ne dépend pas de f . En effet, si f ′ est
une autre isogénie N f ′ (Γ) = f gf ′ (Γ) ⊂ f · EndA · Γ ⊂ f (Γ) donc f ′ (Γ) ⊂ f (Γ)sat =
f (Γsat ) = f (Γ).
Au vu des définitions, on constate immédiatement que, si Γ et Γ′ sont deux sous-
groupes de A tels que Γ ⊂ Γ′ ⊂ Γsat et si Γ′ est de Lehmer ou de Dobrowolski, alors il
en va de même de Γ (car Γ′sat = Γsat et KΓ ⊂ KΓ′ ). En particulier pour démontrer la
conjecture 3.4, on pourrait supposer toujours Γ saturé. De la même façon, les résultats
pour Γ = {0} découlent de ceux pour Γ = Ators et auraient pu être omis de notre
présentation ; toutefois les preuves sont plus simples pour Γ = {0} et il n’est pas exclu
que, de même, la conjecture soit plus abordable dans un premier temps pour certains
groupes non saturés (par exemple dans Gm , le groupe engendré par les 23 plutôt
que son saturé engendré par tous les 21/n ).
Nous utiliserons dans la partie suivante une autre remarque élémentaire : si Γ
est de Dobrowolski alors pour tout ε > 0 on a aussi ωKΓ (V )1+ε µess (V ) ≥ cΓ (ε)
pour tout fermé équidimensionnel V dont au moins une composante est Γ-transverse
(en effet si V1 , . . . , Vs sont les composantes de V alors µess (V ) = max1≤i≤s µess (Vi )
et ωKΓ (Vi ) ≤ ωKΓ (V ) pour 1 ≤ i ≤ s).
Voici à présent la justification de la terminologie de EΓ -torsion.

Lemme 3.4. – Soit EΓ le sous-anneau de l’anneau des morphismes A → A engendré

par les morphismes de groupes (notés End(A)) et les translations par un élément de Γ.
Alors une variété V n’est pas Γ-transverse si et seulement s’il existe ϕ ∈ EΓ \ {0} tel
que ϕ(V ) = {0}.

Démonstration. – Soient χ ∈ EndA et γ ∈ Γ. Il existe λ ∈ N tel que χ + λid est une

isogénie. Notons ψ une isogénie telle que (χ + λid) ◦ ψ = N id pour N ∈ N. Alors
la formule N x + N χ(γ) = (χ + λid)(ψ(x) + N γ) − λN γ montre que le morphisme
x 7→ N (x + χ(γ)) appartient à EΓ . En itérant ce procédé, pour tout δ ∈ EndA · γ
(somme d’éléments de la forme χ(γ)), il existe N ∈ N \ {0} tel que N (id + δ) ∈ EΓ .
Supposons maintenant que V ne soit pas Γ-transverse. On a V ⊂ γ + B avec γ ∈ Γsat
et B 6= A sous-groupe algébrique connexe de A. Il existe M ∈ N \ {0} avec M γ ∈
EndA · Γ et ψ ∈ EndA \ {0} avec ψ(B) = {0} (on obtient ψ en choisissant une
isogénie entre A/B et un sous-groupe de A). Par suite M ψ(V ) = {ψ(M γ)} et δ =
−ψ(M γ) ∈ EndA · Γ. En choisissant N ∈ N \ {0} tel que N (id + δ) ∈ EΓ nous voyons
que ϕ = N (M ψ + δ) ∈ EΓ \ {0} convient : ϕ(V ) = {0}. Réciproquement supposons
maintenant ϕ(V ) = {0} pour ϕ ∈ EΓ \ {0}. Puisque EΓ est inclus dans le sous-anneau
des morphismes x 7→ ψ(x) + δ avec ψ ∈ EndA et δ ∈ EndA · Γ, nous pouvons écrire
ϕ sous cette forme, ce qui donne ψ(V ) = {−δ}. Pour v ∈ V on a bien sûr ψ(v) = −δ
et V ⊂ v + Ker0 ψ. L’hypothèse ϕ 6= 0 donne ψ 6= 0 donc B = Ker0 ψ 6= A. Il
reste à voir que v + B contient un élément γ de Γsat . Choisissons pour cela B ′ tel
que B ∩ B ′ soit fini et A = B + B ′ . Écrivons v = x + γ avec x ∈ B et γ ∈ B ′ . Nous



avons ψ(γ) = −δ et ψ induit une isogénie B ′ → Imψ. Par suite, il existe χ ∈ EndA
envoyant −δ sur un multiple N γ de γ (N ∈ N \ {0}). Ainsi N γ = −χ(δ) ∈ EndA · Γ
et γ ∈ Γsat .

Une variation possible sur les définitions consiste à faire dépendre la hauteur de Γ.
Pour cela, nous posons :
µess ess
Γ (V ) = inf{µ (γ + V ) | γ ∈ Γsat }

(et pour un point nous écrivons hΓ (x) pour µess

Γ ({x})). Cette hauteur présente l’avan-
tage de s’annuler sur les variétés de Γ-torsion (si B est un sous-groupe algébrique
µess (B) = 0 car les points de torsion sont denses dans B). D’autre part elle permet
le renforcement automatique suivant de la notion de groupe de Dobrowolski (ou de
Lehmer de manière analogue).

Lemme 3.5. – Si Γ est de Dobrowolski et saturé alors pour tout ε > 0 et toute sous-
variété Γ-transverse V on a ωKΓ (V )1+ε µess
Γ (V ) ≥ cΓ (ε).

Démonstration. – Il suffit d’appliquer la définition à chaque translaté γ+V avec γ ∈ Γ

en remarquant que γ + V est Γ-transverse et que ωKΓ (γ + V ) = ωKΓ (V ) car le degré
est invariant par translation et γ est défini sur KΓ .

Cette hauteur relative est à rapprocher de celles étudiées dans l’article de de la

Maza et Friedman [40].
Supposons Γ de Dobrowolski et saturé. D’après le lemme µess Γ (V ) > 0 si V est
Γ-transverse. D’autre part µess
Γ (V ) = 0 si V est de Γ-torsion. Nous n’avons rien dit
jusqu’ici sur le cas intermédiaire où V n’est ni Γ-transverse ni de Γ-torsion. Nous
verrons au paragraphe suivant que l’on a encore µess Γ (V ) > 0. On obtient alors une
propriété qualitative de Γ, que l’on pourrait appeler problème de Γ-Bogomolov :
Γ (V ) = 0 ⇐⇒ V est de Γ-torsion.

Dans les trois cas du théorème 3.3, cette propriété est connue même lorsque la variété
abélienne n’est pas à multiplications complexes (dans les deux premiers cas, c’est
le théorème de Zhang, dans le troisième cela découle par exemple des estimations
de [21]). Elle est également vraie pour tout groupe Γ de rang fini saturé comme
conséquence du théorème de Poonen [44].
Terminons par deux énoncés de réduction. Le premier permet de passer des points
aux variétés.

Proposition 3.5. – Soit Γ un sous-groupe de rang fini. On suppose que pour tout ε >
0 il existe un réel c0Γ (ε) > 0 tel que, pour tout point Γ-transverse x ∈ A, on a
ωKΓ (x)1+ε h(x) ≥ c0Γ (ε). Alors Γ est de Dobrowolski.



Cette proposition justifie par exemple d’avoir utilisé dans le théorème 3.3 le résultat
de Carrizosa [17] qui minore seulement la hauteur des points. Elle permet aussi de
réduire à ce cas la conjecture 3.4.
Pour établir cet énoncé, nous passons par un lemme qui sert également à mon-
trer l’équivalence des deux formulations de la conjecture de Zilber-Pink (voir partie
Lemme 3.6. – Soit Γ un sous-groupe de rang fini de A. Il existe un groupe algébrique
A′ (qui est un sous-groupe d’une puissance de A) et un point 0-transverse γ ∈ A′
de sorte que, pour g ∈ A, on a g ∈ Γsat si et seulement s’il existe N ∈ N \ {0}
et ϕ ∈ Hom(A′ , A) tels que N g = ϕ(γ).
Démonstration. – Choisissons des éléments γ1 , . . . , γn de Γ dont les images engendrent
le Q-espace vectoriel Γ ⊗ Q et formons le point γ ′ = (γ1 , . . . , γn ) de An . Notons
ξ = (ξ1 , . . . , ξn ) un point de torsion de An et A′ un sous-groupe algébrique connexe
de An tels que γ ′ ∈ ξ + A′ et de sorte que dim A′ soit minimale pour cette pro-
priété. Posons γ = γ ′ − ξ et montrons que ce point convient. Par minimalité de A′ ,
il est 0-transverse
Pn dans A′ . Si g ∈ Γ il existe N ′ ∈ N \ {0} et a′1 , . . . , a′n ∈ Z tels
′ ′
que N g = i=1 ai γi . En Pmultipliant N ′ et les a′i par un entier bien choisi nous
n Pn
pouvons écrire aussi N g = i=1 ai (γi − ξi ). L’application (x1 , . . . , xn ) 7→ i=1 ai xi
décrit un morphisme ψ : An → A et donc ϕ = ψ|A′ vérifie N g = ϕ(γ). Si main-
tenant g ∈ Γsat nous pouvons écrire M g = j=1 χj (gj ) avec t, M ∈ N \ {0},
χj ∈ End(A) et gj ∈ Γ. Par ce qui précède N gj = ϕj (γ) pour N ∈ N \ {0}
et ϕj ∈ Hom(A′ , A) donc, avec ϕ = j=1 χj ◦ ϕj , nous avons bien M N g = ϕ(γ).
Pour la réciproque, il suffit de montrer Hom(A′ , A)γ ⊂ Γsat . Or, quitte à multi-
plier par un entier, un morphisme A′ → A s’étend en An → A et l’on a clairement
Hom(An , A) · (γ1 , . . . , γn ) = End(A) · γ1 + · · · + End(A) · γn ⊂ End(A) · Γ ⊂ Γsat .
L’indication sur la forme de A′ sert surtout à préciser sa nature : si A est un tore,
A aussi ; si A est une variété abélienne à multiplications complexes, A′ aussi etc.

Corollaire 3.1. – Sous les hypothèses du lemme, une sous-variété V de A est Γ-trans-
verse si et seulement si la sous-variété V × {γ} de A × A′ est 0-transverse.
Démonstration. – Cela résulte de la proposition 4.2 beaucoup plus précise que nous
démontrerons plus bas.

Démonstration de la proposition 3.5. – Soit η > 0. Considérons un couple (A′ , γ)

fourni par le lemme avec une hauteur normalisée h′ sur A′ telle que h′ (γ) ≤ η.
Pour une sous-variété V de A définissons l’ensemble S = {x ∈ V | x Γ-transverse
et h(x) ≤ (dim A)(µess (V ) + η)}. D’après le corollaire et en utilisant la hauteur
h′′ (a, b) = h(a)+ h′ (b) sur A × A′ l’ensemble S ×{γ} s’écrit {y ∈ (V ×{γ}) | y 0-trans-
verse et h′′ (y) ≤ (dim A)(µess (V × {γ}) + η) − (dim A − 1)h′ (γ)} (car µess (V × {γ}) =
µess (V ) + h′ (γ)). Maintenant un résultat d’Amoroso-David pour les tores [3] et de
Ratazzi pour les variétés abéliennes [45] (qui démontrent en fait notre proposition



pour Γ = {0}) affirme que {y ∈ W | y 0-transverse et h′′ (y) ≤ (dim A)µess (W ) + η}

est dense dans W pour toute sous-variété 0-transverse W de A × A′ . Appliqué à W =
V × {γ} et avec h′ (γ) ≤ η ceci montre que S est dense dans V si V est Γ-trans-
verse. Appliquons alors l’hypothèse sur Γ à x ∈ S : nous trouvons en majorant
la hauteur ωKΓ (x)1+ε (µess (V ) + η) ≥ (dim A)−1 c0Γ (ε) pour tout ε > 0. L’inclu-
sion {x} ⊂ V montre directement ωKΓ (x) ≤ ωKΓ (V ) ce qui permet de prendre
cΓ (ε) = (dim A)−1 c0Γ (ε).

En utilisant le même lemme, nous pouvons aussi ramener le cas des groupes de
rang fini aux points de torsion, mais seulement pour la propriété de Lehmer.

Proposition 3.6. – On suppose que, pour tout sous-groupe algébrique connexe A′′ d’une
puissance de A, le sous-groupe A′′tors de A′′ est de Lehmer. Alors tout sous-groupe de
rang fini de A est de Lehmer.

Démonstration. – Soit Γ un sous-groupe de rang fini non nul de A. Nous lui appli-
quons le lemme 3.6 pour obtenir un couple (A′ , γ). Posons A′′ = A × A′ et choi-
sissons des hauteurs normalisées h′′ = h + h′ . Comme le rang de Γ est non nul,
h′ (γ) 6= 0. Fixons ensuite un point Γ-transverse x ∈ A et Z un fermé équidimen-
sionnel de A défini sur KΓ contenant x et tel que ωKΓ (x) = (deg Z)1/(dim A−dim Z) .
Notons encore Ktors le corps KAtors qui est aussi KA′′tors . D’après le lemme 3.6,
le corps KΓ est contenu dans le corps de rationalité des points de division de γ.
Par conséquent, il existe un entier D ≥ 1 tel que, pour tout multiple entier N
de D et tout γ ′ avec N γ ′ = γ, le fermé Z est défini sur Ktors (γ ′ ). Fixons en-
 1/s  1/s
suite un rationnel dans l’intervalle [ 12 hh(x) ′ (γ) , 2 h(x)
h′ (γ) ] que l’on écrit M/N
avec M, N ∈ N et N multiple de D pour assurer la propriété ci-dessus. Soit enfin
x′ ∈ A tel que M x′ = x. Par hypothèse, A′′tors est de Lehmer donc on peut écrire
h′′ (x′ , γ ′ ) ≥ cωKtors (x′ , γ ′ )−1 car (x′ , γ ′ ) est 0-transverse en vertu du corollaire 3.1. Le
choix de M/N montre h′′ (x′ , γ ′ ) = h(x′ )+h′ (γ ′ ) = M −s h(x)+N −s h′ (γ) ≤ 3N −s h′ (γ)
puis cN s ≤ ωKtors (x′ , γ ′ ) en modifiant la valeur de c > 0. Pour évaluer l’indice
d’obstruction, écrivons (x′ , γ ′ ) ∈ [M ]−1 Z × {γ ′ }. Comme ce dernier fermé est dé-
fini sur Ktors (γ ′ ) on a
ωKtors (x′ , γ ′ ) ≤ [Ktors (γ ′ ) : Ktors ] deg([M ]−1 Z × {γ ′ }) dim A′′ −dim Z
′ dim A′′ −dim Z
≤ N s dim A M s(dim A−dim Z) deg Z
 s  dim
dim A−dim Z
A′′ −dim Z
s M
≤ N ωKΓ (x) .
Nous trouvons donc que M N ωKΓ (x) est minoré par une constante et, à nouveau
par le choix de M/N , il en va de même de h(x)ωKΓ (x). En utilisant l’analogue de la
proposition 3.5 où l’on remplace ε par 0, nous avons montré que Γ est de Lehmer.



Malheureusement cette démonstration ne s’étend pas aux groupes de Dobrowolski :

en suivant la même démarche, il resterait une puissance de N ε dans l’estimation finale
que l’on ne sait pas contrôler.

d. Minoration relative à une variété de Γ-torsion. – En suivant Carrizosa [16, 15, 17],
nous introduisons un indice d’obstruction relatif. Soient pour cela un corps L avec k ⊂
L ⊂ k̄ et H une sous-variété de A définie sur L. Pour V sous-variété de H on pose :
n  deg Z 1/(dim H−dim Z)
ωL (V ) = min
deg L H
| Z fermé équidimensionnel défini sur L, V ⊂ Z ⊂ H .
Le résultat de Carrizosa est le premier à faire intervenir un tel indice et elle a montré
son utilité pour l’application à la conjecture de Zilber-Pink. L’intérêt est d’obtenir
une minoration du minimum essentiel des variétés V qui ne sont ni Γ-transverse ni
de Γ-torsion en utilisant l’indice relatif à la plus petite sous-variété de Γ-torsion H
contenant V tout en conservant une dépendance explicite et fine en deg H.
Ici nous montrons comme un tel résultat (pour les groupes saturés) se déduit tou-
jours de la propriété plus faible d’être de Dobrowolski. Un énoncé allant dans ce sens,
dans le cas particulier Γ = A et pour A = E g puissance d’une courbe elliptique, se
trouve dans [54] (avec le degré au lieu de l’indice d’obstruction).
Théorème 3.7. – Soit Γ un sous-groupe saturé de Dobrowolski. Pour tout ε > 0 il existe
un réel c′Γ (ε) > 0 tel que si V est une sous-variété de A qui n’est pas de Γ-torsion et
si H est la plus petite sous-variété de Γ-torsion contenant V alors
(V )1+ε (deg H)sε µess (V ) ≥ c′Γ (ε).
Nous commençons par établir un énoncé qui correspond essentiellement à une ver-
sion faible du théorème où la constante dépend de H.
Lemme 3.7. – Soient Γ un sous-groupe de Dobrowolski saturé de A et f : A → A′
un morphisme surjectif de groupes algébriques. Pour tout ε > 0 il existe un réel
cΓ,f (ε) > 0 tel que si V ′ est une sous-variété f (Γ)-transverse de A′ alors
ωKΓ (V ′ )1+ε µess (V ′ ) ≥ cΓ,f (ε).
Le lemme dit en particulier que f (Γ) est de Dobrowolski mais il dit un peu plus
car le corps KΓ peut contenir strictement Kf (Γ) .
Démonstration. – Quitte à remplacer A par un groupe isogène (voir lemme 3.3) on
peut supposer A = A′ × A′′ et que f est la première projection. Le groupe Γ étant sa-
turé, il s’écrit Γ = Γ′ ×Γ′′ avec Γ′ = f (Γ). On associe à V ′ ⊂ A′ la variété V = V ′ ×A′′ .
Si V ⊂ γ+B alors B contient {0}×A′′ donc B = B ′ ×A′′ d’où γ + B = (γ ′ + B ′ ) × A′′
avec γ ′ ∈ Γ′ . Ceci montre que si V ′ est Γ′ -transverse alors V est Γ-transverse. Mainte-
nant, quitte à choisir une compactification produit et une polarisation produit sur A
de sorte que h(x, y) = h′ (x) + h′′ (y), on voit que µess (V ) = µess (V ′ ) car les points de



hauteur nulle sont denses dans A′′ . Soit ensuite Z ′ défini sur KΓ et contenant V ′ tel
′ ′
que ωKΓ (V ′ ) = (deg Z ′ )1/(dim A −dim Z ) . Posons Z = Z ′ × A′′ . On a dim A − dim Z =
dim Z
dim A′ − dim Z ′ puis deg Z = dim Z ′ (deg Z ′ )(deg A′′ ) tandis que Z est défini sur KΓ
et contient V . Par suite, ωKΓ (V ) ≤ (deg Z)1/(dim A−dim Z) ≤ cωKΓ (V ′ ) pour un réel c
indépendant de V . Il vient ωKΓ (V ′ )1+ε µess (V ′ ) ≥ c−1−ε ωKΓ (V )1+ε µess (V ) qui permet
de conclure.

La preuve du théorème utilise de façon cruciale la proposition suivante.

Proposition 3.8. – Pour tout (A, L ) comme précédemment il existe une famille finie
F de morphismes surjectifs f : A → A′ (pour divers A′ ) et un réel c > 0 tels que,
pour tout sous-groupe algébrique connexe B de A, il existe f ∈ F de sorte que f|B
soit une isogénie de degré au moins c deg L B.

Démonstration. – Nous utilisons la notion de projecteur normalisé décrite en ap-

pendice qui introduit un couple (c0 , B). Nous définissons F comme la famille des
quotients {A → A/B ′ | B ′ ∈ B}. La composée B → A → A/B ′ étant une isogénie
de degré Card(B ∩ B ′ ) lorsque ce nombre est fini, il nous suffit donc de vérifier que
si ϕ ◦ ϕ = aϕ et |ϕ| ≤ c0 a alors Card(Ker0 ϕ ∩ Imϕ) est fini et ≥ c deg(Ker0 ϕ). Si
nous écrivons Kerϕ = F + Ker0 ϕ pour un ensemble fini F tel que les x + Ker0 ϕ sont
disjoints pour x ∈ F alors on a deg(Kerϕ) = (CardF ) deg(Ker0 ϕ) et Card(Kerϕ ∩
Imϕ) = (CardF )Card(Ker0 ϕ ∩ Imϕ) (car Ker0 ϕ + Imϕ = A). Ainsi il reste à montrer
que Card(Kerϕ∩Imϕ) est fini et ≥ c deg(Kerϕ). Or Kerϕ∩Imϕ = {x ∈ Imϕ | ax = 0}
d’après ϕ ◦ ϕ = aϕ donc Card(Kerϕ ∩ Imϕ) = as dim Imϕ (avec s = 1 si A est un tore
et s = 2 sinon). Par suite Card(Kerϕ ∩ Imϕ) ≥ (c−1
0 |ϕ|)
s dim Imϕ
et l’on conclut par le
lemme 6.1.

Nous utilisons aussi le fait suivant.

Lemme 3.8. – Soit (A, L ) comme précédemment. Il existe un réel λ > 0 tel que pour
tout sous-groupe algébrique connexe B de A on peut trouver un sous-groupe algébrique
connexe B ⊥ de A vérifiant : B + B ⊥ = A, B ∩ B ⊥ fini et, pour tous x ∈ B et y ∈ B ⊥ ,
on a h(x) + h(y) ≤ λh(x + y).

Démonstration. – Dans le cas où A est une variété abélienne, une construction clas-
sique (voir [42, p. 173] ou [9, p. 211]) donne un résultat plus précis : soit ι l’injection
B ֒→ A et φ L : A → Â l’isogénie associée à L ; on pose B ⊥ = Ker0 (ι̂ ◦ φ L ). Soient
encore j : B ⊥ ֒→ A l’inclusion, add : A × A → A l’addition et P le faisceau de Poin-
⊗−1 ⊗−1
caré sur A × Â. On sait [42, p. 78] que (idA × φ L )∗ P ≃ add∗ L ⊗ p∗1 L ⊗ p∗2 L

donc (ι × j)∗ add L ≃ (ι × φ L ◦ j)∗ P ⊗ ι∗ L ⊗ j ∗ L . Par les propriétés de P , on
a (ι × φ L ◦ j)∗ P |{0}×B ⊥ trivial et (ι × φ L ◦ j)∗ P |B×{y} ≃ φ L (y)|B ≃ ι̂ ◦ φ L (y)
trivial pour y ∈ B ⊥ donc (lemme de la balançoire [42, p. 54]) (ι × φ L ◦ j)∗ P est
trivial. Ainsi (ι × j)∗ add∗ L ≃ ι∗ L ⊗ j ∗ L ce qui montre, en passant aux hauteurs
normalisées, h(x + y) = h(x) + h(y) pour (x, y) ∈ B × B ⊥ . Ceci entraîne aussi



B ∩ B ⊥ fini et, par dimension, B + B ⊥ = A. Dans le cas torique, nous suppo-

sons que la hauteur est donnée par la compactification A = Gnm ⊂ (P1 )n de sorte
que h(x1 , . . . , xn ) = h(x1 ) + · · · + h(xn ). Soit d = dim B. On choisit un morphisme
de groupes algébriques f : Gdm → A tel que Imf = B. Ce morphisme f est donné par
une matrice F ∈ Matn,d (Z) et l’on peut, sans changer Imf , faire des combinaisons des
colonnes de F de sorte que celles-ci soient deux à deux orthogonales entre elles (dans
Zn avec le produit scalaire usuel). On forme ensuite une matrice G ∈ Matn,n−d (Z)
en complétant la famille libre des colonnes de F en une base orthogonale de Qn
contenue dans Zn . Quitte à multiplier chaque colonne de F ou G par un entier, on
peut supposer que la norme de chaque colonne appartient à un intervalle [N, 2N ]
pour N ∈ N \ {0}. On note g : Gm → A le morphisme donné par G et B ⊥ = Img.
La construction donne clairement B + B ⊥ = A donc par dimension B ∩ B ⊥ est fini.
Il reste à voir h(f (x)) + h(g(y)) ≤ λh(f (x) + g(y)) pour x ∈ k̄ d , y ∈ k̄ n−d . Avec
la hauteur choisie, h(f (x)) ≤ 2nN · h(x) et de même h(g(y)) ≤ 2nN · h(y). D’autre
part, si M = t (F G) ∈ Matn,n (Z) et si ϕ : A → A est l’isogénie associée à M , on a
h(ϕ(f (x) + g(y))) ≤ 2nN · h(f (x) + g(y)) (chaque coefficient de M est de valeur abso-
lue au plus 2N ). Par ailleurs, l’application (x, y) 7→ ϕ(f (x) + g(y)) est donnée par la
matrice diagonale M t M dont chaque coefficient diagonal est au moins N 2 . Par suite
h(ϕ(f (x) + g(y)) ≥ N 2 (h(x) + h(y)). En combinant les estimations, le paramètre N
disparaît et l’on obtient le résultat avec λ = (2n)2 . Pour un autre choix de hauteurs,
on a c−1 h ≤ h′ ≤ ch (lemme 3.2) donc λ = (2n)2 c2 convient.

Démonstration du théorème. – Écrivons H = γ + B avec γ ∈ Γ et B un sous-groupe

algébrique connexe. Comme Γ est saturé on a Γ = (Γ ∩ B) + (Γ ∩ B ⊥ ) ce qui permet
de supposer γ ∈ Γ∩B ⊥ (avec B ⊥ comme dans le lemme 3.8). En particulier, si x ∈ B,
on a h(x) ≤ λh(x + γ) d’où on déduit µess (V − γ) ≤ λµess (V ). D’autre part, comme
γ est défini sur KΓ (ainsi que B car B est l’adhérence de Btors ⊂ Γ), nous avons
immédiatement ωK Γ
(V ) = ωK Γ
(V − γ). Ceci montre qu’il suffit d’établir le résultat
pour V − γ au lieu de V . Autrement dit, nous supposons désormais γ = 0 et donc
V ⊂ B = H. Nous appliquons la proposition 3.8 qui fournit un morphisme f : A → A′
tel que ϕ = f|B est une isogénie B → A′ de degré a ≥ c deg L B. Quitte à remplacer
L par une puissance on peut supposer h′ (f (x)) ≤ h(x) pour x ∈ A et degf ∗ L ′ Z ≤

deg L Z pour un fermé Z de B (on a choisi L sur une compactification de A′ donnant la

hauteur h ; pour avoir ces propriétés il suffit dans le cas abélien que (f ∗ L )⊗−1 ⊗ L soit

engendré par ses sections globales et dans le cas torique qu’elles l’engendrent au-dessus
de A ; il faut auparavant choisir les compactifications pour que f s’étende ; ceci modifie
c sans gravité). Il existe une isogénie ψ : A′ → B telle que ψ◦ϕ = [a] sur B et ϕ◦ψ = [a]
sur A′ . Comme le degré de [a] est abs avec b = dim B, on a deg ψ = abs−1 . Nous posons
W = ψ −1 (V ) qui est un fermé équidimensionnel de A′ . L’idée consiste à appliquer
à W le lemme 3.7. Comme B est la plus petite sous-variété de Γ-torsion contenant V ,
de même A′ est la plus petite sous-variété de f (Γ)-torsion contenant une composante
quelconque de W . Ceci montre que ces composantes sont f (Γ)-transverse. Ensuite,



on a [a]W = ϕ(ψ(W )) = ϕ(V ) = f (V ) donc as µess (W ) = µess ([a]W ) = µess (f (V )) ≤

µess (V ) (car h′ ◦ f ≤ h). Choisissons maintenant un fermé équidimensionnel Z défini
sur KΓ tel que V ⊂ Z ⊂ B et ωK Γ
(V ) = (deg L Z/ deg L B)1/(b−d) où d = dim Z.
L’ensemble équidimensionnel Y = ψ −1 (Z) de A′ contient W et est défini sur KΓ .
Estimons son degré. Dans le cas abélien, nous avons :
a2d deg L ′ Y = deg L ′⊗a2 ·ψ −1 (Z) = degψ∗ ϕ∗ L ′ ψ −1 (Z)
= degϕ∗ L ′ ψ∗ ψ −1 (Z) = (deg ψ|ψ−1 (Z) )(degϕ∗ L ′ Z).
Dans le cas torique, pour faire ce calcul, nous choisissons deux nouvelles compactifi-
cations de A′ et B de façon à avoir des extensions :
ψ̃ ϕ̃
Ã′ −→ B̃ −→ Ā′
∪ ∪ ∪
′ ψ ϕ
A −→ B −→ A′ .
′ ′
Nous choisissons Ã′ comme un éclatement π : Ã′ → Ā′ et L̃ = π ∗ L . Alors les
morphismes [a]Ā′ ◦ π et ϕ̃ ◦ ψ̃ coï ncident sur A′ donc sont égaux. Ceci donne L̃ =

ψ̃ ∗ ϕ̃∗ L et justifie (avec ψ −1 (Z) ⊂ ψ̃ −1 (Z̄) dans Ã′ )
′a ′
ad deg L ′ Y = ( L̃ )·d · ψ −1 (Z) ≤ (ψ̃ ∗ ϕ̃∗ L )·d · ψ̃ −1 (Z̄).
On termine ensuite le calcul de même et l’on a donc dans tous les cas
asd deg L ′ Y ≤ (deg ψ|ψ−1 (Z) )(degϕ∗ L ′ Z).
Maintenant deg ψ|ψ−1 (Z) ≤ deg ψ = asb−1 et degϕ∗ L ′ Z = degf ∗ L ′ Z ≤ deg L Z donc
deg L ′ Y ≤ as(b−d)−1 deg L Z puis ωKΓ (W ) ≤ as (deg L B/a)1/(b−d) ωK
(V ). Finalement
deg L B
ωKΓ (W )1+ε µess (W ) ≤ asε B
ωK (V )1+ε µess (V ).
a Γ

Nous pouvons sans restriction supposer ε < (s(b − d) − 1)−1 de sorte que l’expres-
sion obtenue est une fonction décroissante de a. Nous pouvons alors remplacer a
par c deg L B ce qui nous donne (en changeant la valeur de c)
ωKΓ (W )1+ε µess (W ) ≤ c−1 (deg L B)sε ωK
(V )1+ε µess (V ).
L’application du lemme 3.7 à W donne bien le théorème.

Ce résultat permet donc d’obtenir des versions améliorées des théorèmes de Del-
sinne [22], Amoroso-David [4] ou Galateau [26]. En fait on a même mieux : si l’on
dispose d’un résultat de la forme ωKΓ (V )(log 3ωKΓ (V ))κ µess (V ) ≥ cΓ pour toute
variété Γ-transverse V alors la démonstration fournit une minoration de la forme
ωK Γ
(V )(log 3(deg H)2 ωKΓ
(V ))κ µess (V ) ≥ c′Γ exactement de la même façon.
Notons aussi (encore plus simplement) que si Γ était supposé de Lehmer dans le
théorème alors on aurait la conclusion avec ε = 0.



4. Liens avec la conjecture de Zilber-Pink

a. Formulations de la conjecture. – Nous restons dans le cadre des notations 1.1 :

A est un tore ou une variété abélienne sur un corps de nombres. Pour un entier r
avec 0 ≤ r ≤ dim A, nous notons
A[r] = G

l’union des sous-groupes algébriques de A de codimension au moins r. Par commodité,

nous écrirons aussi A{r} pour l’union des sous-groupes algébriques connexes de A
de codimension au moins r. Nous avons A[r] = Ators + A{r} et Ators = A[dim A] .
Par suite, si Γ est un sous-groupe contenant Ators (c’est le cas notamment si Γ est
saturé) alors Γ + A[r] = Γ + A{r} . Remarquons aussi que Γsat + A[r] est l’union
de toutes les sous-variétés de Γ-torsion de codimension au moins r. Dans ce cadre,
la conjecture de Zilber-Pink est la suivante (nous verrons ci-dessous, théorème 4.3,
qu’elle est équivalente aux conjectures 5.1 et 5.2 de [43] ; dans le cas torique, on
retrouve la Conjecture des Intersections sur les Tores, CIT, de [57]).

Conjecture 4.1. – Si Γ est un sous-groupe de rang fini de A et X une sous-variété

Γ-transverse de A alors l’intersection X ∩ Γ + A[dim X+1] n’est pas dense dans X.

Comme Γ n’intervient qu’à travers Γ + Ators dans cet énoncé, il n’y a aucune
restriction à supposer Ators ⊂ Γ. En fait, si Γ est de rang fini, il en va de même
de Γsat donc la véracité de la conjecture pour Γsat en entraîne la véracité pour Γ et
nous pourrions donc supposer tout de suite Γ saturé.
L’ensemble X ∩ Γ + A[dim X+1] étant l’union des intersections X ∩ Γ + B (où B
parcourt l’ensemble des sous-groupes algébriques connexes de A avec dim X +dim B <
dim A), on peut se demander dans un premier temps à quelle condition une telle
intersection individuelle X ∩ Γ + B peut être dense. La réponse est donné par les
théorèmes sur le problème de Mordell-Lang [24, 25, 31, 34, 47, 55, 41]. Notons p : A →
A/B la projection. L’ensemble X∩Γ+B est dense dans X si et seulement si p(X)∩p(Γ)
est dense dans p(X). Le groupe p(Γ) est de rang fini et la variété p(X) est de dimension
≤ dim X < dim A/B. Par suite si p(X) ∩ p(Γ) est dense dans p(X) alors p(X) est
de p(Γ)-torsion (c’est une équivalence si Γ est saturé). Si c’est le cas X ⊂ p−1 (p(X))
et p−1 (p(X)) est de Γ-torsion. Tout ceci montre que si X ∩Γ+B est dense dans X alors
X n’est pas Γ-transverse. Nous pouvons donner un résultat plus précis en introduisant
un ensemble exceptionnel : ZX,Γ est l’ensemble des points x ∈ X pour lesquels il existe
une sous-variété H de Γ-torsion de A telle que
dimx X ∩ H > max(0, dim X + dim H − dim A).
(dim X+1)
Il s’agit de l’ensemble noté ZX,Γ dans [48]. Si Γ = {0} on a ZX,0 = X \ X ta
tandis qu’avec Γ = A on a ZX,A = X \ X oa dans les notations X oa et X ta de
Bombieri-Masser-Zannier [13].



Lemme 4.1. – Si B est un sous-groupe algébrique connexe de A tel que dim X +

dim B < dim A et si Γ est de rang fini alors l’ensemble (X \ ZX,Γ ) ∩ Γ + B est
Démonstration. – Notons encore p : A → A/B la projection et E l’ensemble de
l’énoncé. Soit Y une composante irréductible de l’adhérence de E. Comme Y ∩Γ+B est
dense dans Y et dim Y +dim B < dim A, la variété Y est contenue dans H = p−1 (p(Y ))
de Γ-torsion. Si x ∈ E ∩ Y alors dim Y ≤ dimx X ∩ H ≤ max(0, dim X + dim H −
dim A) ≤ max(0, dim H − dim B − 1) = max(0, dim p(Y ) − 1) ≤ max(0, dim Y − 1).
On en déduit dim Y = 0 et donc E est fini.
Nous allons maintenant montrer que la conjecture se réduit au cas où Γ = {0}. Le
point crucial est la bijection suivante.
Proposition 4.2. – Dans le cadre du lemme 3.6 considérons l’application λ : A → A×A′
donnée par λ(x) = (x, γ). Fixons a ∈ A. Alors l’application Φ qui à une sous-variété
de 0-torsion H ′ de A × A′ contenant λ(a) associe la composante Φ(H ′ ) de λ−1 (H ′ )
contenant a réalise une bijection entre ces sous-variétés de 0-torsion de A × A′ et
les sous-variétés de Γ-torsion de A contenant a. De plus cette bijection conserve la
codimension : dim A − dim Φ(H ′ ) = dim(A × A′ ) − dim H ′ .
Démonstration. – Soit tout d’abord H une sous-variété de Γ-torsion de A contenant
a. Nous écrivons H = g + B avec B sous-groupe algébrique connexe et g ∈ Γsat .
Il existe N ∈ N \ {0} et ϕ ∈ Hom(A′ , A) tels que N g = ϕ(γ). Notons G le sous-
groupe algébrique de A × A′ noyau de A × A′ → A, (x, y) 7→ N x − ϕ(y). Comme
N 6= 0, cette application est surjective donc dim G = dim A′ . Notons aussi que G ∩
(B × {0}) = Ker[N ]B est fini donc le groupe G + (B × {0}) est de codimension
dim A−dim H. Notons H ′ sa composante contenant λ(a). Par construction λ(H) ⊂ H ′
(car (g, γ) ∈ G). Si (x, γ) ∈ H ′ alors (x − g, 0) ∈ (G + (B × {0})) ∩ (A × {0}) =
(Ker[N ]+B)×{0} d’où x ∈ g+B+Ker[N ] ce qui montre λ−1 (H ′ ) = g+B+Ker[N ] puis
Φ(H ′ ) = H. Supposons ensuite que H ′′ soit une variété de 0-torsion contenant λ(a)
telle que Φ(H ′′ ) = H. Écrivons H ′′ = ξ + B ′ avec ξ ∈ (A × A′ )tors et B ′ sous-groupe
algébrique connexe de A×A′ . Comme (g, γ)+(B ×{0}) ⊂ H ′′ on a B ×{0} ⊂ B ′ et B
est maximal pour cette propriété donc B ′ ∩(A×{0}) = B ×{0}. Par ailleurs la seconde
projection de H ′′ ∩ G (sur A′ ) contient γ donc, ce dernier étant 0-transverse, est égale
à A′ . Par dimension H ′′ ∩ G est une composante de G et l’on a aussi p2 (B ′ ) = A′ .
De la sorte H ′′ contient une composante de G + (B × {0}) donc H ′ ⊂ H ′′ tandis
que B ′ ∩ (A × {0}) = B × {0} et p2 (B ′ ) = A′ donnent dim B ′ = dim A′ + dim B donc
dim H ′′ = dim B ′ = dim H ′ puis H ′′ = H ′ .
Ceci fait, il nous reste seulement à voir que, pour tout H ′ comme dans l’énoncé,
Φ(H ′ ) est bien de Γ-torsion. Soit donc un tel H ′ que l’on écrit ξ +B ′ comme ci-dessus.
On définit B par B ′ ∩ (A × {0}) = (F + B) × {0} où F est un groupe fini. Si λ(x) ∈ H ′
alors λ(x) − ξ et λ(a) − ξ appartiennent à B ′ donc λ(x) − λ(a) = (x − a, 0) ∈ F + B
d’où x ∈ a + F + B. Ceci donne λ−1 (H ′ ) = a + F + B et donc Φ(H ′ ) = a + B.
Voyons enfin que a + B rencontre Γsat . Comme plus haut p2 : B ′ → A′ est surjectif



donc il existe un morphisme ϕ : A′ → B ′ tel que p2 ◦ ϕ = [N ] pour un certain

N ∈ N \ {0}. On écrit ξ = (ξ1 , ξ2 ) et on choisit y ∈ A′ tel que N y = γ − ξ2 . Alors
ϕ(y) = (p1 ◦ ϕ(y), γ − ξ2 ) ∈ B ′ donc p1 ◦ ϕ(y) + ξ1 ∈ a + F + B (car (a − ξ1 , γ − ξ2 ) ∈
B ′ ). D’autre part N p1 ◦ ϕ(y) = p1 ◦ ϕ(γ) − p1 ◦ ϕ(ξ2 ) ∈ Hom(A′ , A)γ + Ators donc
p1 ◦ ϕ(y) ∈ Γsat . Comme ξ1 ∈ Γsat et F ⊂ Γsat , ceci termine la démonstration.
En revenant aux définitions, nous en déduisons les bijections suivantes.
Corollaire 4.1. – Dans le cadre de la propostion, soit X une sous-variété de A. Alors
la bijection λ : X → λ(X) induit des bijections entre :
(1) X ∩ Γsat + A[r] et λ(X) ∩ (A × A′ )[r] pour tout r ∈ N ;
(2) ZX,Γ et Zλ(X),0 .
De plus X est Γ-transverse si et seulement si λ(X) est 0-transverse.
Soit maintenant une classe A de groupes algébriques connexes comme précédem-
ment (tore ou variété abélienne). Nous dirons en abrégé que A est stable lorsqu’elle
est stable par produit et par passage à un sous-groupe algébrique connexe.
Théorème 4.3. – Pour une classe stable A , les trois assertions suivantes sont équiva-
(1) La conjecture est vraie pour A ∈ A .
(2) La conjecture est vraie pour A ∈ A et Γ = {0}.
(3) La conjecture est vraie pour A ∈ A et X transverse.
Démonstration. – (2) =⇒ (1) : pour A ∈ A et Γ ⊂ A on applique le lemme 3.6
qui fournit donc A′ et λ comme dans le corollaire précédent. Soit X une variété
Γ-transverse. Comme λ(X) est 0-transverse et A′ ×A ∈ A , on voit par (2) que λ(X)∩
(A × A′ )[dim λ(X)+1] n’est pas dense dans λ(X). Par suite X ∩ Γ + A[dim X+1] n’est
pas dense dans X. (1) =⇒ (3) : tautologie. (3) =⇒ (2) : soient A ∈ A et X ⊂ A
0-transverse. Écrivons γ + B la plus petite sous-variété de A-torsion contenant X.
Quitte à faire une isogénie, on peut supposer A = B × B ′ avec X = Y × {γ} et Y ⊂ B
est B-transverse. On définit Γ ⊂ B comme l’ensemble des g tels qu’il existe N ∈
N \ {0} et ϕ ∈ Hom(B ′ , B) avec N g = ϕ(γ). Le groupe Γ est de type fini et saturé.
Comme B ∈ A , on peut appliquer (3) à (B, Y, Γ). Ainsi Y ∩ Γ + B [dim Y +1] n’est
pas dense dans Y . De plus, nous sommes dans les conditions du lemme 3.6 : si γ
n’était pas 0-transverse alors il en irait de même de X. Le corollaire montre donc
que X ∩ A[dim X+1] n’est pas dense dans X. C’est le résultat (en réalité après isogénie
mais toute isogénie A → A′ fait correspondre A[r] et A′[r] ).
L’assertion (2) correspond exactement à la conjecture 5.1 de [43] et l’assertion (3)
à la conjecture 5.2. Pink montre l’équivalence de (2) et (3) plus généralement pour
une variété semi-abélienne.
Ainsi pour établir (1) l’on peut se contenter d’établir (2) ou (3). En réalité, on peut
même utiliser le va-et-vient de façon plus subtile en faisant une partie de la preuve
sous les hypothèses de (3) et une autre sous l’hypothèse de (2) : c’est typiquement



le cas dans [51] pour les courbes où une borne de hauteur est établie dans le cadre
de (3) avant de revenir en (2) pour appliquer un résultat de type Lehmer. Même en
dimension supérieure on peut utiliser ce schéma pour obtenir des résultats partiels.
Les méthodes évoquées dans le cours de Ph. Habegger permettent de montrer :
(a) ZX,A est fermé.
(b) (X \ ZX,A ) ∩ Γ + A[dim X+1] est de hauteur bornée.
Dans le cas torique (a) est dû à Bombieri, Masser et Zannier [13] tandis que (b)
est dû à Habegger si Γ = {0} [29] et à Maurin [38, 39] en général. Dans le cas abélien
(a) et (b) ont été établis par l’auteur de ces lignes [49, 50] (et le théorème d’Habegger
[28] donne une autre démonstration du cas Γ = {0}).
Dans la suite de cette partie, nous examinons comment les minorations de hauteur
étudiées dans la partie précédente permettent d’obtenir des résultats de la forme :
{x ∈ (X \ ZX,A ) ∩ Γ + A[dim X+1] | h(x) ≤ β}
est fini (ou seulement non dense dans X) pour tout β ∈ R. Ceci montre que la
conjecture de Zilber-Pink est vraie pour les X tels que ZX,A 6= X (lorsque l’on
connaît les minorations de hauteurs idoines). L’on sait aussi caractériser les variétés
X remplissant cette condition.

b. Application du problème de Lehmer. – Depuis le premier article de Bombieri, Mas-

ser et Zannier sur le sujet [12], à l’origine de la série [12]–[14], l’étape consistant à
passer d’un ensemble de hauteur bornée à un ensemble fini utilise des estimations
dans la direction du problème de Lehmer. On s’est ensuite aperçu que le cadre du
problème de Lehmer relatif donnait une approche plus efficace, surtout en dimension
Nous reprenons ceci en tirant parti du théorème 3.7. Cette démarche s’inspire de
l’appendice de la thèse de M. Carrizosa [16].

Théorème 4.4. – Si Γ est un sous-groupe saturé de rang fini et de Dobrowolski de A

et si X est une sous-variété de A alors
{x ∈ (X \ ZX,Γ ) ∩ Γ + A[dim X+1] | h(x) ≤ β}
est fini pour tout β ∈ R.

Nous utiliserons de manière cruciale le résultat d’interpolation suivant.

Proposition 4.5. – Soient Γ un groupe saturé et X une sous-variété de A définie

sur KΓ . Il existe un réel ρ ayant la propriété suivante. Soit H une variété de Γ-tor-
sion telle que dim X + dim H < dim A. Si x ∈ (X \ ZX,Γ ) ∩ H alors il existe
un fermé V contenant H et défini sur KΓ tel que x est un point isolé de X ∩ V
et deg V ≤ ρ(deg H)1−1/codimH .



Remarque. Dans la démonstration ci-dessous on construit V équidimensionnel de

dimension dim H + 1.
Plus généralement, on pourrait, pour d ∈ {1, . . . , dim A − dim X − dim H}, trouver
sans grand changement un fermé Vd équidimensionnel de dimension dim H +d vérifiant
les mêmes conditions ainsi que la majoration plus forte deg Vd ≤ ρ(deg H)1−d/codimH .

Démonstration. – Pour établir l’énoncé, nous pouvons modifier le couple (Ā, L ) qui
sert à mesurer les degrés (seule la valeur de ρ est affectée). Dans le cas abélien, nous

choisissons L de sorte que L = f ∗ L pour une isogénie f : A → A′ vers une variété
′ ′
abélienne polarisée (A , L ) produit de variétés simples (Ai , L i ) deux à deux égales
ou non isogènes et telles que EndAi est un ordre maximal de EndAi ⊗ Q. Dans le cas
torique, nous utilisons ((P1 )n , O (1)) (et f = idA ). Écrivons maintenant H = γ + B
avec γ ∈ Γ et B une sous-variété semi-abélienne de A. Soit B ′ une sous-variété semi-
abélienne telle que B ⊂ B ′ et B ′ /B simple. Si nous appliquons l’hypothèse x ∈ ZX,Γ
à B et B ′ nous trouvons
dimx X ∩ H ≤ max(0, dim X + dim B − dim A) = 0
dimx X ∩ (γ + B ′ ) ≤ max(0, dim X + dim B ′ − dim A) < dim(B ′ /B).
Notons π : B ′ → B ′ /B la projection et Y l’union des composantes de X ∩ (γ + B ′ )
contenant x. Nos inégalités montrent que x est un point isolé de Y ∩ (γ + π −1 (0)) ⊂
X ∩ H et π(Y − γ) 6= B ′ /B. Par suite, si C est une courbe de B ′ /B non contenue
dans π(Y − γ), définie sur KΓ (B et B ′ le sont car Ators ⊂ Γ) et contenant 0 alors
V = γ + π −1 (C) est définie sur KΓ , contient H = γ + π −1 (0) et x est isolé dans X ∩ V
car les composantes de cette intersection qui contiennent x sont contenues dans Y ∩
V = Y ∩(γ +π −1 (C ∩π(Y −γ))) donc dans Y ∩(γ +π −1 (0)) où x est isolé. Il reste donc
seulement à choisir B ′ et C pour pouvoir estimer le degré de V comme dans l’énoncé.
Vu le choix de L , ceci peut se faire au but de f (quitte à choisir C comme l’image
réciproque d’une courbe à travers l’isogénie B ′ /B → f (B ′ )/f (B) induite par f ). Nous
nous autorisons donc à noter encore B l’image de B dans AQ′ = i=1 Ani i où les Ai
sont simples deux à deux non isogènes. Nous avons B = i=1 Bi avec Bi ⊂ Ani i
et codimBi = qi dim Ai pour un entier qi . Nous fixons une norme sur EndAi ⊗ R qui
induit une norme sur Hom(Ani , Ai ) ⊗ R ≃ (EndAi ⊗ R)ni . D’après les résultats de [36]
il existe ϕi,1 , . . . , ϕi,qi ∈ Hom(Ani , Ai ), libres sur EndAi , nuls sur Bi tels que
c−1 (deg Bi ) ≤ |ϕi,j |s dim Ai ≤ c(deg Bi ) ;

nous utilisons ici le lemme de Siegel sur EndAi ⊗Q [36, théorème 3.1], le calcul du degré
de Bi comme hauteur [36, théorème 5.1] ainsi que la dualité [36, théorème 7.1] pour
passer de l’espace des ϕ : Ai → Ani i d’image contenue dans Bi à celui des ϕ : Ani i → Ai
nuls sur Bi ; pour la minoration on emploie [36, proposition 8.2]. Dans le cas torique
(s = m = dim A1 = 1) le même argument vaut avec le lemme de Siegel usuel et
l’expression de deg B comme volume du module des relations de B. Nous supposons



la fonction j 7→ |ϕi,j | croissante pour tout i et nous choisissons i0 tel que la norme
|ϕi0 ,qi0 | soit maximale. Ce choix donne
 1−1/codimB
|ϕi0 ,qi0 |−s |ϕi,j |s dim Ai ≤  |ϕi,j |s dim Ai  ≤ c′ (deg B)1−1/codimH
i,j i,j
(on fait usage de max(x1 , . . . , xN ) ≥ (x1 · · · xN )1/N pour N = i qi dim Ai =
codimB). Il va donc nous suffire de majorer deg V par Q un multiple du membre
de gauche. Pour cela définissons B ′ ⊂ A′ par B ′ = ′ ′
i=1 Bi avec Bi = Bi
T 0
qi0 −1
si i 6= i0 et Bi′0 = j=1 Kerϕi0 ,j . Ainsi B ⊂ B ′ et le morphisme ϕi0 ,qi0
induit une isogénie α : B ′ /B → Ai0 . Nous pouvons choisir dans Ai0 des courbes
définies sur KΓ , contenant 0, de degré borné et telles qu’aucun fermé strict ne les
contient toutes (si Ai0 est plongé dans Pℓ on le coupe par des variétés linéaires
de dimension ℓ − dim Ai0 + 1). Pour une telle courbe C ′ on pose α−1 (C ′ ) = C
et on évalue deg π −1 (C). Ici π −1 (C) = π −1 α−1 (C ′ ) = p−1 −1 ′ ′
i0 ϕi0 ,qi (C ) ∩ B donc
deg π −1 (C) ≤ deg B ′ · deg p−1 −1 ′
i0 ϕi0 ,qi0 (C ). Par les arguments ci-dessus on a
deg B ′ ≤ c|ϕi0 ,qi0 |−s dim Ai0 |ϕi,j |s dim Ai

tandis que deg p−1 −1

≤ c|ϕi0 ,qi0 |s(dim Ai0 −1) (dans le cas abélien on obtient

i0 ϕi0 ,qi0 (C )
cette relation comme dans le lemme 6.1 ; dans le cas torique elle est inutile car
π −1 (C) = B ′ ). Ensuite on mutliplie et l’on a le résultat (voir aussi la partie 6 de
[48] pour une démonstration essentiellement analogue).

Démonstration du théorème. – Quitte à faire une extension finie de k, on peut sup-

poser X définie sur k. Soit x un élément de l’ensemble de l’énoncé. Il appartient
à une variété de Γ-torsion H que nous choisissons de dimension minimale. Fixons
ε = (dim A)−2 . Par le théorème 3.7, nous avons
ωK Γ
(x)1+ε (deg H)2ε h(x) ≥ c′Γ (ε)
lorsque {x} n’est pas de Γ-torsion c’est-à-dire si x 6∈ Γ. Nous appliquons la proposition
précédente à x et obtenons un fermé V . Comme X et V sont définis sur KΓ et que x
est isolé dans X ∩ V nous avons
[KΓ (x) : KΓ ] ≤ deg(X ∩ V ) ≤ deg X deg V ≤ ρ(deg X)(deg H)1−1/codimH .
Par suite
H [KΓ (x) : KΓ ]
ωK (x)dim H ≤ ≤ ρ(deg X)(deg H)−1/codimH .
deg H
En utilisant h(x) ≤ β, on obtient, pour un réel c > 0 indépendant de x :
(deg H)2ε−(1+ε)/(dim H·codimH) ≥ c.



Ensuite par le choix de ε, nous notons

1+ε 1 4
2ε − ≤ 2ε − ≤ 2ε − = −2ε.
dim H · codimH dim H(dim A − dim H) (dim A)2
Ceci fournit deg H ≤ c−1/2ε . Si x ∈ Γ ce qui précède n’est pas valable mais ici H = {x}
donc deg H = 1. Maintenant l’ensemble G des sous-groupes algébriques connexes de
codimension > dim X et de degré ≤ max(1, c−1/2ε ) est fini et nous venons de montrer
que si x appartient à l’ensemble de l’énoncé alors il existe B ∈ G tel que x ∈ Γ + B.
Par suite notre ensemble est contenu dans l’union
(X \ ZX,Γ ) ∩ (Γ + B)
B∈ G

qui est finie par le lemme 4.1.

Bien entendu, dans l’état actuel des connaissances, ce théorème ne s’applique qu’à
Γ = Ators lorsque A est un tore ou une variété abélienne à mutliplications com-
plexes (d’après les résultats de Delsinne et Carrizosa, voir théorème 3.3). Toutefois la
conclusion est encore valable pour Γ de rang fini quelconque grâce à la bijection du
corollaire 4.1. Avec le résultat de hauteur bornée rappelé plus haut, nous avons donc
la conclusion suivante.

Corollaire 4.2. – Si Ators est de Dobrowolski alors la conjecture de Zilber-Pink est

vraie pour tout Γ sous la condition X 6= ZX,A .

c. Application du problème de Bogomolov. – Plus récemment le problème de Bogo-

molov effectif (dire que Γ = A est de Dobrowolski) a été utilisé pour traiter les points
de petite hauteur dans la conjecture de Zilber-Pink. Ceci a été mis en œuvre par
Habegger [27] dans les tores puis par Viada [53] dans les variétés abéliennes. Cette
approche est aussi utilisée par Maurin [37, 38, 39] dans ses résultats sur les tores.
Notre présentation suit essentiellement [39, partie 7] mais à la fois pour les tores et
pour les variétés abéliennes.
Toujours dans le cadre des notations 1.1 avec la hauteur normalisée h nous défi-
nissons pour un réel ε et une partie S de A le cône suivant :
C (S, ε) = {x + z | x ∈ S, h(z) ≤ ε(1 + h(x))}.

Nous démontrons alors le résultat suivant.

Théorème 4.6. – Si A est de Dobrowolski alors pour tout réel β, toute sous-variété X
de A transverse et de stabilisateur fini, tout sous-groupe Γ de rang fini, il existe ε > 0
tel que
{x ∈ X ∩ C (Γ + A[dim X+1] , ε) | h(x) ≤ β}
n’est pas dense dans X.



Pour démontrer ceci, nous pouvons comme plus haut changer de compactification.
Dans le cas torique, nous choisissons Ā = (P1 )n . Nous posons |x| = h(x)1/s pour x ∈ A
(rappelons que s = 1 si A est un tore et s = 2 sinon). De cette façon, | · | induit une
norme sur A(k̄) ⊗ R. De plus nous choisissons une norme sur End(A) ⊗ R liée à la
précédente par la propriété |ϕ(x)| ≤ |ϕ||x| pour tous x ∈ A et ϕ ∈ End(A). D’après
l’appendice, un couple (c0 , B) et une notion de projecteur normalisé sont associés à
cette norme. Nous utilisons de manière cruciale ces outils dans les preuves qui suivent.

Lemme 4.2. – Si x ∈ Γ + A[r] alors il existe γ ∈ Γsat , P ∈ A[r] tels que x = γ + P

et max(|γ|, |P |) ≤ (c0 + 1)|x|.

Démonstration. – Écrivons x = γ ′ + P ′ avec γ ′ ∈ Γ et P ′ ∈ A[r] . Soit ϕ un projecteur

normalisé tel que rgϕ ≥ r et ϕ(P ′ ) = 0. Notons a = a(ϕ) et γ un élément tel
que aγ = ϕ(x). Comme aγ = ϕ(γ ′ ) on a γ ∈ Γsat . Par ailleurs aϕ(x − γ) = aϕ(x) −
ϕ(aγ) = (aϕ − ϕ ◦ ϕ)(x) = 0 donc P = x − γ ∈ A[r] . Enfin max(|γ|, |P |) ≤ |x| + |γ| ≤
|x| + a−1 |ϕ(x)| ≤ |x| + a−1 |ϕ||x| ≤ (c0 + 1)|x|.

Voyons maintenant que nous pouvons approcher efficacement nos projecteurs nor-
malisés par un ensemble fini.

Lemme 4.3. – Il existe un réel c > 0 tel que, pour tout réel Q ≥ c, il existe un en-
semble fini de projecteurs 2-normalisés EQ tel que si ψ ∈ EQ alors Q < a(ψ) ≤ 2Q
et, pour tout projecteur normalisé ϕ, il existe ψ ∈ EQ de même rang que ϕ avec
|ϕ/a(ϕ) − ψ/a(ψ)| ≤ c/a(ψ).

Démonstration. – Soit B ∈ B. On considère le sous-groupe ΛB = {χ ∈ End(A) |

Imχ ⊂ B et χ(B) = 0} de End(A). On note λB la distance minimale d’un point
de ΛB ⊗ R à ΛB . On choisit aussi un projecteur normalisé ψB tel que ImψB = B
et l’on pose cB = max(λB , a(ψB )). On définit alors c = max{cB | B ∈ B}. Soient
maintenant Q et ϕ comme dans l’énoncé. On note B = Imϕ. On choisit un entier a
multiple de a(ψB ) tel que Q < a ≤ 2Q (ceci est possible car Q ≥ c ≥ a(ψB )). Nous
avons alors  
ϕ ψB
a − ∈ ΛB ⊗ Q
a(ϕ) a(ψB )
donc il existe χ ∈ ΛB avec
ϕ ψB
a − − χ ≤ λB .
a(ϕ) a(ψB )
Posons ψ = (a/a(ψB ))ψB + χ ∈ End(A) et vérifions les propriétés requises. Comme
ImψB = B et Imχ ⊂ B on a Imψ ⊂ B. De plus χ(B) = 0 donne χ ◦ ψB = χ ◦ χ = 0
et Imχ ⊂ B entraî ne ψB ◦ χ = a(ψB )χ. En combinant ceci on trouve ψ ◦ ψ = aψ. En
particulier Imψ = B. Enfin |ψ| ≤ |aϕ/a(ϕ)| + λB ≤ c0 a + λB . Par le choix de Q ≥ c
on a a ≥ λB ≥ c−1 0 λB donc |ψ| ≤ 2c0 a. Tout ceci montre que ψ est un projecteur
2-normalisé avec a(ψ) = a. Par définition |ϕ/a(ϕ) − ψ/a| ≤ λB /a ≤ c/a et ψ est
choisi dans l’ensemble fini des projecteurs 2-normalisés de norme au plus 4c0 Q.



Nous entamons maintenant la démonstration du théorème 4.6. Nous commençons

par une série de réductions de cet énoncé jusqu’à obtenir une assertion de minoration
d’un minimum essentiel qui l’entraîne. Pour alléger les notations, nous notons X d,D
l’ensemble des sous-variétés de A transverses, de stabilisateur fini, de dimension d et
de degré D ainsi que P d (resp. P d ) l’ensemble des projecteurs normalisés (resp.
2-normalisés) de rang au moins d + 1. On rappelle que A[d+1] = ϕ∈ P d Kerϕ.

Proposition 4.7. – Soient Γ un groupe de rang fini et d, D des entiers avec 0 < d <
g = dim A et D ≥ 1. Dans la liste suivante, chaque assertion entraîne la précédente.
(1) Pour tout β1 ∈ R il existe ε1 > 0 tel que si X1 ∈ X d,D alors F1 = {x1 ∈
X1 ∩ C (Γ + A[d+1] , ε1 ) | |x1 | ≤ β1 } n’est pas dense dans X1 .
(2) Pour tout β2 ∈ R il existe ε2 > 0 tel que si X2 ∈ X d,D alors l’ensemble F2 des
x2 ∈ X2 qui s’écrivent x2 = γ2 + P2 + z2 avec γ2 ∈ Γsat , P2 ∈ A[d+1] , z2 ∈ A
et |γ2 | ≤ β2 , |P2 | ≤ β2 , |z2 | ≤ ε2 n’est pas dense dans X2 .
(3) Pour tout β3 ∈ R il existe ε3 > 0 tel que si X3 ∈ X d,D alors l’ensemble F3 des
x3 ∈ X3 qui s’écrivent x3 = P3 + z3 avec P3 ∈ A[d+1] , z3 ∈ A et |P3 | ≤ β3 ,
|z3 | ≤ ε3 n’est pas dense dans X3 .
(4) Pour tout β4 ∈ R il existe ε4 > 0 tel que si X4 ∈ X d,D alors l’ensemble F4 des
x4 ∈ X4 pour lesquels |x4 | ≤ β4 et il existe ϕ4 ∈ P d avec |ϕ(x4 )| ≤ |ϕ4 |ε4 n’est
pas dense dans X4 .
(5) Il existe ε5 > 0 tel que pour tous X5 ∈ X d,D et ϕ5 ∈ P d on ait
µess ((id + ϕ5 )(X5 )) ≥ a(ϕ5 )1/g ε5 .

Démonstration. – Nous ne changeons pas les assertions si nous imposons de plus

dans chacune βi ≥ 1 et εi ≤ 1/4. Nous démontrons donc les 4 implications requises
avec ces conditions supplémentaires. (2) =⇒ (1) On pose β2 = (c0 + 1)(2β1 + 1).
L’assertion (2) fournit ε2 > 0 et on définit ε1 = εs2 (2β1 + 2)−s puis X2 = X1 . Il suffit
alors de voir F1 ⊂ F2 . Si x1 ∈ F1 on écrit x1 = y + z2 avec y ∈ Γ + A[d+1] , z2 ∈ A
et h(z2 ) ≤ ε1 (h(y)+1). On a |z2 | ≤ ε1 (|y|+1) puis |y| ≤ |x1 |+|z2 | ≤ β1 +(1/2)(|y|+1)
donc |y| ≤ 2β1 + 1. Ceci fournit |z2 | ≤ ε2 . D’autre part, par le lemme 4.2, y s’écrit
γ2 + P2 avec γ2 ∈ Γsat et P2 ∈ A[d+1] et max(|γ2 |, |P2 |) ≤ (c0 + 1)|y| ≤ β2 . Ceci
montre bien x1 ∈ F2 . (3) =⇒ (2) Nous employons β3 = β2 et ε2S= ε3 /2. Comme
Γsat est de rang fini, nous pouvons écrire {γ2 ∈ Γsat | |γ| ≤ β2 } = γ3 ∈S {γ2 ∈ Γsat |
|γ2 − γ3 | ≤ ε2 } où S est un ensemble fini. Montrons alors F2 ⊂ γ3 ∈S γ3 + F3 où
chaque F3 est défini avec X3 = X2 − γ3 . En effet si x2 = γ2 + P2 + z2 ∈ F2 alors
x2 − γ3 = P2 + z2 + (γ2 − γ3 ) avec |P2 | ≤ β2 et, si z3 = z2 + (γ2 − γ3 ), |z3 | ≤ 2ε2 = ε3 .
Nous avons bien X3 ∈ X d,D car deg(X2 −γ3 ) = deg(X2 ) et Stab(X2 −γ3 ) = Stab(X2 ).
(4) =⇒ (3) Ici β4 = β3 + 1, ε4 = ε3 , X4 = X3 . Si x3 = P3 + z3 il existe ϕ4 ∈ P d
avec ϕ4 (P3 ) = 0 donc |ϕ4 (x3 )| = |ϕ4 (z3 )| ≤ |ϕ4 ||z3 | ≤ |ϕ4 |ε4 . De plus |x3 | ≤ β3 +ε3 ≤
β4 . Ceci montre directement F3 ⊂ F4 . (5) =⇒ (4) Nous posons Q = (2(c + 1)β4 ε−1 5 )
et ε4 = ε5 (4Qc0 ) où c est défini par le lemme 4.3. Ces choix sont faits pour avoir
(c + 1)β4 + 2c0 Qε4 ≤ Q1/2g ε5 (avec Q ≥ c ≥ 1). On pose aussi X5 = X4 . Si x4 ∈ F4



il existe ϕ4 ∈ P d avec |ϕ4 (x4 )| ≤ |ϕ4 |ε4 . Par le lemme 4.3, il existe ϕ5 ∈ EQ
avec ϕ5 ∈ P d et |ϕ5 /a(ϕ5 ) − ϕ4 /a(ϕ4 )| ≤ c/a(ϕ5 ). Alors
ϕ5 ϕ4 ϕ4 (x4 )
|x4 + ϕ5 (x4 )| ≤ |x4 | + a(ϕ5 ) − (x4 ) +
a(ϕ5 ) a(ϕ4 ) a(ϕ4 )
|ϕ4 |
≤ |x4 | + c|x4 | + a(ϕ5 ) ε4
a(ϕ4 )
≤ (c + 1)β4 + 2c0 Qε4 ≤ Q1/2g ε5 .
Par suite h((id + ϕ5 )(x4 )) ≤ Q1/g ε5 < µess ((id + ϕ5 )(X5 )). Comme id + ϕ5 est une
isogénie (on a (id + ϕ5 ) ◦ ([a(ϕ5 ) + 1] − ϕ5 ) = [a(ϕ5 ) + 1]), on en déduit que x4
appartient à un fermé strict de X4 dépendant de ϕ5 . La conclusion découle ensuite
de la finitude de EQ .

Il nous suffit donc maintenant de démontrer l’assertion (5) puisque (1) entraîne le
théorème. Nous allons même établir un énoncé un peu plus fort dans la mesure où
(1) montre que le ε du théorème ne dépend de X que par son degré (mais il dépend
de β).

Proposition 4.8. – Si A est de Dobrowolski, il existe un réel c > 0 tel que pour toute
sous-variété X de A transverse de stabilisateur fini et tout projecteur 2-normalisé ϕ
de rang au moins dim X + 1 on a
µess ((id + ϕ)(X)) ≥ c(deg X)−g a(ϕ)1/g .

Démonstration. – Nous abrégeons a = a(ϕ) et d = dim X. Si rgϕ = g, nous avons

ϕ = [a] et l’énoncé est clair. Nous supposons donc dans la suite rgϕ ≤ g−1 (et ainsi d ≤
g−2 et g ≥ 3). Notons Y une composante de degré minimal de Z = [a+1]−1 (id+ϕ)(X)
et N le nombre de composantes de Z. Nous utilisons ε = 1/g(g − 2). Nous pouvons
appliquer le fait que A est de Dobrowolski à la variété Y (transverse car X l’est) et
d’après [a + 1]Y = (id + ϕ)(X) nous trouvons
µess ((id + ϕ)(X)) = (a + 1)s µess (Y ) ≥ cA (ε)(a + 1)s ωk̄ (Y )−1−ε

s −(1+ε)/(g−d) s N
≥ cA (ε)(a + 1) (deg Y ) ≥ cA (ε)(a + 1) .
deg Z
Comme Z = ([a + 1] − ϕ)−1 (id + ϕ)−1 (id + ϕ)(X) = ([a + 1] − ϕ)−1 (X + Ker(id + ϕ))
le nombre N est supérieur au nombre de composantes de X + Ker(id + ϕ) qui vaut
Ker(id + ϕ) CardKer(id + ϕ) (a + 1)srgϕ
Card ≥ ≥ .
Stab(X) ∩ Ker(id + ϕ) CardStab(X) (deg X)d+1
Ici la majoration
T du dénominateur résulte de l’inégalité de Bézout (en écrivant
Stab(X) = x∈X X − x) tandis qu’au numérateur nous avons CardKer(id + ϕ) =
(a+1)srgϕ car Ker(id+ϕ) = Ker[a+1]∩Imϕ (on utilise ϕ(x) = −x =⇒ x ∈ Imϕ et x ∈
Imϕ =⇒ ϕ(x) = ax). D’un autre côté nous avons deg Z = (a+1)s(g−d) deg(id+ϕ)(X)
et deg(id + ϕ)(X) ≤ c′ (a + 1)sd deg X (ce degré est majoré par un multiple



de |id + ϕ|sd deg X par le lemme 6.2 et |id + ϕ| ≤ |id| + 2c0 a). En combinant nous
deg Z
≤ c′ (a + 1)s(g−rgϕ) (deg X)d+2 ≤ c′ (a + 1)s(g−d−1) (deg X)g .
Par suite
1+ε g
µess ((id + ϕ)(X)) ≥ c (ε)c′− g−d (deg X)− g−d (1+ε) (a + 1)s(1−(1+ε)(1− g−d ))

et ceci donne l’énoncé avec (1 + ε)/(g − d) ≤ 1, a + 1 ≥ a et 1 − (1 + ε)(1 − (g − d)−1 ) ≥

1 − (1 + ε)(1 − (g − 1)−1 ) = 1/g par le choix de ε.

Il importe de noter ici que la condition ZX,A 6= A entraîne à la fois X transverse

et Stab(X) fini. Par conséquent les résultats de hauteur bornée rappelés à la fin du
paragraphe a donnent l’énoncé suivant (on connaît aussi des versions plus fortes avec
un cône).

Corollaire 4.3. – Si A est de Dobrowolski alors la conjecture de Zilber-Pink est vraie

pour tout Γ sous la condition X 6= ZX,A .

Dans la démonstration de la proposition 4.8, l’hypothèse que A est de Dobrowolski

est immédiatement combinée avec une majoration de l’indice d’obstruction ωk̄ (Y )
par une puissance du degré deg(Y )1/(g−d) . Par conséquent il nous suffirait de savoir
que A est faiblement de Dobrowolski au sens donné à ce terme dans le théorème 3.3 et
donc le théorème 4.6 ainsi que son corollaire ci-dessus valent sous cette hypothèse (et
donc inconditionnellement pour les produits de variétés abéliennes à multiplications
complexes, de courbes elliptiques et de surfaces abéliennes).
Comme conséquence du théorème 4.6 nous pouvons aussi écrire un résultat du
même type avec une hypothèse plus faible sur X. Pour ε ∈ R et r ∈ N nous notons
Aε = {P + z | P ∈ A[r] et h(z) ≤ ε}.

Théorème 4.9. – Si A est de Dobrowolski alors, pour tout réel β et toute sous-variété
X de A de stabilisateur fini et 0-transverse, il existe ε > 0 tel que
{x ∈ X ∩ Aε[dim X+1] | h(x) ≤ β}
n’est pas dense dans X.

Démonstration. – Notons γ + A′ le plus petit translaté de sous-variété semi-abélienne

contenant X. Par hypothèse sur X, le seul sous-groupe algébrique de A contenant
γ + A′ est A lui-même. Quitte à modifier γ par un élément de A′ , nous pouvons
supposer que γ est 0-transverse. Ceci signifie que l’application linéaire EndA → A,
ϕ 7→ ϕ(γ) est injective et, comme sa source est de dimension finie, on en déduit
que |ϕ| ≤ c|ϕ(γ)| pour un réel c > 0. Notons aussi que si z ∈ A est de hauteur
suffisamment petite alors γ − z est encore 0-transverse ; sinon on aurait ϕ(γ) = ϕ(z)
pour un ϕ 6= 0 d’où |ϕ| ≤ c|ϕ(γ)| = c|ϕ(z)| ≤ c|ϕ||z| ce qui est absurde pour |z| > 1/c.
La sous-variété Y = X − γ de A′ est transverse et de stabilisateur fini. Posons encore



Γ = (Hom(A, A′ ) · γ)sat de rang fini. Le lemme 3.7 montre que le sous-groupe A′ de A′

est de Dobrowolski donc, par le théorème 4.6, il existe ε′ > 0 tel que l’ensemble
[dim X+1]
{y ∈ Y ∩ C (Γ + A′ , ε′ ) | |y| ≤ |γ| + β 1/s }
[dim X+1]
n’est pas dense dans Y . Il nous suffit donc de trouver ε > 0 tel que (γ +A′ )∩Aε
[dim X+1] ′
soit inclus dans γ+ C (Γ+A′ , ε ). Considérons donc y ∈ A′ tel que γ+y = P +z
[dim X+1] 1/s
avec P ∈ A et |z| ≤ ε . Quitte à modifier P et z par un point de torsion
nous supposons P ∈ B pour B une sous-variété semi-abélienne de A de codimension
au moins dim X + 1. Par hypothèse γ − z = P − y ∈ B + A′ ; pour ε assez petit ceci
force B + A′ = A. Nous pouvons donc appliquer la proposition 6.2 et elle nous fournit
ϕ : A → A′ et a ∈ N \ {0} tels que ϕ|A′ ◦ ϕ = aϕ, |ϕ|A′ | ≤ c0 a et Ker0 ϕ = B. Écrivons
ϕ(γ) = aγ ′ et ϕ(z) = az ′ avec γ ′ , z ′ ∈ Imϕ ⊂ A′ puis P ′ = y +γ ′ −z ′ ∈ A′ . Nous avons
γ ′ ∈ Γ. De plus ϕ(γ − γ ′ ) = aγ ′ − ϕ|A′ (γ ′ ) = 0 car γ ′ ∈ Imϕ et de même ϕ(z − z ′ ) = 0.
Ceci montre ϕ(P ′ ) = ϕ(y + γ ′ − z ′ ) = ϕ(P + z − z ′ + γ ′ − γ) = 0 car P ∈ B ⊂ Kerϕ.
Ainsi P ′ ∈ Kerϕ ∩ A′ et codimA′ Kerϕ ∩ A′ = codimA′ B ∩ A′ = codimA B ≥ dimX + 1
[dim X+1]
en utilisant B + A′ = A. Nous obtenons P ′ ∈ A′ . Calculons encore |aγ ′ | =
|ϕ(γ ′ )| = |ϕ(γ ′ − P ′ )| ≤ |ϕ|A′ ||γ ′ − P ′ | ≤ c0 a|γ ′ − P ′ | et, finalement,
1 |ϕ| 1/s ε1/s
|z ′ | = |ϕ(z)| ≤ ε ≤ c|ϕ(γ)| = cε1/s |γ ′ | ≤ cc0 ε1/s | − γ ′ + P ′ |
a a a
(dans ce calcul on voit ϕ comme un élément de EndA). Ceci nous montre y = −γ ′ +
[dim X+1]
P ′ + z ′ ∈ C (Γ + A′ , cc0 ε1/s ) et donne la conclusion pour ε assez petit.
Signalons que ce résultat serait faux si l’on remplaçait Aε par le cône C (A[r] , ε)
(voir [39, partie 12]).
Par ailleurs, l’on peut aussi combiner cet énoncé avec un résultat de hauteur bor-
[dim X+1] [dim X+1] ′
née puisque nous avons montré (γ + A′ ) ∩ Aε ⊂ γ + C (Γ + A′ ,ε )
indépendamment de la borne de hauteur.

5. Variétés semi-abéliennes
Dans cette dernière partie, nous évoquons brièvement les problèmes qui se posent
pour étendre ce qui précède aux variétés semi-abéliennes. Si l’on résume notre dé-
marche en 3 étapes :
(1) montrer un résultat de hauteur bornée (voir la fin du paragraphe a de la partie 4
et les notes de Ph. Habegger) ;
(2) montrer que Ators ou A est de Dobrowolski ;
(3) déduire de (2) un résultat de non-densité des points de hauteur bornée (voir
théorèmes 4.4 et 4.6) ;
aucune de ces étapes n’est connue à ce jour dans le cas général des variétés
semi-abéliennes. Nous ne traitons pas ici de (1). L’extension de (3) en suivant les
démonstrations faites dans la partie précédente se heurte surtout au fait que l’on
utilise fréquemment le théorème de complète réductibilité qui ne vaut pas dans le



cas semi-abélien. Toutefois, l’obstruction la plus évidente vient de (2) au moins si

l’on se concentre sur Ators : on peut en effet démontrer qu’il existe des variétés
semi-abéliennes A pour lesquelles le groupe Ators n’est pas de Dobrowolski.
Nous rappelons succintement l’argument dû à Daniel Bertrand et basé sur l’exis-
tence des points déficients mis en évidence par Jacquinot et Ribet (voir [32] ; les
auteurs précisent que la construction est essentiellement due à Breen ; les points dé-
ficients sont aussi nommés points de Ribet par Daniel Bertrand). Soit A une variété
semi-abélienne extension d’une variété abélienne A0 par le tore Gm . On construit
alors [32] un morphisme de groupes u : Hom(A c0 , A0 ) → A et on appelle points dé-
ficients les éléments du groupe de rang fini Adéfi = (Imu)div . Ces points possèdent
deux propriétés remarquables qui les apparentent aux points de torsion : d’une part
ils sont rationnels sur KAtors (voir [32]) et d’autre part la partie de degré 1 de leur
hauteur (notée ĥ L lin à la fin de la partie 2) est nulle (voir [8, p 243]). Pourtant, et c’est
bien sûr tout l’intérêt de cette construction, on démontre qu’il existe des exemples où
Adéfi 6= Ators et même où Adéfi contient des points 0-transverses.
Il y a alors deux façons de montrer que Ators n’est pas de Dobrowolski. En premier
lieu si P est un point de A et Qn un point de n-division de P (nQn = P ) alors
ωk (Qn ) ≤ c(CardKer[n])1/ dim A = cn(2g+1)/(g+1) si g = dim A0 = dim A − 1. Si l’on
suppose que P est déficient, on a aussi h(Qn ) = n−2 h(P ) car la partie de degré 1
de la hauteur est nulle. Par suite ωk (Qn )1+ε h(Qn ) ≤ cn((2g+1)ε−1)/(g+1) tend vers 0
pour ε assez petit, ce qui contredit la propriété de Dobrowolski si P , donc Qn , est
0-transverse (ceci montre même en fait que {0} n’est pas de Dobrowolski).
Alternativement, on peut utiliser seulement la première propriété des points dé-
ficients qui donne ωKAtors (Qn ) = 1 et le fait que h(Qn ) tend vers 0 (l’inégalité
h(Qn ) ≤ n−1 h(P ) est vraie sans utiliser que P est déficient) pour conclure de même
que Ators ne peut pas être de Dobrowolski.
Au vu de ce résultat négatif, on peut se demander quelle est la bonne généralisation
du problème de Lehmer aux variétés semi-abéliennes les plus générales. Le formalisme
introduit dans le présent texte permet de formuler l’hypothèse suivante.

Question. Le groupe de rang fini Adéfi est-il de Dobrowolski ?

Cette suggestion, peu étayée pour l’instant, est une partie de la motivation de
l’introduction de la notion de groupe de Dobrowolski et de son application à des
groupes de rang fini non nul (comme dans le théorème 4.4). Si la réponse à la question
est positive, la voie serait ouverte aux applications à la conjecture de Zilber-Pink
(modulo les points (1) et (3) ci-dessus).
Pour terminer mentionnons encore que les points déficients sont aussi à la base
d’un contre-exemple de Daniel Bertrand à la conjecture de Manin-Mumford relative
pour les familles de variétés semi-abéliennes (voir [11] ; on pourra consulter également



6. Appendice : projecteurs normalisés

Soit A une variété abélienne ou un tore. Nous considérons une norme quelconque
| · | sur EndA ⊗ R.
Proposition 6.1. – Il existe un réel c0 ≥ 1 et une famille finie B de sous-variétés
semi-abéliennes de A tels que, pour toute sous-variété semi-abélienne B de A, il existe
a ∈ N \ {0} et ϕ ∈ EndA tels que
ϕ ◦ ϕ = aϕ, |ϕ| ≤ c0 a, Imϕ ∈ B et Ker0 ϕ = B.
Cette proposition (démontrée ci-dessous) permet de donner la définition principale
de cette partie. Nous fixons une fois pour toutes un couple (c0 , B) comme dans la
Définition 6.1. – On appelle projecteur normalisé un élément ϕ ∈ EndA pour lequel il
existe a ∈ N \ {0} avec ϕ ◦ ϕ = aϕ, |ϕ| ≤ c0 a et Imϕ ∈ B. Si un tel ϕ est non nul,
l’entier a est unique, on l’appelle le paramètre de ϕ et on le note a(ϕ). On pose aussi
a(0) = 1.
On remarque que si ϕ est un projecteur normalisé non nul et m ∈ N \ {0} alors il
en est de même de mϕ et a(mϕ) = ma(ϕ). Cette remarque et la proposition montrent
A[r] = Kerϕ

où l’union porte sur les projecteurs normalisés de rang au moins r (on écrit natu-
rellement rgϕ = dim Imϕ ; pour la notation A[r] voir le début de la partie 4). Cette
formule explique (en partie) l’utilité de cette notion pour la conjecture de Zilber-Pink.
Nous définissons aussi (pour un usage plus technique, voir paragraphe c de la
partie 4) une notion de projecteur 2-normalisé en remplaçant simplement dans la
définition |ϕ| ≤ c0 a par |ϕ| ≤ 2c0 a. Nous utilisons également la notation a(ϕ) dans ce
Nous établissons maintenant la proposition 6.1 comme cas particulier (A′ = A) de
l’énoncé plus général suivant.
Proposition 6.2. – Soient A′ une sous-variété semi-abélienne de A et | · | une norme
sur End(A′ ) ⊗ R. Il existe un réel c0 ≥ 1 et une famille finie B de sous-variétés semi-
abéliennes de A′ tels que, pour toute sous-variété semi-abélienne B de A vérifiant
B + A′ = A, il existe a ∈ N \ {0} et ϕ ∈ Hom(A, A′ ) avec
ϕ|A′ ◦ ϕ = aϕ, |ϕ|A′ | ≤ c0 a, Imϕ ∈ B et Ker0 ϕ = B.
Démonstration. – Choisissons B1 , . . . , Bt des sous-variétés semi-abéliennes simples
de A′ telles que l’addition induise une isogénie B1 × · · · × Bt → A′ . Définissons
B comme l’ensemble de toutes les sommes d’un nombre quelconque de Bi . Véri-
fions d’abord que pour B comme dans l’énoncé il existe B ′ ∈ B avec A = B + B ′
et B ∩ B ′ fini. Prenons pour cela un élément B ′ ∈ B tel que A = B + B ′ et minimal
pour cette propriété. Il en existe car A = B + A′ . Écrivons B ′ = Bi1 + · · · + Bik



et B̃j = B + Bi1 + · · · + Bij pour 0 ≤ j ≤ k. Si la suite des B̃j n’est pas strictement
croissante, disons B̃j−1 = B̃j alors A = B + Bi1 + · · · + Bij−1 + Bij+1 + · · · + Bik
contredisant la minimalité de B ′ . Ainsi B̃j−1 6= B̃j et par suite B̃j /B̃j−1 est isogène
à Bij par simplicité. Ceci entraîne dim B + B ′ = dim B + dim B ′ et donc B ∩ B ′ fini.
Si nous disposons d’un tel B ′ l’application composée B ′ ֒→ A−→A/B est une
isogénie χ de degré Card(B ∩ B ′ ) donc il existe une isogénie χ′ : A/B → B ′ telle
que χ ◦ χ′ = [Card(B ∩ B ′ )]. Posons a = Card(B ∩ B ′ ) et ϕ = (B ′ ֒→ A′ ) ◦ χ′ ◦ π. Nous
avons Imϕ = B ′ ∈ B et Ker0 ϕ = B tandis que ϕ|A′ ◦ ϕ = (B ′ ֒→ A′ ) ◦ χ′ ◦ π ◦ (A′ ֒→
A) ◦ (B ′ ֒→ A′ ) ◦ χ′ ◦ π = (B ′ ֒→ A′ ) ◦ χ′ ◦ χ ◦ χ′ ◦ π = aϕ. Pour établir la proposition, il
reste à choisir B ′ de sorte que |ϕ|A | soit majoré par un multiple de a. Nous imposons
pour cela que Card(B ∩ B ′ ) soit maximal. Si B ′′ ∈ B est tel que B ∩ B ′′ est fini alors

deg(ϕ|B ′′ ) = Card(B ′′ ∩ π −1 (Kerχ′ )) ≤ deg χP ′
card(B ∩ B ′′ ) ≤ adim B . Par ailleurs
pour 1 ≤ i ≤ t, le choix d’une isogénie A/ j6=i Bj → Bi donne une surjection
πi : A → Bi telle que πi|Bj = 0 si i 6= j et l’on peut imposer également que πi|Bi soit
la multiplication par un P entier, disons a′ , que l’on peut même prendre P indépendant
de i. Maintenant si B = i∈I Bi on considère j ∈ I et k 6∈ I et B ′′ = i∈I∪{k}\{j} Bi .

Comme χ′ ◦ π|B ′ = [a] on a πℓ ◦ ϕ|B ′ = [aa′ δi,ℓ ] si i ∈ I. Par suite ( i∈I πi ) ◦ ϕ|B ′′
composée avec l’isogénie i∈I∪{k}\{j} Bi → B ′′ est le produit de l’endomorphisme
[aa′ ] de i∈I\{j} Bi par un morphisme Bk → i∈I Bi déduit de ϕ|Bk . Le degré de ce

produit est donc (aa′ )s(dim B −dim Bj ) deg(πj ◦ ϕ|Bk ) et ceci montre deg(πj ◦ ϕ|Bk ) ≤

cas(dim Bj −dim B ) deg(ϕ|B ′′ ) pour un réel c indépendant de B. Si dim Bj 6= dim Bk
alors πj ◦ ϕ|Bk = 0 donc on a dans tous les cas deg(πj ◦ ϕ|Bk ) ≤ cas dim Bk . Comme
les éléments non nuls de Hom(Bk , Bj ) sont des isogénies on a |πj ◦ ϕ|Bk | ≤ deg(πj ◦
ϕ|Bk )1/s dim Bk pour un choix idoine de norme sur Hom(Bk , Bj )⊗R. Enfin l’application
linéaire Hom(A′ , B ′ ) → j∈I, 1≤k≤t Hom(Bk , Bj ), ψ 7→ (πj ◦ ψ|Bk )j,k est injective
donc |ψ| ≤ c j∈I, 1≤k≤t |πj ◦ψ|Bk |. En appliquant ceci à ψ = ϕ|A′ il vient |ϕ|A′ | ≤ c0 a
car |πj ◦ ϕ|Bk | ≤ ca si k 6∈ I par ce qui précède et πj ◦ ϕ|Bk = [aa′ δj,k ] si k ∈ I (pour
une version de cette démonstration dans le cas des tores voir [39, prop. 7.1]).

Nous terminons par deux lemmes qui ne concernent pas uniquement les projecteurs
normalisés mais contrôlent le degré de variétés associées à un endomorphisme ϕ en
termes de sa norme.

Lemme 6.1. – Il existe c > 0 tel que si ϕ ∈ EndA on a deg(Kerϕ) ≤ c|ϕ|s dim Imϕ .

Démonstration. – Dans le cas abélien,

· dim Kerϕ
(ϕ∗ L )· dim Imϕ · L ·A
deg(Kerϕ) = · dim A
L ·A
est un polynôme en ϕ de degré 2 dim Imϕ d’où la majoration. Dans le cas torique, on
peut choisir une compactification particulière (Ā, L ) de A par exemple (Pn , O (1)).



Alors, si ϕ correspond à une matrice (mij ), le fermé Kerϕ est défini par les équations
Y n
max(0,mij ) max(0,−mij )
Xj = Xj
j=0 j=0
en posant mi0 = − j=1 mij . Ces équations sont toutes de degré au plus c|ϕ| donc
d’après le théorème de Bézout le fermé équidimensionnel Kerϕ vérifie deg(Kerϕ) ≤
(c|ϕ|)scodimKerϕ = (c|ϕ|)s dim Imϕ .

Lemme 6.2. – Il existe c > 0 tel que si X est une sous-variété de A et ϕ ∈ EndA une
isogénie alors deg ϕ(X) ≤ c|ϕ|s dim X deg X.

Démonstration. – Étant donné ϕ ∈ End(A) notons α(ϕ) le plus petit entier naturel
tel qu’il existe une compactification π : Āϕ → Ā de A et une extension ϕ̄ : Āϕ → Ā
⊗−1 ⊗α(ϕ)
de ϕ telles que ϕ̄∗ L ⊗ π∗ L est engendré sur A par ses sections globales
sur Āϕ (pour vérifier l’existence d’un tel entier voir démonstration du lemme 3.2).
Notons aussi X̄ et X̄ϕ l’adhérence de X dans Ā et Āϕ . Lorsque ϕ est une isogénie,
on a les majorations
· dim X · dim X
deg ϕ(X) = L · ϕ(X) = L · ϕ̄(X̄ϕ ) ≤ (ϕ̄∗ L )· dim X · X̄ϕ
⊗α(ϕ) · dim X · dim X
≤ (π ∗ L ) · X̄ϕ = (α(ϕ)dim X ) L · X̄ = α(ϕ)dim X deg X.

Par conséquent, pour établir le lemme, il nous suffit de montrer que α(ϕ) est majoré
par un multiple de |ϕ|s . Pour ceci, nous pouvons même choisir un couple particulier
(Ā, L ) : dans le cas torique nous nous limitons à Ā = (P1 )n et dans le cas abélien nous
imposons que L soit engendré par ses sections globales. Nous avons alors pour m ∈ Z
et ϕ ∈ End(A) l’estimation α(mϕ) ≤ |m|s α(ϕ) d’après [m]∗ L ≃ L . Voyons
ensuite α(ϕ + ψ) ≤ s(α(ϕ) + α(ψ)) pour ϕ, ψ ∈ EndA. Ceci donnera le résultat
car, en fixant une base ϕ1 , . . . , ϕt de EndA, ces relations entraînent α( i=1 mi ϕi ) ≤
P t P t
st−1 i=1 msi α(ϕi ) ≤ c| i=1 mi ϕi |s pour tous m1 , . . . , mt ∈ Z. Dans le cas abélien,
la majoration de α(ϕ + ψ) découle du théorème du cube ([42, page 59] avec f = ϕ,
g = ψ = −h et L symétrique) : (ϕ + ψ)∗ L ⊗ [ϕ∗ L ⊗ ψ ∗ L ]⊗2 ≃ (ϕ − ψ)∗ L
est engendré par ses sections globales. Dans le cas torique, en écrivant ϕ + ψ =
add ◦ (ϕ, ψ), il suffit de montrer que, sur une compactification convenable G de A × A
au-dessus de Ā × Ā avec une extension add : G → A de add : A × A → A, le faisceau
∗ ⊗−1
add L ⊗ p∗1 L ⊗ p∗2 L est engendré sur A × A par ses sections globales sur G. Par
produit, il suffit même de faire ceci pour A = Gm , Ā = P1 , L = O (1). On choisit alors
pour G l’adhérence dans (P1 )3 du graphe de add : G2m → Gm . Le faisceau en question
est la restriction à G de O (1, 1 − 1) et il possède une section globale σ qui l’engendre
au-dessus de G2m : en coordonnées ((X0 : X1 ), (Y0 : Y1 ), (Z0 : Z1 )) de (P1 )3 , le fermé
G est défini par X0 Y0 Z1 = X1 Y1 Z0 et σ est obtenue en recollant X1 Y1 /Z1 et X0 Y0 /Z0 .
Pour une variante de cet argument voir [39, lemmes 4.1 et 4.2].



7. Développements récents

Nous mentionnons brièvement ici quelques progrès autour des conjectures étudiées
ci-dessous qui sont intervenus depuis l’écriture de ce texte en 2011.
Dans la direction de la conjecture 3.4, Amoroso [1] a montré que, pour le groupe
Γ engendré par les nombres 23 (n ≥ 1) et leurs conjugués, un élément de KΓ× qui
n’est pas dans Γsat est de hauteur au moins log(3/2)/18. Il s’agit du cas de degré 1
de la conjecture (pour un groupe particulier). D’autre part, Pottmeyer (non publié)
a démontré que si Γ est un sous-groupe saturé de rang fini de Q alors KΓ× /Γ est un
groupe abélien libre : ceci va aussi dans le sens de la conjecture puisque ce serait une
conséquence d’une minoration de la hauteur sur KΓ× \ Γ.
En ce qui concerne la conjecture de Zilber-Pink, un résultat d’Habegger et Pila [30]
permet de remplacer les arguments de minorations de hauteurs par des résultats de
o-minimalité. Par conséquents les corollaires 4.2 et 4.3 deviennent inconditionnels :
si ZX,A 6= X alors la conjecture de Zilber-Pink vaut pour X et pour tout groupe Γ
de rang fini. En particulier, la conjecture 4.1 vaut pour les courbes (dim X = 1).

[1] F. Amoroso – « On a conjecture of G. Rémond », Ann. Sc. Norm. Super. Pisa Cl.
Sci. 15 (2016), p. 599–608.
[2] F. Amoroso & S. David – « Le problème de Lehmer en dimension supérieure »,
J. reine angew. Math. 513 (1999), p. 145–179.
[3] , « Densité des points à coordonnées multiplicativement indépendantes », Ra-
manujan J. 5 (2001), p. 237–246.
[4] , « Minoration de la hauteur normalisée dans un tore », J. Inst. Math. Jussieu
2 (2003), p. 335–381.
[5] F. Amoroso & E. Viada – « Small points on subvarieties of a torus », Duke Math. J.
150 (2009), p. 407–442.
[6] , « Small points on rational subvarieties of tori », Comment. Math. Helv. 87
(2012), p. 355–383.
[7] F. Amoroso & U. Zannier – « A relative Dobrowolski lower bound over abelian
extensions », Ann. Scuola Norm. Sup. Pisa Cl. Sci. 29 (2000), p. 711–727.
[8] D. Bertrand – « Minimal heights and polarizations on group varieties », Duke Math.
J. 80 (1995), p. 223–250.
[9] , « Duality on tori and multiplicative dependence relations », J. Austral. Math.
Soc. Ser. A 62 (1997), p. 198–216.
[10] , « Unlikely intersections in Poincaré biextensions over elliptic schemes », Notre
Dame J. Form. Log. 54 (2013), p. 365–375.
[11] , « Special points and poincaré bi-extensions », prépublication arXiv:1104.5178,
with an appendix by Bas Edixhoven.
[12] E. Bombieri, D. W. Masser & U. Zannier – « Intersecting a curve with algebraic
subgroups of multiplicative groups », Int. Math. Res. Not. 1999 (1999), p. 1119–1140.



[13] , « Anomalous subvarieties—structure theorems and applications », Int. Math.

Res. Not. 2007 (2007), Art. ID rnm057, 33.
[14] , « On unlikely intersections of complex varieties with tori », Acta Arith. 133
(2008), p. 309–323.
[15] M. a. Carrizosa – « Problème de Lehmer et variétés abéliennes CM », C. R. Math.
Acad. Sci. Paris 346 (2008), p. 1219–1224.
[16] , « Problème de Lehmer relatif pour les variétés abéliennes CM », thèse de
doctorat, Université Paris VI, 2008.
[17] , « Petits points et multiplication complexe », Int. Math. Res. Not. 2009 (2009),
p. 3016–3097.
[18] A. Chambert-Loir – « Relations de dépendance et intersections exceptionnelles »,
Séminaire Bourbaki, vol. 2010/2011, exposé no 1032, Astérisque 348 (2012), p. 149–
[19] M. Chardin – « Une majoration de la fonction de Hilbert et ses conséquences pour
l’interpolation algébrique », Bull. Soc. Math. France 117 (1989), p. 305–318.
[20] S. David & M. Hindry – « Minoration de la hauteur de Néron-Tate sur les variétés
abéliennes de type C. M », J. reine angew. Math. 529 (2000), p. 1–74.
[21] S. David & P. Philippon – « Minorations des hauteurs normalisées des sous-variétés
de variétés abeliennes. II », Comment. Math. Helv. 77 (2002), p. 639–700.
[22] E. Delsinne – « Le problème de Lehmer relatif en dimension supérieure », Ann. Sci.
Éc. Norm. Supér. 42 (2009), p. 981–1028.
[23] E. Dobrowolski – « On a question of Lehmer and the number of irreducible factors
of a polynomial », Acta Arith. 34 (1979), p. 391–401.
[24] G. Faltings – « Diophantine approximation on abelian varieties », Ann. of Math. 133
(1991), p. 549–576.
[25] , « The general case of S. Lang’s conjecture », in Barsotti Symposium in Algebraic
Geometry (Abano Terme, 1991), Perspect. Math., vol. 15, Academic Press, San Diego,
CA, 1994, p. 175–182.
[26] A. Galateau – « Une minoration du minimum essentiel sur les variétés abéliennes »,
Comment. Math. Helv. 85 (2010), p. 775–812.
[27] P. Habegger – « A Bogomolov property for curves modulo algebraic subgroups »,
Bull. Soc. Math. France 137 (2009), p. 93–125.
[28] , « Intersecting subvarieties of abelian varieties with algebraic subgroups of com-
plementary dimension », Invent. math. 176 (2009), p. 405–447.
[29] , « On the bounded height conjecture », Int. Math. Res. Not. 2009 (2009), p. 860–
[30] P. Habegger & J. Pila – « O-minimality and certain atypical intersections », Ann.
Sci. Éc. Norm. Supér. 49 (2016), p. 813–858.
[31] M. Hindry – « Autour d’une conjecture de Serge Lang », Invent. math. 94 (1988),
p. 575–603.
[32] O. Jacquinot & K. A. Ribet – « Deficient points on extensions of abelian varieties
by Gm », J. Number Theory 25 (1987), p. 133–151.
[33] M. Laurent – « Minoration de la hauteur de Néron-Tate », in Seminar on number
theory, Paris 1981–82 (Paris, 1981/1982), Progr. Math., vol. 38, Birkhäuser, 1983,
p. 137–151.



[34] , « équations diophantiennes exponentielles », Invent. math. 78 (1984), p. 299–

[35] D. H. Lehmer – « Factorization of certain cyclotomic functions », Ann. of Math. 34
(1933), p. 461–479.
[36] C. Liebendörfer & G. Rémond – « Hauteurs de sous-espaces sur les corps non
commutatifs », Math. Z. 255 (2007), p. 549–577.
[37] G. Maurin – « Courbes algébriques et équations multiplicatives », Math. Ann. 341
(2008), p. 789–824.
[38] , « Conjecture de Zilber-Pink pour les sous-variétés des tores », thèse de doctorat,
Université Grenoble I, 2010.
[39] , « équations multiplicatives sur les sous-variétés des tores », Int. Math. Res.
Not. 2011 (2011), p. 5259–5366.
[40] A. C. de la Maza & E. Friedman – « Heights of algebraic numbers modulo multi-
plicative group actions », J. Number Theory 128 (2008), p. 2199–2213.
[41] M. McQuillan – « Division points on semi-abelian varieties », Invent. math. 120
(1995), p. 143–159.
[42] D. Mumford – Abelian varieties, Tata Institute of Fundamental Research Studies
in Mathematics, No. 5, Published for the Tata Institute of Fundamental Research,
Bombay ; Oxford Univ. Press, London, 1970.
[43] R. Pink – « A Common Generalization of the Conjectures of André-Oort, Manin-
Mumford, and Mordell-Lang », prépublication, 2005.
[44] B. Poonen – « Mordell-Lang plus Bogomolov », Invent. math. 137 (1999), p. 413–425.
[45] N. Ratazzi – « Densité de points et minoration de hauteur », J. Number Theory 106
(2004), p. 112–127.
[46] , « Théorème de Dobrowolski-Laurent pour les extensions abéliennes sur une
courbe elliptique à multiplication complexe », Int. Math. Res. Not. 2004 (2004), p. 3121–
[47] M. Raynaud – « Sous-variétés d’une variété abélienne et points de torsion », in Arith-
metic and geometry, Vol. I, Progr. Math., vol. 35, Birkhäuser, 1983, p. 327–352.
[48] G. Rémond – « Intersection de sous-groupes et de sous-variétés. I », Math. Ann. 333
(2005), p. 525–548.
[49] , « Intersection de sous-groupes et de sous-variétés. II », J. Inst. Math. Jussieu
6 (2007), p. 317–348.
[50] , « Intersection de sous-groupes et de sous-variétés. III », Comment. Math. Helv.
84 (2009), p. 835–863.
[51] G. Rémond & E. Viada – « Problème de Mordell-Lang modulo certaines sous-variétés
abéliennes », Int. Math. Res. Not. 2003 (2003), p. 1915–1931.
[52] C. J. Smyth – « On the product of the conjugates outside the unit circle of an algebraic
integer », Bull. London Math. Soc. 3 (1971), p. 169–175.
[53] E. Viada – « Lower bounds for the normalized height and non-dense subsets of sub-
varieties of abelian varieties », Int. J. Number Theory 6 (2010), p. 471–499.
[54] , « A functorial lower bound for the essential minimum of varities in a power of
an elliptic curve », prépublication arXiv:0908.3062.
[55] P. Vojta – « Integral points on subvarieties of semiabelian varieties. I », Invent. math.
126 (1996), p. 133–181.



[56] P. Voutier – « An effective lower bound for the height of algebraic numbers », Acta
Arith. 74 (1996), p. 81–95.
[57] B. Zilber – « Exponential sums equations and the Schanuel conjecture », J. London
Math. Soc. 65 (2002), p. 27–44.

Gaël Rémond, Institut Fourier, UMR 5582, CS 40700, 38058 Grenoble Cedex 9, France
E-mail : Gael.Remond@univ-grenoble-alpes.fr



50. A. NOVOTNÝ, R. DANCHIN, M. PEREPELITSA, edited by D. BRESCH – Topics on
Compressible Navier-Stokes Equations
49. T. SAITO, L. CLOZEL, J. WILDESHAUS – Autour des motifs. École d’été franco-asiatique
de géométrie algébrique et de théorie de nombres
48. T. T. Q. LÊ, C. LESCOP, R. LIPSHITZ, P. TURNER – Lectures on quantum topology in
dimension three
G. PRASAD, P. POLO, eds. – Autour des schémas en groupes, École d’été « Schémas en
groupes », Volume III
HOVEN, P. GILLE, G. PRASAD, P. POLO, eds. – Autour des schémas en groupes, École d’été
« Schémas en groupes », Volume II
45. B. DE TILIÈRE, P. FERRARI – C. BOUTILLIER, N. ENRIQUEZ, eds. – Dimer Models and
Random Tilings
44. L. BORCEA, H. KANG, H. LIU, G. UHLMANN – H. AMMARI, J. GARNIER, eds. – Inverse
Problems and Imaging
42–43. S. BROCHARD, B. CONRAD, J. OESTERLÉ – Autour des schémas en groupes, École d’été
« Schémas en groupes », Volume I
41. M. LEVINE, J. WILDESHAUS, B. KAHN – Asian-French summer school on algebraic geometry
and number theory
for fusion
Singularities in mechanics : formation, propagation and microscopic description
37. D. CHAFAÏ, O. GUÉDON, G. LECUÉ, A. PAJOR – Interactions between compressed sensing
random matrices and high dimensional geometry
LUM, B. POONEN, F. BEUKERS, S. SIKSEK – Explicit methods in number theory rational
points and Diophantine equations
M. NICOLAU. S. DUMITRESCU, ed. – Complex manifolds, foliations and uniformization
33. V. P. KOSTOV – Topics on hyperbolic polynomials in one variable
G. MIERMONT, J. PEYRIÈRE – Quelques interactions entre analyse, probabilités et fractals
31. L. BONAVERO, B. HASSETT, J. M. STARR, O. WITTENBERG – Variétés rationnellement
connexes : aspects géométriques et arithmétiques
30. S. CANTAT, A. CHAMBERT-LOIR, V. GUEDJ – Quelques aspects des systèmes dynamiques
29. M. KIM, R. SUJATHA, L. LAFFORGUE, A. GENESTIER, NGÔ B. C. – École d’été franco-
asiatique de géométrie algébrique et de théorie des nombres
J. E. MOREL, R. TURPAULT – Mathematical models and numerical methods for radiative
27. P.-L. CURIEN, H. HERBELIN, J.-L. KRIVINE, P.-A. MELLIÈS – Interactive Models of
Computation and Program Behaviour
26. Z. DJADLI, C. GUILLARMOU, M. HERZLICH – Opérateurs géométriques, invariants
conformes et variétés asymptotiquement hyperboliques
25. M. DISERTORI, W. KIRSCH, A. KLEIN, F. KLOPP, V. RIVASSEAU – Random Schrödinger
Arc spaces and additive invariants in Real Algebraic and Analytic Geometry
23. R. CERF – On Cramér’s Theory in infinite dimensions
22. S. VŨ NGO
. C – Systèmes intégrables semi-classiques : du local au global
difféomorphismes conservatifs des surfaces : un point de vue topologique
20. A. CATTANEO, B. KELLER,C. TOROSSIAN, A. BRUGUIÈRES – Déformation, Quantifica-
tion, Théorie de Lie
19. B. MALGRANGE – Systèmes différentiels involutifs
Autour du centenaire Lebesgue
17. Y. ANDRÉ – Une introduction aux motifs
functors, unstable modules and cohomology of finite group schemes
15. M. BOILEAU, S. MAILLOT, J. PORTI – Three-dimensional orbifolds and their geometric
Panoramas et Synthèses
La série Panoramas et Synthèses publie, en In the series Panoramas et Synthèses are
français ou en anglais, des textes de 100 à published texts from 100 to 150 pages, in
150 pages environ faisant le point sur l’é- French or in English, which give an account
tat présent d’un sujet mathématique. Dans of the present state of some mathematical
une présentation soignée, les auteurs s’at- area. The authors aim at explaining the main
tachent à mettre en évidence les difficultés, problems, while giving some flavor of the
à donner un parfum des démonstrations et proofs and an overview of the recent develop-
un aperçu de l’histoire récente du sujet. Les ments of their subject. The texts, which are
textes, destinés à des mathématiciens profes- intended to be read by non-specialists, should
sionnels non spécialistes, doivent être utilis- be accessible to graduate students.
ables par des étudiants de doctorat.

Instructions aux auteurs / Instructions to Authors

Le manuscrit doit être envoyé en double ex- Two copies of the original manuscript should
emplaire au secrétariat des publications en be sent to the editorial board of the SMF, in-
précisant le nom de la revue. dicating to which publication the paper is be-
Le fichier source TEX (un seul fichier par ing submitted.
article) peut aussi être envoyé par cour- The TEX source file (a single file for each
rier électronique ou par transfert FTP, sous article) may also be sent by electronic mail
réserve que sa compilation par le secrétariat or by FTP transfer, in a format suitable for
SMF soit possible. Contacter le Secrétariat typesetting by the Secretary. Please, send an
à l’adresse électronique revues@smf.ens.fr email to revues@smf.ens.fr for precise in-
pour obtenir des précisions. formation.
La SMF recommande vivement l’utilisation The SMF has a strong preference for
d’AMS-LATEX avec sa classe smfart.cls et AMS-LATEX together with the documentclass
la feuille de style panoramas.sty, disponibles smfart.cls and the style file panoramas.sty,
ainsi que leur documentation sur le serveur available with their User’s Guide at http:
http://smf.emath.fr/ ou sur demande au // smf. emath. fr/ (Internet) or on request
Secrétariat des publications SMF. from the editorial board of the SMF.
Les autres formats TEX et les autres types de Files prepared with other TEX dialects or
traitement de texte ne sont pas utilisables par other word processors cannot be used by the
le secrétariat et sont fortement déconseillés. editorial board and are not encouraged.
Avant de saisir leur texte, les auteurs sont Before preparing their electronic manuscript,
invités à prendre connaissance du document the authors should read the Advice to au-
Recommandations aux auteurs disponible au thors, available on request from the editorial
secrétariat des publications de la SMF ou sur board of the SMF or from the web site of the
le serveur de la SMF. SMF.
Suite aux travaux de Faltings et Vojta démontrant les conjectures de
Mordell et Lang sur les variétés abéliennes et à ceux de Raynaud dé-
montrant la conjecture de Manin-Mumford, de nombreuses nouvelles
questions diophantiennes sont apparues, souvent décrites comme des
questions d’intersections exceptionnelles. L’arithmétique des espaces
de modules de variétés abéliennes et plus généralement des variétés
de Shimura a parallèlement fait l’objet de nombreux travaux, dont
un axe est constitué par la conjecture d’André-Oort.
Ces deux thèmes peuvent être placés dans un même cadre –
la conjecture de Zilber-Pink. Ce volume propose une introduction
à ces problèmes et aux techniques variées, qui sont employées :
géométrie, théorie des hauteurs, groupes réductifs et théorie de
Hodge, variétés de Shimura, théorie des modèles à travers la notion de
structures o-minimales. Il contient les textes correspondant aux cours
donnés au CIRM, en mai 2011, par Philipp Habegger, Gaël Rémond,
Thomas Scanlon, Emmanuel Ullmo et Andrei Yafaev et une ample
introduction rédigée par E. Ullmo, axée sur la notion de bi-algébricité,
visant à présenter le cadre général.

Société Mathématique de France

Vous aimerez peut-être aussi