Vous êtes sur la page 1sur 72

UNIVERSITÉ PAUL SABATIER TOULOUSE III

L E T HÉORÈME DES N OMBRES P REMIERS

MÉMOIRE

présenté en exigence partielle


en vue de l’obtention du diplôme de

Maîtrise de Mathématiques

par

Olivier RODRIGUEZ
sous la direction de

Patrice L ASSÈRE

Juin 2004
À Linda.

Il apparut que, entre deux vérités du domaine réel, le chemin le plus


facile et le plus court passe bien souvent par le domaine complexe.
Jacques Hadamard (1865–1963)
R EMERCIEMENTS

Nous tenons d’abord à remercier Patrice Lassère pour son aide, ses conseils et
sa disponibilité.

Nous souhaitons également remercier Françoise Jadot de nous avoir fourni de


précieuses références bibliographiques, ainsi que Sébastien Pinel et Diana Doro-
bantu pour certaines explications à propos de résultats d’Analyse complexe.

Enfin, nous aimerions exprimer notre gratitude particulière envers Linda Lu-
quot pour son soutien, son aide concernant la mise en page sous LATEX et la patience
dont elle a su faire preuve durant la relecture de ce mémoire.

4
TABLE DES MATIÈRES

Résumé 8

Notations et conventions générales 10

1 Introduction 12

2 Le théorème des nombres premiers et la transformation de Fourier 15


2.1 Prérequis et notations . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 L’expression de ζ comme produit eulérien et ses conséquences . . 17
2.2.1 Le développement de ζ en produit eulérien . . . . . . . . 17
2.2.2 La série de Dirichlet ζP (s) . . . . . . . . . . . . . . . . . 18
2.3 La fonction ` comme transformée de Fourier de la mesure µ . . . 22
2.3.1 La mesure µ . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.2 Transformée de Fourier de µ au sens des distributions . . . 24
2.3.3 La fonction x 7→ e−x π(ex ) comme transformée de Fourier 26
2.4 Régularité de la fonction ζP sur 1 + i R . . . . . . . . . . . . . . 28
2.4.1 Fonctions de type positif . . . . . . . . . . . . . . . . . . 28
2.4.2 Démonstration du théorème 2.4.1 . . . . . . . . . . . . . 29
2.5 Fin de la démonstration . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1 Une version «lissée» du théorème des nombres premiers . 32
2.5.2 Du théorème des nombres premiers «lissé» au théorème
des nombres premiers . . . . . . . . . . . . . . . . . . . 34

3 Une seconde preuve du


théorème des nombres premiers 37
3.1 Convolution des fonctions arithmétiques . . . . . . . . . . . . . . 37
3.2 La fonction de Möbius . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 La fonction de von Mangoldt et les théorèmes de Tchébychev . . 42
3.4 La démonstration de Newman revisitée . . . . . . . . . . . . . . . 45
3.4.1 Le théorème de Landau . . . . . . . . . . . . . . . . . . . 46
3.4.2 Fin de la preuve de Newman . . . . . . . . . . . . . . . . 49

6
4 Démonstrations, variantes et conséquences du théorème
des nombres premiers 53
4.1 Reformulations et conséquences du
théorème des nombres premiers . . . . . . . . . . . . . . . . . . 54
4.2 Zéros de ζ, singularités de ζP et distribution des nombres premiers 57

5 L’hypothèse de Riemann 61

Conclusion 66

Annexe : factorisation des fonctions analytiques 68

Références 71
R ÉSUMÉ

Nous présentons dans ce travail quelques notions de base de la théorie analy-


tique des nombres à travers une étude détaillée du théorème des nombres premiers.

Le premier chapitre constitue un bref historique des travaux réalisés sur ce


résultat riche d’implications et d’applications, conjecturé dès la fin du dix-huitième
siècle, et dont la démonstration ne fut livrée que plus d’un siècle plus tard par
Jacques Hadamard (1865–1963) et Charles de La Vallée-Poussin (1866–1962).
Le second chapitre expose une preuve «moderne» du théorème des nombres
premiers. Les idées qui sont mises à l’oeuvre ici ont germé dès les années 1930,
mais c’est la théorie des distributions de Laurent Schwartz (1915–2002) et Ser-
gueï Lvovitch Sobolev (1908–1989) qui confère à cette démonstration toute son
élégance. Cette preuve, à l’instar de quasiment toutes celles qui furent élaborées
depuis plus d’un siècle, a pour point de départ la propriété cruciale de l’expression
de la fonction ζ de Riemann comme produit eulérien. Comme les démonstrations
originales de Hadamard et de La Vallée-Poussin, elle fait usage du prolongement
méromorphe de ζ sur un voisinage du demi-plan fermé {<e(s) ≥ 1}. Elle fait de
plus appel à quelques notions fondamentales sur la transformation de Fourier et les
distributions tempérées, ce qui la rend moins élémentaire mais aussi plus concep-
tuelle. La non-annulation de ζ sur la droite {<e(s) = 1} y apparaît notamment
comme une conséquence naturelle des propriétés des transformées de Fourier des
mesures positives.

Le troisième chapitre a pour objet de prouver le théorème des nombres pre-


miers à travers une brève exploration du paysage actuel de la théorie analytique
des nombres. On commence par présenter quelques propriétés des fonctions arith-
métiques et multiplicatives. La notion de convolution des fonctions arithmétiques,
due à Dirichlet, consitue un cadre adéquat qui permet d’établir aisément le théo-
rème d’inversion de Möbius. On démontre ensuite les théorèmes de Tchébychev,
qui fournissent une première estimation du nombre de nombres premiers inférieurs
à un réel donné, à l’aide d’une forme faible de la formule de Stirling et de la fonc-
tion sommatoire de la fonction de von Mangoldt. Les liens étroits qui existent entre
cette dernière et la fonction de Möbius sont établis grâce au théorème de Landau.
Un théorème de convergence concernant les séries de Dirichlet dû à Ingham, suivi
d’un corollaire attribué à Landau, permettent d’achever la démonstration du théo-

8
rème des nombres premiers.
Dans le quatrième chapitre, nous présentons différentes formes équivalentes et
conséquences du théorème des nombres premiers. Par ailleurs, les propriétés ana-
lytiques de la fonction ζ apparaissent ici comme une conséquence du théorème de
Hadamard et de la Vallée-Poussin.

Le cinquième chapitre met davantage en évidence les liens étroits entre la


distribution des nombres premiers et la localisation des zéros de ζ dans le plan
complexe. La démonstration des résultats qui sont présentés ici dépasse largement
l’objectif de cet exposé. Nous aborderons notamment l’hypothèse de Riemann et
sa généralisation, qui se présentent aujourd’hui comme les problèmes ouverts les
plus importants en Mathématiques.
N OTATIONS ET CONVENTIONS GÉNÉRALES

Nous rassemblons ici les principales notations et conventions utilisées dans


l’ensemble de cet exposé. Celles qui n’apparaissent que dans un chapitre ou une
section sont définies localement.

1. La lettre N désigne l’ensemble des entiers naturels {1, 2, . . .} et P celui des


nombres premiers. Les ensembles des entiers relatifs, des nombres réels et
des nombres complexes sont désignés respectivement par Z, R, et C.
2. La lettre p, avec ou sans indice, désigne toujours un élément de P. On note
p1 , p2 , p3 , . . . , pn , . . . la suite croissante des nombres premiers.

Dans la suite, si F (p) désigne une expression dépendant d’un nombre pre-
mier pn , on écrira souvent
X Y
F (p)( resp. F (p))
p∈P p∈P

pour la série (resp. le produit infini)


+∞
X +∞
Y
F (pn )( resp. F (pn )).
n=1 n=1

3. On écrit a|b pour signifer que a divise b. La décomposition canonique d’un


entier n en produit de nombres premiers, unique à l’ordre des facteurs près,
est notée
k
ν
Y
n= pj j
j=1

où les pj sont des nombres premiers et les νj des entiers.


4. Le logarithme népérien est noté log. Les itérés log log, log log log, etc., sont
notés log2 , log3 , etc. La constante d’Euler γ est définie comme la limite
 
X 1
γ = lim  − log N  .
N →+∞ n
n≤N

10
On a γ ≈ 0, 577215664. Cependant nous suivrons l’usage traditionnel (no-
tamment dans le chapitre 5) qui consiste à désigner également par γ la partie
imaginaire d’un zéro non trivial de la fonction ζ de Riemann.
5. La partie entière et la partie fractionnaire d’un nombre réel x sont notées
respectivement [x] et {x}.
6. Le signe d’affectation := indique que le membre de gauche d’une égalité est
défini par le membre de droite.
7. La fonction logarithme intégral est définie par
Z x
dt
li(x) = dt ∀x ≥ 2.
2 log t

8. Étant données des fonctions f et g d’une variable réelle ou complexe, nous


employons indifféremment la notation de Landau f = O(g) ou celle de
Vinogradov f  g pour signifier qu’il existe une constante positive C telle
que |f | ≤ Cg dans le domaine de définition commun à f et g. Lorsque la
constante C dépend d’un paramètre α, on notera f = Oα (g) ou f α g. La
notation de Landau f = o(g) est utilisée dans le sens habituel de lim f /g =
0. (i)

(i). Ainsi, O(1) désigne une quantité bornée et o(1) une quantité qui tend vers 0.
C HAPITRE 1

I NTRODUCTION

L’histoire de l’étude de la distribution des nombres premiers commence il y a


près de vingt-trois siècles par un premier résultat dû à Euclide.

Théorème 1.0.1 (Euclide). — Il existe une infinité de nombres premiers.

Démonstration. Soient p1 , p2 , . . . , pn des nombres premiers, posons


n
Y
Pn = pi et Nn = Pn + 1
i=1

et soit pn+1 le plus petit facteur premier de la décomposition de Nn . Alors pn+1


est un nombre premier ≤ Nn et distinct des p1 , p2 , . . . , pn . Ainsi (pk )k>1 est une
suite infinie de nombres premiers distincts.

Il existe plusieurs autres démonstrations de ce théorème, dues notamment à Eu-


ler (1737), Polya (1920) et Erdös (1938). Aucune n’est plus simple que celle d’Eu-
clide. Celle d’Euler (i) a le mérite de montrer, pour la première fois, que l’Analyse
permet de démontrer des résultats sur des nombres entiers. Cette première incur-
sion de l’Analyse dans l’Arithmétique se mua au XIXe siècle en une véritable
invasion pour créer la branche des mathématiques que l’on appelle aujourd’hui la
Théorie Analytique des Nombres.

Par ailleurs, les mathématiciens s’intéressent depuis longtemps aux questions


suivantes :
– La répartition des nombres premiers dans la suite des naturels est-elle régu-
lière ?
– Présente-t-elle des particularités intéressantes ?
(i). Euler établit le théorème d’Euclide sous une forme forte :
X 1
≥ log2 x − log 2, ∀x ≥ 2,
p
p∈P
p≤x

autrement dit : la série des inverses des nombres premiers diverge.

12
Ils sont arrivés à la conclusion que cette répartition était plutôt anarchique et que
globalement, la proportion des nombres premiers va en décroissant.

Soit P l’ensemble des nombres premiers, et pour tout x ∈ R, soit


X
π(x) = #{p ∈ P : p ≤ x} = 1
p∈P
p≤x

le nombre de nombres premiers inférieurs ou égaux à x. Gauss (1792) puis Le-


gendre (1798, 1808) conjecturent que l’on a, lorsque x → +∞ :
x
π(x) ∼ .
log x
En 1852, Thébychev établit une forme faible de cette conjecture par des moyens
élémentaires :
x x
∃A, B ∈ R, 0 < A < 1 < B : ∀x ≥ 2, A < π(x) < B .
log x log x
Numériquement, le résultat constitue un argument très convaincant en faveur de
la conjecture de Gauss-Legendre : pour x suffisamment grand, on peut choisir
A = 0, 921 et B = 1, 106.

Dès 1737, Euler avait fait usage de la fonction ζ, comme fonction de la variable
réelle, pour étudier la suite des nombres premiers. On rappelle que cette fonction
est définie sur le demi-plan ouvert {<e(s) > 1} par l’expression
+∞
X 1
(1.0.1) ζ(s) = .
ns
n=1

Le lien entre les propriétés analytiques de la fonction ζ et la répartition des nombres


premiers est établi par l’expression de ζ(s) comme produit eulérien :
Y 1 −1

ζ(s) = 1− s , ∀s ∈ {<e(s) > 1}.
p
p∈P

Cette identité montre en outre que ζ(s) ne s’annule pas sur le demi-plan {<e(s) >
1}.
Riemann exploite l’idée géniale de prolonger la fonction ζ en une fonction de
la variable complexe, ce qui permet de donner un sens à ζ(s) même hors du do-
maine de convergence de la série. Il établit en 1859 l’existence d’un prolongement
méromorphe à tout le plan complexe de la fonction ζ dont l’étude se prête re-
marquablement bien à la déduction de renseignements concernant π(x). Dans son
article «Über die Anzahl der Primzahlen unter einer gegebenen Grösse» (ii) , Rie-
mann met en évidence – quoique de manière largement conjecturale – le lien étroit
(ii). «Sur le nombre de nombres premiers inférieurs à une grandeur donnée».
entre la distribution des nombres premiers et les zéros de ζ dans le plan complexe.

Enfin, en 1896, le Français Jacques Hadamard et le Belge Charles de La Vallée-


Poussin, s’appuyant l’un et l’autre sur les travaux de Riemann, démontrent indé-
pendamment la conjecture de Gauss-Legendre :

Théorème 1.0.2 (Théorème des Nombres Premiers). — Lorsque x → +∞, on a :


x
(1.0.2) π(x) ∼ .
log(x)

Un point essentiel de la démonstration de Hadamard et de La Vallée-Poussin


est que le prolongement méromorphe de la fonction ζ de Riemann admet 1 comme
unique pôle et ne s’annule pas sur la droite {<e(s) = 1}. C’est cet argument
capital qui sera établi et exploité dans la première preuve que nous présentons au
chapitre suivant.
C HAPITRE 2

L E THÉORÈME DES NOMBRES PREMIERS ET


LA TRANSFORMATION DE F OURIER

Ce chapitre est consacré à la démonstration du théorème des nombres premiers


suivant un schéma dû à J.-P. Kahane [Kah96, Kah97] (d’après [Bos03]).

2.1. Prérequis et notations

On appelle série de Dirichlet une série dépendant d’une variable complexe s,


de la forme

X an
(2.1.1) ,
ns
n=1

où les coefficients an sont des nombres complexes. On vérifie aussitôt que, si la


série (2.1.1) converge absolument pour une valeur s = s0 , alors elle converge
normalement sur le demi-plan {<e(s) ≥ <e(s0 )} et définit ainsi une fonction ho-
lomorphe sur le demi-plan ouvert {<e(s) > <e(s0 )}. L’abscisse de convergence
absolue σ de la série de Dirichlet (2.1.1) est par définition la borne inférieure des
réels re(s) où s est tel que la série définie par (2.1.1) converge absolument ; celle-ci
définit alors une fonction holomorphe sur le demi-plan {<e(s) > σ}.

Rappelons quelques résultats concernantQles produits infinis : soit (un ) une


suite de
Q∞nombres complexes, on pose Pn = nk=0 (1 + uk ). On dit que le produit
infini n=0 (1 + un ) est convergent et de produit P si la suite (Pn ) des produits
partiels converge vers P .

Théorème
P+∞ 2.1.1. — Soit (un ) une suite de nombres complexes. On suppose que
n=0 |un | < ∞, alors :
1. le produit infini +∞
Q
n=0 (1 + un ) est convergent. On dit que le produit infini
est absolument convergent ;
2. soit P = +∞
Q
n=0 (1 + un ) un produit absolument convergent de nombres
complexes, alors P est nul si, et seulement si, l’un des facteurs 1+un est nul.

15
Q+∞ −1
En outre, si 1 + un est non nul pour tout n, le produit infini n=0 (1 + un )
est absolument convergent et

+∞ +∞
!−1
Y Y
−1
(1 + un ) = (1 + un ) .
n=0 n=0

On pourra trouver une démonstration de ces résultats dans l’ouvrage [Wag03].

L’espace vectoriel des fonctions de classe C ∞ à support compact sur R sera


noté D(R) ; l’espace de Schwartz des fonctions à décroissance rapide sur R sera
noté S (R).

La transformée de Fourier d’une distribution tempérée T ∈ S (R) sera notée


F T ou Tb. Elle est définie par :

hTb, ϕi = hT, ϕi
b ∀ϕ ∈ S (R).

Lorsque T appartient à L1 (R), c’est la fonction continue définie sur R par


Z +∞
T (t) = F T (t) =
b e−2πixt T (x)dx.
−∞

On utilisera le résultat suivant.

Proposition 2.1.2 (Lemme de Riemann-Lebesgue). — Soit f ∈ L1 (R), alors


Z +∞
lim e−2πixt f (x)dx = 0.
t→+∞ −∞

La prochaine section est consacrée à la démonstration de l’expression de ζ(s)


comme produit eulérien et à ses premières conséquences. Cette expression permet
notamment d’étudier le comportement de la série de Dirichlet
X 1
ζP (s) :=
ps
p∈P

a priori définie et holomorphe sur le demi-plan <e(s) > 1, lorsque <e(s) tend vers
1+ . Si l’on pose
Z = {t ∈ R∗ : ζ(1 + it) = 0},
on obtient ainsi que la limite

ζP (1 + it) := lim ζP (1 + ε + it)


ε→0+

existe pour tout t ∈ R \({0} ∪ Z) et définit une fonction localement sommable sur
R – en fait, une fonction de classe C ∞ sur R \{0} ∪ Z qui admet des singularités
logarithmiques aux points de {0} ∪ Z.

Dans la section 2.3, on montre que la fonction


t 7→ `(t) := ζP (1 + 2πit)
est la transformée de Fourier de la distribution tempérée associée à la mesure
X 1
µ := δlog p ,
p
p∈P

puis que t 7→ (1 + 2πit)−1 `(t) est la transformée de Fourier de la distribution


tempérée associée à la fonction bornée x 7→ e−x π(ex ). Autrement dit, pour toute
fonction ϕ ∈ D(R), on a :
Z +∞ X 1
(2.1.2) ζP (1 + 2πit)ϕ(t)dt = ϕ(log
b p)
−∞ p
p∈P

et
+∞ +∞
π(ex )
Z Z
`(t)
(2.1.3) ϕ(t)dt = ϕ(x) dx.
ex
b
−∞ 1 + 2πit −∞

En appliquant l’identité (2.1.2) à des fonctions ϕ telles que ϕb ≥ 0, on démontre


dans la section 2.4 que l’ensemble Z des zéros de ζ sur la droite {<e(s) = 1} est
vide et donc que la fonction t 7→ `(t) − log 1/it est de classe C ∞ sur R. Dans la
section 2.5, on en déduit le théorème des nombres premiers en appliquant (2.1.3)
à des fonctions ϕy de la forme t 7→ e2πity ϕ(t) – ainsi ϕ b − y) – puis en
by (x)ϕ(x
faisant tendre y vers l’infini.

2.2. L’expression de ζ comme produit eulérien et ses conséquences

2.2.1. Le développement de ζ en produit eulérien


Le résultat suivant, dû à Euler, peut s’interpréter comme une traduction ana-
lytique du fait que tout entier > 0 s’écrit de manière unique comme produit de
puissances de nombres premiers.
Théorème 2.2.1. — Pour tout s ∈ C tel que <e(s) > 1, on a :
Y 1 −1

(2.2.1) ζ(s) = 1− s .
p
p∈P

Ce produit infini est bien convergent car


X 1 X 1 +∞
X 1
=
ps <e(s)
≤ <e(s)
< ∞,
p∈P p∈P
p n=1
n

puisque <e(s) > 1. La convergence est clairement uniforme sur tout demi-plan
<e(s) ≥ η si η > 1.
Démonstration. Soit s ∈ C tel que <e(s) > 1. Pour tout p ∈ P, on a le dévelop-
pement en série absolument convergente :
+∞
1 −1 X 1
 
1− s = .
p pks
n=1

Il en découle que
Y −1
1 X 1
1− s = ,
p ns
p∈P n∈E (N )
p≤N

où E (N ) est l’ensemble des entiers > 0 dont les diviseurs premiers sont ≤ N .
Comme on a
E (N ) ⊃ {1, . . . , N },
il vient alors


−1 +∞ 1
  X X 1

ζ(s) −
Y 1
1− s =
s

s
p
n=1 n n
p∈P n∈E (N )
p≤N


+∞ 1
X X 1 X 1
≤ s
− =
n=1 n ns ns

n≤N n>N

X 1 X 1
≤ =
ns .
n>N n>N
n<e(s)

L’expression (2.2.1) s’obtient alors en faisant tendre N vers +∞.

2.2.2. La série de Dirichlet ζP (s)


On considère la série de Dirichlet
X 1
ζP (s) := .
ps
p∈P

Son abscisse de convergence absolue est clairement ≤ 1, elle définit donc une
fonction holomorphe sur le demi-plan ouvert {<e(s) > 1}. Nous allons étudier
les propriétés du prolongement de ζP au demi-plan fermé {<e(s) ≥ 1}, sur les-
quelles va reposer la démonstration du théorème des nombres premiers. Pour ce
faire, nous nous appuierons sur le corollaire suivant de l’expression de ζ comme
produit eulérien.
Proposition 2.2.2. — Pour tout s ∈ {<e(s) > 1}, on pose
(2.2.2) g(s) = log ζ(s) − ζP (s).
La fonction g se prolonge en une fonction holomorphe sur le demi-plan {<e(s) >
1
2 }, bornée sur le demi-plan {<e(s) > ρ} pour tout ρ > 1/2.
Démonstration. Le développement eulérien de ζ(s) montre que, pour tout s ∈
{<e(s) > 1},
X 
1

1

(2.2.3) g(s) = − log 1 − s − s .
p p
p∈P

Soit p ∈ P, soit s ∈ C tel que <e(s) > 0, alors 1/ps ∈ D où D désigne le disque
unité ouvert de C. On note log la détermination principale du logarithme sur le
disque ouvert D(1; 1), nous allons montrer que la somme du membre de droite de
(2.2.3) converge pour tout s tel que <e(s) > 1/2, normalement sur chaque demi-
plan {<e(s) ≥ ρ} pour tout réel ρ > 1/2, ce qui établira la proposition.

Soit ρ ∈]1/2; +inf ty[, il existe une constante C(ρ) ∈ R∗+ ne dépendant que
de ρ telle que :
∀u ∈ C, |u| ≤ 2−ρ ⇒ | log(1 − u) + u| ≤ C(ρ)|u|2 .
En effet, la fonction u 7→ log(1 − u) + u est holomorphe dans D, nulle ainsi que
sa dérivée en 0.

Pour tout s ∈ C tel que <e(s) ≥ ρ et tout p ∈ P, il vient :



1
≤ 1 ≤ 1
ps pρ 2ρ
et donc  
1 1
+ s ≤ C(ρ)p−2ρ

log 1 −
p s p
ce qui prouve la convergence normale puisque 2ρ > 1 et donc
X
p−2ρ < ∞.
p ∈P

Ceci achève la démonstration.

Pour étudier ζP (s) dans le domaine complexe, on utilise l’existence d’un pro-
longement méromorphe de la fonction ζ. Une version plus forte du résultat suivant
est citée en annexe (théorème 5.1.1), nous nous contenterons d’établir l’énoncé
élémentaire suivant :
Théorème 2.2.3. — La fonction ζ se prolonge en une fonction méromorphe dans
{<e(s) > 0}, holomorphe en-dehors de 1, et admettant un unique pôle en s = 1 ;
ce pôle est simple et le résidu correspondant est 1.
Autrement dit, la fonction
1
s 7→ ζ(s) −
s−1
a priori définie et holomorphe sur le demi-plan {<e(s) > 1}, admet un prolonge-
ment holomorphe sur le demi-plan {<e(s) > 0}.
P+∞ −s
Démonstration. Soit s ∈ C tel que <e(s) > 1. Pour étudier la somme n=1 n
définissant ζ(s), on considère l’intégrale
Z +∞
x−s dx.
1

On a d’une part :
+∞ +∞
x1−s
Z 
−s 1
x dx = = ,
1 1−s 1 s−1
et d’autre part, on peut écrire :
+∞
X Z +∞ +∞ 
X Z n+1 
−s −s −s −s
n − x dx = n − x dx .
n=1 1 n=1 n

Ainsi, si l’on pose


Z n+1 Z n+1
−s −s
(2.2.4) ϕn (s) := n − x dx = (n−s − x−s )dx,
n n

on obtient :
+∞
1 X
ζ(s) − = ϕn (s).
s−1
n=1
Pour tout entier n ≥ 1, la formule (2.2.4) définit une fonction ϕn holomorphe dans
le demi-plan {<e(s) > 0} (en fait sur C tout entier). De plus, comme la dérivée de
t 7→ n−s − t−s est t 7→ s/ts+1 , elle satisfait sur ce demi-plan à
|s|
|ϕn (s)| ≤ sup |n−s − t−s | ≤
t∈[n;n+1] n<e(s)+1

d’après l’inégalité des accroissements finis. Par conséquent, la série +∞


P
n=1 ϕn (s)
converge normalement sur tout compact du demi-plan {<e(s) > 0} et y définit
une fonction holomorphe, ce qui achève la démonstration.

En particulier, ζ admet un prolongement méromorphe au voisinage de la droite


{<e(s) = 1} ; avec la proposition 2.2.2 on peut alors établir le résultat suivant :
Proposition 2.2.4. — Soit s0 ∈ C tel que <e(s0 ) = 1, soit n la valuation de ζ en
s0 , ainsi 
n = −1 si s0 = 1,

n=0 si s0 6= 1 et ζ(s0 ) 6= 0

n≥1 si s0 6= 1 et ζ(s0 ) = 0.

La fonction holomorphe sur {


re(s) > 1}
s 7→ ζP (s) − n log(s − s0 )
se prolonge en une fonction holomorphe sur un voisinage de s0 .
La notation log désigne ici la détermination principale du logarithme sur C \ R− .

Démonstration. Pour tout s tel que <e(s) > 1, on a :

exp(ζP (s) − n log(s − s0 )) = (s − s0 )−n exp ζP (s)


= (s − s0 )−n ζ(s) exp(−g(s))

Cette fonction se prolonge en une fonction holomorphe ne s’annulant pas sur un


voisinage ouvert de s0 . Sur un disque ouvert D(s0 ; r) de rayon r ∈ R∗+ suffisam-
ment petit, ce prolongement s’écrit exp ϕ(s), où ϕ est holomorphe dans D(s0 ; r) ;
en effet, la fonction exp : C → C∗ est surjective et localement biholomorphe.
Comme l’ouvert
{s ∈ D(s0 ; r) | <e(s) > 1}
est connexe, il existe n ∈ Z tel que sur cet ouvert

ζP (s) − n log(s − s0 ) = ϕ(s) + 2πin.

La fonction ϕ + 2πin constitue donc le prolongement holomorphe recherché.

La proposition 2.2.4 montre que si t ∈ R∗ est tel que ζ(1 + it) 6= 0, on peut
considérer la limite dans C :

ζP (1 + it) := lim ζP (1 + ε + t)
x→0+

ce qui permet aussi d’analyser la régularité locale de la fonction ansi définie, on a


alors le corollaire suivant.

Corollaire 2.2.5. — (i) La fonction t 7→ ζP (1 + it) est de classe C ∞ sur l’ou-


vert
R∗ \{t0 ∈ R∗ : ζ(1 + it0 ) = 0}.

(ii) Au voisinage de 0, la fonction


1
t 7→ ζP (1 + it) − log
it
se prolonge en une fonction de classe C ∞ .
(iii) Si ζ admet un zéro d’ordre n en 1 + it0 , t0 ∈ R∗ , alors
1
t 7→ ζP (1 + it) + n log
i(t − t0 )

se prolonge en une fonction de classe C ∞ au voisinage de t0 . En particulier,


t 7→ ζP (1 + it) est une fonction localement intégrable sur R.
2.3. La fonction ` comme transformée de Fourier de la mesure µ

2.3.1. La mesure µ
Pour analyser le lien entre la répartition des nombres premiers et les propriétés
des fonctions ζ et ζP sur la droite {<e(s) = 1}, on introduit la mesure positive sur
R X 1
µ := δlog p
p
p∈P
et sa transformée de Fourier. On a en effet :
Proposition 2.3.1. — (i) Pour tout ε > 0,
Z
x−1−ε dµ(x) < ∞.
R

(ii) Pour tout λ ∈ C tel que <e(λ) > 0, la fonction d’une variable réelle x 7→
e−λx est µ-intégrable et
Z
(2.3.1) e−λx dµ(x) = ζP (1 + λ).
R

(iii) Pour tout y ∈ R,


Z
(2.3.2) ex χ]−∞;y] (x)dµ(x) = π(ey ).
R

Démonstration. (i) On a
Z X 1
x−1−ε dµ(x) = (log p)−1−ε
R p
p∈P
+∞
X 1
≤ < ∞.
n(log n)1+ε
n=1

(ii) Pour tout λ ∈ R∗+ , il vient :


Z X 1
e−λx dµ(x) = e−λ log p
R p
p∈P
X 1
(2.3.3) =
p1+λ
p∈P

= ζP (1 + λ) < ∞,
d’où l’identité (2.3.1) lorsque λ est réel > 0. Puisque pour tout λ ∈ C et tout
x ∈ R, on a :
−λx
e = e−<e(λ)x ,
cela montre aussi que x 7→ e−λx est µ-intégrable lorsque <e(λ) > 0 ce qui
permet de conclure.
(iii) On a :
Z X 1
ex χ]−∞;y] (x)dµ(x) = elog p χ]−∞,y] (log p)
R p
p ∈P
X X
= χ]−∞;y] (log p) = 1
p ∈P p ∈P
p≤ey

= π(ey ).

Ceci achève la démonstration.

Soit ϕ : R → C une fonction continue. S’il existe ε > 0 tel que ϕ(x) =
O(x−1−ε ) lorsque x → +∞, alors il découle de (i) que ϕ est µ-intégrable. En
particulier, toute fonction ϕ ∈ S (R) est µ-intégrable, et la distribution définie par
la mesure µ Z
ψ ∈ D(R) 7→ hµ, ψi = ψ(x)dµ(x)
R
est tempérée, c’est-à-dire appartient à S 0 (R). Selon l’usage, cette distribution sera
encore notée µ.

D’après l’identité (2.3.1), la transformée de Fourier-Laplace de µ est la distri-


bution associée à la fonction λ 7→ ζP (1 + 2πλ) ; la transformée de Fourier de µ
est donc la distribution associée à la fonction t 7→ ζ(1 + 2πit).

On introduit la fonction définie sur R par


g : x ∈ R 7→ g(x) := ex χR− (x).
Grâce à l’identité (2.3.2), on observe (de manière heuristique) que le produit
de convolution g ? µ coïncide avec la fonction x 7→ e−x π(x). La transformée de
Fourier de g est la fonction gb définie par
Z +∞
gb(t) = F g(t) = e2πitx ex χR− (x)dx
−∞
Z 0
= e(1+2πit)x dx
−∞
1
= .
1 + 2πit

? µ = gb · µ
D’après la formule de transfert g[ b, cela signifierait intuitivement que
x 7→ e−x π(x) admet comme transformée de Fourier la fonction
ζP (1 + 2πit)
t 7→ .
(1 + 2πit)
Il s’agira dans la suite de cet exposé de donner une signification rigoureuse à
ces assertions au moyen de la théorie de la transformée de Fourier des distributions
tempérées.

2.3.2. Transformée de Fourier de µ au sens des distributions


L’objectif de ce paragraphe est d’établir le résultat suivant :

Proposition 2.3.2. — La distribution µ b, transformée de Fourier de µ, coïncide


avec la distribution associée à la fonction localement intégrable ` : R → C définie
par
`(t) = ζP (1 + 2πit).

Autrement dit,
Z X 1
(2.3.4) ∀ϕ ∈ D(R), ζP (1 + 2πit)ϕ(t)dt = ϕ(log
b p).
R p
p∈P

Démonstration. Pour tout ε > 0, on définit une mesure positive µε sur R


X 1
µε := δlog p
p1+ε
p∈P

et une fonction `ε : R → C

`ε (t) := ζP (1 + ε + 2πit).

La mesure µε est de masse totale finie p∈P p−1−ε et définit donc une distribu-
P
tion tempérée que l’on notera encore µε . Quant à `ε , c’est une fonction de classe
(k)
C ∞ et `ε est bornée sur R pour tout k ∈ N puisque la série de Dirichlet définis-
sant ζP est normalement convergente, ainsi que ses dérivées, sur chaque demi-plan
{<e(s) ≥ 1 + ε} avec ε > 0.

Le résultat découle immédiatement des lemmes suivants, démontrés plus bas.

Lemme 2.3.3. — Pour tout ε > 0, on a, au sens des distributions :

µ
cε = `ε .

Autrement dit,
Z
X 1
(2.3.5) ∀ϕ ∈ D(R), ϕ(log p) = ζP (1 + ε + 2πit)ϕ(t)dt.
p1+ε
b
p∈P R

Lemme 2.3.4. — Lorsque ε tend vers 0+ , µε tend vers µ dans S 0 (R).


Autrement dit,
Z Z
∀ψ ∈ S (R), lim ψ(x)dµε (x) = ψ(x)dµ(x),
ε→0+ R R

soit
X 1 X 1
(2.3.6) lim ψ(log p) = ψ(log p).
ε→0+ p1+ε p
p∈P p∈P

Lemme 2.3.5. — Lorsque ε tend vers 0+ , `ε tend vers ` dans D 0 (R).

Autrement dit,
Z Z
(2.3.7) ∀ϕ ∈ D(R), lim `ε (t)ϕ(t)dt = `(t)ϕ(t)dt.
ε→0+ R R

Démonstration du lemme 2.3.3. Ce lemme découle du théorème de Fubini. En ef-


fet, puisque
Z
ϕ(log
b p) = e−2πit log p ϕ(t)dt
ZR

= p−2πit ϕ(t)dt,
R

on a :
X 1 XZ
1+ε
ϕ(log
b p) = p−1−ε−2πit ϕ(t)dt
p R
p∈P p∈P
Z X
= p−1−ε−2πit ϕ(t)dt.
R p∈P

P R
La permutation des symboles et est légitime, vu que
XZ
p−1−ε−2πit ϕ(t)dt = ζP (1 + ε)kϕkL1 < ∞.

p∈P R

Démonstration du lemme 2.3.4. La série p∈P p−1−ε ψ(log p) converge unifor-


P
mément en ε, puisque ψ ∈ S (R) ⊂ L∞ (R).

Démonstration du lemme 2.3.5. On observe que pour tout s0 ∈ 1 + i R,


Z b
|log(1 + ε + it − s0 ) − log(1 + it − s0 )| dt
a
tend vers 0 lorsque ε > 0 tend vers 0 pour tout segment [a; b] ⊂ R. D’après la
proposition 2.2.4 qui donne la description locale de ζP , on déduit alors que
Z b Z b
|`ε (t) − `(t)| dt = |ζP (1 + ε + 2πit) − ζP (1 + 2πit)| dt
a a

tend vers 0 lorsque ε > 0 tend vers 0, d’où `ε tend vers ` dans L1loc (R), donc
dans D 0 (R) puisque L1loc (R) est dense dans D 0 (R) et que l’injection canonique est
continue.

2.3.3. La fonction x 7→ e−x π(ex ) comme transformée de Fourier


On souhaiterait appliquer la relation (2.3.4) à ϕ = fy ∈ D(R) telle que

(2.3.8) fby (x) = ex χ]−∞;y] (x),

de manière à obtenir, grâce à (2.3.2), pour tout y ∈ R :


X 1 Z
fy (log p) =
b ζP (1 + 2πit)fy (t)dt
p R
p∈P

= hb
µ, fy i = hµ, fby i
Z
= fby (t)dµ(t)
ZR
= et χ]−∞;y] dµ(t) = π(ey ).
R

Ce n’est pas possible sans précaution car on aurait alors


1
fy (t) = e(1+2πit)y ,
1 + 2πit
dont le support n’est pas compact. Si on applique la proposition 2.3.2 à fy , il vient
X 1
π(ey ) = fby (log p)
p
p∈P
Z
= `(t)fy (t)dt
R
Z
`(t)
= e(1+2πit)y dt,
R 1 + 2πit
d’où
Z
−y y `(t)
(2.3.9) e π(e ) = e2πity dt.
R 1 + 2πit
Dans ce qui suit, on s’appliquera à montrer que cette formule de transformation de
Fourier est en fait valide au sens des distributions.
Proposition 2.3.6. — La distribution définie par la fonction t 7→ (1 + 2πit)−1 `(t)
est tempérée et sa transformée de Fourier inverse est la distribution associée à la
fonction bornée x 7→ e−x π(ex ).
Autrement dit,
π(ex )
Z Z
`(t)
(2.3.10) ∀ϕ ∈ D(R), ϕ(t)dt = ϕ(x)dx.
ex
b
R 1 + 2πit R

Démonstration. Soit ϕ ∈ D(R), on pose


ϕ(t)
ϕ(t)
e = ,
1 + 2πit
e ∈ D(R). D’après ce qui précède, la transformée de Fourier inverse de
alors ϕ
t 7→ (1 + 2πit)−1 est la fonction fb0 définie sur R par fb0 (x) = ex χR− (x). D’après
la formule de transfert, on a donc :

ϕ(x)
be = fb0 (x) ? ϕ(x)
b
Z +∞
= fb0 (x − y)ϕ(y)dy
b
−∞
Z +∞
= ex e−y χR− (x − y)ϕ(y)dy
b
−∞
Z+∞
= ex e−y χ[x;+∞[ (y)ϕ(y)dy.
b
−∞

En appliquant l’identité (2.3.4) à ϕ,


e on obtient
Z X 1
ζP (1 + 2πit)ϕ(t)dt
e = ϕ(log
be p),
R p
p∈P

ce qui équivaut à
Z
`(t) X Z +∞
(2.3.11) ϕ(t)dt = e−y χ[log p;+∞[ ϕ(y)dy.
b
R (1 + 2πit) −∞p∈P

On a par ailleurs, par définition même de la fonction π :


X
∀y ∈ R, χ[log p;+∞[ (y) = π(ey ).
p∈P

Il vient alors
Z +∞ X Z +∞
−y
e−y π(ey ) |ϕ(y)|

e χ[log p,+∞[ (y)ϕ(y)
b dy = b dy
−∞ p∈P −∞
Z +∞
≤ |ϕ(y)|
b dy < ∞,
−∞
b ∈ L1 (R). On peut donc permuter les symboles
P R
puisque ϕ et dans le membre
de droite de (2.3.11), on obtient ainsi :

π(ey )
Z Z
`(t)
ϕ(t)dt = y
ϕ(y)dy,
b
R (1 + 2πit) R e

d’où le résultat.

La décroissance à l’infini de la transformée de Fourier d’une distribution tem-


pérée est contrôlée par sa régularité locale : il est donc nécessaire d’étudier la ré-
gularité locale de ` pour déterminer le comportement asymptotique de π ; ceci fait
l’objet de la section suivante.

2.4. Régularité de la fonction ζP sur 1 + i R

Nous allons nous employer ici à démontrer le résultat suivant :

Théorème 2.4.1. — La fonction ζ de Riemann n’admet aucun zéro sur la droite


{<e(s) = 1}.

D’après le corollaire 2.2.5, ceci revient à dire que la distribution asssociée à la


fonction t 7→ `(t) − log 1/it est de classe C ∞ sur R. Pour démontrer ce résultat,
nous nous appuierons sur le corollaire de la proposition 2.3.2 suivant.

Corollaire 2.4.2. — Pour toute ϕ ∈ D(R) telle que ϕ


b ≥ 0, on a
Z +∞
(2.4.1) `(t)ϕ(t)dt ≥ 0.
−∞

Démonstration. On a d’après la proposition 2.3.2


Z X 1
`(t)ϕ(t)dt = ϕ(log
b p).
R p
p∈P

Soit ϕ ∈ D(R) telle que ϕ b soit positive, puisque les nombres premiers sont tous
positifs, le terme général de la série du membre de droite de (2.4.1) est positif, d’où
le résultat.

2.4.1. Fonctions de type positif


Pour la suite, il est utile de rappeler trois types de construction de fonctions
ϕ ∈ D(R) telles que ϕ b ≥ 0, qui sont fréquemment appelées fonctions de type
positif.
(i) Pour tout ρ ∈ D(R), posons

ρe(x) = ρ(−x).
On a alors ρe ∈ D(R) et
ρe(x) = ρ(x),
b d

et donc ρ ? ρe ∈ D(R) et

ρ(x)|2 ≥ 0.
? ρe(x) = |b
ρd

(ii) Soit (ai )1≤i≤N ∈ RN et (αi )1≤≤N ∈ CN . Posons


N
X N
X
T = αk δak et Te = αk δ−ak .
k=1 k=1

Il vient alors X
T ? Te = αk αk δak −a`
1≤k,`≤N
et 2
XN
\ −2iπa x
(T ? Te) = αk e k
≥ 0,


k=1
donc si ρ : R → C est de classe C∞ à support compact et de type positif, il
en est de même pour
X
(T ? Te) ? ρ : x 7→ αk αk ρ(x + a` − ak ).
1≤k,`≤N

En effet,  
\ \
(T ? Te) ? ρ = T ? T · ρb
e

d’après la formule de transfert.


(iii) Si ϕ : R → C est de classe C ∞ à support compact et de type positif, il en est
de même pour
1 ·
ϕλ := ϕ
λ λ

pour tout λ ∈ R+ . En effet, ϕ
bλ (x) = ϕ(λx).
b

2.4.2. Démonstration du théorème 2.4.1


En considérant le corollaire 2.4.2 et les constructions (ii) et (iii) (avec αi = 1),
en peut en déduire le lemme suivant.

Lemme 2.4.3. — Pour toute ϕ ∈ D(R) telle que ϕ


b ≥ 0, tout N-uplet (ai )1≤i≤N ∈
RN et tout λ > 0, on a :
X Z +∞
(2.4.2) `(t + ak − a` )ϕλ (t)dt ≥ 0.
1≤k,`≤N −∞
Démonstration. Considérons la fonction ψ := (T ? Te) ? ϕλ . D’après les construc-
tions précédentes, elle est de type positif donc en appliquant le corollaire 2.4.2, on
a Z +∞
`(t)ψ(t)dt ≥ 0.
−∞
Or, par construction, on a
X X
ψ(x) = αk αk ϕλ (x + a` − ak ) = ϕλ (x + a` − ak ).
1≤k,`≤N 1≤k,`≤N
P R
La permutation des symboles et est permise (la somme étant finie), d’où
X Z +∞
`(t + ak − a` )ϕλ (t)dt ≥ 0.
1≤k,`≤N −∞

Ceci achève la démonstration.

Le comportement asymptotique, lorsque λ tend vers 0, de chacune des inté-


grales considérées dans le membre de gauche de (2.4.2) est déterminé par l’ordre
du zéro ou du pôle de ζ en 1 + i(ak − a` ), d’après le lemme suivant.
Lemme 2.4.4. — Soient a ∈ R et

n(a) = ω(ζ, 1 + ia)

l’ordre du zéro de ζ en 1 + ia. Pour tout ϕ ∈ D(R), on a, lorsque λ tend vers 0+ :


Z +∞ Z +∞
−1
`(t + a)ϕλ (t)dt = −n(a) log(λ ) ϕ(t)dt + O(1).
−∞ −∞

On rappelle que, par définition :



−1 si a = 0,

n(a) = 0 si a 6= 0 et ζ(1 + ia) 6= 0,

≥ 1 si a 6= 0 et ζ(1 + ia) = 0.

Démonstration. En appliquant les points (ii) et (iii) du corollaire 2.2.5, on déduit


qu’il existe ε > 0 tel que la fonction
1
t 7→ `(t) + n(a) log
i(t − a)

se prolonge en une fonction de classe C ∞ au voisinage ]a − ε; a + ε[. On note g


une telle fonction, considérons alors f telle que g = f |]a−ε;a+ε[ et qui prolonge g
en une fonction continue et bornée sur R. On obtient alors :
1
∀t ∈]a − ε, a + ε[, `(t) = −n(a) log + f (t − a).
i(t − a)
Pour λ ∈ R∗+ assez petit, le support de ϕλ est donc contenu dans ] − ε; ε[ d’où :
Z +∞ Z +∞  
1
`(t + a)ϕλ (t)dt = −n(a) log + f (t) ϕλ (t)dt
−∞ −∞ it
Z +∞  
1
= −n(a) log + f (λu) ϕ(u)du
−∞ iλu
Z +∞ Z +∞  
−1 1
= −n(a) log(λ ) ϕ(u)du + −n(a) log + f (λu) ϕ(u)du.
−∞ −∞ iu

Comme f et ϕ sont bornées, la dernière intégrale est donc bornée, indépendamment


de λ, par
Z +∞ Z +∞
1
|n(a)| · log ϕ(u) du + sup |f (t)| · |ϕ(u)|du.
−∞
iu
t∈R −∞

Ceci achève la démonstration.

Considérons maintenant une fonction de type positif ϕ ∈ D(R) – par exemple,


en utilisant la construction (i), il vient alors :
Z +∞
ϕ(t)dt > 0.
−∞

En utilisant les lemmes 2.4.3 et 2.4.4, lorsque λ tend vers 0 on a :


X Z +∞ X Z +∞
−1
`(t+ak −a` )ϕλ (t)dt = − n(ak −a` )·log(λ )· ϕ(t)dt+O(1),
1≤k,`≤N −∞ 1≤k,`≤N −∞

dont on déduit l’inégalité suivante :


X
(2.4.3) − n(ak − a` ) ≥ 0.
1≤k,`≤N

Prenons par exemple N = 3 et (a1 , a2 , a3 ) = (−a, 0, a). Comme ζ(s) = ζ(s),


on a n(−t) = n(t) pour tout t ∈ R ; alors, pour tout a > 0, on peut appliquer
l’inégalité précédente, dont on déduit

3n(0) + 4n(a) + 2n(2a) ≤ 0

et on on déduit de (2.4.2) que n(a) = 0.

Ce résultat, combiné au le corollaire 2.2.5, permet bien de conclure que la


distribution associée à la fonction t 7→ `(t) − log(1/it) est de classe C ∞ sur R, ce
qui était l’objet de cette section.
2.5. Fin de la démonstration

2.5.1. Une version «lissée» du théorème des nombres premiers


En appliquant l’identité (2.3.10) à la fonction t → e2πiyt ϕ(t) avec ϕ ∈ D(R),
dont la transformée de Fourier est x 7→ ψ(x − y) pour tout y ∈ R, on obtient ainsi
l’égalité suivante :
Z +∞ Z +∞
π(ex ) `(t)
(2.5.1) ψ(x − y) x dx = ϕ(t)e2πiyt dt.
−∞ e −∞ 1 + 2πit

Ceci va permettre d’introduire une version «lissée» du théorème des nombres pre-
miers.

Proposition 2.5.1. — Pour toute fonction ψ transformée de Fourier d’une fonction


de D(R), on a lorsque y tend vers +∞ :
Z +∞
π(ex ) 1 +∞
Z  
1
(2.5.2) ψ(x − y) x dx = ψ(x)dx + o .
−∞ e y −∞ y

On obtiendrait précisément le théorème des nombres premiers si l’on pouvait


prendre ψ = δ dans la proposition 2.5.1. Pour démontrer cette proposition, on dé-
terminera le comportement asymptotique du membre de droite de l’identité (2.5.1)
lorsque y → +∞. On fait appel au lemme suivant.

Lemme 2.5.2. — Pour toute f ∈ S (R), on a, lorsque y tend vers +∞ :


Z +∞    
1 2πiyt 1 1
(2.5.3) log f (t)e dt = f (0) + o .
−∞ it y y

Pour établir ce lemme, on commence par un calcul classique de transformée de


Fourier.

Lemme 2.5.3. — La transformée de Fourier inverse de la distribution tempérée


d
dt (log 1/it) est la distribution associée à la fonction 2πi · χR+ .

Démonstration. Dans S 0 (R), on a


   
1 1
log = lim log
it ε→0+ it + ε

et par conséquent
   
d 1 d 1
log = lim log
dt it ε→0+ dt it + ε
i 1
= lim =:
ε→0+ it + ε t + i0
Or on sait que pour tout η > 0,
Z +∞
1
F (χR+ (x)e−ηx )(t) = e−2πixt−ηx dx = .
−∞ 2πit + η

Il vient donc naturellement, en faisant tendre η vers 0 :


 
−1 1
F = 2πi · χR+ .
t − i0
Ceci permet de conclure.

Preuve du lemme 2.5.2. Ce lemme décrit le comportement à l’infini de la transfor-


mée de Fourier inverse de la fonction t 7→ log(1/it) f (t). Dans S 0 (R), on peut


écrire :
   
−1
  −1 d 1
2πiyF log(1/it) f (t) (y) = −F log f (t) (y)
dt it
     
−1 d 1 1 0
= −F log · f (t) + log f (t) (y).
dt it it

Comme t 7→ log(1/it) f 0 (t) appartient à L1 (C), le lemme de Riemann-Lebesgue




2.1.2 montre que

lim F −1 log(1/it) · f 0 (t) (y) = 0.


 
(2.5.4)
|y|→+∞

En outre, d’après le lemme 2.5.3,


      
−1 d 1 −1 d 1
F log · f (t) = F log ? F −1 f
dt it dt it
= 2πiχR+ ? F −1 f,

et par conséquent
    Z y
−1 d 1
lim F log · f (t) = lim 2πi F −1 f (x)dx
y→+∞ dt it y→+∞ −∞
Z +∞
= 2πi F −1 f (x)dx
−∞
= 2πif (0).

Dès lors, la relation (2.5.3) découle de l’égalité (2.5.4).

Preuve de la proposition 2.5.1. Le second membre de l’égalité (2.5.1) peut s’écrire


Z +∞   
1 ϕ(t) 2πiyt
`(t) − log e dt.
−∞ it 1 + 2πit
D’après le résultat fondamental du chapitre précédent, la première intégrale est la
transformée de Fourier d’une fonction de D(R), et définit donc une fonction de
S (R) qui est de plus o(1/y). D’après le lemme 2.5.2, la seconde intégrale vaut :

1 +∞
  Z  
1 1 1
ϕ(0) + o = ψ(x)dx + o .
y y y −∞ y

Ceci achève la démonstration de la proposition 2.5.1.

2.5.2. Du théorème des nombres premiers «lissé» au théorème des nombres


premiers
Nous allons construire des fonctions ψ qui sont des approximations de δ, aux-
quelles nous allons appliquer la proposition 2.5.1.

Soit ψ1 une fonction à valeurs positives, qui est la transformée de Fourier de


ϕ ∈ D(R), telle que Z +∞
ψ1 (t)dt = 1
−∞
(une telle fonction existe d’après la construction (i) du paragraphe 2.4.1). Posons,
pour tout λ ∈ R∗+ ,  
1 t
ψλ (t) = ψ1 .
λ λ
Ces fonctions vérifient bien les mêmes conditions que ψ1 . En prenant ε > 0, on
déduit Z Z
lim ψλ (t)dt = lim ψ1 (t)dt = 0
λ→0+ |t|≥ε λ→0+ |t|≥ελ−1
et Z Z
lim |t|ψλ (t)dt = lim |t|ψ1 (t)dt = 0.
λ→0+ |t|≥ε λ→0+ |t|≥ελ−1

En appliquant l’identité (2.5.2) à une telle fonction ψλ , on obtient que le premier


membre est minoré, pour tout ε > 0, par
Z y+ε
π(ex )
ψλ (x − y) x dx
y−ε e

et donc par :
y+ε ε
π(ey−ε ) π(ey−ε )
Z Z
ψλ (x − y)dx = ψλ (t)dt.
ey+ε y−ε ey+ε −ε

Pour tout ε > 0, il existe λ tel que


Z ε
ψλ (x)dx ≥ 1 − ε,
−ε
on obtient ainsi, lorsque y → +∞ :
π(ey−ε )
 
1 1
+o ≥ (1 − ε) y+ε .
y y e
Puisque ε > 0 est arbitraire, on en déduit
y
(2.5.5) lim sup π(ey ) ≤ 1.
y→+∞ ey
En particulier, on peut en déduire qu’il existe M > 0 tel que, pour tout x ≥ 0,
ex
(2.5.6) π(ex ) ≤ M .
x+1
De plus, pour tout ε > 0 et tout y > ε, d’après l’inégalité (2.5.6) et la majoration
π(ex ) ≤ ex , on en déduit
Z y−ε Z y+ε Z +∞  Z y−ε
π(ex ) M
+ + ψλ (x − y) x dx ≤ ψλ (y − x)dx
0 y−ε y+ε e 0 x+1
π(ey+ε ) y+ε
Z
+ y−ε ψλ (x − y)dx
e y−ε
Z +∞
M
+ ψλ (x − y)dx.
y+ε x + 1

Pour la majoration de la première des trois intégrales il est utile de remarquer que,
d’après la convexité de la fonction (x 7→ (x + 1)−1 ) :
1 y−x+1
∀x ∈ [0; y], ≤ ,
x+1 y+1
d’où Z y−ε Z −ε
M M
ψλ (x − y)dx ≤ (1 + |t|)ψλ (t)dt.
0 x+1 y+1 −∞
Par ailleurs, Z y+ε Z +∞
ψλ (x − y)dx ≤ ψλ (t)dt = 1,
y−ε −∞
et Z +∞ Z +∞
M M
ψλ (x − y)dx ≤ ψλ (t)dt.
y+ε x+1 y ε
Pour chaque ε > 0 fixé, il existe λ tel que
Z
(1 + |t|)ψλ (t)dt ≤ ε.
|t|≥ε

Ainsi on obtient, lorsque y tend vers +∞,


π(ey+ε ) M ε
 
1 1
+ ≥ +o
ey−ε y y y
et ε étant arbitrairement choisi, ceci implique
y
(2.5.7) lim inf π(ey ) ≥ 1.
y→+∞ ey
La conjonction de (2.5.5) et (2.5.7) permet de déduire
y
lim π(ey ) = 1,
y→+∞ ey

d’où
log x
lim π(x) = 1.
x→+∞ x
Ceci prouve la relation (1.0.2) et achève la démontration du théorème des nombres
premiers.
C HAPITRE 3

U NE SECONDE PREUVE DU
THÉORÈME DES NOMBRES PREMIERS

Nous exposons dans ce chapitre une preuve du théorème des nombres premiers
dont l’approche originale est due à E. Landau.

3.1. Convolution des fonctions arithmétiques

On appelle fonction arithmétique une suite à valeurs complexes f : N → C.


On munit l’ensemble des fonctions arithmétiques de l’opération de convolution
? : (f, g) 7→ f ? g, également appelée convolution de Dirichlet, définie par
X n
f ? g(n) = f (d)g ∀n ∈ N .
d
d|n

Cette opération correspond au produit ordinaire des séries de Dirichlet ; formelle-


ment, on a
+∞ +∞ +∞
X f ? g(n) X f (n) X g(n)
= ,
ns ns ns
n=1 n=1 n=1

et on vérifie que cette égalité formelle possède un sens analytique dès que les trois
séries sont absolument convergentes.

Remarque 3.1.1. — La fonction ζ de Riemann est la série de Dirichlet associée à


la fonction arithmétique 1 définie par

1(n) = 1 ∀n ≥ 1.

On définit la fonction τ par :


X
τ (n) = 1 ∗ 1(n) = 1.
d|n

Autrement dit, τ (n) est le nombre de diviseurs de l’entier n, soit le nombre de


décompositions de n sous la forme lm avec l, m ∈ N. La série de Dirichlet associée

37
à cette fonction arithmétique est
+∞ +∞ +∞
X τ (n) X 1 X 1
(3.1.1) = = ζ(s)2
ns ns ns
n=1 n=1 n=1

On vérifie que la fonction δ définie par


(
1 si n = 1,
δ(n) =
0 si n > 1

est un élément neutre pour la convolution et que l’ensemble des fonctions arith-
métiques muni de l’addition usuelle et du produit de convolution est un anneau
commutatif unitaire intègre. On peut aussi montrer que cet anneau est factoriel.

On appelle fonction multiplicative toute fonction arithmétique telle que


(
f (1) 6= 0,
f (mn) = f (m)f (n) si (m, n) = 1.

Les fonctions multiplicatives constituent un sous-groupe du groupe des éléments


inversibles pour la convolution. L’importance cruciale des fonctions multiplicatives
en théorie analytique des nombres provient essentiellement au résultat suivant.

Théorème 3.1.2. — Soit f : N → C une fonction multiplicative. On a l’équiva-


lence entre les conditions suivantes :
(i) la série de Dirichlet F (s) := +∞ −s est absolument convergente ;
P
n=1 f (n)n
(ii) la série
+∞
XX f (pν )
(3.1.2)
pνs
p∈P ν=1

est absolument convergente.


De plus, lorsque l’une ou l’autre de ces conditions est réalisée, on a le déve-
loppement en produit eulérien convergent suivant :
+∞ ν
YX p
F (s) = .
pνs
p∈P ν=0

Démonstration. On observe tout d’abord que la convergence de la somme double


(3.1.2), qui est une conséquence immédiate de celle de F (s), implique la conver-
gence du produit infini
+∞ !
Y X f (pν )
1+ pνs .

p∈P ν=1
Réciproquement, sous l’hypothèse que la série double (3.1.2) converge absolu-
ment, on peut écrire, pour x ≥ 1 :
X f (n) X f (n)

ns ns
n≤x P + (n)≤x
+∞ !
Y X f (pν )
= 1+
pνs

p≤x ν=1
+∞ !
Y X f (pν )
≤ 1+ pνs ,

p∈P ν=1

où P + (n) désigne le plus grand facteur premier dans la décomposition de l’entier


n. Ceci montre bien que la série F (s) est absolument convergente. La majoration

+∞ f (n) Y X +∞ ν
X X
f (p )
f (n)

s
− =
n=1 n
ps + ns
p≤x ν=0 P (n)>x
X f (n)

ns

n>x

implique alors, lorsque x → +∞, la formule du développement eulérien.

Le principe de l’hyperbole, dû à Dirichlet, est un procédé commode pour éva-


luer la fonction sommatoire d’un produit de convolution.

Théorème 3.1.3 (Principe de l’hyperbole). — Soient f, g deux fonctions arithmé-


tiques, de fonctions sommatoires respectives
X X
F (x) := f (n) et G(x) := g(n).
n≤x n≤x

On a pour 1 ≤ y ≤ x :
x x  
X X X x
(3.1.3) f ? g(n) = g(n)F + f (m)G −F G(y).
n m y
n≤x n≤y m≤x/y

Démonstration. Le membre de gauche de (3.1.3) s’écrit encore


X X X
f (m)g(d) = f (m)g(d) + f (m)g(d)
md≤x md≤x md≤x
d≤y d>y
X x X  x 
= g(d)F + f (m) G − G(y) ,
d m
d≤y m≤x/y

ce qui implique imméditement le résultat lorsqu’on développe le dernier terme.


L’application historique de cette méthode est la célèbre formule de Dirichlet :

Théorème 3.1.4 (Formule de Dirichlet). — On a


X √
(3.1.4) τ (n) = x(log x + 2γ − 1) + O( x).
n≤x

Démonstration. On applique le principe de l’hyperbole à y = x et f = g = 1
(donc F (x) = G(x) = [x]). Le membre de gauche de (3.1.4) vaut donc
X hxi √ X x √
2 − [ x]2 = 2 − x + O( x).
√ m √ m
m≤ x m≤ x

L’identité classique  
X 1 1
= log z + γ + O ,
m z
m≤z

appliquée à z = x permet de conclure.

3.2. La fonction de Möbius

On désigne par µ la fonction de Möbius, définie comme l’inverse de convolu-


tion de la fonction 1, c’est-à-dire 1 ? µ = δ, ou encore
(
X 1 si n = 1,
µ(d) =
d|n
0 si n > 1.

Son existence est garantie par le fait que les fonctions multiplicatives forment un
sous-groupe de l’ensemble des fonctions arithmétiques inversibles. La multiplica-
tivité permet, pour le calcul de cet inverse, de se restreindre aux puissances de
nombres premiers. La relation de convolution 1 ? µ = δ fournit alors de proche
en proche µ(p) = −1 et µ(pν ) = 0 pour ν Q ≥ 2. On a donc, pour un entier n
ν
quelconque de décomposition canonique n = kj=1 pj j :
(
(−1)k si νj = 1,
µ(n) =
0 si max1≤j≤k νj ≥ 2, 1 ≤ j ≤ k.

Remarque 3.2.1. — La relation de convolution δ = 1 ? µ se traduit en termes de


séries de Dirichlet de la manière suivante :
+∞ +∞
X δ(n) X 1 ? µ(n)
1= =
ns ns
n=1 n=1
+∞ +∞
X 1 X µ(n)
=
ns ns
n=1 n=1
d’où on déduit l’égalité formelle
+∞
1 X µ(n)
=
ζ(s) ns
n=1

lorsque ζ(s) ne s’annule pas.

On peut rassembler les propriétés algébriques de la fonction de Möbius dans


l’énoncé suivant.

Théorème 3.2.2 (Inversion de Möbius). — (a) Soient f, g : N → C deux fonc-


tions arithmétiques. Les deux propriétés suivantes sont équivalentes :
(i) X
g(n) = f (d) ∀n ≥ 1,
d|n

(ii)  
X d
f (n) = g(d)µ ∀n ≥ 1).
n
d|n

(b) Soient F, G : [1; +∞[→ C des fonctions complexes. Les deux conditions sui-
vantes sont équivalentes :
(i) X x
F (x) = G ∀x ≥ 1,
n
n≤x

(ii) X x
G(x) = F µ(n) ∀x ≥ 1.
n
n≤x

Démonstration. 1. Le point (a) exprime simplement l’équivalence des relations


g = f ? 1 et f = g ? µ.
2. On établit par exemple, l’implication (i) ⇒ (ii), la réciproque étant analogue.
Pour tout réel x ≥ 1, on a
X x X X  x 
µ(n)F = µ(n) G
n mn
n≤x n≤x m≤x/n
X  x X

= G µ(n).
k
k≤x mn=k

Par définition de µ, la somme intérieure vaut δ(k). Ceci implique bien (ii).
Remarque 3.2.3. — En appliquant le théorème 3.2.1 pour G(x) ≡ 1, on obtient
X hxi
µ(n) = 1 ∀x ≥ 1,
n
n≤x

ce qui montre que




X µ(n)
(3.2.1) sup
≤1
x∈R n≤x n

et suggère que +∞
P
n=0 µ(n)/n → 0 lorsque x → +∞. Nous verrons au paragraphe
3.4.1 que cette relation est en fait équivalente au théorème des nombres premiers.

3.3. La fonction de von Mangoldt et les théorèmes de Tchébychev

C’est à Tchébychev que sont dus les premiers résultats significatifs concernant
l’évaluation de π(x). Il utilise une forme faible de la formule de Stirling (i) :
X
(3.3.1) log n! = log m = n log n − n + O(log n) ∀n ≥ 2.
1≤m≤n

En effet, pour m ≥ 1, on a
Z m+1 Z m+1  
t
0≤ log tdt − log m = log dt
m m m
Z m+1  
t 1
≤ − 1 dt = .
m m 2m

La formule (3.3.1) découle directement de cette estimation, en sommant pour m =


1, 2, . . . , n−1 et en utilisant le fait qu’une primitive de t 7→ log t est t 7→ t log t−t.

L’idée de Tchébychev consiste à exploiter la décomposition de n! en produit


de facteurs premiers. Pour tout m ≥ 1, on peut écrire :
X
log m = log p
pν |m

où la somme est étendue à tous les couples (p, ν) tels que pν |m avec p premier et
ν ≥ 1. En remplaçant dans l’expression (3.3.1) et en intervertissant les somma-

(i). Démontrée en 1730 : lorsque n → +∞, on a n! ∼ nn e−n 2πn
tions, il vient
X
log n! = log m
1≤m≤n
X X
= log p 1
pν ≤n 1≤m≤n
pν |n
 
X n
= log p .

pν ≤n

On introduit alors la fonction de von Mangoldt, définie par


(
log p si ∃ν ≥ 1 : d = pν ,
Λ(d) =
0 sinon.

On vérifie que cette fonction satisfait à la relation de convolution Λ ? 1 = log. En


convolant par la fonction de Möbius µ, on obtient Λ = µ ? log. On peut également
vérifier que Λ = −(µ log) ? 1.
On déduit alors de ce qui précède la formule asymptotique
X hni
(3.3.2) Λ(d) = n log n − n + O(log n) ∀n ≥ 2.
d
d≤n

Notons B(n) le membre de gauche et posons B(x) = B([x]) pour tout x > 0. On
considère la fonction sommatoire de Λ,
X
ψ(x) = Λ(d).
d≤x

On souhaite établir un encadrement de ψ(x) grâce à l’estimation de B(x) : on verra


plus loin que cela permettra d’obtenir un encadrement de même qualité pour π(x).
Théorème 3.3.1 (Tchébychev). — On a, pour tout réel x ≥ 2 :

x log 2 + O(log x) ≤ ψ(x) ≤ x log 4 + O log x)2 .




Démonstration. On pose
hui
χ(u) = [u] − 2 (u > 0).
2
Alors χ est une fonction 2-périodique vérifiant
(
0 si 0 ≤ u < 1,
(3.3.3) χ(u) =
1 si 1 ≤ u < 2.

On peut évaluer de deux manières la quantité


x
B2 (x) := B(x) − 2B .
2
D’une part, on a d’après la formule (3.3.2) :
   
1 1 1
B2 (x) = x log x − x − 2 x log x − x + O(log x)
2 2 2
= x log 2 + O(log x),

et d’autre part : x


X
B2 (x) = Λ(d)χ .
d
d≤x

Compte tenu de la propriété (3.3.3) de χ, on déduit de cette dernière identité :


x
ψ(x) − ψ ≤ B2 (x) ≤ ψ(x)
2
d’où la minoration de ψ(x) :

ψ(x) ≥ x log 2 + O(log x) ∀x ≥ 2.

En utilisant la minoration de B2 (x) de manière inductive, on obtient


x x x
ψ(x) ≤ B2 (x) + ψ ≤ B2 (x) + B2 +ψ
2 2  4 
X x x 
≤ ... ≤ B2 j + ψ k+1
2 2
0≤j≤k

où k est un entier arbitraire. On choisit


 
log x
k = K(x) :=
log 2

de sorte que ψ x/2k+1 = 0. Il vient




 
X x log 2
ψ(x) ≤ + O(log x)
2j
0≤j≤K(x)

≤ 2x log 2 + O((log x)2 ).

Ceci achève la démonstration.

Comme annoncé, on peut alors déduire de ce résultat une information compa-


rable relative à π(x).

Corollaire 3.3.2. — Lorsque x → ∞, on a :


 x  x
log 2 + o(1) ≤ π(x) ≤ log 4 + o(1) .
log x log x
P
Démonstration. On a ψ(x) = pν ≤x log p, où la somme porte sur tous les couples
(p, ν) avec p premier et ν ≥ 1. Pour chaque p fixé, l’entier ν peut prendre exacte-
ment [log x/ log p] valeurs, donc
X  log x 
ψ(x) = log p.
log p
p≤x

Grâce à l’encadrement [u] ≤ u ≤ [u] + 1 pour u ≥ 1, il suit d’abord

ψ(x) ≤ π(x) log x ≤ 2ψ(x),

puis, en utilisant la majoration du théorème 3.3.1,


X 
log x
 
π(x) log x − ψ(x) = log x − log p
log p
p≤x
 
X X x
≤ log p + log
√ √ p
p≤ x x<p≤x

Z p
X dt
≤ ψ( x) +
√ x t
x<p≤x
Z x

 
π(t) x
= O( x) + √ dt = O
x t log x

d’où  
ψ(x) x
π(x) = +O .
log x (log x)2
Le théorème 3.3.1 permet de conclure.

Remarque 3.3.3. — Une autre conséquence du travail de Tchébychev, indiquée


par lui-même, est l’encadrement

π(x) π(x)
lim inf ≤ 1 ≤ lim sup ,
x→+∞ x/ log x x→+∞ x/ log x

autrement dit : si le rapport π(x) log x/x admet une limite lorsque x → +∞, cette
limite est 1.

3.4. La démonstration de Newman revisitée

Commençons par établir le résultat élémentaire suivant :

Lemme 3.4.1. — Soit (an )n ∈ N une suite de nombres complexes satisfaisant à


X 
an = E(t) + O R(t) , 1≤t≤x
n≤t
où E est une fonction de classe C 1 sur [1; x] et R : [1 ; x] → R+ est une fonction
monotone. Alors, pour toute fonction b : [1; x] → C continue et de classe C 1 par
morceaux, on a
X Z x
E 0 (t)b(t)dt + O R1 (x)

an b(n) =
n≤x 1

avec Z x
R1 (x) = |E(1)b(1)| + |R(x)b(x)| + |R(t)b0 (t)|dt.
1
P
Démonstration. On pose A(t) = n≤t an . Le membre de gauche vaut
X Z x Z x
0
b(x)A(x) − an b (t)dt = b(x)A(x) − A(t)b0 (t)dt.
n≤x n 1

Le résultat indiqué en découle immédiatement en remplaçant dans la dernière inté-


grale A(t) par E(t) + O R(t) et en intégrant par parties la contribution du terme
principal E(t).

3.4.1. Le théorème de Landau


Nous avons vu que la fonction de von Mangoldt Λ = µ ? log est fortement
liée à la fonction caractéristique des nombres premiers et possède une fonction
sommatoire X
ψ(x) = Λ(n)
n≤x

qui, d’après le corollaire 3.3.2, vérifie

(3.4.1) ψ(x) ∼ π(x) log(x) lorsque x → +∞.

Il est donc naturel de se demander si la valeur moyenne de la fonction de Möbius


µ(n) possède une interprétation simple dans le cadre de l’étude asymptotique des
fonctions π(x) et ψ(x). Le théorème suivant, établi par Landau en 1909, répond à
cette question.
Théorème 3.4.2 (Landau). — On a l’équivalence entre les assertions suivantes :
(i)
ψ(x) ∼ x lorsque x → +∞,
(ii) X
µ(n) = o(x) lorsque x → +∞,
n≤x

(iii)
+∞
X µ(n)
= 0.
n
n=1
Remarque 3.4.3. — L’assertion (i) est équivalente au théorème des nombres pre-
miers, c’est donc l’implication (ii) ⇒ (i) qui sera utilisée dans sa démonstration.
Démonstration du théorème de Landau. 1. (iii) ⇒ (ii). Supposons que
X µ(n)
m(x) := = o(1) lorsque x → +∞.
n
n≤x

En appliquant le lemme 3.4.1 à E(t) = 0 et R(t) = supy≥t |m(y)|, on


obtient Z x
X
µ(n)  xR(x) + R(t)dt = o(x).
n≤x 1

2. (ii) ⇒ (i). Notons X


M (x) = µ(n).
n≤x
On établit d’abord une identité de convolution pour la fonction Λ − 1, dont
on doit montrer qu’elle possède une fonction sommatoire qui est o(x). On a
Λ − 1 = (log −τ ) ? µ = (log −τ + 2γ1) ? µ − 2γδ
= f ? µ − 2γδ,
où la fonction f := log −τ + 2γ1 satisfait à
X √
(3.4.2) F (x) := f (n) = O( x),
n≤x

d’après la formule de Dirichlet (3.1.4) et l’identité classique


X
log n = x log x − x + O(1 + log x) ∀x ≥ 1.
n≤x

On va montrer que
X
H(x) := f ? µ(n) = o(x),
n≤x

en utilisant l’estimation (3.4.2) et le principe de l’hyperbole (théorème 3.1.2).


Soit y > 2 fixé, on peut écrire en effet :
x X x  
X x
H(x) = µ(n)F + f (m)M − F (y)M .
n m y
n≤x/y m≤y

Sous l’hypothèse (ii), il suit donc, pour y fixé,



H(x)
≤ lim sup 1
X  x 
lim sup
F
x x→+∞ x n

x→+∞
n≤x/y
r  
1 X x 1
 lim sup =O √ .
x→+∞ x n y
n≤x/y

Comme y peut être choisi arbitrairement grand, ceci implique bien H(x) =
o(x).
3. (i) ⇒ (iii). Il sera fait usage de la majoration


X µ(n)
≤1
n
n≤x

prouvée à la section 3.2. On remarque d’abord que la formule d’inversion de


Möbius µ ? 1 = δ implique
X µ(m)
= δ(n),
md
md=x

d’où, par sommation pour n ≤ x,


X µ(m) X 1
1= ∀x ≥ 1.
m d
m≤x d≤x/m

L’évaluation de la somme intérieure donne


X µ(m)   x   m 
1= log +γ+O
m m x
m≤x
= m(x)(log x + γ) − G(x) + O(1),

où l’on a posé
X µ(m) log(m)
G(x) := .
m
m≤x

Il suffit donc d’établir que l’on a

G(x) = o(log x) lorsque x → +∞.

À cette fin, on vérifie la relation de convolution

µ log = −Λ ? µ = (1 − Λ) ? µ − δ.

Posant X 
P (x) := [x] − ψ(x) = 1(n) − Λ(n) = o(x),
n≤x

on peut donc écrire


X  P (j) − P (j − 1)   
x
G(x) + 1 = m
j j
j≤x
 
X m(x/j) m(x/(j + 1))
= P (j) − + o(1)
j j+1
j≤x
X P (j)  1

x

= mj (x) + m + o(1),
j j+1 j+1
j≤x
avec mj (x) := m(x/j)−m(x/j+1). On se donne alors, pour chaque ε > 0,
un nombre entier j0 (ε) tel que |P (j)| ≤ εj pour j > j0 (ε). En utilisant la
majoration (3.2.1) et l’inégalité
X 1
|mj (x)| ≤ ,
n
x/(j+1)<n≤x/j

il vient
X |P (j)| X1
|G(x + 1)| ≤ 3 + 2ε + o(1),
j n
j≤j0 (ε) n≤x

d’où lim supx→+inf ty |G(x)|/ log x ≤ 2ε. Comme on peut choisir ε arbi-
trairement petit, cela montre bien que

G(x) = o(log x)

ce qui achève la démonstration du théorème.

3.4.2. Fin de la preuve de Newman


La preuve du théorème des nombres premiers telle qu’elle est présentée dans
[New98] nécessite d’établir au préalable l’énoncé qui suit. Ce résultat a été établi
par Ingham par des méthodes d’Analyse de Fourier. La démonstration que nous
proposons est due à Newman et repose sur l’utilisation de l’intégrale curviligne
Z  
z 1 z
F (z)N + dz,
Γ z R2

où nous préciserons le lacet Γ. Nous achèverons la démonstration du théorème de


Hadamard et de La Vallée-Poussin par le corollaire de Landau, qui établit l’as-
sertion (ii) du théorème 3.4.2. Au vu de ce résultat, le Théorème des Nombres
Premiers s’en déduira aussitôt.

Théorème 3.4.4 (Ingham). — Soit (an ) une suite de nombres complexes tels que
|an | ≤ 1, on considère la série de Dirichlet
+∞
X an
F (s) := .
ns
n=1

Cette série converge dans le demi-plan ouvert {<e(s) > 1} et y définit une fonction
analytique. Si, en fait, F (s) est analytique
P+∞dans un voisinage du demi-plan fermé
{<e(s) ≥ 1}, alors la série de Dirichlet n=1 an n−s converge dans un voisinage
du demi-plan fermé {<e(s) ≥ 1}.
Démonstration. Supposons F analytique dans le demi-plan fermé {re(s) ≥ 1}.
On fixe w de telle sorte que <e(w) ≥ 1 : ainsi, la fonction (z 7→ F (z + w)) est
analytique dans le demi-plan fermé {<e(z) ≥ 0}. Soient

R ≥ 1,
1
δ = δ(R) tel que 0 < δ ≤ , M = M (R) ≥ 0.
2
de sorte que sur {−δ ≤ <e(z); |z| ≥ R}, on ait

z 7→ F (z + w) est analytique, |F (z + w)| ≤ M.

On introduit à présent le lacet Γ (orienté dans le sens direct) constitué

de l’arc de cercle {|z| = R, <e(z) > −δ}


et du segment vertical {<e(z) = −δ; |z| ≤ R}

On désigne par ΓA et ΓB les morceaux de Γ contenus respectivement dans les


demi-plans droit et gauche. D’après le théorème de Cauchy, on a
Z  
z 1 z
2πiF (w) = F (z + w)N + dz.
Γ z R2

avec n ∈ N. Sur ΓA , on a
+∞ N +∞
X an X an X an
F (z + w) = z+w
= z+w
+
n n nz+w
n=1 n=1 n=N +1

et on pose
N
X an
SN (z + w) =
nz+w
n=1
+∞
X an
rN (z + w) =
nz+w
n=N +1

Une nouvelle application du théorème de Cauchy donne


Z   Z  
1 z 1 z
SN (z+w)N z + 2 dz = 2πiSN (w)− SN (z+w)N z + 2 dz,
ΓA z R −ΓA z R

où −ΓA désigne l’image de ΓA par la symétrie par rapport à l’origine. Ainsi, en


effectuant le changement de variable z 7→ −z, on a
Z   Z  
z 1 z −z 1 z
SN (z+w)N + dz = 2πiSN (w)− SN (w−z)N + dz.
ΓA z R2 ΓA z R2
On obtient alors
    
SN (w − z
Z Z
z 1 z z 1 z
2πi[F (w)−Sn (w)] = rN (z + w)N − + 2 dz+ F (z+w)N + 2 dz.
ΓA Nz z R ΓB z R
Notons x = <e(z), on a
1 z 2x
+ 2 = 2 sur le cercle {|z| = R}, en particulier sur ΓA ,
 z R2  R
1 z 1 |z| 2
z R2 ≤ δ 1 + R2 ≤ δ sur le segment vertical {re(z) = −δ; |z| ≤ R},
+

puis
+∞ +∞ +∞
X 1 X 1 X 1
|rN (z + w)| = ≤ nz+w ≤

nz+w nx+1
n=N +1 n=N +1 n=N +1
Z +∞
dt 1
≤ x+1
= x
,
N t xN

et

+∞ +∞ N
X 1 X 1 X
|Sn (w − z)| = ≤ ≤ nx−1

nw−z nw−z


n=1 n=1 n=1
Z N  
x−1 x−1 x 1 1
≤N + t dt = N + .
0 N x
On a alors sur ΓA :
    
rN (z + w)N z − SN (w − z) 1 z 1 1 1 2x 4 2

+ ≤ + + + 2 ≤ 2+
Nz z R2 x x N R R RN
d’où
  
rN (z + w)N z − SN (w − z)
Z
1 z 4π 2π
z
+ 2
dz ≤ + .
ΓA
N z R R N
On obtient alors
Z   Z R Z 0
F (z + w)N z 1 + z dz ≤ −δ 2 2|x| 3
nx 2 dx

2
MN dy + 2M
ΓB
z R
−R δ −δ R 2
4M R 6M
≤ + 2 .
δN δ R (log N )2
Enfin, il vient
2 1 MR M
|F (w) − SN (w)| ≤ + + δ
+ 2 <ε
R N δN R (log N )2
pour N suffisamment grand, si on fixe R = 3/ε. Ceci achève la démonstration.
Il s’ensuit l’énoncé suivant.

Corollaire 3.4.5 (Landau). — On a


X
µ(n) = o(x) lorsque x → +inf ty),
n≤x

où µ désigne la fonction de Möbius.

Démonstration. On a effectivement |µ(n)| ≤ 1 pour tout n ∈ N et on a (de ma-


nière formelle)

X µ(n) 1
s
=
n ζ(s)
n=1

comme il a été observé dans la section 3.2. Le théorème 3.4.3 fournit immédiate-
ment le résultat souhaité.

Fin de la démonstration du théorème des nombres premiers. Compte tenu de l’im-


plication (ii) ⇒ (i) dans le théorème de Landau 3.4.2, on a alors

ψ(x) ∼ x lorsque x → +∞.

Grâce à l’équivalent (3.4.1)

ψ(x) ∼ π(x) log x lorsque x → +∞,

on a finalement
x ∼ π(x) log x lorsque x → +∞,
ce qui prouve le Théorème des Nombres Premiers.
C HAPITRE 4

D ÉMONSTRATIONS , VARIANTES ET
CONSÉQUENCES DU THÉORÈME
DES NOMBRES PREMIERS

Les démonstrations originales de Hadamard et de La Vallée-Poussin prenaient


comme point de départ l’expression de la fonction ζ comme produit eulérien. Ils
établissaient la non-annulation de ζ sur la droite {<e(s) = 1} par des arguments
directs, superficiellement différents mais au fond de même nature : ils montraient
en effet que si ζ admettait un zéro en 1 + it0 où t0 ∈ R∗+ , alors elle posséderait
un pôle en 1 + it0 – ce qui n’est pas le cas. Il paraît difficile de présenter cet ar-
gument de façon plus suggestive que ne le fait Hadamard dans la note [Had68],
présentée à l’Académie des Sciences de Paris le 22 juin 1896, où il annonce sa
démonstration du théorème des nombres premiers. La non-annulation de ζ sur
{<e(s) = 1} est établie sous une forme qualitative plus précise, spécifiant un voi-
sinage de {<e(s) = 1} où ζ ne s’annule pas. Hadamard et de La Vallée-Poussin
concluaient leurs démonstrations en exprimant π(x) en fonction de ζP ou, ce qui
revient à peu près au même, de log ζ, grâce à une utilisation ingénieuse de la for-
mule des résidus.

Vers 1930, Wiener obtint une nouvelle démonstration du théorème des nombres
premiers, où les techniques d’analyse complexe sont remplacées dans une large
mesure par l’analyse harmonique de la fonction t 7→ ζ(1 + it). Cette philosophie
est menée à son terme dans la démonstration de Kahane que nous avons présentée
en premier lieu.

Mentionnons enfin qu’en 1949, Erdös [Erd49] et Selberg [Sel49] ont donné (i)
une preuve élémentairedu théorème des nombres premiers, c’est-à-dire une preuve
qui évite tout recours à la théorie des fonctions analytiques et n’utilise que des
inégalités d’analyse réelle élémentaire. L’outil essentiel est ici la formule asymp-
(i). La démonstration fut établie conjointement par Erdös et Selberg, mais ce dernier seul obtint
la médaille Fields.

53
totique suivante, aujourd’hui connue sous le nom d’identité de Selberg :
X X
(log p)2 + log p log q = 2x log x + O(x).
p∈P p,q∈P
p≤x pq≤x

La procédure est semblable à celle employée à la section 3.3 pour obtenir l’enca-
drement du théorème de Tchébychev 3.3.1 à partir d’une forme faible de la formule
de Stirling. L’introduction de l’exposant 2 permet ici d’obtenir immédiatement
une formule asymptotique. En utilisant l’identité de Selberg, Erdös a notamment
prouvé que le rapport pn+1 /pn de deux nombres premiers consécutifs tend vers 1.

4.1. Reformulations et conséquences du


théorème des nombres premiers

Le théorème des nombres premiers admet en fait bien des reformulations, dont
l’équivalence découle de raisonnements élémentaires. Citons deux d’entre elles :

Théorème 4.1.1. — Chacune des assertions suivantes est équivalente au théo-


rème des nombres premiers 1.0.2 :
(i) Lorsque l’entier n → ∞, on a

(4.1.1) pn ∼ n log n,

où pn désigne le n-ième nombre premier.


(ii) Lorsque x → ∞, on a
X
(4.1.2) log p ∼ x.
p∈P
p≤x

Démonstration. 1. (1.0.2) =⇒ (4.1.1). Il s’ensuit du théorème des nombres


premiers 1.0.2 :

log π(k) ∼ log k lorsque k → +∞),

puis
π(k) log π(k) ∼ k.
En faisant k = pn , on obtient l’équivalent (4.1.1).
2. (4.1.1) ⇒ (1.0.2). Pour tout x ∈ [2; +∞[, on a :

pπ (x) ≤ x < pπ(x)+1 .

D’après (4.1.1), on a :

pπ (x) ∼ π(x) log π(x)


et
pπ(x)+1 ∼ (π(x) + 1) log(π(x) + 1) ∼ π(x) log π(x).
Par conséquent :
x ∼ π(x) log π(x)
ce qui implique (comme plus haut) que

log x ∼ log π(x),

d’où enfin
x
π(x) ∼ .
log x
3. (1.0.2) ⇒ (4.1.2). On va utiliser la formule de sommation suivante, qui ser-
vira à nouveau dans la prochaine section :

Lemme 4.1.2. — Pour toute suite de nombres complexes (an )n ∈ N∗ et tout


N ∈ N∗ , on a

X N
X −1
(4.1.3) ap = π(N )an + π(N )(an − an+1 ).
p∈P n=1
p≤N

En effet,

X N
X 
ap = π(k) − π(k − 1) ak
p∈P k=1
p≤N
N
X −1 N
X
= π(N )an + π(k)ak − π(k − 1)ak .
k=1 k=2

En appliquant l’identité (4.1.3) à an = log n, on obtient :


N −1  
X X 1
(4.1.4) log p = π(N ) log N − π(n) log 1 + .
n
p∈P n=1
p≤N

D’après le théorème des nombres premiers 1.0.2,

(4.1.5) π(N ) log N ∼ N lorsque N → +∞

tandis que
 
1 1
π(n) log 1 + ∼ lorsque n → +∞.
n log n
Comme
N −1
X 1 N
∼ = o(N ) lorsque n → +∞),
log n log N
n=2
on a donc
N −1  
X 1
(4.1.6) π(n) log 1 + = o(N ).
n
n=1

L’équivalent (4.1.2) découle de (4.1.4), (4.1.5) et (4.1.6).


4. (4.1.6) ⇒ (1.0.2). Compte tenu de (4.1.2), la majoration
X
log p ≤ π(x) log x
p∈P
p≤N

montre que
log x
lim inf π(x) ≥ 1.
x→+∞ x
Par ailleurs, pour tout η ∈]0; 1[ et tout x ∈ R∗+ , il vient :
X
log p ≤ π(xη ) ≤ xη log x,
p∈P
p≤xη

ce qui implique, d’après (4.1.2), que pour tout η ∈]0; 1[ :


X
(4.1.7) log p ∼ x lorsque x → +∞.
p∈P
xη <p≤x

Par ailleurs, pour tout x ∈ R∗+ ,


X
(4.1.8) log p ≥ [π(x) − π(xη )] log xη ≥ ηπ(x) log x − ηxη log x.
p∈P
xη <p≤x

Il découle alors de (4.1.7) et (4.1.8)


log x
η lim sup π(x) ≤ 1,
x→+∞ x

puis, comme η ∈]0; 1[ est arbitraire :

log x
lim sup π(x) ≤1
x→+∞ x

ce qui achève la démonstration.


Dans la continuation immédiate des travaux de Thébychev, Mertens établit en
1874 des formules asymptotiques pour des sommes portant sur des nombres pre-
miers. Citons l’une d’entre elles :

Théorème 4.1.3 (Mertens). — Lorsque x → +∞, on a :


X log p
= log x + O(1).
p
p∈P
p≤x

Démonstration. On a déjà montré dans la section 3.3 que


X Λ(d)
= log x + O(1).
d
d≤x

Or, on a
X log p X Λ(d) X log p
− =
p d pν
p∈P d≤x p∈P
p≤x p≤x,pν ≥2
X log p
≤  1,
p(p − 1)
p∈P

d’où le résultat.

On remarque enfin que pour tout λ ∈]1; +∞[, le théorème des nombres pre-
miers montre que, lorsque x → +∞, on a
λx
π(λx) ∼
log x
et donc
(λ − 1)
π(λx) − π(x) ∼ .
log x
On en déduit l’énoncé suivant :

Proposition 4.1.4. — Pour tout λ ∈]1; +∞[, il existe x(λ) ∈ R+ tel que, pour
tout x ≥ x(λ), l’intervalle ]x; λx] contienne un nombre premier.

4.2. Zéros de ζ, singularités de ζP et distribution des nombres premiers

On déduit immédiatement de la proposition 2.2.4 et du corollaire 2.2.5 le ré-


sultat suivant.

Proposition 4.2.1. — Les assertion suivantes sont équivalentes :


(i) pour tout t ∈ R∗ , la fonction ζP admet un prolongement holomorphe au
voisinage de 1 + it ;
(ii) la fonction ζ de Riemann ne possède pas de zéro sur la droite 1 + i R ;
(iii) pour tout t ∈ R∗ ,

ζP (1 + σ + it) = o(log σ −1 )
lorsque σ > 0 tend vers 0 ;
la fonction t 7→ ζP (1 + it) est de classe C ∞ sur R∗ .

Comme mentionné dans l’introduction, les démonstrations originales du théo-


rème des nombres premiers reposaient de façon cruciale sur le fait que ces condi-
tions sont satisfaites, et il en va de même de toutes ses démonstrations fondées
sur le développement en produit eulérien et les propriétés analytiques de ζ. Nous
allons montrer qu’inversement ces conditions découlent du théorème des nombres
premiers, ce qui mettra davantage en lumière le lien étroit qu’elles possèdent avec
ce dernier et rendra moins surprenante la stratégie de démonstration.

Commençons par établir un résultat élémentaire sur les séries de Dirichlet.

Lemme 4.2.2. — Soit +∞ −s une série de Dirichlet, de coefficients a ∈


P
n=1 an n n

R+ , dont l’abscisse de convergence absolue σ 0 appartient à R et qui diverge en
σ0 . Soit en outre +∞ −s une série de Dirichlet, à coefficients complexes, telle
P
n=1 nb n
que
bn
(4.2.1) lim = 1.
n→+∞ an

On a alors, lorsque <(s) > σ0 et que <(s) tend vers σ0 :


∞ ∞ ∞
!
X X X
−s −s <(s)
bn n − an n = o an n .



n=1 n=1 n=1

On observe que l’hypothèse (4.2.1) entraîne que l’abscisse de convergence ab-


P+∞
solue de la série n=1 bn n−s est ≤ σ0 .

Démonstration. Soit s ∈ R∗+ , il existe n ∈ N tel que, pour tout n > N ,

|bn − an | ≤ εan .

On a alors, pour tout s tel que <e(s) > σ0 :


+∞ +∞
+∞ +∞
X X X X
−s −s −<e(s)
bn n − an n ≤ (|an | + |bn |)n +ε an n−<e(s) .



n=1 n=1 n=1 n=N +1

Comme
+∞
X
an n−σ0 = +∞,
n=1
on a :
+∞
X
lim an n−σ = +∞
σ→σ0+ n=1

et donc !−1
+∞
X N
X
lim an n−σ (|an | + |bn |)n−σ = 0.
σ→σ0+ n=1 n=1

Par conséquent, il existe δ > 0 tel que



X+∞ +∞
X +∞
X
−s −s
0 < <e(s) − σ0 < δ ⇒ bn n − an n ≤ 2ε an n−<e(s) .


n=1 n=1 n=1

Ceci achève la démonstration.

D’après la formule de sommation (4.1.3), on a lorsque <e(s) > 1,

X +∞
X
ζP (s) = p−s = π(n)[n−s − (n + 1)−s ]
p∈P n=1
+∞
"  #
1 −s
X 
= π(n)n−s 1− 1+ .
n
n=1

On pose, pour (s, n) ∈ C × N∗ ,


 −s
1 s
1− 1+ = + R(n, s).
n n

On vérifie que lorsque s varie dans un compact K de C, on a

(4.2.2) |R(n, s)| ≤ CK n−2 ,

où CK désigne une constante ne dépendant que de K. Il vient alors, si <e(s) > 1 :


+∞
X +∞
X
(4.2.3) ζP (s) = s π(n)n−s−1 + π(n)n−s R(n, s).
n=1 n=1

D’après (4.2.2), la seconde somme converge pour tout s tel que <e(s) > 0, norma-
lement sur tout compact de {<e(s) > 0} (car on a π(n) ≤ n), et définit donc une
fonction holomorphe sur ce demi-plan.
Pour étudier la première somme, on introduit la série de Dirichlet
+∞
X 1 1
Z(s) := .
log n ns
n=2
On vérifie que son abscisse de convergence absolue vaut 1 et que, si <e(s) > 1,
+∞
X 1
Z 0 (s) = = 1 − ζ(s).
ns
n=2

Il en découle que, pour tout t ∈ R∗ , Z admet un prolongement holomorphe sur un


voisinage de 1 + it. Comme ζ possède un pôle simple en 1, avec comme résidu 1,
il vient de plus :
Z(1 + σ) = log σ −1 + O(1)
lorsque σ > 0 tend vers 0.

Par ailleurs, le théorèmePdes nombres premiers permet d’appliquer le lemme


+∞
4.1.2 aux séries de Dirichlet n=1 π(n)n−s et Z(s). On obtient ainsi que lorsque
<e(s) tend vers 1+ :

+∞
X π(n) 1
− Z(s) = o(log(<e(s) − 1)−1 ),

n ns


n=1

puis que, pour tout t ∈ R+ ,


+∞
X π(n) 1
= o(log σ −1 )
n n1+σ+it
n=1

lorsque σ > 0 tend vers 0.

Compte tenu de (4.2.3) et de l’holomorphie sur <e(s) > 0 de la seconde


somme dans (4.2.3), il en découle que la condition (iii) de la proposition 4.1.1.
est satisfaite.
C HAPITRE 5

L’ HYPOTHÈSE DE R IEMANN

On rappelle que la fonction ζ définie par la formule (1.0.1) est holomorphe


sur le demi-plan {<(s) > 1}. Une des propriétés les plus frappantes et les plus
importantes découvertes par Riemann est l’existence d’une équation fonctionnelle
de la fonction ζ :
 
1
(5.0.1) ζ(s) = 2s π s−1 sin πs Γ(1 − s)ζ(1 − s) (s 6= 0, 1)
2

où Γ désigne la fonction d’Euler initialement définie par


+∞
1 Y (1 + 1/n)s
Γ(s) = (s ∈ C, s 6= −n, n ∈ N),
s 1 + s/n
n=1

plus couramment exprimée sous la forme


Z +∞
(5.0.2) Γ(s) = xs−1 e−x dx (<e(s) > 0).
0

Cette fonction holomorphe dans le demi-plan {<e(s) > 0} possède un prolonge-


ment méromorphe à tout le plan complexe dont l’ensemble des pôles est − N, ces
pôles étant simples. (i) C’est la formule
Z +∞ s−1
t
ζ(s)Γ(s) = t−1
dt (<e(s) > 1)
0 e
due à Riemann, qui permet d’établir l’équation fonctionnelle (5.0.1), dont on déduit
le résultat suivant.
(i). Ce prolongement est fournit par le théorème de factorisation de Weierstrass, qui permet de
construire une fonction entière admettant pour zéros simples les entiers ≤ 0, en posant
+∞
1 Y z  −z/n
= eγz z 1+ e
Γ(z) n=1
n

où γ désigne la constante d’Euler définie dans les Notations et conventions générales. On vérifie que
la fonction Γ ainsi obtenue coïncide bien avec la fonction définie par l’intégrale (5.0.2).

61
Théorème 5.0.3. — La fonction ζ se prolonge en une fonction méromorphe dans
tout le plan complexe avec un seul pôle au point s = 1 et ce pôle est simple.
L’équation fonctionnelle (5.0.1) vaut dans tout le plan complexe. La fonction ζ
de Riemann ne s’annule pas dans le demi-plan {<e(s) > 1}. Dans le demi-plan
{<e(s) < 0}, ses zéros sont les points s = −2n où n ∈ N∗ ; ces zéros sont simples
et sont appelés les zéros triviaux de la fonction ζ.

On pourra trouver une preuve des énoncés précédents dans [Wag03]. On peut
démontrer que la fonction ζ admet une infinité de zéros non triviaux qui sont donc
situés dans la bande dite critique {0 ≤ <e(s) ≤ 1}. On peut dès à présent faire
une remarque élémentaire concernant ces zéros : comme ζ(s) ∈ R lorsque s est
réel > 1, on a ζ(s) = ζ(s) pour s ∈ {<e(s) > 1}, donc pour tout s, la fonction
s 7→ ζ(s) étant méromorphe dans tout le plan complexe. Il en résulte que si s est
un zéro non trivial de la fonction ζ, il en est de même de s. D’autre part, l’équation
fonctionnelle montre que si s est un zéro non trivial, alors 1 − s est également un
zéro non trivial. Autrement dit, les zéros non triviaux sont distribués symétrique-
ment par rapport à l’axe réel et par rapport au point s = 1/2.

Nous avons vu que l’absence de zéro de ζ sur la droite {<e(s) = 1} suffit à


établir le théorème des nombres premiers. En fait, les démonstrations originales de
Hadamard et de La Vallée-Poussin conduisent aussitôt à une estimation explicite
du reste π(x) − logx x . Par ailleurs, leurs démonstrations fournissent que tout zéro
non trivial ρ = β + iγ de ζ satisfait à
c
β ≤1− .
(log(3 + |γ|)9
pour une certaine constante c > 0 convenable. Dès 1898, de La Vallée-Poussin,
en utilisant d’ailleurs un théorème de factorisation des fonctions analytiques dû a
Hadamard, améliore ce résultat en
c
β ≤1− .
log(3 + |γ|)
Ceci fournit une majoration effective pour le terme d’erreur dans le théorème des
nombres premiers. On peut en effet déduire de l’estimation précédente que l’on a,
pour une constante convenable a > 0,

ψ(x) = x + O(xe−a log x
),

π(x) = li(x) + O(xe log x ),
P
où on rappelle que ψ(x) = n≤x Λ(n) désigne la fonction sommatoire de la
fonction de von Mangoldt rencontrée à la section 3.3. D’après la définition du
logarithme intégral li(x), on a
x
li(x) ∼ lorsque x → +∞,
log x
donc π(x) ∼ li(x), mais l’approximation est en réalité de bien meilleure qualité
puisque le terme d’erreur est O(x/(log x)k ) pour tout entier k > 0.

Ainsi l’absence de zéro de ζ sur la droite {<e(s) = 1} fournit déjà une très
bonne évaluation asymptotique de π(x). Dans son mémoire de 1859, Riemann
émet la conjecture suivante, qui n’a toujours pas été résolue aujourd’hui, malgré
les efforts conjugés de centaines de mathématiciens.
Conjecture 5.0.4 (Hypothèse de Riemann). — Tous les zéros non triviaux de la
fonction ζ de Riemann sont situés sur la droite critique {<e(s) = 21 }.
Cette conjecture, riche d’implications dans toutes les branches de la théorie des
nombres, possède des généralisations dans de nombreux domaines des mathéma-
tiques et se présente comme la garante de l’harmonie de la répartition des nombres
premiers.

Les formules établies par Riemann dans son mémoire et connues sous le nom
de formules explicites de la théorie des nombres, permettent d’évaluer π(x) en
fonction des zéros non triviaux de ζ et de mieux appréhender l’incidence de l’hy-
pothèse de Riemann sur la loi de répartition des nombres premiers. Nous énonce-
rons ici des expressions analogues plus simples pour ψ(x). La justification a priori
de telles formules tient au fait que la théorie de Hadamard permet de définir une
fonction analytique essentiellement par ses zéros et ses singularités. Dans le cas de
ζ, on a en effet
eAs Y 
s 1
ζ(s) = 1 1 − es/ρ avec A = log 2π − 1 − γ
2(s − 1)Γ( 2 s + 1) ρ ρ 2
où γ désigne la constante d’Euler et où le produit porte sur tous les zéros non
triviaux de ζ. Les éventuels zéros multiples sont répétés avec leur ordre de mul-
tiplicité et on peut montrer que le produit infini converge absolument. Comme la
fonction ζ définit complètement ψ(x), l’existence d’un lien direct entre ψ(x) et les
zéros de ζ est clair. La formule explicite est
X xρ 1
(5.0.3) ψ(x) = x − − log 2π − log(1 − x2 ),
ρ
ρ 2
où la somme porte sur les zéros non triviaux ρ de ζ. Cette formule vaut pour x 6= pν
avec p premier, ν ∈ N. Au vu d’une telle formule, il n’est guère surprenant que la
taille du terme d’erreur du théorème des tombres premiers soit liée à la quantité
Θ := sup <e(s),
ζ(ρ)=0

qui satisfait à 21 ≤ Θ ≤ 1 d’après la symétrie des zéros résultant de l’équation


fonctionnelle. On a en fait
ψ(x) = x + O(xΘ (log x)2 ),
π(x) = li(x) + O(xΘ (log x)).
Réciproquement, on peut montrer que

Θ = inf{ϑ ∈ R | π(x) − li(x) = O(xϑ )}.

Ainsi, l’hypothèse de Riemann équivaut à la majoration

∀ε > 0, π(x) = li(x) + Oε (x1/2+ε ),

soit encore
1
Θ= .
2
On sait qu’un tel résultat, s’il était démontré, serait optimal. Par ailleurs, il a été dé-
montré que la différence ∆(x) := π(x)−li(x) change de signe infiniment souvent.

Notons que la série ρ xρ /ρ dans la formule (5.0.3) n’est pas absolument


P
convergente : le cas échéant, la fonction ψ serait alors continue, ce qui n’est claire-
ment pas le cas. Ceci suggère qu’il existe une infinité de zéros non triviaux. Hardy
et Littlewood ont prouvé en 1914 le résultat suivant.
Théorème 5.0.5 (Hardy-Littlewood). — La fonction ζ de Riemann admet une in-
finité de zéros non triviaux sur la droite critique {<e(s) = 12 }.
De nombreuses approches ont été adoptées pour démontrer l’hypothèse de Rie-
mann, mais aucune n’a abouti. Les calculs ont établi que plusieurs milliards de
zéros non triviaux de ζ sont situés sur l’axe critique. De plus, Levinson a montré
qu’au moins un tiers de ces zéros sont situés sur la droite {<e(s) = 21 } ; cette pro-
portion a ensuite été améliorée jusqu’à 40%. Conjointement, de nombreux efforts
sont également déployés pour prouver ce que l’on appelle l’hypothèse de Riemann
généralisée, liée aux séries de Dirichlet et sur laquelle repose tout un pan de la
théorie analytique des nombres.

Soit n un entier ≥ 1, on désigne par Z/n Z l’ensemble des éléments inver-
sibles de l’anneau commutatif unitaire Z/n Z . On définit la fonction indicatrice
d’Euler ϕ par ×
ϕ(n) = # Z/n Z .
Pour tout entier n ≥ 1, ϕ(n) est égal au nombre des entiers qui sont premiers à n.
Soient a et q deux entiers premiers entre eux, on pose

π(x; a, q) := #{p ∈ P : p ≤ x; p ≡ a mod q}).

Dirichlet a montré en 1837 qu’il existe une infinité de nombres premiers p ≡


a mod q. Il paraît alors raisonnable de supputer une répartition équitable des nombres
premiers parmi les ϕ(q) classes possibles. Compte tenu du théorème des nombres
premiers, cette hypothèse conduit à la conjecture
x
(5.0.4) π(x; a, q) ∼ .
ϕ(q) log q
Ce problème a été complètement résolu par de La Vallée-Poussin en 1896, grâce à
des outils spécifiques forgés par Dirichlet. Si q est un entier, on appelle caractère
de Dirichlet modulo q une fonction arithmétique χ : N → C telle que
(a) χ est q-périodique ;
(b) χ est supportée par tous les entiers premiers à q, c’est-à-dire
χ(n) = 0 ⇒ (n, q) = 1;

(c) χ est complètement multiplicative, c’est-à-dire


∀m, n ∈ N, χ(mn) = χ(m)χ(n).

Le caractère χ0 , appelé caractère principal, est défini par


(
1 si (n, q) = 1,
χ0 (n) =
0 sinon.
On définit alors la série de Dirichlet L(s, χ) associée au caractère χ par
+∞
X χ(n)
L(s, χ) = .
ns
n=1

On peut montrer que ces séries sont absolument convergentes dans le demi-plan
{<e(s) > 1}, où elles se développent en produit eulérien :
Y 1 −1

L(s, χ) = 1− s .
p
p∈P

En particulier,
Y  1 −1
  
1
L(s, χ0 ) = 1− s = 1 − s ζ(s).
p q
p∈P
(p,q)=1

De manière analogue à la conjecture de Gauss-Legendre, l’argument crucial qui


permet d’établir la formule asymptotique (5.0.4) est l’absence de zéro des fonctions
L(·, χ) sur la droite {<e(s) = 1}. À l’instar de la fonction ζ de Riemann, il existe
une conjecture concernant la répartition des zéros de ces fonctions dans le plan
complexe.
Conjecture 5.0.6 (Hypothèse de Riemann généralisée). — Tous les zéros non tri-
viaux des fonctions L(·, χ) de Dirichlet sont situés sur la droite critique {<e(s) =
1
2 }.
Si cette conjecture était prouvée, elle fournirait l’estimation
li(x) √
π(x; a, q) ∼ + O( x log x) lorsque x → +∞,
ϕ(q)
uniformément pour x ≥ 3, q ≥ 1, (a, q) = 1.
C ONCLUSION

Depuis la naissance de l’arithmétique, les nombres premiers ne cessent de fas-


ciner les mathématiciens, notamment du fait de l’aspect remarquable de leur ré-
partition. Avec le formidable développement de l’informatique, la principale moti-
vation aujourd’hui est la nécessité d’assurer la confidentialité de transmissions de
toutes natures. Les moyens déployés afin d’étudier la distribution des nombres pre-
miers ont atteint une importance considérable, essentiellement à cause de la mise
au point de nouvelles méthodes algorithmiques et cryptographiques (les systèmes
à clefs publiques par exemple et le système RSA (ii) en particulier). Les enjeux éco-
nomiques énormes de ces applications expliquent l’accroissement de l’intêret des
pouvoirs civils et militaires pour le sujet depuis moins de trente ans.

Au-delà de telles considérations, l’attrait pour les mystères de cette théorie est
alimenté par les conjectures qui la font avancer. La plupart de celles-ci contiennent
l’idée sous-jacente que «tout ce qui n’est pas trivialement interdit est réalisé». Ci-
tons quelques-uns de ces problèmes profonds et non résolus :
– la conjecture des nombres premiers jumeaux : «Il existe une infinité de paires
(p, q) avec p et q premiers et q = p + 2», et sa généralisation proposée par
Hardy et Littlewood en 1923 ;
– la conjecture de Goldbach : «Tout nombre pair > 2 est somme de deux
nombres premiers» ;
– l’hypothèse de Riemann et sa généralisation aux fonctions L(s, χ) concer-
nant la répartition des nombres premiers dans les progressions arithmétiques,
que nous n’avons fait qu’effleurer dans le chapitre 5 ;
– l’existe d’une infinité de nombres premiers de la forme Mp = 2p − 1 avec
p premier, appelés nombres de Mersenne, dont on connaît une méthode
permettant de tester leur primalité et qui sert encore à produire de grands
nombres premiers.
Cette liste est bien entendu loin d’être exhaustive, et nous passons sous silence de
nombreuses autres questions d’origine algébrique et probabiliste.
La distribution des nombres premiers apparaît tour à tour harmonieuse, comme
le montre le théorème de Hadamard et de La Vallée-Poussin, et irrégulière, comme
le suggèrent les tables. Celles-ci mettent en évidence un aspect chaotique dont
le désordre apparent s’accorde finalement avec des modèles aléatoires classiques
(ii). En référence à Rivest, Shamir et Adleman.

66
issus, par exemple, de phénomènes physiques : certains comparent le modèle de
répartition des nombres premiers à celui d’un gaz parfait, soumis à la régularité
globale et à l’irrégularité locale. Il semblerait que les nombres premiers occupent
tout le “hasard” disponible, c’est-à-dire compatible avec la contrainte drastique qui
pèse sur eux : engendrer la suite ultra-régulière des nombres entiers.
A NNEXE : FACTORISATION DES
FONCTIONS ANALYTIQUES

Les résultats que nous mentionnons ci-après sont présentés de façon détaillée
et démontrés dans l’ouvrage [Wag03]. Nous nous bornerons ici à en donner les
énoncés.

On définit les facteurs primaires de Weierstrass comme suit :

E0 (z) = 1 − z
z2 zk
 
Ek (z) = (1 − z) exp z + + ... + pour ≥ 1.
2 k

Théorème 5.0.7 (Théorème de factorisation de Weierstrass). — Soient (an )n≥1


une suite de nombres complexes telle que an 6= 0 et lim|an |→+∞ = +∞, k(n) ∈ N
des entiers tels que
+∞ 
r k(n)+1
X 
< ∞ (r > 0)
|an |
n=1

et soit g : C → C une fonction entière, alors la fonction


+∞  
g(z)
Y z
(5.0.5) f (z) = e Ek(n) ,
an
n=1

où le produit infini est


S normalement convergent sur tout compact de C, est une
fonction entière dont +∞ n=1 {an } est l’ensemble des zéros et

(5.0.6) ω(f ; an ) := #{p ∈ N× : ap = an }


S+∞
Réciproquement, toute fonction entière dont l’ensemble des zéros est n=1 {an }
avec la multiplicité donnée par (5.0.5) est de la forme (5.0.6).

Soit f : C → C une fonction entière, pour tout r > 0 on pose

M (r) = max |f (z)|.


|z|=r

68
La fonction M : R+ → R+ est croissante d’après le principe du maximum et
même strictement croissante si la fonction f n’est pas constante. On définit l’ordre
de f par
A
ρ = inf{A ≥ 0 : (∃r0 ≥ 0)(∀r ≥ r0 ) M (r) ≤ er } ∈ [0; +∞[.
On notera ord(f ) l’ordre de f . On dit que f est d’ordre fini si ρ est fini.

Il existe des relations étroites reliant l’ordre d’une fonction entière et la répar-
tition de ses zéros dans le plan complexe. Soit f une fonction entière non identi-
quement nulle, on notera (an )n≥1 la suite de ses zéros non nuls, chaque zéro étant
répété un nombre de fois égal à sa multiplicité. Si rn = |an |, on peut supposer la
suite (rn ) croissante, soit
0 < rn = |an |, rn ≤ rn+1 .
La suite (an ) peut être finie ; lorsqu’elle est finie, on a rn → +∞. On note k le
plus petit entier, s’il existe, tel que
+∞
X
rn−(k+1) < ∞.
n=1

Lorsqu’un tel entier n’existe pas, on pose k = ∞ ; k ∈ N ∪{∞} est appelé le rang
de la suite (an ). Le théorème de factorisation de Weierstrass permet d’écrire
f (z) = eQ(z) z m P (z)
où m = ω(f ; 0),
+∞  
Y z
P (z) = Ek
an
n=1
et Q est une fonction entière qui n’est définie qu’à l’addition près d’un multiple de
2πi. L’exposant de convergence est une notion qui complète celle de rang. On le
définit comme suit :
+∞
X
ρc = inf{ρ ≥ 0 : rn−ρ < ∞} ∈ [0; +∞[
n=1

où l’on convient que inf ∅ = ∞. On dispose alors du résultat suivant.


Théorème 5.0.8 (Théorème de factorisation de Hadamard). — Soit f une fonction
entière d’ordre fini ρ non identiquement nulle, alors la suite (an ) de ses zéros non
nuls est de rang fini k et
+∞  
Y z
f (z) = eQ(z) z m Ek , m = ω(f ; 0),
an
n=1

où Q est un polynôme de degré q et


ρ = max(q, ρc ).
Remarque 5.0.9. — Le théorème de Hadamard se révèle être un outil particulière-
ment puissant pour résoudre le problème de la détermination du terme exponentiel
dans le théorème de Weierstrass.

La preuve de l’existence d’une infinité de zéros non triviaux de la fonction ζ


repose sur l’énoncé suivant.

Proposition 5.0.10. — Soit f une fonction entière d’ordre fini ρ ∈ R \ N. Alors,


pour tout a ∈ C, la fonction z 7→ f (z) − a admet une infinité dénombrable de
zéros dont l’exposant de convergence est ρ.
R ÉFÉRENCES

[Bos03] Jean-Benoît B OST : Le théorème des nombres premiers et la transfor-


mation de Fourier. In La fonction zêta, pages 1–35. Ed. Éc. Polytech.,
Palaiseau, 2003.
[Erd49] P. E RDÖS : On a new method in elementary number theory which leads
to an elementary proof of the prime number theorem. Proc. Nat. Acad.
Sci. U. S. A., 35:374–384, 1949.
[Had68] Jacques H ADAMARD : Œuvres de Jacques Hadamard. Tomes I, II, III,
IV. Comité de publication des oeuvres de Jacques Hadamard : M. Fré-
chet, P. Levy, S. Mandelbrojt, L. Schwartz. Éditions du Centre National
de la Recherche Scientifique, Paris, 1968.
[Kah96] Jean-Pierre K AHANE : Une formule de Fourier sur les nombres premiers.
Gaz. Math., (67):3–9, 1996.
[Kah97] Jean-Pierre K AHANE : A Fourier formula for prime numbers. In Har-
monic analysis and number theory (Montreal, PQ, 1996), volume 21
de CMS Conf. Proc., pages 89–102. Amer. Math. Soc., Providence, RI,
1997.
[New98] Donald J. N EWMAN : Analytic number theory, volume 177 de Graduate
Texts in Mathematics. Springer-Verlag, New York, 1998.
[Sel49] Atle S ELBERG : An elementary proof of the prime-number theorem.
Ann. of Math. (2), 50:305–313, 1949.
[Wag03] Claude WAGSCHAL : Fonctions holomorphes, équations différentielles.
Collection Méthodes. [Methods Collection]. Hermann, Paris, 2003.

71