Académique Documents
Professionnel Documents
Culture Documents
Calcul intégral
Emmanuel Russ avec des modications mineures de Philippe Eyssidieux
Contact :
philippe.eyssidieux@univ-grenoble-alpes.fr
==============================================
Table des matières
1 Calcul intégral en dimension 1 5
1.1 Intégrale d'une fonction en escalier . . . . . . . . . . . . . . . . . 5
1.1.1 Fonctions en escalier . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Intégrale d'une fonction en escalier . . . . . . . . . . . . . 7
1.2 Intégrale d'une fonction continue par morceaux . . . . . . . . . . 8
1.2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.2 Lien avec les primitives . . . . . . . . . . . . . . . . . . . 12
1.2.3 Changement de variable . . . . . . . . . . . . . . . . . . . 13
1.2.4 Intégration par parties . . . . . . . . . . . . . . . . . . . . 14
1.2.5 Inégalités de Cauchy-Schwarz et de Minkowski . . . . . . 17
1.2.6 Sommes de Riemann . . . . . . . . . . . . . . . . . . . . . 20
1.2.7 Convergence de suites d'intégrales . . . . . . . . . . . . . 22
1.2.8 Méthodes de calcul approché . . . . . . . . . . . . . . . . 25
1.3 Longueur des courbes paramétrées . . . . . . . . . . . . . . . . . 30
1.4 Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.4.1 Coecients de Fourier d'une fonction 2π -périodique . . . 36
1.4.2 Le noyau de Dirichlet . . . . . . . . . . . . . . . . . . . . 37
1.4.3 Convergence quadratique . . . . . . . . . . . . . . . . . . 38
1.4.4 Convergence ponctuelle . . . . . . . . . . . . . . . . . . . 40
1.5 Intégrales impropres . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.5.1 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.5.2 Cas des fonctions positives . . . . . . . . . . . . . . . . . 46
1.5.3 Cas des fonctions à valeurs dans R . . . . . . . . . . . . . 48
1.5.4 Intégrales plusieurs fois impropres . . . . . . . . . . . . . 50
1.5.5 Convergence de suites d'intégrales impropres . . . . . . . 51
3
2.3.2 Changement de variable . . . . . . . . . . . . . . . . . . . 66
2.3.3 Calculs d'aires et de volumes . . . . . . . . . . . . . . . . 69
2.3.4 Intégrales de surface . . . . . . . . . . . . . . . . . . . . . 70
2.3.5 Formule de Green-Riemann . . . . . . . . . . . . . . . . . 74
2.4 Intégrales impropres . . . . . . . . . . . . . . . . . . . . . . . . . 74
3 Probabilités et statistiques 77
3.1 Algèbres de Boole et probabilités booléennes . . . . . . . . . . . 77
3.2 Tribus et probabilités . . . . . . . . . . . . . . . . . . . . . . . . 78
3.3 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . 83
3.5 Variables aléatoires réelles . . . . . . . . . . . . . . . . . . . . . . 86
3.5.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.5.2 Variables aléatoires réelles indépendantes . . . . . . . . . 88
3.6 Variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . 89
3.6.1 Dénitions et premières propriétés . . . . . . . . . . . . . 89
3.6.2 Espérance, moments d'une variable aléatoire discrète . . . 92
3.7 Variables aléatoires à densité . . . . . . . . . . . . . . . . . . . . 99
3.7.1 Dénitions et premières propriétés . . . . . . . . . . . . . 99
3.7.2 Espérance et moments d'une variable aléatoire à densité . 101
3.8 Convergences de suites de variables aléatoires . . . . . . . . . . . 106
3.8.1 Convergence en probabilité d'une suite de variables aléa-
toires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.8.2 Convergence en loi d'une suite de variables aléatoires . . . 107
3.9 Théorèmes limite . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.9.1 Théorème central limite de Poisson . . . . . . . . . . . . . 110
3.9.2 Approximation de la loi binomiale par la loi hypergéomé-
trique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.9.3 Théorème de de Moivre-Laplace . . . . . . . . . . . . . . 111
3.9.4 Le théorème central limite . . . . . . . . . . . . . . . . . . 111
3.9.5 Loi faible des grands nombres . . . . . . . . . . . . . . . . 111
3.10 Vecteurs gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.11 Statistique inférentielle . . . . . . . . . . . . . . . . . . . . . . . . 115
3.11.1 Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.11.2 Estimateur . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.11.3 Intervalles de conance . . . . . . . . . . . . . . . . . . . 120
3.11.4 Intervalle de uctuation . . . . . . . . . . . . . . . . . . . 121
3.11.5 Conséquences sur la prise de décision . . . . . . . . . . . . 122
==============================================
Chapitre 1
Théorème 1.0.1 Soient a < b des réels. Il existe une unique forme linéaire
b Rb Rb
: C 0 ([a, b], R) → R
R
a
telle que
a
f ≥ 0 si f ≥ 0 et a 1[c,d] = d − c pour tous
a ≤ c ≤ d ≤ b.
L'espace des fonctions en escalier étant engendré par les indicatrices des seg-
ments, ceci résulte de du Théorème 1.2.9.
On rappelle d'abord les étapes de la construction de l'intégrale des fonctions
continues par morceaux sur un segment. Comme cette construction a déjà été
vue en L2 ou en classes préparatoires, nous ne détaillons pas les arguments.
5
Dénition 1.1.3 Soient n ≥ 1, a < b et f : [a, b] → Rn une fonction. On dit
que f est en escalier si, et seulement si, il existe une subdivision σ = (x0 , ..., xN )
telle que f soit constante sur chaque intervalle ]xi , xi+1 [, i ∈ {0, N − 1}. Dans
ce cas, on dit que la subdivision σ est adaptée à f.
Exemple 1.1.5 1. Soient a < b. Toute fonction constante sur [a, b] est en
escalier.
kf k∞ := sup kf (x)k .
a≤x≤b
Z b N
X −1
f (x)dx := (xi+1 − xi )ci . (1.1)
a i=0
Exemple 1.1.8 1. S'il existe u ∈ Rn tel que f (x) = u pour tout x ∈ [a, b],
alors
Z b
f (x)dx = (b − a)u.
a
2. Si f = E (la partie entière) sur [0, 3],
Z 3
f (x)dx = 0 × (1 − 0) + 1 × (2 − 1) + 2 × (3 − 2) = 3.
0
Proposition 1.1.9
Rb
L'application f 7→ a
f (x)dx est linéaire de E([a, b], Rn )
n
dans R .
Z c Z b Z b
f (x)dx + f (x)dx = f (x)dx.
a c a
ceaux
1.2.1 Dénition
Dénition 1.2.1 Soient I un intervalle de R, f : I → Rn et a ∈ I . Soit l ∈ Rn .
1. On dit que
lim f (x) = l
x→a, x>a
si, et seulement si, pour tout ε > 0, il existe δ > 0 tel que, pour tout
x ∈ I, si a < x < a + δ , kf (x) − lk < ε. On dit alors que f possède une
limite à droite en a.
2. On dit que
lim f (x) = l
x→a, x<a
si, et seulement si, pour tout ε > 0, il existe δ > 0 tel que, pour tout
x ∈ I, si a − δ < x < a, kf (x) − lk < ε. On dit alors que f possède une
limite à gauche en a.
et
lim f (x) = 0.
x→ 12 , x< 12
1
On notera que ces limites à gauche et à droite sont diérentes de f 2 .
sin x
2. Soit f :]0, 1] → R dénie par f (x) = x . Alors
lim f (x) = 1.
x→0, x>0
1
3. Soit f :]0, 1] → R dénie par f (x) = sin x . Alors f ne possède pas de
limite à droite en 0.
Dénition 1.2.3 Soient a < b et f : [a, b] → Rn . On dit que f est continue par
morceaux sur [a, b] si, et seulement si, il existe une subdivision σ = (x0 , ..., xN )
de [a, b] telle que :
Remarque 1.2.4 On notera que cette dénition revient à dire que, pour tout
i ∈ {0, . . . , N − 1}, la restriction de f à ]xi , xi+1 [ se prolonge en une fonction
continue sur [xi , xi+1 ].
Exemple 1.2.5 1. Toute fonction continue sur [a, b] est continue par mor-
ceaux.
1
(
si 0 < x ≤ 1,
f (x) = x
0 si x=0
2. Toute fonction continue par morceaux sur [a, b] est bornée sur [a, b] et
possède, en tout point de [a, b], une limite à gauche et une limite à droite.
3. Pour toute f ∈ Cpm ([a, b], Rn ), on pose
kf k∞ := sup kf (x)k .
a≤x≤b
Théorème 1.2.9
Rb
Soient a < b. L'application f 7→ a f (x)dx, initialement dé-
n n
nie de E([a, b], R ) dans R , se prolonge de manière unique en une application
n n
Rb
linéaire continue de Cpm ([a, b], R ) dans R , encore notée f 7→ f (x)dx. On a
a
Z
b
f (x)dx
≤ kf k∞ (b − a) (1.2)
a
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c
Ra
Il est commode de dénir
b
f (x)dx pour a≤b :
1. On pose
Z a
f (x)dx = 0.
a
2. On pose
Z a Z b
f (x)dx = − f (x)dx.
b a
Proposition 1.2.13 Soient a<b et f : [a, b] → Rn une fonction continue par
morceaux. Si f = (f1 , ..., fn ), alors
!
Z b Z b Z b
f (x)dx = f1 (x)dx, ..., fn (x)dx .
a a a
Z
Z
b
b
f (x)dx
≤ kf (x)k dx.
a
a
Preuve : les deux premiers points se montrent comme dans le cas des fonctions
en escalier. Pour le 3, soit h := g−f , qui est une fonction continue et positive sur
[a, b]. x0 ∈ [a, b] tel que h(x0 ) > 0, alors par continuité de h sur [a, b],
S'il existe
1
il existe c, d ∈ [a, b] avec a ≤ c ≤ x0 ≤ d ≤ b et c < d tels que h(x) ≥ h(x0 )
2
pour tout x ∈ [c, d]. Cela implique
Z b Z c Z d Z b
1
h(x)dx = h(x)dx + h(x)dx + h(x)dx ≥ (d − c)h(x0 ) > 0,
a a c d 2
Rb
alors que
a
h(x)dx = 0 par hypothèse.
Pour 4, on pose à nouveau h := g−f , qui est une fonction continue par morceaux
et positive sur [a, b]. Le même argument montre que h = 0 en tout point de
continuité de h, et la conclusion s'en déduit.
Rb Rb Rb
Pour 5, on suppose que
a
f (x)dx ≥ 0, de sorte que a f (x)dx = a |f (x)| dx.
Rb
Comme f ≤ |f |, on a donc f = |f | sur [a, b], donc f ≥ 0 sur [a, b]. Si f (x)dx ≤
a
0, on applique le cas précédent à −f .
1.2.2 Lien avec les primitives
Théorème 1.2.16 Soient I un intervalle de R et f : I → Rn une fonction dont
la restriction à tout segment inclus dans I est continue par morceaux. On xe
a ∈ I. Pour tout x ∈ I, on pose
Z x
F (x) := f (t)dt.
a
Z v
Z v
kF (v) − F (u)k =
≤
f (t)dt
kf (t)k dt ≤ M (v − u),
u u
ce qui termine la preuve dans ce cas. Les autres cas sont analogues.
Pour 2, soient x ∈ I et ε > 0. Comme f possède une limite à droite en x, notée
l, il existe δ > 0 tel que, pour tout t ∈]x, x + δ], kf (t) − lk < ε. Alors, pour tout
y ∈]x, x + δ],
Z y Z y
F (y) = F (x) + f (t)dt = F (x) + l(y − x) + (f (t) − l)dt,
x x
de sorte que
Z y
Z y
F (y) − F (x) 1
≤ 1
− l
=
(f (t) − l)dt kf (t) − lk dt ≤ ε,
y−x
y−x
x
y−x
x
ce qui montre bien que Fd0 (x) = l. Pour la dernière majoration, plus précisément,
on dénit
kf (t) − lk si x < t ≤ x + δ,
g(t) :=
0 si x = t,
Z b Z ϕ(b)
(f ◦ ϕ)(t)ϕ0 (t)dt = f (u)du.
a ϕ(a)
Preuve : on note d'abord que(f ◦ ϕ)ϕ0 est bien continue sur [a, b] et f est bien
0
continue sur [ϕ(a), ϕ(b)] ⊂ I . Soit F une primitive de f sur I . Alors (F ◦ ϕ) =
0 0 0 0
(F ◦ ϕ)ϕ = (f ◦ ϕ)ϕ , de sorte qu'une primitive de (f ◦ ϕ)ϕ est F ◦ ϕ. On a
donc
Z b
(f ◦ ϕ)(t)ϕ0 (t)dt = (F ◦ ϕ)(b) − (F ◦ ϕ)(a),
a
alors que
Z ϕ(b)
f (u)du = F (ϕ(b)) − F (ϕ(a)).
ϕ(a)
Exemple 1.2.20
3π
sin2 t cos tdt. Si ϕ(t) = sin t pour tout
R
1. Soit I := 0
2
t∈R et f (u) = u 2
pour tout u ∈ R, on a ϕ(0) = 0 et ϕ( 3π2 ) = −1, donc
3π
Z 2
Z −1
I= (f ◦ ϕ)(t)ϕ0 (t)dt = f (u)du,
0 0
u3
et comme une primitive de f est F (u) = 3 , on obtient que
1
I = F (−1) − F (0) = − .
3
R1
2. Soit I := 1 √ 1 dt. Si ϕ(u) = sinh u pour tout u ∈ R, si a est tel que
2 1+t2
1 √ 1
ϕ(a) = 2 et b tel que ϕ(b) = 1, et si f (t) = 1+t2
, alors
Z ϕ(b) Z b Z b
1
I= f (t)dt = f (ϕ(u))ϕ0 (u)du = p cosh udu = b−a,
ϕ(a) a a 1 + sinh2 u
de sorte que
Z a Z 0 Z a Z a
f (t)dt = f (t)dt + f (t)dt = 2 f (t)dt.
−a −a 0 0
En eet, si ϕ(t) = t + T ,
Z x+T Z ϕ(x) Z x Z x Z x
0
f (t)dt = f (t)dt = f (ϕ(t))ϕ (t)dt = f (t+T )dt = f (t)dt,
T ϕ(0) 0 0 0
donc
Z x+T Z 0 Z T Z x+T Z T
f (t)dt = f (t)dt + f (t)dt + f (t)dt = f (t)dt.
x x 0 T 0
Z b Z b
u(t)v 0 (t)dt = u(b)v(b) − u(a)v(a) − u0 (t)v(t)dt.
a a
Preuve : la fonction uv est C 1 et sa dérivée vaut u0 v + v 0 u. En d'autres termes,
une primitive de u v + v 0 u est uv , et comme u0 v + v 0 u est continue, on a
0
Z b
(u0 (t)v(t) + v 0 (t)u(t))dt = u(b)v(b) − u(a)v(a),
a
avec Z π
J := et cos tdt.
0
de sorte que
donc
1 1
I= (u(π)v(π) − u(0)v(0) + u(π)w(π) − u(0)w(0)) = (eπ + 1) .
2 2
Voici une conséquence importante de la formule d'intégration par parties :
k b
(b − a)j (b − t)k (k+1)
X Z
f (b) = f (a) + f (j) (a) + f (t)dt.
j=1
j! a k!
k b
(b − a)j (b − t)k (k+1)
X Z
f (b) = f (a) + f (j) (a) + f (t)dt.
j=1
j! a k!
k+1
Si on pose u(t) = f (k+1) (t) et v(t) = − (b−t)
(k+1)! , alors une intégration par parties
montre que
b b
(b − t)k (k+1)
Z Z
f (t)dt = u(t)v 0 (t)dt
a k! a
b
(b − a)k+1 (k+1) (b − t)k+1 (k+2)
Z
= f (a) + f (t)dt,
(k + 1)! a (k + 1)!
ce qui donne bien la conclusion pour k+1 et termine la preuve.
Z b Z b
f (t)g(t)dt = f (c) g(t)dt.
a a
Preuve : comme f est continue, il existe m≤M tels que f ([a, b]) = [m, M ].
Comme g est positive, on a donc
Z b Z b Z b
m g(t)dt ≤ f (t)g(t)dt ≤ M g(t)dt.
a a a
Rb Rb
Si
a
g(t)dt = 0, cette inégalité montre que a
f (t)g(t)dt = 0, et n'importe quel
c convient. Sinon, on a
Rb
a
f (t)g(t)dt
m≤ Rb ≤ M,
a
g(t)dt
et la conclusion provient du fait que f ([a, b]) = [m, M ].
Théorème 1.2.25 (Deuxième formule de la moyenne) Soient a < b, f :
[a, b] → [0, +∞[ C 1 et décroissante et g : [a, b] → R continue. Alors il existe
c ∈ [a, b] tel que
Z b Z c
f (t)g(t)dt = f (a) g(t)dt.
a a
pose donc que f (a) > 0. Pour tout t ∈ [a, b], on pose G(t) := g(u)du. Une
a
intégration par parties montre que
Z b Z b Z b
f (t)g(t)dt = f (t)G0 (t)dt = f (b)G(b) − f 0 (t)G(t)dt.
a a a
Comme −f 0 ≥ 0, la première formule de la moyenne montre qu'il existe d ∈ [a, b]
tel que
Z b Z b
0
f (t)G(t)dt = G(c) f 0 (t)dt = G(d)(f (b) − f (a)),
a a
donc
Z b
1 f (b) f (b)
f (t)g(t)dt = G(b) + G(d) 1 − ,
f (a) a f (a) f (a)
et comme le membre de droite de cette égalité est compris entre G(b) et G(d) et
G est continue, le théorème des valeurs intermédiaires assure qu'il existe c ∈ [d, b]
tel que
Z b
1
f (t)g(t)dt = G(c),
f (a) a
ce qui est la conclusion.
Z ! 12 ! 21
b Z b Z b
f (x)g(x)dx ≤ f 2 (x)dx g 2 (x)dx , (1.3)
a a a
1 1
|f1 (x)g1 (x)| ≤ f1 (x)2 + g1 (x)2 ,
2 2
de sorte que
Z b Z b Z b
1 1
|f1 (x)g1 (x)| dx ≤ f1 (x)2 + g1 (x)2 = 1,
a 2 a 2 a
donc
Z Z
b b
1
Z b
1
f (x)g(x)dx ≤ |f (x)g(x)| dx = (AB) |f1 (x)g1 (x)| dx ≤ (AB) 2
2
a a a
(1.5)
ce qui donne bien (1.3).
On suppose maintenant f et g continues et positives et qu'il y a égalité dans
(1.3). Sif = 0, il n'y a rien à montrer. Si g = 0, on a bien g = 0f . On suppose
donc que ni f ni g n'est identiquement nulle, ce qui (Proposition 1.2.15) implique
Rb Rb
que
a
f (x)2 dx > 0 et a g(x)2 dx > 0. On dénit A, B, f1 et g1 comme avant.
Comme
Z b Z b
1 1
f1 (x)g1 (x)dx = 1 = f1 (x)2 + g1 (x)2 dx
a a 2 2
avec f1 g1 ≤ 21 f12 + 12 g12 , la proposition 1.2.15 montre que, pour tout x ∈ [a, b],
1 1
f1 (x)g1 (x) = f1 (x)2 + g1 (x)2 ,
2 2
et le lemme 1.2.27 assure que f1 = g1 , ce qui montre que g = µf pour un µ > 0.
On passe au cas général : f et g sont continues et il y a égalité dans (1.3). Si f
ou g est la fonction nulle, il n'y a rien à prouver. On suppose que ni f ni g n'est
la fonction nulle. Alors, comme
Z Z ! 21 ! 21
b b Z b Z b
2 2
f (x)g(x)dx ≤ |f (x)g(x)| dx ≤ |f (x)| dx |g(x)| dx ,
a a a a
on a Z Z
b b
f (x)g(x)dx = |f (x)g(x)| dx (1.6)
a a
et
! 21 ! 21
Z b Z b Z b
2 2
|f (x)g(x)| dx = |f (x)| dx |g(x)| dx .
a a a
Le cas d'égalité pour les fonctions positives assure que |g| = µ |f | pour un µ ≥ 0.
Comme ni f ni g n'est la fonction nulle, µ > 0.
L'égalité (1.6) montre que fg ≥ 0 sur [a, b] ou f g ≤ 0 sur [a, b] (proposition
1.2.15).
On suppose que f g ≥ 0. Soit alors x tel que f (x) > 0. On a donc g(x) > 0 (on
ne peut avoir g(x) = 0 car |g(x)| = µ |f (x)|), de sorte que g(x) = µf (x). De
même, si f (x) < 0, g(x) < 0, de sorte que g(x) = µf (x). Enn, si f (x) = 0,
on a aussi g(x) = 0 = µf (x). Finalement, g = µf . On montre de même que, si
f g ≤ 0, g = −µf .
Théorème 1.2.28 [Inégalité de Minkowski] Soient f, g ∈ Cpm ([a, b], R). Alors :
2 2
1. f + g, f et g sont continues par morceaux sur [a, b] et
! 12 ! 21 ! 21
Z b Z b Z b
2 2 2
|f (x) + g(x)| dx ≤ f (x)dx + g (x)dx , (1.7)
a a a
! 21 ! 21
Z b Z b Z b
f (x)(f (x) + g(x))dx ≤ f (x)2 dx (f (x) + g(x))2 dx (1.8)
a a a
et
! 12 ! 21
Z b Z b Z b
2 2
g(x)(f (x) + g(x))dx ≤ g(x) dx (f (x) + g(x)) dx . (1.9)
a a a
R 21
b 2
et on en déduit (1.7) en divisant les deux membres par
a
(f (x) + g(x)) dx .
! 12 ! 21
Z b Z b
2 2
|f (x) + g(x)| dx ≤ (|f (x)| + |g(x)|) dx
a a
! 21 ! 21
Z b Z b
2 2
≤ |f (x)| dx + |g(x)| dx .
a a
(1.10)
On suppose maintenant f et g continues et positives, et qu'il y a égalité dans
(1.7). Si f + g = 0, f = g = 0 et il n'y a rien à prouver. On peut donc supposer
que f + g n'est pas la fonction nulle. D'après la preuve précédente, on a donc
égalité dans (1.8) et (1.9), ce qui, d'après le cas d'égalité dans Cauchy-Schwarz,
montre qu'il existe µ1 ≥ 0 tel que
f = µ1 (f + g)
g = µ2 (f + g).
Si µ1 = 0, on a f = 0. Sinon, g = µµ12 f .
On passe au cas général : f et g sont continues et il y a égalité dans (1.7).
D'après (1.10), on a donc
Z b Z b
2 2
|f (x) + g(x)| dx = (|f (x)| + |g(x)|) dx (1.11)
a a
et
! 21 ! 21 ! 21
Z b Z b Z b
2 2 2
(|f (x)| + |g(x)|) dx = |f (x)| dx + |g(x)| dx .
a a a
de sorte que f (x) et g(x) sont de même signe pour tout x ∈ [a, b]. Ainsi, on a
f = 0, ou g = µf , ce qui termine la preuve.
Z N −1
b X
f (x)dx − (xi+1 − xi )f (yi )
≤ ε.
a
i=0
N
X −1 i2
X
(xi+1 − xi )f (yi ) = (xi+1 − xi )e = xi2 +1 − xi1 e,
i=0 i=i1
si bien que
Z b N
X −1
f (x)dx − (xi+1 − xi )f (yi ) = ((d − xi2 +1 ) − (c − xi1 )) e.
a i=0
|d − xi2 +1 | ≤ 2 |σ| .
ε
dès que |σ| < δ := 4kek .
On suppose maintenant f en escalier. Alors f est une combinaison linéaire
de fonctions du type considéré auparavant (Proposition 1.1.6) et on raisonne
par linéarité.
Dans le cas général, soient f continue par morceaux, ε > 0 et g en escalier
ε
telle que kf − gk∞ ≤
3(b−a) . Soient σ une subdivision de [a, b] et y0 , ..., yN −1
comme dans l'énoncé du théorème 1.2.29. Alors
Z N −1
Z
b X
b
f (x)dx − (xi+1 − xi )f (yi )
≤
(f (x) − g(x))dx
a
a
i=0
N −1
X
+
(xi+1 − xi )(f (yi ) − g(yi ))
Zi=0 N −1
b X
+
g(x)dx − (xi+1 − xi )g(yi )
a
Z i=0
b N −1
2ε
X
≤ +
g(x)dx − (xi+1 − xi )g(yi )
,
3
a
i=0
n−1 Z b
b−a X b−a
lim f a+k = f (t)dt
n→+∞ n n a
k=0
et
n b
b−a X b−a
Z
lim f a+k = f (t)dt
n→+∞ n n a
k=1
n
X 1
xn = .
n+k
k=1
Alors
n
1X 1
xn = k
.
n 1+ n
k=1
1
Posons alors f (x) = 1+x pour x ∈ [0, 1]. On a donc
n Z 1
1X k
xn = f → f (t)dt = ln2,
n n 0
k=1
Preuve :
Rb
cela résulte immédiatement de la continuité de l'application f 7→
a
f (x)dx de Cpm ([a, b], Rn ) muni de k·k∞ dans Rn .
1
k2 x si 0≤x≤ ,
2k
1 1
fk (x) := k − k2 x si ≤x≤ ,
2k k
1
0 si ≤ x ≤ 1,
k
et si f (x) = 0 pour tout x ∈ [0, 1], alors les fk et f sont continues sur [0, 1],
R1 1
fk (x) → f (x) pour tout x ∈ [0, 1], mais 0 fk (x)dx = 4 pour tout k ≥ 1.
Dans le cas d'une convergence simple, on peut toutefois énoncer le théorème de
convergence dominée :
Z π
4
In := tann (x)dx.
0
Preuve : soient x ∈ I et (xk )k≥1 une suite de points de I qui converge vers
x. Pour tout k ≥ 1 et tout t ∈ [a, b], on pose hk (t) := f (t, xk ) et h(t) :=
f (t, x). Alors hk est continue par morceaux sur [a, b] et limk→+∞ hk (t) = h(t)
avec h continue par morceaux sur [a, b]. De plus, khk (t)k ≤ g(t) pour tout
k ≥ 1 et tout t ∈ [a, b]. Le théorème de convergence dominée montre donc que
Rb Rb
limk→+∞ a f (t, xk )dt = a f (t, x)dt, ce qui donne bien la conclusion.
Z 1
F (t) := etx f (x)dx.
0
Alors F est continue sur R. En eet, si g(t, x) := etx f (x), on vérie que, pour
tout x ∈ [0, 1], t 7→ g(t, x) est continue en tout point de [0, +∞[ et que, pour tout
t ≥ 0, x 7→ etx f (x) est continue. De plus, pour tout M > 0, tout t ∈ [−M, M ]
Mx
et tout x > 0, |g(t, x)| ≤ e |f (x)| et la fonction |f | est continue sur [0, 1]. Le
corollaire 1.2.36 montre que F est continue sur [−M, M ], et comme c'est vrai
pour tout M > 0, F est continue sur R.
Preuve : soit x ∈ I . Soit (hk )k≥1 une suite de réels qui tend vers 0. Pour tout
k≥1 assez grand pour que x + hk ∈ I et tout t ∈ [a, b], on pose
f (t, x + hk ) − f (t, x)
hk (t) := .
hk
Alors hk est continue par morceaux et limk→+∞ hk (t) = ∂f ∂x (t, x). De plus, pour
tout k et tout t ∈ [a, b], le théorème des accroissements nis montre que
b b
f (t, x + hk ) − f (t, x)
Z Z
∂f
lim dt = (t, x)dt,
k→+∞ a hk a ∂x
g(x) avec g(x) := xeM x |f (x)| pour tout x ∈ [0, 1]. Le corollaire 1.2.38 assure
donc que, pour tout t ∈ [−M, M ],
Z 1
0
F (t) = xetx f (x)dx.
0
Comme c'est vrai pour tout M > 0, on a donc cette formule pour tout t ∈ R.
1.2.8 Méthodes de calcul approché
On rappelle d'abord ce qu'est le polynôme interpolateur de Lagrange.
Preuve : Soit En
le R-espace vectoriel des polynômes dans R[X] de degré
n − 1. Une base de En est (1, X, ..., X n−1 ) donc En est de
inférieur ou égal à
dimension n. L'application P 7→ (P (a1 ), ..., P (an )) est une application linéaire
n
de En dans R et elle est injective (car un polynôme de degré inférieur ou égal
à n − 1 qui possède n racines distinctes est le polynôme nul), donc c'est un
n
isomorphisme puisque E et R ont la même dimension.
Pour tout i ∈ {0, . . . , n − 1}, on remplace f sur [ai , ai+1 [ par f (ai ). On
Rb
compare donc
a
f (x)dx à
n−1 n−1
X b−a X
Rn := (ai+1 − ai )f (ai ) = f (ai ).
i=0
n i=0
Rb
Par le théorème 1.2.29, limn→+∞ Rn = a
f (x)dx.
Théorème 1.2.41 On suppose f de classe C 1 sur [a, b]. Soit M1 := maxa≤x≤b |f 0 (x)|.
Alors, pour tout n ≥ 1,
Z
b (b − a)2
f (x)dx − Rn ≤ M1 .
2n
a
Preuve : on écrit que
Z n−1 Z
b X ai+1
f (x)dx − Rn = (f (x) − f (ai ))dx
a a i
i=0
n−1
X Z ai+1
≤ |f (x) − f (ai )| dx
i=0 ai
n−1
X Z ai+1
≤ M1 (x − ai )dx
i=0 ai
n−1
X(ai+1 − ai )2
= M1
i=0
2
M1 (b − a)2
= .
2n
Théorème 1.2.42 On suppose f de classe C 2 sur [a, b]. Soit M2 := maxa≤x≤b |f 00 (x)|.
Alors, pour tout n ≥ 1,
Z
b (b − a)3
f (x)dx − Tn ≤ M2 .
12n2
a
La preuve utilise :
(x − a)(x − b) 00
g(x) − P (x) = g (c),
2
2. si M := supt∈[a,b] |g 00 (t)|, alors pour tout x ∈ [a, b],
(x − a)(b − x)
|g(x) − P (x)| ≤ M .
2
Preuve du lemme 1.2.43 : soit x ∈ [a, b]. Si x = a ou x = b, n'importe quel
c convient. On suppose donc que x 6= a et x 6= b. Pour tout t ∈ [a, b], on dénit
h(t) := g(t) − P (t) − K(t − a)(t − b),
où K ∈ R est choisi de sorte que h(x) = 0. Comme h est C 2 sur [a, b] et
h(a) = h(x) = h(b), le théorème de Rolle assure qu'il existe u ∈]a, c[ et v ∈]c, b[
0 0
tels que h (u) = h (v) = 0, et une nouvelle application du théorème de Rolle
00 00
montre qu'il existe c ∈]u, v[ tel que h (c) = 0, ce qui donne g (c) = 2K , et on
conclut en écrivant que h(x) = 0. Le point 2 résulte immédiatement du 1.
On utilisera aussi :
b−a
b
b−a b−a
Z Z 2
(x − a)(b − x)dx = y+ − y dy,
a − b−a
2
2 2
Z
b n−1
X Z ai+1
f (x)dx − Tn ≤ |f (x) − Pi (x)| dx
a ai
i=0
n−1
X Z ai+1
M2
≤ (x − ai )(ai+1 − x)dx
2 i=0 ai
M2 (b − a)3
= .
12 n2
Méthode de Simpson
Pour tout i ∈ {0, . . . , n − 1}, on remplace f sur [ai , ai+1 ] par le polynôme
d'interpolation de Lagrange (de degré inférieur ou égal à
2) aux points ai , ai +a
2
i+1
ai +ai+1
et ai+1 associé aux valeurs f (ai ), f 2 et f (ai+1 ), noté Pi dans la suite.
On utilisera :
Lemme 1.2.45 Soient a < b. Pour tout polynôme P de degré inférieur ou égal
à 2,
b
b−a
Z
a+b
P (x)dx = P (a) + P (b) + 4P .
a 6 2
Preuve : il sut de le faire quand P (x) = 1, quand P (x) = x et quand
P (x) = x2 , puis d'utiliser la linéarité de l'intégrale.
Rb
On compare donc
a
f (x)dx à
n−1 n−1 !
b−a X X ai + ai+1
Sn := f (a0 ) + f (an ) + 2 f (ai ) + 4 f .
6n i=1 i=0
2
Preuve : pour tout i ∈ {0, . . . , n − 1}, on a, avec les notations déjà utilisées
et en appliquant le lemme 1.2.45,
Z ai+1 Z ci + h
2 h h h
(f (t)−Pi (t))dt = f (t)dt− f ci − + f ci + + 4f (ci ) .
ai ci − h
2
6 2 2
u ∈ 0, h2 ,
Pour tout on pose
Z ci +u
u
ϕ(u) := f (t)dt − (f (ci − u) + f (ci + u) + 4f (ci )) .
ci −u 3
On calcule
1
ϕ0 (u) = f (ci + u) + f (ci − u) − (f (ci − u) + f (ci + u) + 4f (ci ))
3
− u3 (−f 0 (ci − u) + f 0 (ci + u))
2 u
= (f (ci + u) + f (ci − u) − 2f (ci )) − (−f 0 (ci − u) + f 0 (ci + u)) ,
3 3
puis
2 0 1
ϕ00 (u) = (f (ci + u) − f 0 (ci − u)) − (−f 0 (ci − u) + f 0 (ci + u))
3 3
− u3 (f 00 (ci − u) + f 00 (ci + u))
1 0 u
= (f (ci + u) − f 0 (ci − u)) − (f 00 (ci − u) + f 00 (ci + u)) ,
3 3
et enn
1 00 1
ϕ(3) (u) = (f (ci + u) + f 00 (ci − u)) − (f 00 (ci − u) + f 00 (ci + u))
3u 3
− −f (3) (ci − u) + f (3) (ci + u)
3
u
= − −f (3) (ci − u) + f (3) (ci + u) .
3
Par le théorème des accroissements nis,
(3) 2M4 u2
ϕ (u) ≤ .
3
Comme ϕ00 (0) = 0, on en déduit
u
2M4 u3
Z
|ϕ00 (u)| ≤
(3)
ϕ (t) dt ≤ .
0 9
0
Comme ϕ (0) = 0, on a donc
M4 u4
|ϕ0 (u)| ≤ ,
18
et comme ϕ(0) = 0, on en déduit
M4 u5
|ϕ(u)| ≤ .
90
En particulier,
ai+1
h M4 h5
Z
(f (t) − Pi (t))dt = ϕ ≤ .
ai 2 2880
On en déduit que
Z n−1
b X Z ai+1
f (x)dx − Sn ≤ (f (t) − Pi (t))dt
a ai
i=0
M4 (b − a)5
≤ .
2880n4
Exemple 1.3.10 1. Soit f (t) = (cos t, sin t) pour t ∈ I := [0, 2π]. Alors
f 0 (t) = (− sin t, cos t) et kf 0 (t)k = 1 pour tout t ∈ [0, 2π]. La longueur de
l'arc (I, f ) est 2π .
2. Soit f (t) = (a(t − sin t), a(1 − cos t)) pour t ∈ [0, 2π] et a > 0. Alors
2
f 0 (t) = (a(1−cos t), a sin t), donc kf 0 (t)k = 2a2 (1−cos t) = 4a2 sin2 2t .
Z 2π Z π
t
2a sin 2 dt = 4a
sin udu = 8a.
0 0
ψ(t) − ψ(a)
h(t) := .
ϕ(t) − ϕ(a)
Pour tout t ∈ A, h(t) = 1 ou h(t) = −1. On suppose qu'il existe t1 6= t2 dans A
tels que h(t1 ) = 1 et h(t2 ) = −1. Alors
Si ψ(t1 ) − ψ(t2 ) = ϕ(t1 ) − ϕ(t2 ), alors ϕ(t2 ) = ϕ(a), ce qui est faux. De même, si
ψ(t1 ) − ψ(t2 ) = −ϕ(t1 ) + ϕ(t2 ), alors ϕ(t2 ) = ϕ(a), ce qui est faux. Finalement,
h est constante, toujours égale à 1 ou à −1, ce qui montre qu'il existe ε ∈ {−1, 1}
tel que, pour tout t ∈ A,
pour tout t ∈ I , ϕ0 est une abscisse curviligne et, par la proposition 1.3.12, il
existe ε ∈ {−1, 1} et k ∈ R tels que, pour tout t ∈ I ,
On en déduit que ϕ est dérivable sur I et que, pour tout t ∈ I , ϕ0 (t) = ε kf 0 (t)k.
La réciproque est immédiate.
N
X −1
Lσ := kf (ti+1 ) − f (ti )k .
i=0
Alors
Z b
kf 0 (t)k dt = sup Lσ ,
a
où la borne supérieure est prise sur toutes les subdivisions σ de I.
Preuve :
PN −1
pour tout t ∈ [a, b], on dénit ϕ(t) = supσ i=0 kf (xi+1 ) − f (xi )k,
où la borne supérieure est prise sur toutes les subdivisions σ = (x0 , .., xN ) de
[a, t].
On vérie d'abord que ϕ est bien dénie. Soient t ∈ [a, b] et σ = (x0 , ..., xN ) une
subdivision de [a, t]. Pour tout i ∈ {0, . . . , N − 1},
Z xi+1
kf (xi+1 ) − f (xi )k ≤ kf 0 (t)k dt,
xi
et comme c'est vrai pour toute subdivision de [a, t], ϕ(t) est bien dénie.
Soient t ∈ [a, b] et h > 0 tel que t + h ∈ [a, b]. Soient σ = (x0 , ..., xN ) une
subdivision de [a, t + h] et j ∈ {0, . . . , N − 1} tel que xj ≤ t < xj+1 . Alors
N
X −1 j−1
X
kf (xi+1 ) − f (xi )k ≤ kf (xi+1 ) − f (xi )k + kf (t) − f (xj )k
i=0 i=0
N
X −1
+ kf (xj+1 ) − f (t)k + kf (xi+1 ) − f (xi )k
i=j+1
Z xj+1 N
X −1 Z xi+1
≤ ϕ(t) + kf 0 (u)k du + kf 0 (u)k du
t i=j+1 xi
Z t+h
= ϕ(t) + kf 0 (u)k du.
t
Ainsi, en prenant la borne supérieure sur toutes les subdivisions de [a, t + h], on
obtient que
Z t+h
ϕ(t + h) − ϕ(t) ≤ kf 0 (u)k du.
t
Finalement,
Z t+h
1 1 1
kf (t + h) − f (t)k ≤ (ϕ(t + h) − ϕ(t)) ≤ kf 0 (t)k dt,
h h h t
1
lim (ϕ(t + h) − ϕ(t)) = kf 0 (t)k .
h→0, h>0 h
On raisonne de même pour h < 0. Ainsi, ϕ est dérivable sur [a, b] et, pour tout
t,
ϕ0 (t) = kf 0 (t)k .
Rb Rb
Comme ϕ(a) = 0, sup Lσ = ϕ(b) = a ϕ0 (t)dt = a kf 0 (t)k dt.
Dénition 1.3.15 Soit (I, γ) un arc paramétré de classe C 1 et K := γ(I). Soit
f :K→R une fonction continue. On note I = [a, b]. On dénit
Z Z b
f= f (γ(t))γ 0 (t)dt.
γ a
Z Z b
f = f (γ(t))γ 0 (t)dt
γ
Zab0
= f (γ ◦ ϕ(s))γ 0 (ϕ(s))ϕ0 (s)ds
0
Zab0
= f (γ ◦ ϕ(s))(γ ◦ ϕ)0 (s)ds.
a0
pour tout x ∈ R.
Plus généralement, on pose la question suivante : si f ∈ Cper et x ∈ R, la série
de Fourier de f en x converge-t-elle, et si oui, quelle est sa limite ?
1.4.2 Le noyau de Dirichlet
Dénition 1.4.4 Soit N ∈ N. Pour tout x ∈ R, on dénit
X
DN (x) := einx .
|n|≤N
sin N + 21 x
DN (x) = . (1.15)
sin x2
N
X
DN (x) = einx = e−iN x 1 + eix + · · · + e2iN x
n=−N
N
X
SN f (x) = fb(n)einx
n=−N
N Z 2π
X 1
= f (t)ein(x−t) dt
2π 0
n=−N
N Z x
X 1
= f (x − u)einu du
2π x−2π
n=−N
N Z 2π
X 1
= f (x − u)einu du
2π 0
n=−N
Z 2π
1
= f (x − u)DN (u)du.
2π 0
1.4.3 Convergence quadratique
Dénition 1.4.7 On dénit D comme l'espace des fonctions f ∈ Cper telles
que, pour tout x ∈ R,
f (x+ ) + f (x− )
f (x) = ,
2
où f (x+ ) := limy→x y>x f (y) et f (x− ) := limy→x y<x f (y).
Z 2π
1
hf, gi := f (t)g(t)dt. (1.17)
2π 0
De plus,
Z 2π Z 2π
1 2 1 2
min |f (t) − g(t)| dt = |f (t) − SN f (t)| dt
g∈PN 2π 0 2π 0
Z 2π N
1 b 2
X
2
= |f (t)| dt − f (n) .
2π 0 k=−N
b 2
P
3. La série n∈Z f (n) converge et
2 Z 2π
X 1 2
fb(n) ≤ |f (t)| dt [Inégalité de Bessel]. (1.18)
2π 0
n∈Z
Preuve : le point 1 est immédiat. Pour 2, il est clair que SN f ∈ PN et, pour
tout −N ≤ k ≤ N ,
Z 2π
1
hf, ek i = f (t)e−ikt dt = fb(k) = Sd
N f (k) = hSN f, ek i.
2π 0
⊥
Cela montre que f − SN f ∈ PN . L'identité
Z 2π Z 2π
1 2 1 2
min |f (t) − g(t)| dt = |f (t) − SN f (t)| dt
g∈PN 2π 0 2π 0
provient du théorème de Pythagore. Enn,
Z 2π
1 2
|f (t)| dt = hf, f i
2π 0
= h(f − SN f ) + SN f, (f − SN f ) + SN f i
= hf − SN f, f − SN f i + hSN f, SN f i
Z 2π N
1 b 2
X
2
= |f (t) − SN f (t)| dt + f (n) .
2π 0
k=−N
On a donc
N Z 2π
b 2 1
X
2
f (n) ≤ |f (t)| dt
2π 0
k=−N
Z 2π N
b 2
1 X X 2
2
|f (t)| dt ≤ f (n) + ε ≤ fb(n) + ε,
2π 0 k=−N n∈Z
Z b
lim g(t)e−int dt = 0.
|n|→+∞ a
Z
b ε
−int
h(t)e dt ≤
2
a
π
f (x + t) + f (x − t)
Z
1
SN f (x) = DN (t)dt
2π Z−π 2
π
1
= (f (x + t) + f (x − t))DN (t)dt,
2π 0
grâce, encore une fois, à la parité de DN . Comme
Z π
DN (t)dt = 2π,
−π
Rπ
on a donc
0
DN (t)dt = π , donc, par la proposition 1.4.5, l'erreur EN =
f (x+ ) + f (x− )
SN f (x) − vérie :
2
Z π
1
EN = (f (x + t) − f (x+ ) + f (x − t) − f (x− ))DN (t)dt
2π Z0
π
N + 21 t
1 + − sin
= (f (x + t) − f (x ) + f (x − t) − f (x ))
sin 2t
2π 0
Pour tout t ∈ ]0, π], on pose
f (x + t) − f (x+ ) + f (x − t) − f (x− )
g(t) := .
sin 2t
f (x+t)−f (x+ )
On vérie que t 7→ t possède une limite quand t → 0 avec t > 0 (c'est
immédiat si f est dérivable en x, et sinon, utiliser la dénition d'une fonction
sin( t )
C 1 par morceaux). Il en est donc de même pour g car t 7→ t 2 possède une
limite quand t tend vers 0. On prolonge ainsi g en une fonction continue en 0,
et la fonction ainsi prolongée est continue par morceaux sur [0, π]. On conclut
donc par le lemme de Riemann-Lebesgue.
Exemple 1.4.16
2
Soit f (x) := 1 − πx2 pour tout x ∈ [−π, π], prolongée par 2π -
1
périodicité sur R. La fonction f est continue sur R et C par morceaux. Pour
tout n ∈ Z∗ ,
π π
t2
Z Z
1 −int 1
fb(n) = 1− 2 e dt = u(t)v 0 (t)dt
2π −π π 2π −π
t2 e−int
avec u(t) = 1 − π 2 et v(t) = −in . On a donc
π
2t e−int
Z
1 1
fb(n) = (u(π)v(π) − u(−π)v(−π)) − − 2 dt
2π Z π 2π −π π −in
1
= − te−int dt
inπ 3 Z−π
π
1
= − u1 (t)v10 (t)dt,
inπ 3 −π
−int
avec v1 (t) = e−in . On a donc
u1 (t) = t et
Z π
1 0
f (n) = −
b u1 (π)v1 (π) − u1 (−π)v1 (−π) − u1 (t)v1 (t)dt
inπ 3 Z π −π
1 1
= − 2π(−1)n − e−int dt
inπ 3 −in −π
2
= (−1)n+1 2 2 .
π n
Pour n = 0, Z π
1 2
fb(0) = f (t)dt = .
2π −π 3
D'après le théorème d'Abel-Dirichlet, pour tout x ∈ R,
2 X 2
f (x) = + (−1)n+1 2 2 einx
3 π n
n∈Z∗
2 X 4
= + (−1)n+1 2 2 cos(nx).
3 π n
n≥1
2 X 4
0= − ,
3 π 2 n2
n≥1
donc
X 1 π2
= .
n2 6
n≥1
Z π 2
4 4 X 1 1 t2
+ 4 = 1 − dt,
9 π ∗
n4 2π −π π2
n∈Z
donc
4 8 X 1 8
+ 4 = ,
9 π n4 15
n≥1
et
X 1 π4
= .
n4 90
n≥1
Les notions de base sur ces intégrales seront rappelées sans qu'on donne le
détail des arguments.
1.5.1 Dénitions
Dénition 1.5.1 Soient I ⊂ R un intervalle et f : I → Rn . On dit que f
est continue par morceaux sur I si, et seulement si, pour tous a < b ∈ I , la
restriction de f à [a, b] est continue par morceaux.
Z b
f (t)dt := lim F (x).
a x→b, x<b
Rb
2. On dit que l'intégrale impropre
a
f (t)dt diverge si, et seulement si, elle
ne converge pas.
Exemple 1.5.5 1. Soit f (t) = e−t pour t ∈ [0, +∞[. Pour tout x ∈ [0, +∞[,
Z x
F (x) = e−t dt = 1 − e−x ,
0
Z ∞
e−t dt = 1.
0
1
2. Soit f (t) = 1−t pour tout t ∈ [−1, 1[. Pour tout x ∈ [−1, 1[,
Z x
1
F (x) = dt = −ln(1 − x) + ln2,
−1 1−t
R1 1
donc limx→1,x<1 = +∞. Ainsi, l'intégrale
−1 1−t
dt diverge.
3. Soit f (t) = cos t pour tout t ∈ [0, +∞[. Pour tout x ∈ [0, +∞[,
Z x
F (x) = cos tdt = sin x,
0
R +∞
et comme F n'a pas de limite en +∞, l'intégrale
0
cos tdt diverge.
On peut donner une dénition analogue pour des fonctions continues sur ]a, b] :
Z b
f (t)dt := lim F (x).
a x→a, x>a
Rb
2. On dit que l'intégrale impropre
a
f (t)dt diverge si, et seulement si, elle
ne converge pas.
Remarque 1.5.12
Rb
Il peut arriver que
a
f (t)dt converge sans converger abso-
lument. On verra un exemple de ce phénomène plus loin.
1.5.2 Cas des fonctions positives
Proposition 1.5.13 Soient a < b avec a ∈ RR et b ∈ R ou b = +∞. Soit f :
b
[a, b[→ [0, +∞[ continue par morceaux. Alors a f (t)dt converge si, et seulement
Rx
si, il existe M > 0 tel que, pour tout x ∈ [a, b[, f (t)dt ≤ M . On a alors
Rb a
a
f (t)dt ≤ M .
On utilisera souvent les corollaires 1.5.14 et 1.5.15 avec des fonctions de réfé-
rence.
Exemple 1.5.17
R +∞ 2 2
1. L'intégrale
0
e−x dx converge. En eet, e−x ≥ 0
2
pour tout x ≥ 0 et il existe C > 0 tel que, pour tout x ≥ 1, e−x ≤ xC2 et
R +∞ C
1 x2 d converge.
R +∞ x sin x
2. L'intégrale
2 (x−1)3 dx converge absolument. En eet, pour tout x ≥ 2,
x sin x x 1
(x−1)3 ≤ (x−1) 3 ∼ x2 .
R1
3. L'intégrale √ 1 dx est convergente. En eet, au voisinage de 1,
0 1−x3
1 1 1 1
√ =√ √ ∼√ √ ,
1 − x3 1 − x 1 + x + x2 3 1−x
Exemple 1.5.19 1
P
La série n≥2 nlnn diverge. En eet, pour tout n ≥ 2,
Z n+1
1 1
≥ dt,
nlnn n tlnt
donc
N Z N +1
X 1 1
≥ dt,
n=1
nlnn 1 tlnt
R N +1 1
Rx 1
et comme limN →+∞ 1 tlnt dt = limx→+∞ 1 tlnt
dt = +∞, on obtient la
conclusion.
1.5.3 Cas des fonctions à valeurs dans R
Proposition 1.5.20 [Règle d'Abel] Soient a < b avec a ∈ R et b ∈ R ou
b = +∞, et f, g : [a, b[→ R continues. On suppose que :
Preuve : on notera que f (x) ≥ 0 pour tout x ∈ [a, b[. Soit ε > 0. Il existe
ε 0
δ>0 tel que, pour tout x ∈ [b − δ, b[, 0 ≤ f (x) ≤ M . Soient x < x ∈ [b − δ, b[.
0
Par la deuxième formule de la moyenne, il existe y ∈]x, x [ tel que
Z x0 Z y
f (t)g(t)dt = f (x) g(t)dt,
x x
donc Z 0
x ε y
Z
f (t)g(t)dt ≤ g(t)dt ≤ ε,
M x
x
et le critère de Cauchy permet de conclure.
D'après la règle d'Abel, l'intégrale converge. De plus, elle ne converge pas absolu-
ment. En eet, dans le cas contraire, comme 0 ≤ cos2 (λt) ≤ |cos(λt)|, l'intégrale
R +∞ −α 2
1
t cos (λt)dt serait convergente. Or, pour tout A > 1,
Z A Z A Z A
−α 1 −α 1
t 2
cos (λt)dt = t dt + t−α cos(2λt)dt.
1 2 1 2 1
RA R 2A RA
Comme t−α cos(2λt)dt = 2α−1 2 u−α cos(λu)du, A 7→ 1 t−α cos(2λt)dt
1 R A −α
possède une limite en +∞. Comme A 7→
1
t cos2 (λt)dt possède aussi une
R A −α
limite en +∞, on en déduit que A 7→ t dt possède une limite en +∞, ce
1
qui est faux puisque α ≤ 1.
Si α ≤ 0, l'intégrale 1 t cos(λt)dt est divergente. En eet, dans le cas
R +∞ −α
R π2 +nπ −α
contraire, on devrait avoir limn→+∞ − π +nπ t cos(λt)dt = 0. Or, si an :=
λ
2
λ
π +nπ
2
t−α cos(λt)dt,
R λ
− π +nπ
2
comme cos(λt) est de signe constant sur l'intervalle d'in-
λ
tégration, on a
π +nπ
Z 2
λ
|an | = − π +nπ
t−α |cos(λt)| dt
2
λ
Z π2 +nπ
− π2 + nπ −α
λ
≥ − π +nπ
|cos(λt)| dt
λ 2
π −α Z λπ +nπ
1 − 2 + nπ 2
= t−α |cos u| du
λ λ −π 2 +nπ
−α
2 − π2 + nπ
= ,
λ λ
ce qui donne une contradiction.
Remarque 1.5.22
R +∞ sin
On vient de voir que l'intégrale √ t dt converge. Par
1 t
R +∞
sin 2
contre, l'intégrale √ t + sin t dt est divergente, car si elle convergeait,
1 t t
R +∞ sin2 t
l'intégrale
1 t dt convergerait aussi, ce qui n'est pas le cas par un argument
sin t sin t sin2 t
analogue à celui de l'exemple 1.5.21. Les fonctions t 7→ √ et t 7→ √ +
t t t
sont équivalentes au voisinage de +∞ mais les intégrales de 1 à +∞ ne sont
pas de même nature (comparer avec le corollaire 1.5.15, ici aucune fonction ne
garde un signe constant au voisinage de +∞).
On peut parfois utiliser un changement de variable pour déterminer si une in-
tégrale impropre converge ou non.
Exemple 1.5.23
R +∞
L'intégrale
1
cos(t2 )dt converge. En eet, pour tout A>
2
1, le changement de variables u=t donne
Z A Z A2
2 1 cos u
cos(t )dt = √ du,
1 2 1 u
R +∞
cos
RA
et comme l'intégrale √ u du converge, on voit que A 7→ cos(t2 )dt pos-
u 1 1
2
sède une limite. On notera que t 7→ cos(t ) ne tend pas vers 0 en +∞.
On peut aussi utiliser une intégration par parties pour étudier certaines inté-
grales impropres.
sin t
(
si t > 0,
f (t) := t
1 si t=0
et
sin2 t
g(t) := 2
si t > 0,
1t si t = 0.
R +∞
Les fonctions f et g [0, +∞[. L'intégrale 0 f (t)dt converge
sont continues sur
R +∞ sin t R +∞
par la règle d'Abel (qu'on applique à
1 t dt). L'intégrale 0 g(t)dt converge
1
aussi car 0 ≤ g(t) ≤ 2 pour tout t > 0 et cela donne la convergence de l'intégrale
R +∞ t
1
g(t)dt.
R +∞ R +∞
De plus,
0
f (t)dt = 0 g(t)dt. En eet, soit A > 0. En intégrant par
1
parties, en posant u(t) = 1 − cos t et v(t) = ,
t
A A Z A
1 − cos A 1 − cos t
Z Z
sin t 0 1
dt = u (t)v(t)dt = −A 1 − cos + dt.
1
A
t 1
A
A A 1
A
t2
Or
1 − cos A
lim = 0,
A→+∞ A
1 1
et, quand A → +∞, 1 − cos A ∼ A2 , de sorte que
1
lim A 1 − cos = 0.
A→+∞ A
Enn, pour tout A > 0, par le changement de variables t = 2u,
A
A A
sin2 t
1 − cos t sin2 u
Z Z Z 2
2
dt = 2 dt = du,
1
A
t2 1
A
t2 1
2A
u2
Si un tel c existe, alors les mêmes conditions sont satisfaites pour tout c ∈]a, b[
et la dénition (1.22) ne dépend pas du choix de c.
R c1
La vérication ne pose pas de problème : si c1 , c2 ∈]a, b[,
f (t)dt converge, si
a
R c2 Rb
alors
a
f (t)dt converge aussi, et la conclusion est analogue pour
c2
f (t)dt. De
plus,
Z c2 Z b Z c1 Z c2 Z c1 Z b
f (t)dt + f (t)dt = f (t)dt + f (t)dt + f (t)dt + f (t)dt
a c2 Zac1 Zc1b c2 c1
= f (t)dt + f (t)dt.
a c1
Remarque 1.5.26
Rb
Dans la situation de la dénition 1.5.25, si
a
f (t)dt converge,
Rb R θ(x)
alors, siθ :]a, b[→]a, b[ est telle que limx→a θ(x) = b, on a a f (t)dt = limx→a x f (t)dt.
R θ(x)
Par contre, il peut arriver que limx→a f (t)dt existe pour une certaine fonc-
Rb x Rx
tion θ sans que f (t)dt ne converge. Par exemple, pour tout x > 0, tdt = 0,
a −x
R +∞
mais
−∞
tdt ne converge pas.
Exemple 1.5.27
R +∞
1. Pour tout α ∈ R, 0
tα dt diverge.
R2 3
1√
dt est convergente. En eet, 12 √t−11√2−t dt est
R
2. L'intégrale √
1 t−1 2−t
1√ 1
convergente, car quand t → 1, √ ∼ √t−1 , ces fonctions sont posi-
t−1 2−t
R 32 1 R2
tives et
1
√
t−1
dt est convergente. On raisonne de même pour 3 √t−11√2−t dt
2
converge.
Z 2
1
√ √ dt = 2 arcsin 1 = π.
1 t−1 2−t
Corollaire 1.5.29
R
[Continuité sous le signe pour les intégrales impropres]
Soient a < b avec a ∈ R, b ∈ R ou b = +∞ et I ⊂R un intervalle de R. Soit
f : [a, b[×I → Rn . On suppose que :
1. pour tout x ∈ I, la fonction t 7→ f (t, x) est continue par morceaux sur
[a, b[,
2. pour tout t ∈ [a, b[, la fonction x 7→ f (t, x) est continue sur I,
3. il existe une fonction g : [a, b[→ R continue par morceaux telle que, pour
Rb
tout t ∈ [a, b] et tout x ∈ I , kf (t, x)k ≤ g(t) et l'intégrale a g(t)dt
converge.
Rb
Alors, pour tout x ∈ I , l'intégrale a
f (t, x)dt converge absolument et la fonction
Rb
x 7→ a
f (t, x)dt est continue sur I.
Z +∞
Γ(x) := tx−1 e−t dt.
0
Corollaire 1.5.31
R
[Dérivabilité sous le signe pour les intégrales impropres]
Soient a < b avec a ∈ R, b ∈ R ou b = +∞ et I ⊂R un intervalle de R. Soit
f : [a, b[×I → Rn . On suppose que :
1. pour tout x ∈ I, la fonction t 7→ f (t, x) est continue par morceaux sur
Rb
[a, b[ et l'intégrale
a
f (t, x)dt converge,
2. pour tout t ∈ [a, b[, la fonction x 7→ f (t, x) est dérivable sur I et, pour
tout x ∈ I , t 7→ ∂f
∂x (t, x) est continue par morceaux sur [a, b[,
3. il existe une fonction g : [a, b[→
R continue
par morceaux telle que, pour
∂f Rb
tout t ∈ [a, b] et tout x ∈ I ,
∂x (t, x)
≤ g(t), et l'intégrale a g(t)dt
converge.
∂f
Rb
Alors, pour tout x ∈ I , l'intégralea ∂x
(t, x)dt converge absolument, la fonction
Rb R b ∂f
x 7→ a
f (t, x)dt est dérivable sur I et sa dérivée est x 7→
a ∂x
(t, x)dt.
Z +∞
0
Γ (x) = tx−1 e−t lntdt.
0
Chapitre 2
Dénition 2.1.1 Soit P ⊂ Rn . On dit que P est un pavé si, et seulement si,
il existe des intervalles bornés I1 , ..., In ⊂ R tels que P = I1 × ... × In . Si, pour
tout k ∈ {1, n}, Ik est de longueur lk , alors la mesure (ou son volume, ou encore
son aire si n = 2) de P est dénie comme
n
Y
mes P := lk .
k=1
Exemple 2.1.2 2
1. L'ensemble [0, 1[×]0, 1] est un pavé de R .
2 2 2
2
2. L'ensemble (x, y) ∈ R ; x + y ≤ 1 n'est pas un pavé de R .
Si P = [a1 , b1 ]×. . .×[an , bn ] est un pavé fermé, on note E(P, R) l'ensemble des
fonctions qui sont des restrictions de fonction en escalier à P . Comme 1Q |P =
1Q∩P et que Q ∩ P est un pavé si Q et P sont des pavés, E(P, R) est le sous
P
espace vectoriel de R engendré par les fonctions indicatrices des pavés contenus
dans P .
Si σ est une subdivision de P , c'est à dire la donnée pour tout 1 ≤ j ≤ n
d'une subdivision σj = (xj,0 , . . . , xj,Nj ) de [aj , bj ], on a une partition Qσ de P
formée des pavés Q = I1 × In où Ii est soit de la forme {xj,i } soit de la forme
]xj,i , xj,i+1 [.
Une subdivision σ est dite adaptée à la fonction f si f est constante sur
les pavés de Qσ . L'espace des fonctions en escalier auxquelles σ est adaptée
55
forme un sous espace vectoriel Eσ (P, R) ⊂ E(P, R) dont une base est donnée
par{1Q }Q∈Qσ . C'est une
S famille libre car les pavés de Qσ sont disjoints deux à
deux. On a E(P, R) = σ Eσ (P, R).
Rn
f (x)dx = mes P .
Rσ
Soyons plus précis. On peut dénir une forme linéaire
P
sur Eσ (P, R) en la
Rσ
dénissant par que
P
1Q = mes Q si Q est un pavé de Qσ , ce qui est légitime
puisque ces fonctions forment une base de Eσ (P, R).
R = J1 × . . . × Jn
Un pavé
vérie 1R ∈ Eσ (P, R) Ji est
si et seulement si toute extrémité de
R σun des points
de coupures de la subdivision σi . On vérie alors facilement que 1 = mes R.
P R
En eet pour chaque i ∈ {1, . . . , n} Ji est un intervalle d'extrémités xi,ji , xi,ri
ji ≤ ri donc
i −1
rX
xi,ri − xi,ji = xi,ki +1 − xi,ki
ki =ji
et on a bien
n
Y n
X Y Z σ
mes R= (xi,r − xi,j ) = (xi,ki +1 − xi,ki ) = 1R .
i=1 k1 ,...,kn i=1 P
Rσ
Ceci montre que 1 est indépendant de σ tel que 1R ∈ Eσ (P, R) puis que
P R
Rσ
f est indépendant de σ tel que f ∈ Eσ (P, R). Cette valeur commune est bien
P
donnée par la formule de la dénition 2.1.3.
On a une application linéaire naturelle E(P, R) → E(Rn , R), f 7→ f˜P qu'on
appelle le prolongement par zéro. Le prolongement par zéro de f ∈ E(P, R)
est la fonction f˜P telle que f˜P (x) = f (x) si x ∈ P et f˜P (x) = 0 sinon. Toute
fonction en escalier f˜ sur R est de la forme f˜P pour un pavé P convenable
n
c
R
(tout pavé tel que f s'annulle sur P convient). f ne dépend pas de P et se
P
˜
R
note
Rn
f .
On vérie immédiatement les propriétés suivantes :
de Rn
2.2.1 Dénition des fonctions intégrables
Dénition 2.2.1 Soit P un pavé fermé. Une fonction f : P → R est dite
intégrable si pour tout
R >0 il existe deux fonctions φ, ψ ∈ E(P, R) telles que
|f − φ| ≤ ψ et
P
ψ < .
Lemme
R 2.2.4 Si (φn , ψn )n∈N est une approximation en escalier de f alors
( P
φn )n∈N est une suite de Cauchy.
Dénition 2.2.5
R
La limite de la suite ( P φn )n∈N est indépendante de l'ap-
proximation en escalier de la fonction
R f : P → R, s'appele l'intégrale de f sur
P et se note
P
f.
Il est facile de voir que la somme de deux fonctions intégrables est intégrable,
que le produit par un réel constant d'une fonction intégrable est intégrable et
R R R
que
P
λf + µg = λ P
f +µ P
g. On a donc prouvé le :
Théorème 2.2.6 L'espace des fonctions intégrables forme un sous espace vec-
P
torielR − Int(P, R)R ⊂ R formé de fonctions bornées. L'application qui à f
intégrable associe f est l'unique forme linéaire sur R − Int(P, R) telle que si
R RP
f ≥ 0 P f ≥ 0 et P 1Q = mes Q si Q ⊂ P est un pavé.
Proposition 2.2.7 Toute fonction continue sur P à valeurs réelles est inté-
grable.
Preuve : Une telle fonction f est uniformément continue car P est compact.
Par suite pour tout > 0 il existe δ > 0 tel que supi |xi −x0i | < δ implique |f (x)−
0
f (x )| ≤ mes P . Choisissant une subdivision de pas < δ de chaque segment
facteur de P , nous obtenons une subdivision σ de P et, par construction :
X
|f − φQ 1Q | ≤ 1P ,
mes P
Q∈Qσ
et
Z
I + (f ) := inf v(x)dx; v ∈ E + (f ) .
Rn
Z
I − (f ) := sup u(x)dx; u ∈ E − (f ) .
Rn
3. On dit que f est intégrable si, et seulement si, I + (f˜) = I − (f˜). On dénit
alors l'intégrale de f par
Z
f (x)dx = I + (f ) = I − (f ).
Rn
Lemme
R 2.2.10R f :P →R est intégrable si, et seulement si, f˜P est intégrable.
On a f˜ =
Rn P P
f.
On le vérie d'abord pour f continue sur [a, b]. Soit en eet ε > 0. Il existe
ε
δ > 0 tel que, pour tous u, v ∈ [a, b] avec |u − v| ≤ δ , |f (u) − f (v)| ≤ b−a .
On considère une subdivision (x0 , ..., xN ) de [a, b] avec xi+1 − xi < δ
pour tout i ∈ {0, . . . N − 1}. Pour tout i ∈ {0, N − 1}, on pose mi =
ε
inf [xi ,xi+1 ] f et Mi = sup[xi ,xi+1 ] f , de sorte que 0 ≤ Mi − mi ≤ b−a . Si
PN −1 PN −1
u := i=0 mi 1[xi ,xi+1 [ + f (b)1{b} et v := i=0 mi 1[xi ,xi+1 [ + f (b)1{b} ,
− +
Rb
alors u ∈ E (f ), v ∈ E (f ) et (v − u)(x)dx ≤ ε, de sorte que
a
Z b Z b Z b Z b
u(x)dx ≤ I − (f ) ≤ f (x)dx ≤ I + (f ) ≤ v(x)dx ≤ u(x)dx+ε,
a a a a
|f1 f2 − φ1 φ2 | = |f1 f2 − f1 φ2 + f1 φ2 − φ1 φ2 |
≤ |f1 ||f2 − φ2 | + |φ2 ||f1 − φ1 |
≤ sup |f1 |ψ2 + sup |f2 |ψ1 .
P P
R
Posant (Φ, Ψ) = (φ1 .φ2 , supP |f1 |ψ2 + supP |f2 |ψ1 ) on obtient que P Ψ ≤
(supP |f1 |+supP |f2 |). Le produit de deux fonctions en escalier étant en escalier,
la proposition est démontrée.
X
ψ≤ 1Q = 1SQ⊂A Q = 1B 0 ≤ 1A ,
Q⊂A
En particulier B 0 ⊂ A. P
Supposons que φ en escalier vérie φ ≥ 1A . On peut écrire φ= Q φQ 1Q où
{Q} est une famille de pavés deux à deux disjoints. Si Q ∩ A 6= ∅ on a φQ ≥ 1 .
Par suite
X
φ≥ 1Q = 1SQ∩A6=∅ Q = 1C 0 ≥ 1A ,
Q∩A6=∅
0
En particulierA R⊂ C .
φ − ψ ≤ , mes (C 0 \ B 0 ) = Rn 1C 0 \B 0 ≤ Rn φ − ψ ≤ .
R R
En particulier si
Rn
0
On peut remplacer B par la réunion B des seuls pavés ouverts dans la construc-
0 0 0
tion de B et remplacer C par C la réunion des adhérences des pavés de C , on
a toujours B ⊂ A ⊂ C et mes C \ B.
Lemme 2.2.17 Une partie bornée A ⊂ Rn est cubable si et seulement si, pour
tout > 0, sa frontière ∂A est contenue dans une réunion de pavés dont la
mesure est < .
P
φi − ψi < . Toutes les parties A considérées vérifent :
Cas particulier (c'en est bien un car toute fonction continue sur K se prolonge
à une fonction continue dénie sur Rn ) :
Dénition 2.2.20 [Intégrale d'une fonction continue sur un compact cubable]
Soient K ⊂ Rn un compact cubable et f :K →R continue. On dénit, pour
tout x ∈ Rn ,
f (x) si x ∈ K,
fe(x) :=
0 si x ∈ Rn \ K.
Alors fe est intégrable et on dénit
Z Z
f (x)dx = fe(x)dx.
K Rn
et
Z b Z t
ψ(t) = f (x, y)dy dx.
a c
Z b
g(y) := f (x, y)dx.
a
La fonction g est continue sur [c, d]. En eet, x 7→ f (x, y) est continue sur [a, b],
y 7→ f (x, y) est continue sur [c, d], et, comme f est continue sur [a, b] × [c, d],
il existe M > 0 tel que |f (x, y)| ≤ M pour tout (x, y) ∈ [a, b] × [c, d]. Comme
la fonction x 7→ M est continue sur [a, b], le corollaire 1.2.36 assure que g est
continue sur [c, d].
Rt
Comme ϕ(t) =
c
g(y)dy , la fonction ϕ est dérivable sur [c, d] et ϕ0 (t) = g(t) =
Rb
a
f (x, t)dx pour tout t ∈ [c, d].
Pour tout t ∈ [c, d] et tout x ∈ [a, b], on pose
Z t
h(x, t) = f (x, y)dy.
c
Pour tout t ∈ [c, d], x 7→ h(x, t) est continue sur [a, b] (conséquence du corollaire
∂h
1.2.36). Pour tout x ∈ [a, b], t 7→ h(x, t) est dérivable ∂hsur [c, d] et ∂t (x, t) =
f (x, t). De plus, pour tout x ∈ [a, b] et tout t ∈ [c, d], ∂t (x, t) = |f (x, t)| ≤ M
et la fonction x 7→ M est continue sur [a, b]. Ainsi, par le corollaire 1.2.38,
Rb Rb
comme ψ(t) =
a
h(x, t)dx, ψ est dérivable sur [c, d] et ψ 0 (t) = a f (x, t)dx.
0 0
Ainsi, ϕ (t) = ψ (t) pour tout t ∈ [c, d], et comme ϕ(a) = ψ(a), on a ϕ(t) = ψ(t)
pour tout t ∈ [c, d] et en particulier, ϕ(d) = ψ(d).
t
Soit x ∈ [a, b]. Par le changement de variables u = tan 2 , on obtient que, pour
tout ε > 0,
q
x+1
Z π−ε Z tan( π−ε
2 )
1 2 1 x−1
dt = √ dv
0 x − cos t x2
−1 0 +1 v2
r !
2 x+1 π−ε
= √ arctan tan .
x2 − 1 x−1 2
Z π
1 π
dt = √ .
0 x − cos t x2 − 1
Il vient que
Z b
1
I=π √ dx.
a x2 − 1
Le changement de variable x = cosh t donne
I = π(β − α),
eα + e−α = 2a,
√
et sieα = √
A, cela donne A2 − 2aA + 1 = √
0, soit A = a + a2 − 1, donc
α = ln a + a2 − 1 et de même β = ln b + b2 − 1 . Finalement,
√ !
b + b2 − 1
I = πln √ .
a + a2 − 1
Théorème 2.3.4 [Intégration par piles] Soient K ⊂ Rn−1 un compact cubable
et ϕ1 , ϕ2 : B → R des fonctions continues telles que ϕ1 (x) ≤ ϕ2 (x) pour tout
x ∈ K . Alors :
n
1. l'ensemble A := {(x, xn ) ∈ R ; ϕ1 (x) ≤ xn ≤ ϕ2 (x)} et est un compact
n
cubable de R ,
Exemple 2.3.5
2
R 2 2
D:= (x, y) ∈ R ; x ≤ y ≤ x . On veut
Soit
calculer
D
x dxdy .
2 2
On remarque que D := (x, y) ∈ R ; 0 ≤ x ≤ 1 et x ≤ y ≤ x . Par le théorème
2.3.4,
Z Z 1 Z x Z 1
2 2 1 1 1
x dxdy = x dy dx = x2 (x − x2 )dx = − = .
D 0 x2 0 4 5 20
Théorème 2.3.6 [Théorème de Fubini pour des fonctions intégrables] Soient
n, m ≥ 1, P ⊂ Rn et Q ⊂ Rm des pavés compacts et f : P ×Q → R une fonction
intégrable sur P × Q.
On suppose que pour tout xR ∈ P (y 7→ f (x, y) est intégrable sur Q.
Alors, la fonction F : (x 7→ Q
f (x, y)dy) est intégrable et :
Z Z Z
f (x, y)dxdy = f (x, y)dy dx.
P ×Q P Q
Preuve du théorème 2.3.6 : Le théorème est vrai pour les fonctions indi-
catrices de pavés et la clause d'intégrabilité est satisfaite. En eet la restriction
d'une fonction indicatrice d'un pavé à un autre pavé est l'indicatrice du pavé
1 0 0 (x, y)dy = mes Q0 1P 0 (x). Donc cette fonction est
R
intersection. De plus
Q P ×Q
proportionnelle à l'indicatrice d'un pavé. Par linéarité, le théorème est vérié
R
pour les fonctions en escalier, la fonction (x 7→ Q
f (x, y)dy) étant en escalier si
f l'est.
Dans le cas général, utilisant le lemme 2.2.2, on choisit
R f1 ≤ f ≤ f2 un enca-
drement en escalier de f tel que f − f1 < .
P ×Q 2
La fonction F ne serait pas
dénie sans l'hypothèse que nous faisons mais cette hypothèse étant faite on a
R R
F1 ≤ F ≤ F2 avec F1 , F2 F − F1 = P ×Q f2 − f1 < en raison
P 2
en escalier et
R R
du cas particulier des fonctions en escalier. Mais évidemment F = P ×Q fi
P i
toujours par ce cas particulier. Ceci observé, le cas général s'obtient par passage
à la limite.
√ !
Z Z A Z A2 −x2
1dxdy = √ dy dx
DA −A − A2 −x2
Z A p
= 2 A2 − x2 dx
Z−A
Ap
= 4 A2 − x2 dx
0Z π
2
= 4A2 sin2 θdθ
0
= πA2 ,
i
∂ϕ
Jϕ(x) = (x) .
∂xj 1≤i,j≤n
Théorème 2.3.9 n]
[Changement de variables dans les intégrales en dimension
Soient K un compact cubable de Rn Ω et ϕ : Ω → ϕ(Ω)
contenu dans un ouvert
1
un C -diéomorphisme de Ω sur l'ouvert ϕ(Ω). Alors ϕ(K) est un compact
n
cubable de R et, pour toute fonction continue f : ϕ(K) → R,
Z Z
f (y)dy = (f ◦ ϕ)(x) |det Jϕ(x)| dx.
ϕ(K) K
Exemple 2.3.10 [Coordonnées polaires] On pose ϕ(r, θ) := (r cos θ, r sin θ)
pour tout (r, θ) ∈ R2 . On vérie que ϕ est C∞ Jϕ(r, θ) = r. Si
et det
∆ := (r, θ) ∈ R2 ; r ≥ 0
et −π ≤θ ≤π
et
I := (x, y) ∈ R2 ; x ≤ 0
et y=0 ,
◦ ◦
alors ϕ : ∆ → R2 \ I est un C ∞ -diéomorphisme. En eet, si (r, θ) ∈ ∆, r > 0
et −π < θ < π , donc si r sin θ = 0, on a θ = 0, donc r cos θ = r > 0. Ainsi
(r cos θ, r sin θ) ∈
/ I.
◦
Soit maintenant (x, y) ∈ R2 \ I . Si (r, θ) ∈ ∆ est tel que (r cos θ, r sin θ) = (x, y),
on a donc p
r = x2 + y 2 (2.1)
et
x y
cos θ = p , sin θ = p .
x2 + y2 x2 + y2
Comme
θ
1 − tan2
2
cos θ = θ
,
1 − tan2 2
on obtient donc que
r 2 − x2 y2
θ2 r−x
tan = = = .
2 r+x (r + x)2 (r + x)2
θ y y
tan = = p .
2 r+x x + x2 + y 2
Comme − π2 < θ
2 < π
2 , on obtient que
y
θ = 2 arctan p . (2.2)
x2 + y2 + x
θ
1 − tan2
2 x
cos θ = 2 θ
=p
1 + tan 2 x + y2
2
et
θ
2 tan 2 x
sin θ = θ
=p .
1 + tan2 2 x2 + y 2
Ce calcul montre bien que (r, θ) 7→ (r cos θ, r sin θ) est un C∞ diéomorphisme,
dont la réciproque est connue explicitement.
2
I = R e−x dx. Soient A > 0, DA := (x, y) ∈ R2 ; x2 + y 2 ≤ A2
R
On veut calculer
et CA := [−A, A]2 . On pose
Z
2 2
IA := e−(x +y ) dxdy.
DA
1
On vérie comme plus haut que
ϕ
est un C -diéomorphisme de ]0, A[×]−π, π[→
(x, y) ∈ R2 ; 0 < x2 + y 2 < A2 \ [−A, 0] × {0}. On en déduit que
Z Z A
2 2 2
IA = e−r rdrdθ = 2π re−r dr = π 1 − e−A .
[0,A]×[−π,π] 0
!2
Z A
−A2 −x2 2
π 1−e ≤ e dx ≤ π(1 − e−2A ),
−A
A2
Z Z
1dxdy = rdrdθ = 2π = πA2 .
DA [0,A]×[−π,π] 2
donc
detJg(r, θ, ϕ) = r2 cos φ.
On dénit
n π πo
∆ := (r, θ, ϕ) ∈ R3 ; r ≥ 0, −π ≤ θ ≤ π, − ≤ ϕ ≤
2 2
et
I := (x, y, z) ∈ R3 ; x ≤ 0, y = 0 .
◦
Alors g est un C∞ diéomorphisme de ∆ sur R3 \ I . Pour le voir, on commence
◦
par observer que si (r, θ, ϕ) ∈ ∆, g(r, θ, ϕ) ∈ R3 \ I .
◦
On suppose que (r1 , θ1 , ϕ1 ) et (r2 , θ2 , ϕ2 ) appartiennent à ∆ et que g(r1 , θ1 , ϕ1 ) =
g(r2 , θ2 , ϕ2 ) = (x, y, z). Alors r12 = r22 = x2 + y 2 + z 2 , donc r1 = r2 > 0. Ensuite,
sin ϕ1 = sin ϕ2 , donc ϕ1 = ϕ2 ∈] − π2 , + π2 [. On en déduit que cos θ1 = cos θ2
et sin θ1 = sin θ2 , et comme θ1 , θ2 ∈] − π, π[, on a bien θ1 = θ2 . Ainsi, g est
◦
injective sur ∆. p
3
Soit (x, y, z) ∈ R \ I . On pose r = x2 + y 2 + z 2 > 0, puis on dénit ϕ ∈
π π z x
] − 2 , + 2 [ tel que sin ϕ = r . Enn, on dénit θ ∈] − π, π[ tel que cos θ = r cos ϕ
y x2 +y 2
et sin θ = r cos ϕ . Un tel θ existe car
r 2 cos2 ϕ = 1. Les r, θ, ϕ ainsi dénis vérient
◦
bien g(r, θ, ϕ) = (x, y, z). Ainsi g(∆) = R3 \ I .
◦
Enn, comme Jg(r, θ, ϕ) > 0 pour tout (r, θ, ϕ) ∈ ∆, le théorème d'inversion
◦
∞
locale montre bien que g est un C diéomorphisme de ∆ sur R3 \ I .
A := (x, y) ∈ R2 ;
il existe t ∈ [0, 2π] tel que x = a(t − sin t), 0 ≤ y ≤ a(1 − cos t) .
Soit f (t) := a(t − sin t) pour tout t ∈ [0, 2π]. La fonction f est un homéomor-
phisme de [0, 2π] sur [0, 2πa]. Soit g := f −1 et ϕ(x) := a(1 − cos g(x)) pour tout
x ∈ [0, 2πa]. Alors
A = (x, y) ∈ R2 ; 0 ≤ x ≤ 2πa
et 0 ≤ y ≤ ϕ(x) .
B := (x, y, z) ∈ R3 ; x2 + y 2 + z 2 ≤ R2 .
Ce volume vaut
Z
I = 1dxdydz
ZB
= r2 cos ϕdrdθdϕ
[0,R]×[−π,π]×[− π π
2 ,+ 2 ]
R3 4πR3
= 2π × 2 × = .
3 3
Exemple 2.3.14
n B = (x, y, z) o∈ R3 ; x2 + y 2 + z 2 ≤ 1
Considérons la boule
2
et le cylindre Σ = (x, y, z) ∈ R3 ; x2 + y − 21 ≤ 14 . On cherche le volume
n 2 o
de B ∩ Σ. Soit D := (x, y) ∈ R2 ; x2 + y − 12 ≤ 14 , qui est le disque de
centre
(0, 12 ) et
de rayon
1
2
. On remarque que, pour tout (x, y) ∈ D , k(x, y)k ≤
(x, y) − (0, 1 )
+
(0, 1 )
≤ 1, où k·k désigne la norme euclidienne. Par suite,
2 2
n p p o
B ∩ Σ = (x, y, z) ∈ R3 ; (x, y) ∈ D et − 1 − x2 − y 2 ≤ z ≤ 1 − x2 − y 2 ,
si bien que
Z Z √1−x2 −y2 !
mes (B ∩ Σ) = √ dz dxdy
(x,y)∈D
Z − 1−x2 −y 2
p
= 4 1 − x2 − y 2 dxdy
D0
Z π Z
2 p
mes (B ∩ Σ) =4 1− r2 rdr dθ
0 0<r<sin θ
Z π
4 2 3
= (1 − (1 − sin2 θ) 2 )dθ
3 0
Z π
4 2 2π 8
= (1 − cos3 θ)dθ = − .
3 0 3 9
Il est bien connu que u∧v est nul si et seulement si u et v sont colinéaires. De plus,
dans le cas contraire, on vérie aisément que u∧v est orthogonal à u et v (pour la
3
structure euclidienne standard de R ) donc normal au plan engendré par {u, v}.
D'autre part, il est classique que la norme de u ∧ v est l'aire du parallélogramme
Π de sommets (0, u, v, u + v) c'est à dire kukkvk| sin(θ)| avec θ l'angle (u, [ v).
2
Ceci découle de la formule laisée en exercice que detB (u, v, u ∧ v) = ku ∧ vk
B étant la base canonique. La positivité du déterminant nous enseigne que
(u, v, u ∧ v) est une base directe. Ce déterminant est l'aire du pavé oblique Q
3
de côtés u, v, u ∧ v (par la formule de changement de variable dans R pour les
applications linéaires). Ce pavé étant un prisme droit de base le paralélogramme
Π et de hauteur la norme de u ∧ v , il s'ensuit que l'aire de Π est le quotient de
l'aire de Q par sa hauteur soit ku ∧ vk.
Une autre façon de faire serait de le vérier si les vecteurs ont leur troisième
R2 ⊂ R3 et d'utiliser que si Ω
coordonnée nulle est un élément de SO(3), on a
Ωu ∧ Ωv = Ω(u ∧ v), ce qui découle facilement du la formulation en terme de
produit mixte :
detB (u, v, w) = (u ∧ v, w).
Cette formule n'est pas autre chose que le développement par rapport à la 3ème
colonne du déterminant. On pourra par exemple se référer à la page Wikipédia
du produit vectoriel.
avec U =]0, 2π[×]0, 2π[, alors l'aire de (U, f ) (tore de révolution) est
Z
∂f
(x, y) ∧ ∂f (x, y)
dxdy = 4π 2 rR.
∂x ∂y
U
R R def R
Si (U, f ) et (V, g) sont équivalentes,
(U,f )
hdσ = (V,g)
hdσ = S
hdσ .
Remarque 2.3.20
R R
L'analogue en dimension 1 de
S
−dσ est
Γ
−|ds| au sens
de la dénition 1.3.19.
Alors le point (x0 , y0 , z0 ) ∈ Φ−1 (t) a un voisinage V tel que V ∩ Φ−1 (t) est le
support géométrique d'une nappe régulière.
régulière.
Lemme 2.3.26 Il existe une famille nie (φi )i∈I de fonction continues sur Σ,
φi ≥ 0 étant nulle hors d'un compact KP i contenu dans le support géométrique
Si ⊂ Σ d'une nappe régulière, telle que i∈I φi = 1S .
S
On peut donc poser, observant que i∈I Si = Σ :
Z XZ
hdσ = hφi dσ.
Σ i∈I Si
car elle est contenue dans une union nie de pavés dont la somme des volumes
R
est arbitrairement petite. En revanche aire(∂K) = dσ > 0 puisque Σ n'est
∂K
pas vide.
On peut généraliser comme suit pour des hypersurfaces de Rn qui sont des
objets de dimension n − 1. Le U dans
la dénition de nappe
doit être remplacé
∂f
par un ouvert de Rn−1 . Le facteur
∂x (x, y) ∧ ∂f
∂y (x, y)
doit être remplacé par
n
la norme euclidienne du vecteur de R dont les coordonnées sont les mineurs
n−1×n−1 de la jacobienne de l'application f . La théorie précédente se
généralise moyennant des modications mineures.
où ~
N est le vecteur unitaire normal à ∂K orienté dans la direction sortante.
Dénition
R 2.4.1 Soit f : Rn → [0, +∞[ continue. On dira que l'intégrale im-
propre
Rn
f (x)dx M > 0 tel que, pour
converge si, et seulement si, il existe
n
R
tout compact cubable
R K ⊂ R ,
K
f (x)dx ≤ M . Cela revient à dire qu'il existe
K > 0 tel que B(0,A) f (x)dx ≤ K pour tout A > 0. Dans ce cas, la limite
R R
limA→+∞ B(0,A) f (x)dx existe dans R et vaut, par dénition, Rn f (x)dx.
En eet, tout compact cubable est inclus dans
R B(0, A) pour un A > 0 et la
fonction A 7→ B(0,A)
f (x)dx est croissante et majorée par M.
Exemple 2.4.3
2
+y 2 )
1. L'intégrale impropre de la fonction (x, y) 7→ e−(x
sur R2 est convergente (voir l'exemple 2.3.10).
x2 + y 2 ≤ 1,
1 si
f (x, y) =
(x2 + y 2 )α/2 si x2 + y 2 ≥ 1.
Z +∞
x2 √
Iσ = e− 2σ dx = 2πσ.
−∞
Pour voir ceci observons que, par le théorème de Fubini sur les pavés
carrés de centre 0 et les propriétés élémentaires des intégrales impropres
Z
x2 +y 2
Iσ2 = e− 2σ dxdy
R2
Z +∞ Z π
−r 2
= r.e 2σ drdθ
0 −π
−r 2
= 2π[−σe 2σ ]+∞
0
= 2πσ.
Ω
f (x)dx converge absolumentRsi, et seulement si, il existe M > 0 tel que, pour
tout compact cubable K ⊂ Ω, |f (x)|dx ≤ M .
K
Lemme 2.4.5 Il existe une suite (Kn )n∈N de compacts cubables contenus dans
Ω telle que :
1. Kn ⊂ Kn+1 ,
S
2. n∈N Kn = Ω.
Preuve : Soit Fn := {x ∈ Ω| d(x, 0) ≤ n etd(x, Ωc ) ≤ 1/n}. Ceci dénit une
suite (Fn )n∈N de compacts contenus dans Ω vériant (1) et (2). Il n'est pas
évident qu'ils sont cubables et en général ce sera faux. Recouvrons la frontière
de Fn par une union nie de pavés fermés contenus dans Ω ce qui est possible par
compacité de ∂Fn . Posons Fn∗ la réunion de Fn avec cette union de pavés fermés.
Fn∗ est cubable car sa frontière est est une réunion nie de pavés de mesure nulle.
Fn∗ ,
S
Posons Kn = m≤n c'est un compact cubable. La suite (Kn )n∈N convient.
Théorème
R 2.4.6 Soit f : Ω → R Riemann-intégrable telle que que l'intégrale
impropre
Ω
f (x)dx converge absolument. Pour toute suite de compacts comme
R
dans le lemme 2.4.5 (Kn )n∈N , la suite ( f )n∈N converge. Sa limite, qui est
KR
n
indépendante de la suite (Kn )n∈N , se note f.
Ω
Exemple 2.4.7 dx
R
1.
Rn \B̄(0,R) r α
converge absolument ssi α > n.
dx
R
2.
B(0,R)\{0} r α
converge absolument ssi α < n.
Probabilités et statistiques
3.1 Algèbres de Boole et probabilités booléennes
Dénition 3.1.1 Soit Ω un ensemble. Une algèbre de Boole sur Ω est un en-
semble A ⊂ P(Ω) (donc un ensemble formé de parties de Ω) vériant les pro-
priétés suivantes :
1. ∅ ∈ A, Ω ∈ A,
2. pour tout A ∈ A, Ω \ A ∈ A,
3. pour tous A, B ∈ A, A ∪ B ∈ A.
77
Ensuite,
\ [
Ω\ Ak = (Ω \ Ak ) ∈ A,
1≤k≤n 1≤k≤n
T
donc 1≤k≤n Ak ∈ A.
Enn, pour 2, A \ B = A ∩ (Ω \ B) ∈ A.
Dénition 3.1.4 Soit A ⊂ P(Ω) une algèbre de Boole, avec Ω 6= ∅. Une pro-
babilité booléenne P sur(Ω, A) est une application P : A → [0, 1] telle que :
1. P (Ω) = 1,
2. pour toute suite nie (An )1≤n≤N ∈ A telle que An ∩ Am = ∅ pour tous
n 6= m, !
N
X N
[
P (An ) = P An .
n=1 n=1
Tant qu'on étudie que des phénomènes ayant un espace Ω d'états idéaux ni,
on peut se limiter aux algèbres de Boole. Le cas général nécessite des hypothèses
plus strictes.
Ensuite,
\ [
Ω\ Ak = (Ω \ Ak ) ∈ A,
1≤k≤n 1≤k≤n
T
donc 1≤k≤n Ak ∈ A.
De même, pour 2,
\ [
Ω\ Ak = (Ω \ An ) ∈ A,
n≥1 n≥1
T
donc n≥1 An ∈ A.
Enn, pour 3, A \ B = A ∩ (Ω \ B) ∈ A.
Dénition 3.2.4 On appelle espace probabilisable tout couple (Ω, A) formé
d'un ensemble Ω et A une tribu sur Ω. Dans ce cas, les éléments de A sont
appelés événements.
1. P (Ω) = 1,
2. pour toute suite
P (An )n≥1 ∈ A telle que An ∩ Am = ∅ pour tous n 6= m,
la série n≥1 P (A n ) converge et
X [
P (An ) = P An .
n≥1 n≥1
On dit aussi que (Ω, A, P ) est un espace probabilisé.
1. on a P (∅) = 0,
2. pour tout n ≥ 1 et tous A1 , ..., An ∈ A avec Ak ∩ Al = ∅ pour tous k 6= l,
[ Xn
P Ak = P (Ak ),
1≤k≤n k=1
P+∞
avec la convention que, si la série
S n=1 P (An ) diverge, l'inégalité (3.1)
[
P An = lim P (An ),
n→+∞
n≥1
\
P An = lim P (An ).
n→+∞
n≥1
!
[n [ X Xn
P Ak = P Bn = P (Bn ) = P (Ak ).
k=1 n≥1 n≥1 k=1
On suppose maintenant A ⊂ B. Alors B = A ∪ (B \ A) avec A ∩ (B \ A) = ∅,
donc
P (B) = P (A) + P (B \ A) ≥ P (A).
Soit maintenant (An )n≥1 une suite d'événements dans A. On dénit B1 := A1
et, si nS≥ 1 B
et si on a construit
S 1 , ..., B n ∈ A avec Bk ∩ Bl = ∅ pour tous
Sn
k 6= l, 1≤k≤n Bk = 1≤k≤n Ak et Bn ⊂ An , on pose Bn+1 = An+1 S \ k=1 Bk .
Alors Bn+1 ∈ A et Bn+1 ∩ Bk = ∅ pour tout k ∈ {1, n}. De plus, 1≤k≤n Bn =
S
1≤k≤n A k . Ainsi, comme B n ⊂ A n pour tout n ≥ 1 ,
[ [ X X
P An = P Bn = P (Bn ) ≤ P (An ).
n≥1 n≥1 n≥1 n≥1
Soit enn (An )n≥1 ∈ A. On suppose que An ⊃ An+1 pour tout n ≥ 1. Pour
tout n ≥ 1, soit Bn := Ω \ An . Alors Bn ∈ A et Bn ⊂ Bn+1 pour tout n ≥ 1.
Par suite,
\ \
P An = 1 − P Ω \ An
n≥1 n≥1
[
= 1−P Bn
n≥1
= 1 − lim P (Bn )
= lim P (An ).
On admettra le résultat suivant dont la preuve n'est ni simple ni éclairante
ni utile dans les raisonnements probabilistes :
Théorème 3.2.8 (Théorème de Carathéodory-Hahn) Soit A une algèbre
de Boole sur Ω. Soit PA une probabibilité booléenne sur A. Alors il existe une
tribu F sur Ω telle que F contient A et P = PF une probabilité sur F étendant
PA . De plus PF = PF 0 sur la tribu F ∩ F 0 .
3.3 Indépendance
A ∩ B = {2, 4, 6} × {5} ,
de sorte que
3×1 3 1
P (A ∩ B) = = × = P (A)P (B),
6×6 6 6
ce qui traduit le fait que A et B sont des événements indépendants.
Dénition 3.3.1 Soit (Ω, A, P ) un espace probabilisé.
2. Soient I un ensemble et (Ai )i∈I ∈ A. On dit que les (Ai )i∈I sont indé-
pendants si, et seulement si, pour tout entier n≥1 et tous i1 , ..., in ∈ I
avec ik 6= ij pour tous k 6= j , (Ai1 , ..., Ain ) sont indépendants.
A = (A ∩ B) ∪ (A ∩ (Ω \ B))
P (A ∩ (Ω \ B)) = P (A) − P (A ∩ B)
= P (A) − P (A)P (B)
= P (A)(1 − P (B))
= P (A)P (Ω \ B).
P (A ∩ B)
P (A|B) := .
P (B)
A = {(ω1 , ω2 ) ∈ Ω; ω1 = 6}
et
Bk = {(ω1 , ω2 ) ∈ Ω; ω1 + ω2 = k} .
On a donc
6 1
P (A) = 2
= ,
6 6
tandis que
P (A ∩ B12 )
P (A|B12 ) = =1
P (B12 )
et
P (A ∩ B11 ) 1
P (A|B11 ) = = .
P (B11 ) 2
P (A ∩ B) = P (A|B)P (B).
Pour le deuxième, on montre par récurrence sur k que, pour tout k ∈ {2, n},
\ \k
P (A1 )P (A2 |A1 )...P Ak | Aj = P Aj .
1≤j≤k−1 j=1
Preuve :
S
on pose B := Ω \ n≥1 An . On note que
[
P (B) = 1 − P An = 0.
n≥1
Alors
[ [
A= (A ∩ An ) (A ∩ B),
n≥1
X
P (A) = P (A ∩ An ) + P (A ∩ B)
n≥1
X
= P (A|An )P (An ).
n≥1
P (A|Ak )P (Ak )
P (Ak |A) = P .
n≥1 P (A|An )P (An )
P (A|Ak )P (Ak ) = P (A ∩ Ak ),
3.5.1 Généralités
Dénition 3.5.1 Soit (Ω, A, P ) un espace probabilisé. On appelle variable aléa-
toire réelle surΩ toute fonction X : Ω → R telle que, pour tout ouvert U ⊂ R,
X −1 (U ) := {ω ∈ Ω; X(ω) ∈ U } appartienne à A. Cela revient à dire que, pour
−1
tous −∞ ≤ a < b ≤ +∞, X (]a, b[) ∈ A.
Proposition 3.5.2 (Ω, A, P ) un espace probabilisé et X : Ω → R une
Soient
variable aléatoire réelle sur Ω. L'ensemble T des parties A ⊂ R telles que
X −1 (A) ∈ A forme une tribu de R, qui contient les ouverts et les fermés de
R, ainsi que les intervalles de la forme [a, b[ avec −∞ < a < b ≤ +∞ et ceux de
la forme ]a, b] avec −∞ ≤ a < b < +∞.
Preuve : par hypothèse, R ∈ T . Soit (Ak )k≥1 une suite de parties de T. Alors
[ [
X −1 Ak = X −1 (Ak ) ∈ A.
k≥1 k≥1
Preuve : pour 1, pour tous a < b ∈ R, (f ◦ X)−1 (]a, b[) = X −1 (f −1 (]a, b[)). Or
−1 −1 −1
f (]a, b[) est un ouvert parce que f est continue, donc X (f (]a, b[)) ∈ A.
Le point 2 se montre de façon analogue, en utilisant le fait que tout ouvert de
Rn est une réunion dénombrable de pavés.
Preuve : les deux premiers points sont admis. Pour le dernier, soient U, V des
ouverts de R. Alors, comme f −1 (U ) et g −1 (V ) sont des ouverts de R,
P (X ≤ x et Y ≤ y) = P (X ≤ x)P (Y ≤ y),
qui représente le nombre de piles obtenu parmi ces n lancers. Pour tout k∈
{1, n}, n
n 1
P (X = k) = .
k 2
PX (A) := P X −1 (A) ,
De plus, si (An )n≥1 est une suite de parties de N avec Ak ∩ Al = ∅ pour tous
k 6= l, on a X −1 (Ak ) ∩ X −1 (Al ) = ∅ pour tous k 6= l, si bien que
[ [
PX An = P X −1 An
n≥1 n≥1
[
= P X −1 (An )
n≥1
X
= P (X −1 (An ))
n≥1
X
= PX (An ).
n≥1
Remarque 3.6.4 1. La loi PX est une probabilité sur l'ensemble des va-
leurs prises par X et non sur Ω.
2. La loi d'une variable aléatoire discrète X est entièrement déterminée par
la connaissance de PX ({k}) pour tout k ∈ N. En eet, si A ⊂ N, on a
alors X
PX (A) = PX ({k}) .
k∈A
Exemple 3.6.5 1. Soit p ∈]0, 1[. Une variable aléatoire discrète X suit la
loi de Bernoulli de paramètre p, notée B(p), si, et seulement si, P (X =
0) = 1 − p et P (X = 1) = p. On note que X : Ω → {0, 1}.
2. Soient n ≥ 1 et p ∈]0, 1[. Une variable aléatoire discrète X suit la loi
binomiale de paramètres n et p, notée B(n, p), si, et seulement si, la loi
de X est la loi binomiale B(n, p) sur {0, n}, ce qui veut donc dire
n k
P (X = k) = p (1 − p)n−k
k
λk
P (X = k) = e−λ .
k!
On notera que X : Ω → N.
5. Soient n, r, r1 des entiers avec 1≤n<r et 0 ≤ r1 ≤ r. On dit qu'une
variable aléatoire discrète X suit la loi hypergéométrique de paramètres
n, r, r1 si, et seulement si,
r1 r−r1
k n−k
P (X = k) = r
n
6. Soient n≥1 et p ∈]0, 1[. On dit qu'une variable aléatoire discrète X suit
la loi binomiale négative de paramètres n, p si, et seulement si,
n+k−1 n
P (X = k) = p (1 − p)k
n−1
pour tout k ∈ N. On notera que X : Ω → N. De plus, on vérie que la
loi de X est bien une probabilité sur N. En eet, pour tout x ∈] − 1, 1[,
X n + k − 1
(1 − x)−n = xk ,
n−1
k≥0
donc
X n + k − 1
(1 − p)k = p−n .
n−1
k≥0
P (X = k et Y = l) = P (X = k)P (Y = l).
Cela revient à dire que, pour tous A, B ⊂ N,
P (X ∈ A et Y ∈ B) = P (X ∈ A)P (Y ∈ B).
1. Si X X est intégrable.
est bornée, alors
Preuve : on suppose qu'il existe M >0 tel que X(ω) ≤ M pour tout ω ∈ Ω.
Alors, pour tout entier N > M,
N
X M
X
nP (X = n) = nP (X = n),
n=0 n=0
ce qui montre que X1Ak est intégrable. De plus, pour tout n∈N avec n 6= 0,
[
{X = n} = {ω ∈ Ak ; X(ω) = n}
k≥1
[
= {ω ∈ Ω; (X1Ak )(ω) = n} ;
k≥1
et l'union est disjointe. Alors,
X X X
nP (X = n) = nP ({ω ∈ Ω; (X1Ak )(ω) = n})
n≥1 n≥1
k≥1
XX
= nP ({ω ∈ Ω; (X1Ak )(ω) = n})
X n≥1
k≥1
= E(X1Ak ).
k≥1
Ak := {ω ∈ Ω; X(ω) = k}
et
Bl := {ω ∈ Ω; Y (ω) = l} .
S
On note que Ω= Ak ∩ Bl et que cette union est disjointe.
(k,l)∈N2
On vérie d'abord que X + Y est intégrable. Soit N ≥ 1. Alors
X X X
nP (X + Y = n) = n P ({X + Y = n} ∩ Ak ∩ Bl )
0≤n≤N 0≤n≤N (k,l)∈N2
X X
≤ n P (Ak ∩ Bl )
0≤n≤N
X k+l=n X
≤ kP (Ak ∩ Bl ) + lP (Ak ∩ Bl )
(k,l)∈N2 (k,l)∈N2
X X
= kP (Ak ) + lP (Bl ),
k∈N l∈N
de sorte que
X
E(X + Y ) = (k + l)P (Ak ∩ Bl )
(k,l)∈N2
X X
= kP (Ak ∩ Bl ) + lP (Ak ∩ Bl ).
(k,l)∈N2 (k,l)∈N2
On en déduit que
!
X X X
kP (Ak ∩ Bl ) = kP (Ak ∩ Bl )
(k,l)∈N∗ ×N k≥1 l∈N
X
= kP (Ak ),
k≥1
donc X X
kP (Ak ∩ Bl ) = kP (Ak ) = E(X).
(k,l)∈N×N k∈N
X
E(X k ) = nk P (X = n).
n∈N
La preuve utilise :
Lemme 3.6.16
P Soient (an )n∈N et (bn )n∈N des suites de réels
P telles que les séries
2 2
P
a
n≥0 n et b
n≥0 n soient convergentes. Alors la série n≥0 an bn est conver-
gente et
! 21 ! 21
X X X
an bn ≤ a2n b2n .
n∈N n∈N n∈N
On a, pour tout t ∈ R,
X X X
0 ≤ f (t) = b2n t2 + 2 an bn t + a2n .
n≤N n≤N n≤N
b2n = 0,
P
Si n≤N alors bn = 0 pour tout n ≤ N, et on a clairement
21 12
X X X
an bn ≤ a2n b2n . (3.3)
n≤N n≤N n≤N
b2n > 0, alors comme f est une fonction polynôme de degré 2 et f (t) ≥ 0
P
Si n≤N
pour tout t ∈ R, on a encore (3.3). Ainsi,
! 21 ! 12
X X X
an bn ≤ a2n b2n ,
n≤N n∈N n∈N
et comme c'est vrai pour tout N ≥ 1, on obtient bien la conclusion.
1 1
X X
nP (X = n) = n(P (X = n)) 2 (P (X = n)) 2
n∈N n∈N
! 21 ! 12
X X
2
≤ n P (X = n) P (X = n)
n∈N n∈N
21
= E X2 ,
On vérie que XY est bien une variable aléatoire discrète. En eet, pour tout
n∈N avec n 6= 0,
[ n no
{ω ∈ Ω; X(ω)Y (ω) = n} = {ω ∈ Ω; X(ω) = k}∩ ω ∈ Ω; Y (ω) = ∈ A.
k
k∈N; k|n
Si n = 0,
[
{ω ∈ Ω; X(ω)Y (ω) = 0} = {ω ∈ Ω; X(ω) = 0} {ω ∈ Ω; Y (ω) = 0} ∈ A.
2
et on applique l'inégalité de Markov à |X − E(X)| .
3.7 Variables aléatoires à densité
1
P (X = a) = lim P (a − < X ≤ a)
k→+∞ Z
a
k
= lim f (x)dx
k→+∞ 1
a− k
= 0.
Remarque 3.7.3
P
X : Ω → Z une variable discrète. Comme k∈Z P (X =
Soit
k) = 1, il existe k ∈ Z tel que P (X = k) > 0, ce qui montre que X ne possède
pas de densité.
A−m
Z A
(x−m)2 √ Z σ√2 −y2 √ Z 2 √
e− 2σ2 dx = σ 2 e dy → σ 2 e−y dy = σ 2π,
−A−m
−A √
σ 2
R
1. pour tout x ∈ R, Z x
FX (x) = fX (t)dt,
−∞
Z x
1
P (X = x) = lim P x− <X≤x = lim fX (t)dt = 0.
n→+∞ n 1
x− n
fX (g −1 (y)) (g −1 )0 (y)
si y ∈ g(R),
fY (y) =
0 sinon .
P (Y ≤ b) = P (y0 < g ◦ X ≤ b)
= P (X ≤ g −1 (b))
Z g−1 (b)
= fX (x)dx
Z−∞b
= fX (g −1 (y))(g −1 )0 (y)dy
y0
Z b
= fY (y)dy.
−∞
Alors g◦X est intégrable et les expressions de son espérance, au sens des dé-
nitions 3.7.14, 3.6.8 et 3.7.11, coïncident.
1. X est intégrable,
2. on a
Z Z
E(X 2 ) = x2 fX (x)dx, E(X) = xfX (x)dx.
R R
1
|x| fX (x) ≤ (1 + x2 )fX (x),
2
(x − m)2
Z
1
E(X) = √ x exp − 2
dx
σ 2π R Z A 2σ
(x − m)2
1
= √ lim x exp − dx
σ 2π A→+∞ Z−A 2σ 2
A−m
y2
1
= √ lim (y + m) exp − 2 dy
σ 2π ZA→+∞ −A−m 2σ
y2
1
= √ y exp − 2 dy
σ 2π RZ 2σ2
1 y
+ m √ exp − 2 dy
σ 2π R 2σ
= m.
On vérie de même que X2 est intégrable, puis que, par changement de variables
et intégration par parties,
(x − m)2
Z
1
Var(X) = √ (x − m)2 exp − 2
dx
σ 2π R Z A 2σ
(x − m)2
1 2
= √ lim (x − m) exp − dx
σ 2π A→+∞ Z−A 2σ 2
A−m
y2
1
= √ lim y 2 exp − 2 dy
σ 2π A→+∞ −A−m 2σ
Z A−m 2
1 2 σ z
= √ σ lim z 2 exp − dz
2π A→+∞ −A−m 2
Z σ2
1 z
= √ σ 2 exp − dz
2π R 2
2
= σ .
Proposition 3.7.20 [Inégalité de Bienaymé-Tchebyche pour des variables aléa-
toires à densité] Soient (Ω, A, P ) un espace probabilisé et X une variable aléa-
toire réelle sur Ω. On suppose que X possède une densité fX et que X2 est
intégrable. Alors, pour tout λ > 0,
Var(X)
P (|X − E(X)| ≥ λ) ≤ .
λ2
Preuve : on écrit que
Z
Var(X) = (x − E(X))2 fX (x)dx
ZR+∞
≥ (x − E(X))2 fX (x)dx
ZE(X)+λ
E(X)−λ
+ (x − E(X))2 fX (x)dx
−∞
2
≥ λ (P (X ≥ E(X) + λ) + P (X ≤ E(X) − λ))
= λ2 P (|X − E(X)| ≥ λ) .
Proposition 3.7.21 On suppose que X et Y sont indépendantes, que X pos-
sède une densité fX et que Y possède une densité fY . Alors la variable (X, Y )
2
possède la densité f(X,Y ) : R → [0, +∞[ donnée par f(X,Y ) (x, y) = fX (x)fY (y).
E(XY ) = E(X)E(Y ).
Z
E(XY ) = xyf(X,Y ) (x, y)dxdy
ZR2
= xyfX (x)fY (y)dxdy
R2
Z Z
= xfX (x)dx yfY (y)dy
R R
= E(X)E(Y ).
Z
fX+Y (x) = fX (x − y)fY (y)dy := (fX ∗ fY )(x).
R
Proposition 3.8.3 Soient (Xn )n≥1 une suite de variables aléatoires sur Ω, X
et Y des variables aléatoires sur Ω. On suppose que Xn → X en probabilité et
Xn → Y en probabilité. Alors X = Y presque sûrement (ce qui veut dire que
P (X 6= Y ) = 0).
P ({|X − Y | ≥ ε}) = 0.
[ 1
{X 6= Y } = |X − Y | ≥ .
k
k≥1
Proposition 3.8.4 Soient (Xn )n≥1 et (Yn )n≥1 deux suites de variables aléa-
toires sur Ω, X et Y des variables aléatoires sur Ω. On suppose que Xn → X
en probabilité et Yn → Y en probabilité. Alors :
1. Xn + Yn → X + Y en probabilité,
n ε o α
P |Xn − X| ≥ <
2 2
pour tout n ≥ N1 . De même, il existe N2 ≥ 1 tel que
n ε o α
P |Yn − Y | ≥ <
2 2
pour tout n ≥ N2 .
N := max(N1 , N2 ), pour tout n ≥ N ,
Si
n ε o n ε o
P ({|(Xn + Yn ) − (X + Y )| ≥ ε}) ≤ P |Xn − X| ≥ +P |Yn − Y | ≥ < α,
2 2
ce qui montre que
Exemple 3.8.6 Pour tout k ≥ 1, soit Xk une variable aléatoire de loi uniforme
0, k1 , ..., k−1 1 (ce qui signie que P (Xk = kj ) = k+1
1
sur , pour tout 0 ≤ j ≤ k ).
k
Alors Xk converge en loi vers X , qui suit la loi uniforme sur [0, 1], c'est-à-dire
la loi de densité 1[0,1] . En eet, pour tout x ∈ R (voir la proposition 3.7.10),
0 si x < 0,
FX (x) = x si 0 < x < 1,
1 si x ≥ 1.
Soit x < 0. Alors pour tout k , FXk (x) = FX (x) = 0. Si x ≥ 1, pour tout k ,
FXk (x) = FX (x) = 1. On suppose maintenant 0 ≤ x < 1. Soient k ≥ 1 et
j ∈ {0, k − 1} tels que kj ≤ x < j+1
k , de sorte que
j+1 j j+1 j+2
= FXk ≤ FXk (x) ≤ FXk = ,
k+1 k k k+1
donc
j+1 j+1 x 1
FX (x) − FXk (x) ≤ x − < ≤ − ,
k+1 k(k + 1) k + 1 k(k + 1)
et
j+2 2
FXk (x) − FX (x) ≤ −x≤ ,
k+1 k+1
ce qui montre que limk→+∞ FXk (x) = FX (x).
On examine le lien entre convergence en probabilité et en loi. On remarque
d'abord que la convergence en loi n'entraîne pas la convergence en loi :
0 ≤ ω < 21 ,
0 si
Xk (ω) := 1
1 si
2 ≤ω ≤1
si k est pair et
0 ≤ ω < 21 ,
1 si
Xk (ω) := 1
0 si
2 ≤ω ≤1
1 1
si k est impair. Alors la loi de Xk est
2 δ0 + 2 δ1 pour tout k ≥ 1, donc Xk
converge en loi vers X1 . Toutefois, il n'y a pas convergence en probabilité car,
pour tout k pair, |Xk − X1 | = 1 partout.
FX (x) − ε ≤ P (X ≤ x − δ)
= P (X ≤ x − δ et Xk ≤ x) + P (X ≤ x − δ et Xk > x)
≤ P (Xk ≤ x) + P (Xk − X > δ)
≤ FXk (x) + ε,
et
Proposition 3.8.10 Soient (Xn )n≥1 une suite de variables aléatoires à valeurs
dans N et X N. Alors Xn → X
une variable aléatoire à valeurs dans en loi si,
et seulement si, pour tout k ∈ N, limn→+∞ P (Xn = k) = P (X = k).
Preuve : on remarque d'abord que, pour tout x∈/ N et pour tout n ≥ 1, FXn
et FX sont continues en x.
On suppose d'abord que Xn → X en loi. Soit k ∈ N. Alors
1 1
P (X = k) = P k − < X ≤ k +
2 2
1 1
= FX k + − FX k −
2 2
1 1
= lim FXn k + − FXn k −
n→+∞
2 2
1 1
= lim P k − < Xn ≤ k +
n→+∞ 2 2
= lim P (Xn = k).
n→+∞
n−k
lim (1 − pn ) = e−λ ,
n→+∞
N p N (1−p)
k n−k
P (X = k) = N
n
Soit une urne contenant N boules dont Np sont rouges et N (1 − p) sont noires.
On tire au hasard et sans remise n boules. Si X est le nombre de boules rouges
tirées, alors X suit une loi hypergéométrique de paramètres N, n, p.
Théorème 3.9.3 Soient n≥1 et p ∈]0, 1[. Pour tout entier N ≥1 tel que Np
soit entier, soit XN une variable suivant la loi hypergéométrique de paramètres
N, n, p. Soit X suivant la loi B(n, p). Alors XN → X en loi quand N → +∞.
Preuve : soit k ∈ N. On pose q = 1 − p. Pour N assez grand (dépendant de n
et de k ), on aura bien n − N q ≤ k ≤ N p ≤ N , donc
Ainsi, si fn := Pn Yi
S pour tout n ≥ 1, S
fn
→0 en probabilité. Mais
S
fn
=
i=1 n n
Sn
n − m, ce qui termine la preuve.
Remarque 3.9.7 Si (Xn )n≥1 est une suite de variables aléatoires indépen-
dantes de même loi et de carré intégrable, cette suite satisfait les hypothèses
du théorème 3.9.6.
Preuve : il sut d'appliquer le théorème 3.9.6 à la suite des 1An , compte tenu
de la remarque 3.9.7.
1. On dit que X est intégrable si, et seulement si, pour tout i ∈ {1, d},
Xi est intégrable. Dans ce cas, l'espérance de X est le vecteur E(X) =
(E(X1 ), ..., E(Xd )).
2. On dit que X est de carré intégrable si, et seulement si, pour tout i ∈
{1, d}, Xi2 est intégrable. Dans ce cas, on dénit la matrice de covariance
de X comme la matrice C ∈ Md (R) donnée par
Dénition 3.10.4 Soit X = (X1 , ..., Xd ) une variable aléatoire dénie sur
(Ω, A, P ) et à valeurs dans Rd . On dit que X est un vecteur gaussien si, et seule-
d
ment si, pour tout α = (α1 , ..., αd ) ∈ R , la variable aléatoire réelle hα, Xi =
Pd 2
k=1 αk Xk est gaussienne (c'est-à-dire qu'elle suit une loi N (m, σ ) pour un
m ∈ R et un σ > 0).
On vérie facilement :
La variable aléatoire (U, V ) n'est donc pas gaussienne. Re- marquons par ailleurs
que U et V ne sont pas indépendantes. En eet, par indépendance de ε et U ,
la dernière inégalité étant due au fait que les coecients de Λ sont positifs.
Preuve du corollaire 3.10.8 : soient Y1 , ..., Yd des variables aléatoires
indépendantes de loi N (0, 1). Alors le vecteur aléatoire Y = (Y1 , ..., Yd ) est
gaussien, d'espérance nulle et de matrice de covariance Id .
La matrice C étant symétrique positive, on peut choisir une matrice symétrique
positive A ∈ Md (R) telle que A2 = At A = C . La variable aléatoire X := m+AY
est alors gaussienne et d'espérance m. La covariance de X est la matrice D ∈
Md (R) telle que
X X X
Dij = E((AY )i (AY )j ) = E aik Yk ajk Yk = aik ajk = Cij ,
1≤k≤d 1≤k≤d 1≤k≤d
Preuve : il est immédiat que, si les X1 , ..., Xd sont indépendantes, alors C est
diagonale. La réciproque est admise.
Preuve : soient Y1 , ..., Yd des variables aléatoires indépendantes de loi N (0, 1).
Alors la variable aléatoire Y = (Y1 , ..., Yd ) est d'espérance nulle et de matrice
de covariance Id , et possède une densité fY donnée par
d 1 2 1 2
Y e− 2 yk e− 2 kyk
fY (y) = √ = p d
.
k=1
2π (2π)
P (X ∈ B) = P (m + AY ∈ B)
1 2
e− 2 kyk
Z
= 1B (m + Ay) p d
dy
Rd (2π)
−1 2
e− 2 kA (x−m)k
Z 1
−1
= 1B (x) p d
det A dx,
Rd (2π)
ce qui montre que X possède une densité donnée par
−1 2
e− 2 kA (x−m)k
1
det A−1 .
fX (x) = p d
(2π)
−1
On termine en remarquant que det(A ) = det(C)−1/2 et que, pour tout z ∈ Rd ,
−1
2
A z
= hA−1 z, A−1 zi = hz,t A−1 A−1 zi = hz, C −1 zi.
3.11.1 Un exemple
Soient N ≥ 1 un entier et S = {s1 , ..., sN } une population. On veut esti-
mer la proportion θ de personnes parlant l'anglais dans cette population, en
interrogeant seulement n personnes (n ≤ N ).
Soit Ω = S n l'ensemble des échantillons de taille n (avec répétitions). Un élément
ω de Ω est donc de la forme (ω1 , ..., ωn ) avec ωi ∈ S pour tout i ∈ {1, n}. Pour
traduire le fait qu'on fait un sondage au hasard, on munit Ω de la probabilité
uniforme : pour tout ω ∈ Ω,
1
P ({ω}) = .
Nn
A chaque personne sondée, donc pour chaque ωi , on demande si elle parle an-
glais. Pour tout i ∈ {1, n}, on dénit la variable aléatoire Xi : Ω → {0, 1}
par
1 si ωi parle anglais,
Xi (ω) =
0 si ωi ne parle pas anglais.
Pn
Ainsi, pour tout ω ∈ Ω, k=1 Xk (ω) représente le nombre de personnes parlant
anglais dans l'échantillon, et
n
1X
Mn (ω) := Xk (ω)
n
k=1
où
Ai := {(ω1 , ..., ωn ); ωi parle anglais }).
On a donc
]Ai = N n−1 × θN,
donc
P (Xi = 1) = θ.
k
Soient maintenant k ∈ {1, n}, 1 ≤ i1 < ... < ik ≤ n et (ε1 , ..., εk ) ∈ {0, 1} .
Alors
]A
P (Xi1 = ε1 , ..., Xik = εk ) = ,
]Ω
où
A = (ω1 , ..., ωn ); ωij parle anglais pour tout j ∈ {1, k} ).
On a donc
k
Y
P (Xi1 = ε1 , ..., Xik = εk ) = (θ)k = P (Xij = εj ),
j=1
ce qui montre bien l'indépendance annoncée. On dit que les variables X1 , ..., Xn
forment un échantillon de taille n de loi de Bernoulli de paramètre θ.
Comme nMn est une somme de variables aléatoires indépendantes suivant toutes
la loi B(1, θ), nMn suit la loi B(n, θ). Enn, on remarque que
n
1X
E(Mn ) = E(Xk ) = θ
n
k=1
et
1
Var(Mn ) = θ(1 − θ),
n
donc
P (|Mn − θ| > ε) = P (|Mn − E(Mn )| > ε)
2
= P (|Mn − E(Mn )| > ε2 )
1
≤ Var (Mn )
ε2
1
= θ(1 − θ)
nε2
1
≤ .
4nε2
q
5
On prend par exemple ε= n . On fait un sondage de taille n, ce qui revient
à choisir ω, et on observe
i X1 (ω), ..,
qXn (ω), puis q
on calcule
h Mn (ω). Alors, θ
appartient à l'intervalle Mn (ω) − n , Mn (ω) + n5 avec une
5
conance au
1
moins égale à 1− 4nε2 = 0, 95.
3.11.2 Estimateur
Voici la situation générale. On suppose qu'un phénomène suit une loi de
probabilité connue, notée µθ , qui dépend de certains paramètres inconnus θ. On
note Θ l'ensemble des valeurs que peut prendre θ. Dans l'exemple du paragraphe
3.11.1, µθ est une loi de Bernoulli de paramètre θ ∈ Θ =]0, 1[.
2. On appelle observation ou réalisation de l'échantillon tout n-uplet (X1 (ω), ..., Xn (ω))
pour un ω ∈ Ω.
Soit (X1 , ..., Xn ) un échantillon de loi µθ . On note P la loi de (X1 , ..., Xn ). Soit
x = (x1 , ..., xn ) ∈ X une observation.
Dénition 3.11.2 1. Soit f : Θ → R une fonction. On appelle estimateur
de f (θ) une variable aléatoire Tn (X1 , ..., Xn ) à valeurs dans f (Θ), uti-
lisée pour estimer f (θ). On appelle estimateur ponctuel toute valeur de
l'estimateur en un point ω.
2. Un estimateur Tn (X1 , ..., Xn ) est dit consistent (ou convergent) si, et
seulement si, Tn (X1 , ..., Xn ) converge en probabilités vers f (θ) quand n
tend vers +∞, c'est-à-dire que, pour tout ε > 0,
3. Si l'estimateur Tn (X1 , ..., Xn ) est intégrable, son biais est déni par
pour tout θ ∈ Θ. On dit que Tn (X1 , ..., Xn ) est un estimateur sans biais
si, et seulement si, pour tout θ ∈ Θ,
n
1X
Mn = X := Xi .
n i=1
Or
n
X n
X n
X
(Xk − m)2 = Xk2 − 2m Xk + nm2 ,
k=1 k=1 k=1
donc !
n
X
2
= n E(X12 ) − m2 = nσ 2 ,
E (Xk − m)
k=1
si bien que
σ2
P (|Mn − m| > ε) ≤ →0
nε2
quand n → +∞. On vient de (re)démontrer la loi faible des grands
nombres pour des variables de carré intégrable.
On notera que, si les Xk sont de loi B(1, θ), alors nMn est de loi B(n, θ).
Si les Xk sont de loi N (m, σ 2 ), alors Mn est de loi N (m, n1 σ 2 ).
2. On veut estimer σ2 . Si m est connue, on prend comme estimateur
n
1X
Vn = (Xk − m)2 .
n
k=1
n
1X
E(Vn ) = E((Xk − m)2 ) = σ 2 .
n
k=1
4
De plus, si les Xk sont intégrables, l'estimateur est consistant. En eet,
n n
1X 2 1X
Vn = Xk − 2m Xk + m2 ,
n n
k=1 k=1
On calcule
n
1 X X
E(Mn2 ) = E(Xk2 ) + E(Xk Xl )
n2
k=1 k6=l
1 n−1 2
= E(X12 ) + m ,
n n
la dernière ligne venant du fait que, comme Xk et Xl sont indépendantes
2
pour k 6= l, E(Xk Xl ) = E(Xk )E(Xl ) = m .
Soit k ∈ {1, n}. On calcule
1X 1
E(Xk Mn ) = E(Xk Xl ) + E(Xk2 )
n n
l6=k
n−1 2 1
= m + E(X12 ).
n n
Par suite,
1
E(Sn2 ) nE(X12 ) − 2(n − 1)m2 − 2E(X12 ) + E(X12 ) + (n − 1)m2
=
n−1
1
(n − 1)E(X12 ) − (n − 1)m2
=
n−1
= σ2 .
3.11.3 Intervalles de conance
On reprend les notations de la section précédente. Au lieu d'estimer f (θ)
de façon ponctuelle, on peut chercher un intervalle dépendant d'une observa-
tion, pour lequel on pourra dire que f (θ) appartient à cet intervalle avec une
probabilité qu'on sait estimer.
Var(ϕ(X1 , ..., Xn )) ≤ r.
Soit α ∈]0, 1[. Alors
r r
r r
ϕ(x1 , ..., xn ) − , ϕ(x1 , ..., xn ) + ; (x1 , ..., xn ) ∈ X
1−α 1−α
est un intervalle de conance pour f (θ) au niveau α.
Preuve : soit θ ∈ Θ. On calcule
r r
r r
P |f (θ) − ϕ(X1 , ..., Xn )| > = P |E(ϕ(X1 , ..., Xn )) − ϕ(X1 , ..., Xn )| >
1−α 1−α
1−α
≤ Var(ϕ(X1 , ..., Xn ))
r
≤ 1 − α,
ce qui donne bien la conclusion.
Par exemple, si nP= 500 et que, sur les observations réalisées, 75 personnes
1 n 75 1 1
parlent l'anglais,
n k=1 xk = 500 = 0, 15, et on peut dire que θ ∈ 0, 15 − 10 , 0, 15 + 10
avec une conance de 0, 95.
Dénition 3.11.7 Soit (In )n≥1 une suite d'intervalles de conance, chaque In
ne dépendant que de X1 , ..., Xn . On dit que le niveau de conance asymptotique
de la suite (In )n≥1 vaut a si, et seulement si, pour tout θ ∈ Θ,
lim P (θ ∈ In ) = a.
n→+∞
√
Mn − m
P ( n |Mn − m| ≤ xσ) = P √ ≤ x → P (|Z| ≤ x),
σ n
où Z suit la loi N (0, 1). Si a > 0, une table fournit xa > 0 tel que P (|Z| ≤
xa ) = a. Alors il vient que
√
P ( n |Mn − m| ≤ xa σ) → a.
h P i
1 n Pn
Cela signie que x k − x a √σ , 1 x k + x a √σ est un intervalle de
n k=1 n n k=1 n
conance asymptotique de m au niveau a.
Alors
Xn
lim P ∈ In = 1 − α.
n→+∞ n
Preuve : le théorème de Moivre-Laplace assure que
!
X − np
n
lim P ≤ uα = P (|Z| ≤ uα ) = 1 − α.
p
n→+∞ np(1 − p)
Or
X − np Xn − np
n
≤ uα ⇔ −uα ≤ p ≤ uα
p
np(1 − p) np(1 − p)
r r
p(1 − p) Xn p(1 − p)
⇔ p− uα ≤ ≤p+ uα .
n n n
1
Pour α = 0, 05 = 20 , on a uα = 1, 96, donc
" r r #
p(1 − p) p(1 − p)
In = p − 1, 96 , p + 1, 96 .
n n
1
On notera que p(1 − p) ≤ 4 , donc
p 1, 96
1, 96 p(1 − p) ≤ ≤ 1,
2
de sorte que
1 1
In ⊂ p − √ , p + √ .
n n
q q
p(1−p)
L'intervalle p − 1, 96
n , p + 1, 96 p(1−p)n gure dans les programmes de
h i
1 1
terminale S, alors que p − √ , p + √ se trouve dans ceux de seconde.
n n
1. Si f∈
/ In , l'hypothèse sur p est considérée comme non valable.